不再傻傻分不清 你想了解的人工智能這里都有
當(dāng)前,人工智能正在席卷全球科技產(chǎn)業(yè),越來(lái)越多的行業(yè)和市場(chǎng)都在人工智能領(lǐng)域進(jìn)行深耕,作為當(dāng)今輔助人類進(jìn)行創(chuàng)新和變革的重要生產(chǎn)力工具和技術(shù)驅(qū)動(dòng)力,人工智能技術(shù)當(dāng)前已經(jīng)發(fā)展到什么階段了呢?未來(lái)人工智能產(chǎn)業(yè)又將會(huì)走向何方呢?本期我們一起來(lái)聊聊。
對(duì)于人工智能技術(shù)來(lái)說(shuō),我們?nèi)粘=?jīng)?吹降幕蛟S是機(jī)器算法的應(yīng)用、又或是對(duì)于自然語(yǔ)言的處理等內(nèi)容,對(duì)于人工智能來(lái)說(shuō),現(xiàn)在已經(jīng)收集了海量的最優(yōu)算法,其中涵蓋了計(jì)算機(jī)視覺(jué)、游戲、自然語(yǔ)言處理、網(wǎng)絡(luò)圖、知識(shí)庫(kù)等很多內(nèi)容。
計(jì)算機(jī)視覺(jué)感知
其中值得一提的是計(jì)算機(jī)視覺(jué),對(duì)于計(jì)算機(jī)視覺(jué)來(lái)說(shuō),3D技術(shù)是最受青睞的一類,2017年的CVPR,MIT、馬薩諸塞大學(xué)阿默斯特分校和谷歌DeepMind的研究人員展示了一項(xiàng)成果,使用自動(dòng)編碼器(VAE),構(gòu)建了一個(gè)名叫SingleVPNet的框架,能從多個(gè)視角的深度圖或其相應(yīng)的輪廓(silhouette)學(xué)習(xí)生成模型,并使用渲染函數(shù)從這些圖像生成細(xì)節(jié)精致的3D形狀。
對(duì)于計(jì)算機(jī)識(shí)別感知框架來(lái)說(shuō),通過(guò)一系列不同視角的2D深度圖當(dāng)中,研究人員就能夠去生成新的3D形狀和3D圖片,其中的平均誤差將會(huì)縮小到0.35左右,也就是說(shuō)計(jì)算機(jī)視覺(jué)所帶來(lái)的3D圖片將會(huì)是非常逼真的一張圖。
動(dòng)作識(shí)別
在人工智能領(lǐng)域當(dāng)中,動(dòng)作識(shí)別是整個(gè)視頻識(shí)別當(dāng)中最為關(guān)鍵的一項(xiàng)組成部分,整個(gè)動(dòng)作可能會(huì)貫穿視頻當(dāng)中,對(duì)于動(dòng)作識(shí)別來(lái)說(shuō),很有可能成為圖像識(shí)別的重要組成部分,2017年的NeurIPS,CMU機(jī)器人學(xué)院的研究人員Rohit Girdhar 和 Deva Ramanan 利用注意力機(jī)制(Attentional Pooling),在保持網(wǎng)絡(luò)復(fù)雜度和計(jì)算量基本不變的情況下,在三個(gè)靜態(tài)圖像和視頻標(biāo)準(zhǔn)動(dòng)作識(shí)別數(shù)據(jù)集上提升了動(dòng)作識(shí)別的基準(zhǔn)。其中,在MPII人體姿態(tài)數(shù)據(jù)集上取得了12.5%的相對(duì)改進(jìn)。
人臉識(shí)別技術(shù)
在今年的市場(chǎng)研究數(shù)據(jù)報(bào)告顯示,在被譽(yù)為工業(yè)界“黃金標(biāo)準(zhǔn)”的全球人臉識(shí)別算法測(cè)試(FRVT)中,依圖科技以千萬(wàn)分之一誤報(bào)下的識(shí)別準(zhǔn)確率超過(guò)99%,繼續(xù)保持全球人臉識(shí)別競(jìng)賽冠軍。
千萬(wàn)分位誤報(bào)下的識(shí)別準(zhǔn)確率超過(guò)99%,意味著更多核心關(guān)鍵的安防場(chǎng)景被解鎖。相比于去年同期,全球人臉識(shí)別性能提升了80%。在整個(gè)報(bào)告當(dāng)中對(duì)于很多國(guó)內(nèi)的人工智能企業(yè)進(jìn)行了重點(diǎn)的提及和展示,而中國(guó)的人工智能企業(yè)也的確在業(yè)務(wù)領(lǐng)域和技術(shù)創(chuàng)新方面領(lǐng)跑全球。
人體姿態(tài)數(shù)據(jù)分析
在今年的9月份,AlphaPose系統(tǒng)升級(jí),采用PyTorch框架,在姿態(tài)估計(jì)標(biāo)準(zhǔn)測(cè)試集COCO validation set上,達(dá)到 71mAP的精度比OpenPose 相對(duì)提升17%,Mask-RCNN相對(duì)提升8%,同時(shí),速度達(dá)到了20FPS比OpenPose相對(duì)提高66%,Mask-RCNN相對(duì)提高300%。
圖像分類
計(jì)算機(jī)對(duì)于圖像處理來(lái)說(shuō)其實(shí)早就已經(jīng)超越了人類的原有技術(shù)應(yīng)用,當(dāng)前圖像分類精度的最好成績(jī),往往是其他研究的副產(chǎn)物。ICLR 2017,谷歌大腦 Barret Zoph 和 Quoc V. Le 發(fā)表了“Neural Architecture Search with Reinforcement Learning”,他們用強(qiáng)化學(xué)習(xí)自動(dòng)搜索神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),最終AI自己設(shè)計(jì)出的模型,在 CIFAR-10數(shù)據(jù)集上做圖像分類取得了96.35%的精度。
GAN在今年不斷發(fā)展,今年ICLR DeepMind 提出的 BigGAN,可謂當(dāng)前最強(qiáng)圖像生成模型,在128x128分辨率的ImageNet上訓(xùn)練,BigGAN的 Inception 分?jǐn)?shù)(IS)可以達(dá)到 166.3 ,F(xiàn)rechet Inception 距離(FID)9.6。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 3 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 4 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 5 2025年8月人工智能投融資觀察
- 6 7 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 8 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬(wàn)套HSD上車