ECCV 2020 | 基于對(duì)抗路徑采樣的反事實(shí)視覺(jué)語(yǔ)言導(dǎo)航
為了提升對(duì)于未知環(huán)境的適應(yīng)性,預(yù)探索也被應(yīng)用到了整套系統(tǒng)中去。導(dǎo)航器可以首先探索不熟悉的環(huán)境,并增加在未知環(huán)境中執(zhí)行導(dǎo)航指令的機(jī)會(huì)。針對(duì)先前的預(yù)探索方法,像束搜索和自模仿學(xué)習(xí),他們基于指令并對(duì)每一條指令進(jìn)行優(yōu)化,但這種方法會(huì)造成路徑過(guò)長(zhǎng)。在真實(shí)環(huán)境中部署機(jī)器人到陌生環(huán)境時(shí),首先要熟悉環(huán)境并有效地在環(huán)境中執(zhí)行自然語(yǔ)言指令。
與先前方法優(yōu)化給定指令或假設(shè)一次性覆蓋所有未知環(huán)境不同,本文提出了利用APS方法來(lái)實(shí)現(xiàn)基于環(huán)境的預(yù)探索,可以使得智能體僅僅針對(duì)同一環(huán)境中的任務(wù)進(jìn)行環(huán)境預(yù)探索,而無(wú)需先驗(yàn)知識(shí)。在未知環(huán)境中,利用APS來(lái)采樣多條路徑P’并生成導(dǎo)航指令I(lǐng)’。隨后利用(P’,I’)來(lái)優(yōu)化位置環(huán)境中的NAV。在預(yù)探索過(guò)程中,固定APS參數(shù)而僅僅優(yōu)化NAV。通過(guò)這樣的方法可以有效提升模型對(duì)于未知環(huán)境的適應(yīng)能力。
未知環(huán)境中的預(yù)探索優(yōu)化流程。APS對(duì)未知環(huán)境進(jìn)行采樣來(lái)優(yōu)化NAV。
二、實(shí)驗(yàn)結(jié)果
為了驗(yàn)證這種方法的有效性,研究人員在視覺(jué)語(yǔ)言導(dǎo)航數(shù)據(jù)集R2R(Room-to-Room)上進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)分別針對(duì)Seq2Seq、Speaker-Follower、RCM等三個(gè)基準(zhǔn)進(jìn)行,分別為其增加隨機(jī)采樣增強(qiáng)路徑、APS采樣增強(qiáng)路徑觀察導(dǎo)航誤差(Navigation Error)、成功率(Oracle Success Rate,Success Rate)、路徑長(zhǎng)度加權(quán)的成功率(Success Rate weighted by Path Length),其結(jié)果如下表所示:
可以看到基于APS的方法顯著地提升了三種基準(zhǔn)的性能,下圖還更為直觀地反映了隨機(jī)采樣和APS增強(qiáng)采樣模式針對(duì)兩種方法在不同增強(qiáng)率下性能提升:
下圖還展示了預(yù)探索策略對(duì)于未知環(huán)境導(dǎo)航的有效性,可以看到經(jīng)過(guò)預(yù)探索后導(dǎo)航模型可以根據(jù)指令徑直向前,方向和移動(dòng)過(guò)程更為準(zhǔn)確。研究人員還發(fā)現(xiàn)在差異較大的環(huán)境中,預(yù)探索能顯示出的能力也就越強(qiáng),在實(shí)際使用中就會(huì)具有更強(qiáng)的適應(yīng)性和泛化性。
如果想要了解更多的實(shí)現(xiàn)細(xì)節(jié)和實(shí)驗(yàn)結(jié)果分析比較,請(qǐng)參看論文,其中不僅包含了充分的理論分析和模型的詳盡實(shí)現(xiàn)細(xì)節(jié),同時(shí)還涵蓋了完整的消融性分析結(jié)果。
關(guān)于我“門(mén)”
將門(mén)是一家以專(zhuān)注于發(fā)掘、加速及投資技術(shù)驅(qū)動(dòng)型創(chuàng)業(yè)公司的新型創(chuàng)投機(jī)構(gòu),旗下涵蓋將門(mén)創(chuàng)新服務(wù)、將門(mén)技術(shù)社群以及將門(mén)創(chuàng)投基金。將門(mén)成立于2015年底,創(chuàng)始團(tuán)隊(duì)由微軟創(chuàng)投在中國(guó)的創(chuàng)始團(tuán)隊(duì)原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。
將門(mén)創(chuàng)新服務(wù)專(zhuān)注于使創(chuàng)新的技術(shù)落地于真正的應(yīng)用場(chǎng)景,激活和實(shí)現(xiàn)全新的商業(yè)價(jià)值,服務(wù)于行業(yè)領(lǐng)先企業(yè)和技術(shù)創(chuàng)新型創(chuàng)業(yè)公司。
將門(mén)技術(shù)社群專(zhuān)注于幫助技術(shù)創(chuàng)新型的創(chuàng)業(yè)公司提供來(lái)自產(chǎn)、學(xué)、研、創(chuàng)領(lǐng)域的核心技術(shù)專(zhuān)家的技術(shù)分享和學(xué)習(xí)內(nèi)容,使創(chuàng)新成為持續(xù)的核心競(jìng)爭(zhēng)力。
將門(mén)創(chuàng)投基金專(zhuān)注于投資通過(guò)技術(shù)創(chuàng)新激活商業(yè)場(chǎng)景,實(shí)現(xiàn)商業(yè)價(jià)值的初創(chuàng)企業(yè),關(guān)注技術(shù)領(lǐng)域包括機(jī)器智能、物聯(lián)網(wǎng)、自然人機(jī)交互、企業(yè)計(jì)算。在近四年的時(shí)間里,將門(mén)創(chuàng)投基金已經(jīng)投資了包括量化派、碼隆科技、禾賽科技、寬拓科技、杉數(shù)科技、迪英加科技等數(shù)十家具有高成長(zhǎng)潛力的技術(shù)型創(chuàng)業(yè)公司。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
12月18日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
推薦專(zhuān)題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 6 特朗普要求英特爾首位華人 CEO 辭職
- 7 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 8 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線(xiàn)
- 9 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 10 騰訊米哈游押寶的中國(guó)AI應(yīng)用,正在海外悶聲發(fā)財(cái)