不只有理想小鵬,元戎啟行VLA輔助駕駛,也來(lái)了
作者 | 王凌方
編輯 | 邱鍇俊
一輛能對(duì)盲區(qū)風(fēng)險(xiǎn)識(shí)別、讀懂路標(biāo)、與你對(duì)話的汽車正駛?cè)氍F(xiàn)實(shí)。
2025年8月26日,元戎啟行發(fā)布全新一代輔助駕駛平臺(tái)——DeepRoute IO 2.0,該平臺(tái)搭載自研的VLA(Vision-Language-Action)模型。
VLA模型融合了視覺(jué)感知、自然語(yǔ)言理解和動(dòng)作決策能力,其將大語(yǔ)言模型的推理能力應(yīng)用于智能駕駛領(lǐng)域,增加了空間語(yǔ)義理解,形成了推理能力,提高了應(yīng)對(duì)復(fù)雜路況的能力。
在此次發(fā)布會(huì)上,元戎啟行同步展示VLA模型的4大功能:空間語(yǔ)義理解、異形障礙物識(shí)別、文字類引導(dǎo)牌理解、記憶語(yǔ)音控車,這些功能將根據(jù)實(shí)際部署節(jié)奏逐步釋放。
從元戎啟行此前客戶來(lái)看,這意味著長(zhǎng)城汽車、Smart等品牌可能也會(huì)很快迎來(lái)VLA輔助駕駛上車。
01
VLA模型的三重突破
在VLA模型出現(xiàn)之前,行業(yè)主流的基于CNN(卷積神經(jīng)網(wǎng)絡(luò))實(shí)現(xiàn)BEV(鳥瞰圖)的端到端系統(tǒng),長(zhǎng)期存在三大難以突破的瓶頸:盲區(qū)感知受限、缺乏邏輯推理能力、泛化能力不足。
對(duì)此,元戎啟行CEO周光在發(fā)布會(huì)上舉了一個(gè)例子:BEV(鳥瞰視角)架構(gòu)如同玩坦克大戰(zhàn),墻后的物體看不到就被認(rèn)為不存在,真實(shí)的視角更像CS(游戲《反恐精英》),人類司機(jī)能夠通過(guò)空間關(guān)系預(yù)判風(fēng)險(xiǎn)并謹(jǐn)慎通過(guò),這是CNN系統(tǒng)無(wú)法做到的。
相比CNN的端到端模型,VLA模型主要有以下幾個(gè)突破。
一是,思維鏈推理:算得比人類更準(zhǔn)。
VLA模型的核心優(yōu)勢(shì)在于其思維鏈(Chain of Thought, CoT)能力。它能夠進(jìn)行長(zhǎng)時(shí)序因果推理,將離散信息串聯(lián)分析,從而做出更擬人化的決策。
傳統(tǒng)端到端模型駕駛經(jīng)驗(yàn)單一,只能推理幾秒內(nèi)的路況;而VLA支持高級(jí)語(yǔ)義理解和長(zhǎng)時(shí)序推理,擅長(zhǎng)應(yīng)對(duì)復(fù)雜路況。
二是,海量知識(shí)庫(kù):自帶“駕駛百科全書”。
通過(guò)互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)蒸餾與訓(xùn)練,VLA模型積累了豐富的常識(shí)知識(shí)。
這種知識(shí)泛化能力是傳統(tǒng)系統(tǒng)無(wú)法企及的。傳統(tǒng)方案需要依賴地圖數(shù)據(jù)更新,至少需要一周時(shí)間處理新出現(xiàn)的交通標(biāo)識(shí),而VLA模型可以實(shí)時(shí)理解。
三是,多模態(tài)融合:視覺(jué)+語(yǔ)言+動(dòng)作的協(xié)同。
VLA模型首次實(shí)現(xiàn)了視覺(jué)感知、語(yǔ)言理解和動(dòng)作決策的深度融合。它不僅能“看見”道路,還能“讀懂”路標(biāo),“理解”指令,并做出合理決策。
這種融合讓系統(tǒng)能夠處理更加復(fù)雜的場(chǎng)景:識(shí)別盲區(qū)風(fēng)險(xiǎn)、理解文字引導(dǎo)牌、支持自然語(yǔ)音交互,能夠更好地適應(yīng)復(fù)雜多變的真實(shí)道路環(huán)境。
02
四大功能重新定義智能駕駛
發(fā)布會(huì)上,周光詳細(xì)介紹了VLA模型的四大核心功能,這些功能并非單純的技術(shù)展示,而是針對(duì)真實(shí)駕駛中的痛點(diǎn)場(chǎng)景設(shè)計(jì),將根據(jù)量產(chǎn)節(jié)奏逐步應(yīng)用。
空間語(yǔ)義理解:駕駛“透視眼”
空間語(yǔ)義理解是VLA模型的最大亮點(diǎn)。在公交車遮擋、復(fù)雜路口、橋洞等視野受限的場(chǎng)景中,VLA能夠感知潛在風(fēng)險(xiǎn),主動(dòng)對(duì)盲區(qū)進(jìn)行“預(yù)防性預(yù)判”。系統(tǒng)可在風(fēng)險(xiǎn)出現(xiàn)前提前減速、穩(wěn)妥通行,具備高度擬人化的防御性駕駛策略。
異形障礙物識(shí)別:駕駛“百事通”
系統(tǒng)能夠識(shí)別并靈活應(yīng)對(duì)各種非結(jié)構(gòu)化障礙物,不再僅提示“障礙物”,而是具體識(shí)別出物體類型,并采取相應(yīng)的避讓策略。
文字類引導(dǎo)牌理解:駕駛“翻譯官”
VLA模型能夠準(zhǔn)確解析潮汐車道、公交專用道等道路文字信息,減少誤判與違章,讓復(fù)雜路況通行如“開卷考試”般從容。
記憶語(yǔ)音控車:個(gè)性化交互體驗(yàn)
系統(tǒng)支持自然語(yǔ)言指令交互,并能夠?qū)W習(xí)用戶偏好,實(shí)現(xiàn)個(gè)性化駕駛體驗(yàn)。用戶可通過(guò)語(yǔ)音指令控制車輛,系統(tǒng)會(huì)優(yōu)先考慮安全,其次才是用戶指令與原定規(guī)劃。
03
商業(yè)化落地前景樂(lè)觀
技術(shù)突破的背后,是元戎啟行在商業(yè)化領(lǐng)域的堅(jiān)實(shí)積累。截至2025年8月,元戎啟行已實(shí)現(xiàn)近10萬(wàn)輛搭載城市領(lǐng)航輔助系統(tǒng)的車型交付,涵蓋SUV、MPV、越野車等多種品類,合作車型超過(guò)10款,進(jìn)入行業(yè)“10萬(wàn)級(jí)別交付”第一梯隊(duì)。
這些量產(chǎn)成果,為VLA模型的應(yīng)用奠定了基礎(chǔ),畢竟大模型也需要真實(shí)路況數(shù)據(jù)持續(xù)優(yōu)化,而10萬(wàn)輛車的行駛數(shù)據(jù),正是VLA改進(jìn)的重要支撐。
DeepRoute IO 2.0平臺(tái)作為VLA模型的載體,以“多模態(tài)+多芯片+多車型”為核心設(shè)計(jì)理念,可面向多種主流乘用車平臺(tái)開展定制化部署。
傳感器適配方面,該平臺(tái)可同時(shí)支持激光雷達(dá)和純視覺(jué)方案,用戶可根據(jù)車型定位進(jìn)行選擇,高端車型用激光雷達(dá)提升精度,中端車型靠純視覺(jué)控制成本。
車型覆蓋方面,周光認(rèn)為,VLA模型完全可適配15萬(wàn)元以上車型,10萬(wàn)元級(jí)車型通過(guò)算力優(yōu)化也有望搭載。
周光透露,2025年元戎已達(dá)成5個(gè)車型的VLA模型的定點(diǎn)合作。
不過(guò),VLA模型仍處于發(fā)展階段。周光表示,VLA目前還未完全實(shí)現(xiàn)思維鏈(COT),這是關(guān)鍵差距。長(zhǎng)遠(yuǎn)來(lái)看,語(yǔ)言和推理能力是實(shí)現(xiàn)完全無(wú)人化自動(dòng)駕駛的核心。比如遇到“左轉(zhuǎn)不受燈控”這種臨時(shí)標(biāo)識(shí),依賴地圖更新是不夠的,第一次遇到就需實(shí)時(shí)理解。VLA在這條路上任重道遠(yuǎn),需要更多技術(shù)沉淀。“特斯拉之所以投入十倍算力和參數(shù),正是因?yàn)镚PT架構(gòu)是明確方向,CNN無(wú)法支撐這種擴(kuò)展。”
除此之外,元戎啟行還有更為宏大的目標(biāo)。根據(jù)其Road AGI 戰(zhàn)略,VLA 模型不僅將應(yīng)用于乘用車,還將拓展至 Robotaxi 業(yè)務(wù),從道路場(chǎng)景拓展到小區(qū)、電梯、辦公室等室內(nèi)外環(huán)境,讓機(jī)器人擺脫遙控或巡線依賴,實(shí)現(xiàn)真正的自主移動(dòng)。
“我們將持續(xù)推動(dòng)RoadAGI業(yè)務(wù),實(shí)現(xiàn)“AGI for Robot”,最終打開物理世界的通用人工智能的大門。”周光最后說(shuō)道。
-END-
原文標(biāo)題 : 不只有理想小鵬,元戎啟行VLA輔助駕駛,也來(lái)了
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【在線研討會(huì)】普源精電--激光原理應(yīng)用與測(cè)試解決方案
-
精彩回顧立即查看>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
- 1 從技術(shù)狂歡到安全合規(guī) :2025上半年自動(dòng)駕駛?cè)谫Y進(jìn)入“場(chǎng)景閉環(huán)”新周期
- 2 飛行汽車:開啟規(guī)模化試飛
- 3 智駕技術(shù)戰(zhàn):特斯拉、華為、理想、小鵬和比亞迪,誰(shuí)才是未來(lái)?
- 4 最嚴(yán)輔助駕駛新規(guī),兩部門再劃監(jiān)管、宣傳紅線
- 5 百度蘿卜快跑:從北大嶼山到香港島:自動(dòng)駕駛在香港的 “三級(jí)跳” 啟示錄
- 6 奧迪A5L Sportback全新登場(chǎng),上市亮點(diǎn)探秘
- 7 道通科技,全球汽車診斷市場(chǎng)龍頭
- 8 自動(dòng)駕駛RoboTaxi“闖五關(guān)”:混合運(yùn)營(yíng)才能扛起商業(yè)化大旗?蘿卜快跑、小馬智行、文遠(yuǎn)知行、特斯拉、Waymo怎么選?
- 9 狂飆 836%!小馬智行與文遠(yuǎn)知行,自動(dòng)駕駛界的 “瑜亮之爭(zhēng)”,誰(shuí)能成為王者?
- 10 自動(dòng)駕駛專利大揭秘:中國(guó)憑啥占了全球超四成?百度公司3477件申請(qǐng)量霸氣登頂榜首