王興興:機(jī)器人最大的問題還是AI模型?大模型怎么不夠用了?
這些年,伴隨著人工智能和機(jī)器人的高速發(fā)展,AI驅(qū)動(dòng)已經(jīng)成為了大多數(shù)人的共識(shí),然而就最近知名機(jī)器人公司宇樹科技的創(chuàng)始人王興興卻表示當(dāng)前機(jī)器人最大的問題還是AI模型,這究竟是怎么回事?為啥如此蓬勃發(fā)展的大模型不夠用了?
一、王興興:機(jī)器人最大的問題還是AI模型?
據(jù)澎湃新聞的報(bào)道,在2025外灘大會(huì)圓桌討論環(huán)節(jié),宇樹科技創(chuàng)始人兼首席執(zhí)行官王興興表示,在機(jī)器人領(lǐng)域,硬件和大腦不是同一層面的事,現(xiàn)階段,機(jī)器人硬件完全足夠用,“用一兩年都可以”,最大的問題還是AI大模型本身能力不夠用,在多模態(tài)融合方面表現(xiàn)還不夠理想。
王興興表示,目前純語言模型或純視頻模型的效果已經(jīng)非常好,但如果要把語言和圖像很好地結(jié)合起來,仍是一個(gè)較大的難點(diǎn)。在機(jī)器人領(lǐng)域,現(xiàn)階段沒有很好的辦法把硬件用起來。比如如何用模型控制機(jī)器人靈巧手等,目前還存在一定挑戰(zhàn)。他表示,雖然AI在信息處理、文字圖像等領(lǐng)域,AI應(yīng)用的表現(xiàn)已經(jīng)非常好,但讓AI干活的領(lǐng)域還是荒漠,只是長了幾棵小草,爆發(fā)性增長的前夜還未到來。
“現(xiàn)在是對年輕人非常友好的時(shí)代,AI時(shí)代是一個(gè)非常公平的時(shí)代”,王興興認(rèn)為,年輕人可以用AI模型自己學(xué)編程等。他鼓勵(lì)大家可以對AI模型的認(rèn)知更激進(jìn)一些,可以不僅僅把AI僅僅當(dāng)作一個(gè)工具,還可以把它當(dāng)作一個(gè)全能型的工具,去重新學(xué)習(xí)和接受它,把它用得更好。
不過和王興興有類似看法的人其實(shí)并不少,網(wǎng)上曾經(jīng)流傳著一個(gè)段子“我想AI應(yīng)該是幫我做洗衣和洗碗的活兒,好讓我去玩藝術(shù)、搞創(chuàng)作;而不是AI去玩藝術(shù)搞創(chuàng)作讓我來做洗衣洗碗的活兒”。
二、大模型是怎么不夠用的?
隨著人工智能技術(shù)的迅猛發(fā)展,機(jī)器人已經(jīng)成為現(xiàn)代科技的重要組成部分。然而,盡管大模型的發(fā)展速度飛快,但其在實(shí)際應(yīng)用中的表現(xiàn)卻仍不盡如人意,尤其是在機(jī)器人賽道,這就是王興興表態(tài)的根源,我們該怎么看這件事呢?
首先,大模型雖發(fā)展迅猛,但大多仍處于發(fā)展的初級階段。近年來,大模型領(lǐng)域可謂是風(fēng)起云涌,眾多科技巨頭和科研團(tuán)隊(duì)紛紛投入大量資源進(jìn)行研發(fā)。從早期的簡單模型到如今參數(shù)規(guī)模龐大、功能日益復(fù)雜的大模型,其發(fā)展速度可謂令人嘆為觀止。然而,我們必須清醒地認(rèn)識(shí)到,目前大部分大模型依然停留在邏輯推理的層面。它們能夠根據(jù)輸入的信息進(jìn)行一定程度的邏輯分析和推理,輸出看似合理的結(jié)果。但這種邏輯推理更多是基于已有的數(shù)據(jù)和預(yù)設(shè)的規(guī)則,缺乏真正的理解和創(chuàng)新能力。
以自然語言處理領(lǐng)域的大模型為例,它們可以生成流暢的文本,回答各種問題,但在處理一些具有深度和復(fù)雜性的語義理解時(shí),往往會(huì)出現(xiàn)偏差。比如,對于一些隱晦的隱喻、雙關(guān)語或者文化背景相關(guān)的表達(dá),大模型可能無法準(zhǔn)確把握其真正含義?梢哉f,大模型在理解人類語言的豐富內(nèi)涵和微妙之處方面還有很長的路要走。而且,大模型目前的發(fā)展仍然處于初期階段,需要不斷地進(jìn)行訓(xùn)練和優(yōu)化。每一次的訓(xùn)練都需要海量的數(shù)據(jù)和強(qiáng)大的計(jì)算資源支持,這不僅成本高昂,而且訓(xùn)練過程也存在諸多不確定性。因此,從整體發(fā)展水平來看,大模型距離真正成熟還有很大的差距。
其次,機(jī)器人硬件雖然已經(jīng)滿足需要,但大模型思維方式與人類差異巨大。在機(jī)器人硬件方面,近年來取得了顯著的進(jìn)步。各種先進(jìn)的傳感器、執(zhí)行器和機(jī)械結(jié)構(gòu)使得機(jī)器人在感知環(huán)境、運(yùn)動(dòng)控制等方面具備了強(qiáng)大的能力。例如,一些工業(yè)機(jī)器人可以精確地完成復(fù)雜的裝配任務(wù),服務(wù)機(jī)器人能夠在室內(nèi)環(huán)境中自主導(dǎo)航、避障。然而,硬件的進(jìn)步并沒有完全轉(zhuǎn)化為機(jī)器人智能水平的提升,關(guān)鍵問題在于大模型的思維方式與人類思維存在較大差異。
人類在處理問題時(shí),往往能夠憑借直覺、經(jīng)驗(yàn)和創(chuàng)造力快速做出判斷和決策。一些看似簡單的事情,比如識(shí)別一個(gè)物體的用途、理解一個(gè)場景的氛圍,對于人類來說可能是本能反應(yīng)。但對于大模型來說,這些任務(wù)卻需要相當(dāng)長的一段時(shí)間來進(jìn)行訓(xùn)練。以圖像識(shí)別為例,雖然大模型在識(shí)別常見物體方面已經(jīng)取得了很高的準(zhǔn)確率,但對于一些不常見或者具有特殊含義的圖像,大模型可能需要大量的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練才能準(zhǔn)確識(shí)別。而且,大模型在處理問題時(shí)通常是基于統(tǒng)計(jì)規(guī)律和模式匹配,缺乏對事物本質(zhì)的理解。這種思維方式上的差異導(dǎo)致大模型在面對復(fù)雜多變的現(xiàn)實(shí)場景時(shí),往往表現(xiàn)出力不從心。
第三,大模型當(dāng)前僅能替代基礎(chǔ)工作,高難度任務(wù)面前力不從心。從當(dāng)前大模型的實(shí)際應(yīng)用來看,其能夠替代和勝任的依然是大量基礎(chǔ)性、重復(fù)性、規(guī)則明確的工作任務(wù)。例如,在客服領(lǐng)域,大模型可以高效處理標(biāo)準(zhǔn)化的問答;在內(nèi)容創(chuàng)作中,可以生成新聞稿、營銷文案等格式化文本;在工業(yè)自動(dòng)化中,可執(zhí)行預(yù)設(shè)程序的裝配與檢測。然而,一旦任務(wù)復(fù)雜度提升,涉及多步驟推理、跨領(lǐng)域知識(shí)整合或動(dòng)態(tài)環(huán)境適應(yīng),大模型的表現(xiàn)便迅速下降。
以家庭服務(wù)機(jī)器人為例,簡單的“播放音樂”“開關(guān)燈”等語音指令可以順利完成,但我們要知道我們?nèi)粘I钪械暮芏鄨鼍笆悄:,比如說:幫我找找昨天收到的快遞,可能放在門口的鞋柜或者沙發(fā)底下等地方,這對于機(jī)器人來說就難度巨大了,機(jī)器人不僅需要理解時(shí)間、物品、空間位置等多重信息,還需具備視覺搜索、物體識(shí)別、路徑規(guī)劃和交互反饋等綜合能力,這對當(dāng)前的大模型而言仍是巨大挑戰(zhàn)。因此,我們?nèi)匀恍枰溃竽P湍壳叭蕴幱?ldquo;工具化”階段,而非“智能體”階段,其能力邊界清晰,難以應(yīng)對真實(shí)世界中普遍存在的模糊性與不確定性。
第四,具身智能離構(gòu)建符合實(shí)際工作需求的大腦還有很長的一段路。具身智能作為人工智能的一個(gè)重要分支,旨在賦予機(jī)器人身體感知和行動(dòng)的能力,使其能夠在真實(shí)環(huán)境中自主完成任務(wù)。如今,越來越多的工具化機(jī)器人涌入市場,它們可以在特定場景下完成特定的操作,比如搬運(yùn)貨物、清掃地面等。
但要實(shí)現(xiàn)真正像人一樣工作的機(jī)器人仍然面臨巨大困難。以做家務(wù)為例,一個(gè)合格的家庭主婦不僅要知道如何打掃房間、洗衣服做飯,還要懂得根據(jù)家庭成員的習(xí)慣和喜好來安排日常事務(wù),甚至在遇到突發(fā)情況時(shí)能夠迅速做出反應(yīng)。這對于機(jī)器人的大模型提出了極高的要求,它需要具備全面的生活常識(shí)、情感理解和社交溝通能力。
目前,雖然有些機(jī)器人已經(jīng)學(xué)會(huì)了扭秧歌這樣的表演性動(dòng)作,但這距離真正意義上的家務(wù)勞動(dòng)和助理角色還有很長的路要走。要讓機(jī)器人真正融入人類生活,成為得力的幫手,就需要為其打造一個(gè)高度發(fā)達(dá)且符合實(shí)際工作需要的“大腦”,而這無疑需要大量的大模型訓(xùn)練和實(shí)踐積累。
第五,人工智能的未來到底該向何處去?對于大模型的發(fā)展來說,目前簡單低質(zhì)量地卷參數(shù)已經(jīng)意義不大。隨著模型參數(shù)規(guī)模的不斷擴(kuò)大,雖然在一定程度上提升了模型的性能,但也帶來了諸多問題,如訓(xùn)練成本高昂、模型推理速度慢、可解釋性差等。而且,單純追求參數(shù)規(guī)模的擴(kuò)大并不能從根本上解決大模型在具身智能應(yīng)用中面臨的難題。
大模型們進(jìn)化升級最該考慮的事情是如何能夠真正幫助具身智能的落地。這需要從多個(gè)方面進(jìn)行努力。一方面,要優(yōu)化大模型的訓(xùn)練方法和算法,提高模型的訓(xùn)練效率和質(zhì)量,使模型能夠在更少的數(shù)據(jù)和計(jì)算資源下獲得更好的性能。另一方面,要加強(qiáng)大模型與機(jī)器人硬件的深度融合,實(shí)現(xiàn)軟硬件的協(xié)同優(yōu)化。通過將機(jī)器人的傳感器數(shù)據(jù)實(shí)時(shí)反饋給大模型,使大模型能夠更好地感知環(huán)境、理解任務(wù),從而做出更準(zhǔn)確的決策和行動(dòng)。
因此,王興興所提出的問題答案無疑是肯定的,而大模型的“不夠用”,并非數(shù)量不足,而是智能深度與實(shí)用性尚待質(zhì)的飛躍,這才是大模型該做的事情。
原文標(biāo)題 : 王興興:機(jī)器人最大的問題還是AI模型?大模型怎么不夠用了?

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬億刺激”計(jì)劃來了
- 6 2025年8月人工智能投融資觀察
- 7 8 a16z最新AI百強(qiáng)榜:硅谷頂級VC帶你讀懂全球生成式AI賽道最新趨勢
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬套HSD上車