訂閱
糾錯(cuò)
加入自媒體

“明牌”對(duì)局,自變量開(kāi)源模型超越pi0

2026-01-12 10:26
腦極體
關(guān)注

圖片

近日,全球首個(gè)大規(guī)模多任務(wù)的真機(jī)基準(zhǔn)測(cè)試平臺(tái)RoboChallenge榜單更新,前三名依次為pi0.5、WALL-OSS和pi0。

科普時(shí)間到,pi0.5、pi0是出自美國(guó)公司 Physical Intelliqence的操作大模型,WALL-OSS是出自中國(guó)自變量機(jī)器人的全自研開(kāi)源操作大模型,不僅能完成操作,而且能同時(shí)生成復(fù)雜推理過(guò)程。

這一結(jié)果釋放出強(qiáng)烈的信號(hào)。很長(zhǎng)一段時(shí)間內(nèi),中國(guó)具身智能產(chǎn)業(yè)陷入“大腦缺位”的爭(zhēng)議:我們有較強(qiáng)的本體結(jié)構(gòu)設(shè)計(jì)和運(yùn)控算法,但很難讓機(jī)器人真正“用腦思考”,自主與物理世界交互,進(jìn)而帶來(lái)創(chuàng)造生產(chǎn)力的可能。但現(xiàn)在,中國(guó)具身智能模型已經(jīng)與海外頂級(jí)模型同臺(tái)共舞。

更有意思的是,自變量和pi高度默契地選擇將模型開(kāi)源?此婆既坏膽(zhàn)略趨同,實(shí)則是具身智能產(chǎn)業(yè)發(fā)展到關(guān)鍵階段的必然選擇。

圖片

在RoboChallenge的最新測(cè)試中,自變量WALL-OSS展現(xiàn)了極強(qiáng)的競(jìng)技狀態(tài),總分位居第二,超越了明星模型pi0。在疊洗碗巾、按按鈕、澆盆栽等多個(gè)任務(wù)中,WALL-OSS的得分摘得桂冠,排名第一。

圖片

先來(lái)劃個(gè)重點(diǎn)。

RoboChallenge的測(cè)試或許更像是一場(chǎng)“開(kāi)卷考試”,因?yàn)閿?shù)十個(gè)桌面任務(wù)與場(chǎng)景都是預(yù)知的。這就相當(dāng)于提前布置考題。

而WALL-OSS作為開(kāi)源模型,某種程度上相當(dāng)于明牌上場(chǎng),其每一步操作都真實(shí)可見(jiàn)為模型驅(qū)動(dòng),更多的意義在于給出解題思路,“進(jìn)一步展示模型的真實(shí)性能”。

與用閉源模型參與測(cè)評(píng)的“黑箱”,不知任務(wù)究竟如何完成不同,WALL-OSS作為開(kāi)源模型,其一舉一動(dòng)相當(dāng)于“明牌”炸場(chǎng),換句話說(shuō)其核心能力均可通過(guò)公開(kāi)的代碼和參數(shù)得到完整解釋和復(fù)現(xiàn),其在榜單上的成績(jī)完全是模型真實(shí)能力的直接體現(xiàn),是無(wú)法摻水,難以被“操作”的硬核實(shí)力證明。

從技術(shù)細(xì)節(jié)來(lái)看,WALL-OSS取得優(yōu)異成績(jī)的核心在于對(duì)“端到端”架構(gòu)的深度重構(gòu):

圖片

它依托創(chuàng)新的混合專(zhuān)家(MoE)架構(gòu)及“共享注意力+專(zhuān)家分流”設(shè)計(jì),有效解決了視覺(jué)語(yǔ)言模型向具身模型遷移時(shí)的“災(zāi)難性遺忘”與“模態(tài)解耦”難題;

通過(guò)“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式,消除了“認(rèn)知與動(dòng)作脫節(jié)”的痛點(diǎn),使模型能精準(zhǔn)掌控如澆盆栽時(shí)的動(dòng)作力度;

此外,其內(nèi)化的跨層級(jí)思維鏈推理能力,實(shí)現(xiàn)了高層決策與底層執(zhí)行的無(wú)縫切換,使其在面對(duì)各類(lèi)突發(fā)狀況時(shí),仍能精準(zhǔn)控制關(guān)節(jié)完成復(fù)雜任務(wù)。

有個(gè)小插曲,WALL-OSS去年9月開(kāi)源,與Physical Intelligence開(kāi)源pi0.5相錯(cuò)一天,這也側(cè)面說(shuō)明了自變量的技術(shù)步調(diào)一直與國(guó)際頭部具身大腦公司同頻。而今天自變量與Physical Intelligence的模型又在榜單前排聚首,更說(shuō)明自變量已經(jīng)站穩(wěn)了全球第一梯隊(duì)。

圖片

開(kāi)源之所以重要,在于生態(tài)建設(shè),其價(jià)值最終體現(xiàn)在生態(tài)的繁榮之上。

自變量認(rèn)為,在具身智能這一軟硬件深度耦合的前沿領(lǐng)域,構(gòu)建一個(gè)高質(zhì)量的開(kāi)源基礎(chǔ)模型底座,是加速整個(gè)行業(yè)生態(tài)繁榮的堅(jiān)實(shí)“地基”,也是實(shí)現(xiàn)機(jī)器人在物理世界大規(guī)模、穩(wěn)定交互的關(guān)鍵。

當(dāng)前,機(jī)器人模型的驗(yàn)證鏈路冗長(zhǎng),行業(yè)里專(zhuān)用小模型、通用大模型質(zhì)量參差不齊,基礎(chǔ)模型、專(zhuān)用模型、微調(diào)模型混雜,且缺乏統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。開(kāi)源是撥開(kāi)迷霧、推動(dòng)行業(yè)標(biāo)準(zhǔn)化和成熟化的必由之路。

在《硅谷101播客》中,自變量聯(lián)合創(chuàng)始人兼CTO王昊曾說(shuō):“我一直都覺(jué)得開(kāi)源是非常重要的事情,開(kāi)源意味著我們可以站在巨人的肩膀上繼續(xù)前進(jìn)。我們可以基于已有成果做更多的改進(jìn),社區(qū)開(kāi)發(fā)者的反饋也會(huì)幫助到開(kāi)源的公司,開(kāi)源公司可以從中吸取到經(jīng)驗(yàn),然后把這個(gè)技術(shù)路線思考得更加深入。”

圖片

自變量開(kāi)源的WALL-OSS正是秉承這種“提供肩膀”的開(kāi)源理念,所以他們選擇更為徹底的開(kāi)放:不僅開(kāi)放了預(yù)訓(xùn)練模型權(quán)重、完整訓(xùn)練代碼和數(shù)據(jù)集接口,甚至還提供了詳盡的部署文檔。

除了構(gòu)建行業(yè)繁榮生態(tài)之外,“站在巨人肩膀上”還在于避免行業(yè)陷入重復(fù)性研發(fā)的低效困境——無(wú)需每個(gè)企業(yè)、每個(gè)研究者都從零開(kāi)始“一手手自建高樓”,而是可以基于開(kāi)源的基礎(chǔ)模型快速迭代創(chuàng)新,將更多精力投入到差異化技術(shù)研發(fā)與場(chǎng)景化應(yīng)用落地中,大幅提升整個(gè)行業(yè)的創(chuàng)新效率。

黃仁勛也曾直白說(shuō)過(guò),“開(kāi)源如此重要的原因,在于沒(méi)有開(kāi)源初創(chuàng)企業(yè)不能蓬勃發(fā)展,大學(xué)研究人員不能做研究,科學(xué)家不能使用人工智能;旧,你的經(jīng)濟(jì)沒(méi)有能力從根本上提升自己”。這不僅適用于AI,對(duì)于具身智能和任何技術(shù)來(lái)說(shuō)都是如此。

圖片

事實(shí)上,技術(shù)革命的背后就是一場(chǎng)技術(shù)大規(guī)模應(yīng)用并改變生產(chǎn)方式的過(guò)程。如果沒(méi)有應(yīng)用也就把技術(shù)困厄于象牙塔,無(wú)法激起漣漪。

如自變量所說(shuō)“擁抱開(kāi)源,以透明對(duì)抗虛假,以協(xié)作代替閉門(mén)造車(chē)”,具身行業(yè)這條厚雪長(zhǎng)坡上,需要的是明燈而非迷霧,眾人拾柴而非孤芳自賞。而開(kāi)源,正是那盞能夠照亮前路、匯聚眾力的燈。

圖片

       原文標(biāo)題 : “明牌”對(duì)局,自變量開(kāi)源模型超越pi0

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)