訂閱
糾錯
加入自媒體

2026大模型賽道新年啟示:在20%的勝率下,笨笨地堅持

2026-01-13 09:39
正見TrueView
關注

當唐杰、楊植麟、林俊旸、姚順雨這四個名字,罕見地同時出現(xiàn)在一張圓桌上時,哪怕不聽內容,這個畫面本身就已經是中國AGI歷史的關鍵一幀。

1月10日AGI-Next前沿峰會活動現(xiàn)場  圖源:微博AI

四人中一個是剛登陸港股的智譜創(chuàng)始人,一個是率領Kimi狂奔的90后少壯派,一個是阿里通義背后的開源操盤手,一個是剛從OpenAI歸國加盟騰訊的首席科學家。繼六小虎之后,大家又為中國大模型新貴們起了一個新的Title,媒體稱他們?yōu)椤富K慕堋埂?/p>

但在這場2026年開年會議上,空氣中彌漫的不是商業(yè)互吹的虛情,而是一種“后DeepSeek時代”的冷靜清醒。

Q:“三到五年后全球最領先的AI公司是中國公司的概率有多大?”

A:“20%”。

從這幾位中國AI領域的頂尖從業(yè)者的對話中,可以清晰感受到中美在算力上存在的鴻溝,而這僅僅是表象。更深層的差距在于資源分配的邏輯與研發(fā)的文化。

在美國,充沛的算力被允許用于探索無人區(qū),甚至進行浪費式的試錯,OpenAI們可以押注一個長期可能沒有確定回報的技術路線。而在中國,絕大多數(shù)團隊的算力資源首先需要確,F(xiàn)有業(yè)務的存活與交付。

這種捉襟見肘的狀態(tài),迫使中國的AI研發(fā)走上了一條迥異的道路,我們必須極度務實,“在螺絲殼里做道場”的工程藝術練到極致,追求在確定性路徑上的快速跟進與極致優(yōu)化,并磨煉出在嚴苛資源限制下進行算法與基礎設施聯(lián)合優(yōu)化的生存技能。

此外,圓桌清晰地揭示了行業(yè)正在發(fā)生的結構性分化。

智譜AI創(chuàng)始人兼首席科學家唐杰斷言,以對話(Chat)為核心形態(tài)的競爭,隨著DeepSeek的出現(xiàn)已基本告一段落。未來的戰(zhàn)場將沿著兩條岔路展開,在面向普通消費者(To C)的一端,模型本身智商分數(shù)的邊際提升已難以被用戶感知,競爭的關鍵轉向了對用戶上下文(Context)的理解與個性化服務能力,即所謂的“情商”。而在面向企業(yè)(To B)的生產力場景,情況則截然不同。

正如前OpenAI研究員、現(xiàn)任騰訊CEO辦公室首席科學家姚順雨所指出的,企業(yè)愿意為能將任務準確率從60%提升到90%的模型支付數(shù)倍的溢價,代碼(Coding)能力因直接兌換為生產效率,已成為價值制高點,這也解釋了為何智譜等公司選擇將重注押注于此。

面對這樣的格局,中國AI的進化路線在2026年呈現(xiàn)出高度務實的技術圖景。“2026年范式的改變一定會發(fā)生,我們也在努力,希望這個變化發(fā)生在我們身上。”

Scaling Law并未被拋棄,但單純的數(shù)據(jù)和算力堆砌,邊際效益正在銳減,真正的進步來自架構、優(yōu)化器和數(shù)據(jù)層面的系統(tǒng)性創(chuàng)新,目的是為了讓模型擁有更好的“Taste”。如月之暗面楊植麟所研究的MUON優(yōu)化器、kimi Linear架構等創(chuàng)新,來追求更高的Token效率與更優(yōu)的長上下文性能。

在備受關注的智能體(Agent)領域,一個共識是解決長尾復雜任務的根本能力,仍深植于模型層本身。“解決它需要回到模型層,燒卡訓練。”因此模型公司正在不可避免地變成產品公司,千問、智譜、kimi,都在將模型能力直接封裝為可用的Agent服務。

當模型本身就是解決問題的最佳路徑時,中間層就失去了存在價值。這意味著缺乏訓練能力的純應用層“套殼”創(chuàng)業(yè)將面臨天花板,真正的機會在于巨頭無暇顧及的垂直細分與行業(yè)縱深,那些巨頭看不上的細分場景、行業(yè)特有的復雜流程、需要深厚領域知識才能解決的問題。

而對于“自主學習”這一前沿愿景,幾人普遍持審慎態(tài)度,認為其更多是漸變而非突變,且必須優(yōu)先解決安全性與可控性的根本矛盾。

記憶系統(tǒng)是另一個共識方向。唐杰認為,人的記憶系統(tǒng)有短期記憶、工作記憶、長期記憶甚至社會記憶多個層次,而大模型在這方面還有很大提升空間。

最終,圓桌回歸到那個最初的數(shù)字,20%。這20%的勝率是建立在一種深刻的戰(zhàn)略清醒之上,它意味著放棄不切實際的彎道超車幻想,轉而尋求在硬件限制下的極致工程實現(xiàn)、在特定市場中的垂直場景深耕,以及如唐杰所言的“笨笨的堅持”——“永遠不要想著環(huán)境是最好的,我們恰恰是幸運的。”“如果我們笨笨地堅持,也許走到最后的就是我們。”

中國AI創(chuàng)業(yè)者的發(fā)展之路大抵如此。

大模型賽道的下一程,將不再是追求宏大的“登月時刻”,而是一場考驗耐力、專注與務實創(chuàng)造力的漫長跋涉。

牌局已然明朗,勝率或許不高,但真正的參與者明白,只要留在牌桌上,就有將一手普通牌打到極致的可能。

以下為編輯整理后的AGI-Next圓桌對話內容,因速記原文超萬字,整理內容進行了較大幅度刪改:

圖源:微博AI

01

模型分化

To C與To B、垂直整合與分層發(fā)展的路徑差異

李廣密:硅谷企業(yè)呈現(xiàn)明顯分化,比如Anthropic聚焦Coding,Google Gemini深耕全模態(tài),OpenAI側重To C。中國模型在開源領域表現(xiàn)突出,各位如何看待模型分化的趨勢?

姚順雨:我有兩個大的感受。其一,To C與To B的分化愈發(fā)清晰。To C場景中,ChatGPT、豆包等產品的用戶體驗提升已不明顯,多數(shù)用戶僅將其作為搜索引擎加強版,對高階智能需求有限;而To B領域,智能水平直接掛鉤生產力與商業(yè)價值,用戶愿為頂尖模型支付溢價,年薪20萬美元的從業(yè)者,更傾向選擇200美元/月、能精準完成八九個任務的強模型,而非50美元/月、僅能完成五六個任務的弱模型,強弱勢模型的差距會持續(xù)拉大。

其二,垂直整合與分層發(fā)展的分化。To C領域,模型與產品需強耦合迭代,垂直整合模式依然有效;但To B領域,模型公司應專注提升模型能力,應用公司則聚焦利用強模型賦能生產力環(huán)節(jié),兩者各司其職更高效。

騰訊作為To C基因濃厚的企業(yè),會重點通過補充上下文與環(huán)境信息,讓模型更好滿足用戶個性化需求,比如結合微信聊天記錄優(yōu)化“今日吃什么”這類問題的回答;To B方面,將先服務內部場景,借助10萬員工的真實場景數(shù)據(jù),突破標注商的數(shù)據(jù)局限。

林俊旸:分化是自然發(fā)生的,公司并無絕對的To B或To C基因,核心是服務真實人類需求。Anthropic的成功并非只因Coding能力強,而是通過高頻對接企業(yè)客戶發(fā)現(xiàn)了真實需求。

美國API消耗量中Coding占絕對主導,但中國目前尚未出現(xiàn)這一現(xiàn)象。千問更相信AGI應順其自然發(fā)展,To C產品可能進一步分化到醫(yī)療、法律等垂直領域,To B則需依托模型能力與客戶需求的精準匹配創(chuàng)造價值。

楊強:工業(yè)界與學術界的分化也值得關注。當前工業(yè)界在大模型領域領跑,學術界多跟風實踐,但當大模型進入穩(wěn)態(tài)后,學術界需承接工業(yè)界尚未解決的核心問題,比如智能上限的界定、資源在訓練與推理中的分配平衡、記憶與推理的協(xié)同閾值等。

像哥德爾不完備定理揭示的模型幻覺問題,就需要數(shù)學界、算法界與工業(yè)界聯(lián)合探索“資源投入與幻覺降低的平衡點”,這類理論突破將孕育新的計算模式。

唐杰:Chat范式的競爭自DeepSeek出現(xiàn)后已基本結束,后DeepSeek時代,智譜押注了Coding與推理的結合,GLM-4.5就是這一方向的成果。2023年多家大模型集中上線但用戶有限,核心原因是未真正解決問題。如今分化的關鍵是企業(yè)需依托自身資源稟賦,在通用能力之外打造獨特優(yōu)勢,而非盲目跟風。

02

新范式探索

自主學習的漸變式演進與衡量標準革新

李廣密:預訓練、強化學習的收益已逐漸見頂,硅谷聚焦自主學習這一新范式。OpenAI推動了Transformer和RL(強化學習)兩大范式,姚順雨曾任職OpenAI,如何看待下一代范式的走向?

姚順雨:自主學習是硅谷的共識,但存在兩大關鍵認知。其一,自主學習不是單一方法論,而是依附于具體數(shù)據(jù)與任務,聊天個性化、代碼適配企業(yè)環(huán)境、科學領域探索等,每種場景的挑戰(zhàn)與方法均不同;其二,自主學習已在發(fā)生,只是呈漸變式發(fā)展,比如ChatGPT通過用戶數(shù)據(jù)優(yōu)化聊天風格,Claude自行編寫95%的項目代碼。

2025年已出現(xiàn)明確信號,Cursor每幾小時就用最新用戶數(shù)據(jù)迭代,新模型也在引入真實環(huán)境數(shù)據(jù)訓練,只是受限于預訓練能力,效果尚未超越OpenAI。

當前最大挑戰(zhàn)是想象力,我們需先明確自主學習的落地形態(tài),比如是能賺錢的交易系統(tǒng),還是解決人類未解的科學問題,才能針對性突破。全球范圍內,OpenAI仍最有可能誕生新范式,盡管其創(chuàng)新基因因商業(yè)化有所削弱。

林俊旸:RL范式仍處于早期,算力投入未充分釋放潛力,Infra層面仍有諸多問題待解。下一代范式的核心方向,一是自主進化,需探索測試時擴展(Test-time scaling)的可能性,比如通過輸出更多Token提升能力,O 系列模型已初步驗證這一思路;二是AI的主動性,未來模型應能通過環(huán)境觸發(fā)自主思考,而非依賴人類指令,但需同步解決安全風險,避免AI做出危害行為。

自主學習可能先在用戶理解與個性化場景落地,但目前缺乏明確的衡量指標,技術層面的核心挑戰(zhàn)是如何設計有效的評估體系。記憶技術的突破也是線性發(fā)展的過程,當前模型僅能機械記憶過往信息,要達到類似人類的理解與共情,仍需約一年時間,未來算法與Infra的深度結合將釋放更大潛力。

楊強:聯(lián)邦學習的協(xié)作理念可支撐自主學習的落地。通用大模型與本地領域小模型的去中心化協(xié)作,既能保護數(shù)據(jù)隱私,又能充分發(fā)揮通用模型的能力,這種模式在醫(yī)療、金融等對隱私敏感的場景中極具價值。開源模式將加速這一進程,知識、代碼與模型的開源共享,能降低協(xié)作門檻,推動跨機構的技術創(chuàng)新。

唐杰:2026年大概率會迎來范式革新,持續(xù)學習、記憶、多模態(tài)均有突破可能。核心驅動因素有二:一是學術界與工業(yè)界的差距縮小,如今高校已具備一定算力,開始涉足模型架構、持續(xù)學習等前沿研究,創(chuàng)新種子已萌芽;二是效率瓶頸倒逼變革,當前大模型投入巨大但收益遞減,100TB數(shù)據(jù)的Scaling成本高達10億-20億,但收益有限,需建立“智能效率(Intelligence Efficiency)”標準,衡量投入與智力收益的ROI,通過創(chuàng)新范式實現(xiàn)“以更少投入獲得同等智能提升”。

03

Agent戰(zhàn)略

2026年能否實現(xiàn)“自動化一周工作”的突破?

李廣密:市場預期2026年Agent能自動化人類1-2周的工作量,而非僅作為工具。硅谷企業(yè)多采用“模型+Agent”端到端模式,各位如何看待Agent的發(fā)展前景與生態(tài)格局?

姚順雨:To B領域的生產力Agent正處于上升曲線,其價值與模型智能高度協(xié)同,模型越強,解決的任務越多,商業(yè)收益越高。

當前兩大瓶頸需突破:一是環(huán)境部署,即使模型不再迭代,將現(xiàn)有模型落地到各類企業(yè),也能帶來10-100倍的收益,對GDP產生5%-10%的影響,但目前實際影響尚不足1%;二是用戶教育,人與人的差距本質是工具使用能力的差距,中國應加強AI工具使用培訓,讓更多人掌握Kimi、智譜等國產模型的應用方法。To C領域的Agent則需平衡模型智能與產品指標,兩者并非完全正相關,需找到精準的價值切入點。

林俊旸:Agent的未來形態(tài)是“托管式”,需具備自主進化與任務決策能力,這要求模型與產品一體化,“模型即產品”是核心邏輯。當前Agent的交互環(huán)境局限于電腦,未來需與具身智能結合,實現(xiàn)與真實物理世界的交互,比如指揮機器人完成制藥實驗,才能真正承擔長時間、復雜任務。

通用Agent的核心機會在長尾問題,頭部需求易被模型公司通過算力+數(shù)據(jù)快速解決,但創(chuàng)業(yè)者若能在“套殼”體驗或垂直場景適配方面超越模型公司,仍有突圍可能。

RL(強化學習)技術的成熟讓問題修復更高效,即使是少量未標注數(shù)據(jù),通過合理設計獎勵函數(shù)也能快速優(yōu)化模型,這為Agent的迭代提供了便利。

楊強:Agent的發(fā)展可分為四個階段,當前仍處于初級階段,目標與規(guī)劃均由人類定義,本質是高級Prompt工具。未來,大模型將通過觀察人類工作過程,自主定義目標與規(guī)劃,成為內生性系統(tǒng)。這一過程中,通用大模型與本地小模型的協(xié)作將發(fā)揮重要作用,既能保障數(shù)據(jù)隱私,又能提升Agent對特定場景的適配能力。

唐杰:Agent的核心價值取決于三個因素:一是解決問題的價值密度,早期很多Agent因功能簡單被Prompt替代,只有真正解決高價值問題才能存活;二是成本控制,若調用API即可解決問題,Agent的必要性將大打折扣,需平衡開發(fā)成本與應用價值;三是迭代速度,需在半年時間窗內快速滿足用戶需求并持續(xù)迭代。智譜當前在Coding領域的Agent調用量表現(xiàn)良好,未來將持續(xù)聚焦高價值場景,推動Agent從工具向“自動化任務執(zhí)行者”升級。

04

中國AGI的全球競爭力

3-5年成為全球領先者的概率與關鍵條件

李廣密:未來3-5年,中國AI企業(yè)成為全球領先者的概率有多大?需要突破哪些關鍵條件?

姚順雨:概率較高,我持樂觀態(tài)度。中國在技術復現(xiàn)、工程落地、產業(yè)配套等方面優(yōu)勢顯著,制造業(yè)、電動車等領域的發(fā)展已證明,中國企業(yè)能在已知賽道快速追趕并實現(xiàn)局部超越。

關鍵需突破三大條件:一是算力瓶頸,解決光刻機、軟件生態(tài)等核心環(huán)節(jié)的產能問題,依托電力與基礎設施優(yōu)勢構建算力保障;二是To B市場培育,提升國內企業(yè)的支付意愿,同時支持企業(yè)出海參與國際競爭;三是創(chuàng)新文化培育,當前中國人才更傾向于做確定性的事情,缺乏突破新范式的冒險精神,需通過經濟環(huán)境、商業(yè)氛圍的優(yōu)化,鼓勵更多人投身前沿探索,這是中國能否從跟跑轉向領跑的核心。

林俊旸:概率約20%,這已是較為樂觀的判斷。中美差距主要體現(xiàn)在:一是算力投入結構,美國企業(yè)將大量算力用于下一代研究,而中國企業(yè)的算力多被交付需求占據(jù);二是冒險文化積淀,美國人在電動車等新興領域的冒險精神,是中國當前缺乏的,但00后團隊的冒險意識已在提升;三是軟硬結合的協(xié)同,2021年阿里芯片團隊與大模型團隊因溝通壁壘錯失協(xié)同機會,未來需推動模型與芯片的聯(lián)合研發(fā)。

無需恐懼算力差距,核心是堅守為人類社會創(chuàng)造價值的初心,即使模型不是最強,只要能解決實際問題,就具備競爭力。

楊強:參考互聯(lián)網發(fā)展路徑,中國AI企業(yè)有望實現(xiàn)彎道超車。AI是技術底座,中國在產品落地與場景創(chuàng)新方面具備優(yōu)勢,To C領域將呈現(xiàn)百花齊放的態(tài)勢,微信等產品的成功已證明中國企業(yè)的場景運營能力;To B領域雖受支付意愿、企業(yè)文化等因素限制,但Palantir的“本體遷移學習”模式提供了借鑒,通過工程化方法將通用解決方案適配具體企業(yè)場景,中國AI原生企業(yè)有望發(fā)展出類似的To B解決方案,快速縮小差距。

唐杰:中美企業(yè)界AI Lab仍存在差距,但中國的機會在年輕一代與環(huán)境優(yōu)化。90后、00后創(chuàng)業(yè)者敢于冒險,俊旸、姚順雨等均在聚焦前沿探索;國家層面進一步優(yōu)化營商環(huán)境,減少大企業(yè)與小企業(yè)的競爭壁壘,讓創(chuàng)新者有更多時間與資源投入研發(fā);個人層面,需堅持長期主義,在環(huán)境逐步改善的過程中持續(xù)深耕。

環(huán)境肯定不會是最好的,永遠不要想著環(huán)境是最好的,我們恰恰是幸運的,經歷了環(huán)境從原來沒那么好,到慢慢變得更好的時代,我們是經歷者,也許就是財富、收獲最多的人。如果我們笨笨地堅持,也許走到最后的就是我們。

李廣密:期待未來能有更多資源投入中國AGI行業(yè),讓年輕研究員有充足算力支撐探索,培育出中國自己的頂尖AI人才,推動行業(yè)實現(xiàn)從跟跑到領跑的跨越。感謝各位嘉賓的分享!

       原文標題 : 2026大模型賽道新年啟示:在20%的勝率下,笨笨地堅持

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號