訂閱
糾錯(cuò)
加入自媒體

硅谷程序員,瘋狂“投喂”中國大模型

2026-03-08 09:50
市值榜
關(guān)注

圖片

作者:賈樂樂 ,編輯:趙元

一組來自全球最大AI模型API聚合平臺(tái)OpenRouter的數(shù)據(jù),在國內(nèi)外都引發(fā)了強(qiáng)烈震動(dòng)。

截至2026年2月28日,該平臺(tái)內(nèi)前十模型總Token消耗量已突破28.7萬億,其中,國產(chǎn)模型貢獻(xiàn)超過14.69萬億,為歷史上首次單月Token調(diào)用占比過半,且超越了美國模型。

從周維度看,2月16日至2 2日, 中國模型周調(diào)用量達(dá)5.16萬億Token,而同期美國模型跌至2.7萬億,中國模型全球占比達(dá)61%。調(diào)用量排名前五的模型中,中國占據(jù)四席——MiniMax M2.5、月之暗面 Kimi K2.5、DeepSeek V3.2和智譜GLM-5。

盡管接下來的一周,中國模型調(diào)用量下降,反超的時(shí)間很短暫,但能在全球最大的API聚合平臺(tái)上與美國模型正面交鋒并短暫領(lǐng)先,本身已是實(shí)力的證明。

此外,OpenRouter平臺(tái)的用戶中,美國開發(fā)者占比高達(dá)47.17%,而中國開發(fā)者僅占6.01%。也有報(bào)告顯示,80%的美國人工智能初創(chuàng)公司在其產(chǎn)品開發(fā)過程中使用了中國的開源模型。

這意味著,推動(dòng)中國模型登頂?shù)闹髁,是那些來自硅谷、來自歐洲的海外開發(fā)者,而非國內(nèi)市場的自嗨。

這是因?yàn)榇竽P蛷?ldquo;誰更聰明”的單維比拼,進(jìn)入到了“誰聰明”“誰省錢”的多維比拼階段。

一、真香定律:美國開發(fā)者愛上中國Token

中國AI模型能夠在全球調(diào)用量上實(shí)現(xiàn)對美國的超越,背后是多重因素疊加形成的系統(tǒng)性優(yōu)勢,而其中直接的驅(qū)動(dòng)力是,便宜。

先看一組數(shù)字。

長江證券的研報(bào)顯示,在輸入價(jià)格上,MiniMax M2.5和智譜GLM-5都是0.3美元/百萬Token,而Anthropic的Claude Opus 4.6是5美元,是中國模型的16.7倍。

輸出端更夸張,MiniMax-M2.5 價(jià)格為1.1 美元/百萬Token,智譜GLM-5 為2.55 美元/百萬Token,Claude Opus4.6 則為25 美元/百萬Token,分別是前兩者的約22.7 倍和9.8 倍。2月底剛出的阿里Qwen 3.5,直接把百萬Token價(jià)格打到0.8元人民幣,相當(dāng)于谷歌Gemini的十八分之一。

而在大量日常場景里,尤其是伴隨著Agent時(shí)代的到來,用戶對量大便宜算力的需求,壓過了對“頂級(jí)智商”的需求。

今年2月,開源框架OpenClaw火了,AI從“聊天工具”變成了能自己干活兒的“數(shù)字員工”。

一個(gè)Agent任務(wù)動(dòng)輒消耗幾十萬上百萬Token,按量付費(fèi)的API成本瞬間成了開發(fā)者的大頭開支。月之暗面順勢推出KimiClaw,支持一鍵部署,結(jié)果Kimi K2.5發(fā)布20天內(nèi)的調(diào)用量就超過了去年全年,累計(jì)收入也超過了2025年總和。

圖片

這也是Google和Anthropic封禁那些在訂閱制下進(jìn)行全自動(dòng)調(diào)用的賬戶,因?yàn)橛嗛嗁M(fèi)用是有限的,遠(yuǎn)遠(yuǎn)覆蓋不了全自動(dòng)調(diào)用的算力成本。

當(dāng)消耗量指數(shù)級(jí)增長時(shí),單位Token的價(jià)格優(yōu)勢,就成了決定生死的競爭力。

這個(gè)成本優(yōu)勢不是憑空掉下來的,底層是電力和工程的支撐。

算力的盡頭是電力。

中國工業(yè)用電比美國低30%到40%,中西部綠電甚至低50%到70%。加上中國工業(yè)用電盤子大,可以充分利用谷電訓(xùn)練模型,這構(gòu)成了中國AI企業(yè)的物理成本護(hù)城河。

另一頭,是被迫卷出來的工程能力。從2024年4月起,中國AI企業(yè)就在尖端芯片斷供的狀態(tài)下活著,拿不到最好的卡,就把手里的卡壓榨到極限。

中國模型普遍采用混合專家架構(gòu),這一技術(shù)路線重構(gòu)了算力消耗邏輯。一個(gè)幾千億參數(shù)的模型,處理簡單問題時(shí)只激活其中一小部分“專家網(wǎng)絡(luò)”,這種“按需激活”的模式,省電省算力。

最后是開源生態(tài)的正向循環(huán)。

過去一年,中國大模型在全球的Token消耗占比增長了421%。斯坦福的報(bào)告說,2024年8月到2025年8月,中國開發(fā)者貢獻(xiàn)了Hugging Face總下載量的17.1%,略高于美國的15.8%。

開源生態(tài)降低了全球開發(fā)者的使用門檻,也讓中國模型在持續(xù)的技術(shù)反饋里快速迭代,能力和價(jià)格的綜合優(yōu)勢在擴(kuò)大。如硅谷投資人Aditya Agarwal所說:“50%以上的大模型調(diào)用通過廉價(jià)的開源模型完成,中國模型實(shí)際在支持大部分AI應(yīng)用,美國同行甚至無法替代。”

中國AI模型出海的成功,是技術(shù)架構(gòu)創(chuàng)新+極致成本控制+開源生態(tài)+場景適配共同作用的結(jié)果,也是系統(tǒng)性優(yōu)勢的集中爆發(fā)。

二、 出海模式:從應(yīng)用到算力、生態(tài)

如果說調(diào)用量數(shù)據(jù)解釋了中國AI“有多強(qiáng)”,那么接下來需要回答的是:這些Token究竟通過什么路徑流向全球?

過去幾年,中國AI出海的主流方式是“應(yīng)用輸出”,即,把AI能力封裝成APP,送到海外用戶手里。字節(jié)的Gauthmath、美圖的影像產(chǎn)品、快手的KLING AI,走的都是這條路。

到今天,這條路徑依然在貢獻(xiàn)可觀的用戶規(guī)模和收入。

以Talkie為例,這款情感陪伴類應(yīng)用覆蓋全球200多個(gè)國家,在北美Z世代中滲透率持續(xù)提升。用戶在和AI角色聊天的過程中,每一句話都在消耗Token。這類C端收入占Minimax收入的70%以上,且仍在快速增長中:2026 年 2 月日均 Token 消耗量達(dá)到了2025 年 12 月的 6 倍以上。

字節(jié)的Gauthmath在美國拍照搜題市場拿下47%的份額,成功替代老牌產(chǎn)品Mathway,也是同樣的邏輯。

這類模式不直接按Token向用戶收費(fèi),而是通過訂閱、內(nèi)購、廣告變現(xiàn)。但從底層看,它們消耗的依然是中國算力,是中國AI出海的“用戶基本盤”。

如果把AI出海比作一條產(chǎn)業(yè)鏈,應(yīng)用是下游,算力是上游。中國企業(yè)先在下游做產(chǎn)品、做流量,然后向上游走,做底層、做基建。

一方面,通過API管道式輸出,直接把算力做成水電煤。

海外開發(fā)者通過OpenRouter等聚合平臺(tái),調(diào)用中國大模型的API,推理在中國本土的數(shù)據(jù)中心完成,按Token付費(fèi)。整個(gè)過程,算力不出境,電力不出境,只有價(jià)值通過Token跨境交付。

這是一種典型的“賣水賣電”生意。開發(fā)者不需要自己部署模型,不需要買顯卡,就能讓應(yīng)用跑在中國的模型上。

據(jù)報(bào)道,月之暗面負(fù)責(zé)API服務(wù)的團(tuán)隊(duì)近期快速擴(kuò)編,以獨(dú)立業(yè)務(wù)分支形式直接向總裁張予彤匯報(bào)。組織層面的調(diào)整,足以說明API業(yè)務(wù)的重要性正在快速上升。

從商業(yè)角度看,這類模式的優(yōu)勢在于可規(guī);、利潤率可觀,而且隨著Agent時(shí)代到來,單次任務(wù)的Token消耗量指數(shù)級(jí)增長,API業(yè)務(wù)的想象空間還在放大。

另一方面,通過構(gòu)建開源生態(tài),為算力輸出修路。

阿里通義千問、DeepSeek系列選擇了一條看起來“免費(fèi)”的路:把模型權(quán)重、工具鏈、工程范式全部開源,海外開發(fā)者可以免費(fèi)下載,在本地服務(wù)器上部署。

免費(fèi)圖的是讓中國模型進(jìn)入全球開發(fā)者的默認(rèn)工具箱,成為他們技術(shù)棧的一部分。當(dāng)一個(gè)開發(fā)者用熟了開源模型,他未來開發(fā)商業(yè)應(yīng)用時(shí),自然會(huì)優(yōu)先考慮調(diào)用同系列的API。

基于阿里和DeepSeek開源模型的衍生模型上傳量,已經(jīng)超過基于美國主流模型的。這意味著全球開發(fā)者正在中國開源模型的基礎(chǔ)上,生長出一個(gè)龐大的技術(shù)生態(tài)。生態(tài)一旦形成,遷移成本就極高。

可以說,今天的中國AI出海,不再是單一的“應(yīng)用輸出”,而是一個(gè)三層結(jié)構(gòu):底層是開源生態(tài),通過開放換取開發(fā)者心智;中間層是API算力輸出,直接把Token賣給全球開發(fā)者,是商業(yè)化的核心引擎;頂層是應(yīng)用輸出,用產(chǎn)品觸達(dá)終端用戶,既是流量入口,也是算力消耗的重要場景。

三層相互支撐,共同說明,中國算力正在成為全球AI的底層基礎(chǔ)設(shè)施。

三、下半場考驗(yàn):商業(yè)優(yōu)勢遭遇規(guī)則壁壘

OpenRouter平臺(tái)上的數(shù)字確實(shí)亮眼,但OpenRouter不代表全貌。

消費(fèi)級(jí)市場(開發(fā)者、初創(chuàng)公司、Agent應(yīng)用)的決策鏈條短,核心指標(biāo)是性價(jià)比+上手快。開發(fā)者用哪個(gè)模型,往往自己說了算。這個(gè)邏輯下,中國模型的“便宜量又足”是絕對優(yōu)勢。

企業(yè)級(jí)市場不一樣。政府、金融、醫(yī)療、關(guān)鍵基礎(chǔ)設(shè)施,決策鏈條長,涉及合規(guī)、安全、審計(jì)、供應(yīng)商穩(wěn)定性等等。

海外的企業(yè)級(jí)市場就更復(fù)雜了。

所以,有一個(gè)問題是繞不開的,即,在國際競爭中,純商業(yè)方面的競爭優(yōu)勢,比如好用、成本低,可能還不夠。

比如,此前的英偉達(dá)H200被禁止出口。雖然現(xiàn)在已經(jīng)可以進(jìn)口英偉達(dá)H200,但在AI競爭層面,美國的政策指不定又會(huì)出現(xiàn)什么“反復(fù)”,而當(dāng)前推理集群還是離不開英偉達(dá)的H100/H200。

當(dāng)然,封鎖具有雙面性,一方面會(huì)使得訓(xùn)練成本上升,模型迭代速度放緩,另一方面正是這種背景,倒逼工程優(yōu)化提升效率,國產(chǎn)芯片取得進(jìn)展。

但風(fēng)險(xiǎn)同樣存在。銀河證券的研報(bào)指出,全球模型迭代周期正在縮短,主流模型更新頻率已由半年縮短至數(shù)月。如果核心能力提升速度放緩,成本優(yōu)勢可能在高端市場迅速失去吸引力。

大摩首席經(jīng)濟(jì)學(xué)家邢自強(qiáng)認(rèn)為,Token出?隙ㄊ怯锌臻g的,但不要過度吹捧中國的開源大模型、Token出海借助電力優(yōu)勢,而忽視了地緣政治與安全考量。

他舉例稱,中國在5G設(shè)備領(lǐng)域同樣有性價(jià)比和技術(shù)優(yōu)勢,但從2018、2019年之后,歐美不少電信網(wǎng)絡(luò)中,中國的5G基站還是被替代了。

在企業(yè)級(jí)市場,對價(jià)格敏感的中小企業(yè)可能被中國模型的性價(jià)比穿透,但在政府、金融、醫(yī)療等涉及數(shù)據(jù)主權(quán)和關(guān)鍵基礎(chǔ)設(shè)施的領(lǐng)域,準(zhǔn)入邏輯從“性價(jià)比”轉(zhuǎn)向“合規(guī)信任、品牌認(rèn)知與生態(tài)鎖定”。

美國正通過投資審查、標(biāo)準(zhǔn)制定、數(shù)據(jù)主權(quán)規(guī)則,系統(tǒng)性地構(gòu)筑企業(yè)級(jí)市場的準(zhǔn)入門檻。

這意味著地緣政治的“天花板”正在降低。

2025年12月,美國政府提出所謂的“硅和平倡議”(Pax Silica),聲稱要把擁有全球頂尖科技企業(yè)或其他優(yōu)勢資源的國家聯(lián)合起來,以確保“供應(yīng)鏈安全”等。

專業(yè)人士認(rèn)為,這是試圖用規(guī)則、投資與項(xiàng)目清單重塑全球技術(shù)分工與資本流向,看起來是走向了重塑生態(tài),實(shí)際上是包裝下的排他性整合。

這個(gè)“他”是誰,不言而喻。

從芯片封鎖到“硅和平倡議”,從遏制發(fā)展到規(guī)則輸出,美國的目標(biāo)是從生態(tài)層面重塑游戲規(guī)則、掌握話語權(quán)。

所以,模型調(diào)用量反超,是階段性的成果,但也是故事的一半。

AI出海的下半場,需要在保持成本優(yōu)勢的同時(shí),面對更多、更復(fù)雜的問題,有的問題可以靠提升模型性能、系統(tǒng)效率、競爭力來解決,有的問題沒有答案。

       原文標(biāo)題 : 硅谷程序員,瘋狂“投喂”中國大模型

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請輸入評(píng)論內(nèi)容...

請輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)