訂閱
糾錯(cuò)
加入自媒體

產(chǎn)業(yè)丨ASIC , 趕超GPU?

當(dāng)OpenAI悄悄測(cè)試谷歌TPU的消息在AI圈傳開時(shí),整個(gè)行業(yè)都嗅到了不一樣的味道。如今,谷歌、亞馬遜AWS、Meta等云服務(wù)巨頭集體押注自研ASIC,野村證券甚至預(yù)測(cè)2026年ASIC出貨量將首次超越英偉達(dá)GPU。這場(chǎng)沒有硝煙的戰(zhàn)爭(zhēng),究竟是通用算力的黃昏,還是專用芯片的黎明?

作者 | 方文三

片來(lái)源 |  網(wǎng) 絡(luò) 

從[價(jià)值壟斷]到[數(shù)量追趕]的微妙失衡 

當(dāng)前的AI服務(wù)器市場(chǎng),英偉達(dá)仍牢牢占據(jù)著[價(jià)值王座]。

數(shù)據(jù)顯示,其AI GPU在市場(chǎng)價(jià)值中的占比超過(guò)80%,而ASIC僅為8%-11%。

但如果將目光轉(zhuǎn)向出貨量這一關(guān)鍵指標(biāo),天平已在悄然傾斜。

2025年,谷歌自研的TPU芯片出貨量預(yù)計(jì)達(dá)150萬(wàn)-200萬(wàn)臺(tái),亞馬遜AWS的Trainium 2 ASIC約為140萬(wàn)-150萬(wàn)臺(tái),兩者合計(jì)規(guī)模已接近同期英偉達(dá)AI GPU的40%-60%。

更具顛覆性的是,隨著Meta計(jì)劃2026年量產(chǎn)100萬(wàn)-150萬(wàn)顆MTIA芯片,以及微軟2027年啟動(dòng)大規(guī)模ASIC部署。

野村證券判斷:ASIC整體出貨量有望在2026年某個(gè)時(shí)間點(diǎn)超越英偉達(dá)GPU。

這一變化的背后,是云服務(wù)商對(duì)[降本增效]的迫切需求。

以日均處理海量數(shù)據(jù)的谷歌為例,其最新一代TPU針對(duì)Transformer架構(gòu)深度優(yōu)化,計(jì)算效率較上一代提升30%以上;

亞馬遜AWS的Trainium 2則聚焦分布式訓(xùn)練場(chǎng)景,支持千億參數(shù)模型的并行計(jì)算。

在特定場(chǎng)景下,這些ASIC的表現(xiàn)已逼近甚至部分超越英偉達(dá)A100 GPU。

對(duì)云服務(wù)商而言,自研ASIC的意義遠(yuǎn)不止[替代]。

谷歌每天處理數(shù)十億次搜索請(qǐng)求,AWS承載著全球數(shù)百萬(wàn)企業(yè)的云計(jì)算需求,Meta的社交平臺(tái)每秒產(chǎn)生海量交互數(shù)據(jù),這些場(chǎng)景的AI任務(wù)相對(duì)固定,恰好匹配ASIC[定制化]的核心優(yōu)勢(shì)。

據(jù)測(cè)算,同等算力下ASIC的功耗可控制在GPU的30%以內(nèi),對(duì)需要部署數(shù)萬(wàn)張卡的云服務(wù)商來(lái)說(shuō),每年節(jié)省的電費(fèi)相當(dāng)于一個(gè)小型電廠的年發(fā)電量。

ASIC的定制化改寫算力經(jīng)濟(jì)規(guī)則

如果把芯片世界比作一個(gè)工具箱,那么ASIC就是為特定任務(wù)量身打造的[專業(yè)工匠],而GPU則是能應(yīng)對(duì)多種場(chǎng)景的[全能選手]。

這種定位差異,在AI大模型規(guī)模化商用的今天被無(wú)限放大。

ASIC的核心優(yōu)勢(shì),在于對(duì)特定算法的[極致適配]。以大模型推理為例,一旦模型部署,其算法邏輯(如Transformer的注意力機(jī)制)、計(jì)算流程(輸入輸出格式、精度需求)會(huì)長(zhǎng)期固定。

ASIC可以直接將這些邏輯[固化]到硬件架構(gòu)中,去掉GPU中用于通用計(jì)算的冗余模塊,讓硬件資源100%服務(wù)于目標(biāo)任務(wù)。

谷歌TPU v5e的能效比是英偉達(dá)H100的3倍,AWS Trainium 2在推理任務(wù)中的性價(jià)比比H100高30%-40%,正是這種優(yōu)化的直接體現(xiàn)。

對(duì)比更為直觀的是運(yùn)維成本。一塊NVIDIA GPU功耗約700瓦,運(yùn)行大模型時(shí)每小時(shí)電費(fèi)約0.56元(按0.8元/度計(jì));而同等算力的ASIC芯片功耗可控制在200瓦內(nèi),同樣任務(wù)每小時(shí)電費(fèi)僅0.16元。

對(duì)ChatGPT這樣需要數(shù)十萬(wàn)臺(tái)推理芯片支撐的應(yīng)用來(lái)說(shuō),這種差距意味著每年數(shù)億元的成本節(jié)省。

ASIC的崛起還踩中了AI產(chǎn)業(yè)的[階段紅利]。當(dāng)前大模型已從[野蠻生長(zhǎng)]的訓(xùn)練階段,逐步轉(zhuǎn)向[規(guī);涞豜的推理階段。

巴克萊預(yù)測(cè),到2026年推理計(jì)算需求將占通用人工智能總計(jì)算需求的70%以上,是訓(xùn)練需求的4.5倍。

推理場(chǎng)景的[算法固化]特性,與ASIC的[專用性]形成完美契合,這也是谷歌、Meta等巨頭加速布局的核心邏輯。

從歷史維度看,這種[通用到專用]的迭代并不陌生。

比特幣挖礦早期用CPU,后來(lái)轉(zhuǎn)向GPU,但真正實(shí)現(xiàn)產(chǎn)業(yè)化的是比特大陸的ASIC礦機(jī),其單位能耗的挖礦效率是GPU的千倍級(jí)別。

當(dāng)AI模型架構(gòu)從快速迭代走向相對(duì)穩(wěn)定,ASIC正在重復(fù)類似的[效率革命]。

ASIC的規(guī);現(xiàn)實(shí)困境與隱憂

盡管ASIC的優(yōu)勢(shì)顯著,但規(guī);渴鸩⒎翘雇。這場(chǎng)算力競(jìng)賽的背后,隱藏著產(chǎn)能、技術(shù)與風(fēng)險(xiǎn)的多重挑戰(zhàn)。

產(chǎn)能瓶頸首當(dāng)其沖。以Meta計(jì)劃2026年量產(chǎn)的MTIA芯片為例,其依賴臺(tái)積電CoWoS技術(shù),而當(dāng)前CoWoS晶圓產(chǎn)能僅能支持30萬(wàn)-40萬(wàn)片,遠(yuǎn)低于其100萬(wàn)-150萬(wàn)顆的出貨目標(biāo)。

更嚴(yán)峻的是,谷歌、AWS、微軟等廠商若同步擴(kuò)產(chǎn),高端封裝產(chǎn)能將成為制約ASIC放量的[卡脖子]環(huán)節(jié)。

臺(tái)積電雖然計(jì)劃2025年將CoWoS產(chǎn)能提升50%,但從產(chǎn)能建設(shè)到實(shí)際投產(chǎn)需12-18個(gè)月,短期內(nèi)難以緩解供需矛盾。

技術(shù)門檻同樣高企。大尺寸CoWoS封裝對(duì)芯片設(shè)計(jì)、材料一致性要求極高,系統(tǒng)調(diào)試周期長(zhǎng)達(dá)6-9個(gè)月。

即便是技術(shù)成熟的谷歌,也需投入大量資源解決散熱、信號(hào)干擾等問題。

Meta的MTIA T-V1芯片采用36層高規(guī)格PCB與液冷+空冷混合散熱,其復(fù)雜程度堪比航天級(jí)設(shè)備,任何設(shè)計(jì)瑕疵都可能導(dǎo)致量產(chǎn)延期。

更隱蔽的風(fēng)險(xiǎn)在于ASIC的[專用性陷阱]。AI模型架構(gòu)并非一成不變,若未來(lái)從Transformer轉(zhuǎn)向新型架構(gòu),前期投入的ASIC可能面臨[瞬間過(guò)時(shí)]的風(fēng)險(xiǎn)。

黃仁勛曾直言:[一個(gè)完美的ASIC在某些工作上表現(xiàn)出色,但在其他方面卻很糟糕。一旦AI的工作內(nèi)容改變,它就會(huì)變得毫無(wú)用處。]

這也是為何谷歌Gemini模型仍同時(shí)部署在英偉達(dá)GPU上——通過(guò)[通用+專用]的混合架構(gòu)對(duì)沖技術(shù)迭代風(fēng)險(xiǎn)。

供應(yīng)鏈的[蝴蝶效應(yīng)]也不容忽視。若Meta、AWS等云服務(wù)商集中拉貨,高端ABF載板、HBM3E存儲(chǔ)芯片、液冷組件等關(guān)鍵物料極易短缺,進(jìn)一步推高成本并拖慢量產(chǎn)節(jié)奏。

2024年下半年,HBM內(nèi)存價(jià)格因需求激增上漲30%,這一情景可能在ASIC擴(kuò)產(chǎn)潮中重演。 

英偉達(dá)的技術(shù)、生態(tài)與反擊戰(zhàn) 

面對(duì)ASIC的挑戰(zhàn),英偉達(dá)并未坐以待斃,而是通過(guò)技術(shù)迭代與生態(tài)強(qiáng)化構(gòu)筑[三重壁壘]。

在2025年COMPUTEX大會(huì)上,英偉達(dá)推出NVLink Fusion技術(shù),開放互連協(xié)議允許第三方CPU或xPU與自家GPU無(wú)縫協(xié)作。

這一策略看似[妥協(xié)],實(shí)則通過(guò)開放接口擴(kuò)大生態(tài)覆蓋,同時(shí)保持自身在計(jì)算核心上的主導(dǎo)權(quán)。

硬件參數(shù)上,英偉達(dá)H100的計(jì)算密度較同期ASIC高出約20%,NVLink互連帶寬是自研ASIC的1.5倍以上,在訓(xùn)練千億參數(shù)大模型等復(fù)雜任務(wù)中仍不可替代。

生態(tài)壁壘更是英偉達(dá)的[王牌]。全球超90%的企業(yè)AI解決方案基于CUDA開發(fā),從模型訓(xùn)練到部署,開發(fā)者已形成深度路徑依賴。

即便ASIC算力接近GPU,企業(yè)也需投入數(shù)億甚至數(shù)十億元重構(gòu)軟件生態(tài),這種[轉(zhuǎn)換成本]構(gòu)成了最堅(jiān)固的護(hù)城河。

正如摩根士丹利分析:[CUDA生態(tài)就像一座高速公路網(wǎng),所有的車都在上面跑,想換路就要重建整個(gè)路網(wǎng)。]

供應(yīng)鏈控制力同樣關(guān)鍵。英偉達(dá)是HBM內(nèi)存的最大買家,占據(jù)SK海力士70%以上的產(chǎn)能;通過(guò)與臺(tái)積電的深度合作,其獲得了最多的CoWoS封裝產(chǎn)能分配。

這種[搶資源]的能力,讓英偉達(dá)在算力競(jìng)賽中掌握了節(jié)奏主導(dǎo)權(quán)。

當(dāng)ASIC廠商還在為產(chǎn)能焦慮時(shí),英偉達(dá)已通過(guò)規(guī);少(gòu)降低邊際成本,維持高毛利率優(yōu)勢(shì)。

黃仁勛的[生態(tài)戰(zhàn)]策略也在奏效。通過(guò)開放NVLink Fusion,英偉達(dá)將聯(lián)發(fā)科、Marvell等廠商納入[朋友圈],形成[GPU+第三方xPU]的異構(gòu)計(jì)算生態(tài)。

這種[以我為主、開放合作]的模式,既應(yīng)對(duì)了ASIC的挑戰(zhàn),又鞏固了自身在產(chǎn)業(yè)鏈中的核心地位。

通用與專用的共存大概率是未來(lái)格局 

ASIC的崛起并非意味著GPU的衰落,而是AI算力市場(chǎng)從[一極主導(dǎo)]走向[多元共生]的開始。

這場(chǎng)變革的最終結(jié)局,更可能是[通用GPU+定制ASIC]的雙軌并行格局。

短期來(lái)看,ASIC是[增量補(bǔ)充]而非[存量替代]。

英偉達(dá)在高端訓(xùn)練市場(chǎng)(如千億參數(shù)模型)仍占據(jù)絕對(duì)主導(dǎo),其技術(shù)積累與生態(tài)優(yōu)勢(shì)短期內(nèi)難以撼動(dòng)。

ASIC則在特定場(chǎng)景快速滲透,成為云服務(wù)商降本增效的重要選擇。

2025-2026年將是雙線并行的過(guò)渡期,市場(chǎng)呈現(xiàn)[GPU主導(dǎo)價(jià)值、ASIC增長(zhǎng)數(shù)量]的特征。

長(zhǎng)期而言,市場(chǎng)將呈現(xiàn)[分層競(jìng)爭(zhēng)]態(tài)勢(shì)。

英偉達(dá)繼續(xù)領(lǐng)跑通用AI算力市場(chǎng),支撐前沿模型探索與復(fù)雜任務(wù)處理;

ASIC則在垂直場(chǎng)景占據(jù)優(yōu)勢(shì),通過(guò)定制化優(yōu)化實(shí)現(xiàn)效率最大化。

對(duì)主權(quán)AI體系,ASIC可能成為突破供應(yīng)限制的重要路徑,但需突破技術(shù)積累、人才儲(chǔ)備與生態(tài)構(gòu)建的多重障礙。

從應(yīng)用維度看,兩者的分工將更加清晰:GPU負(fù)責(zé)[從0到1]的創(chuàng)新探索,ASIC負(fù)責(zé)[從1到N]的規(guī)模落地。

就像超級(jí)計(jì)算機(jī)用于前沿科研,而專用服務(wù)器支撐日常數(shù)據(jù)處理,AI算力市場(chǎng)也將形成[創(chuàng)新與效率]的平衡。

行業(yè)數(shù)據(jù)也印證了這一趨勢(shì)。摩根士丹利預(yù)計(jì),AI ASIC市場(chǎng)規(guī)模將從2024年的120億美元增長(zhǎng)至2027年的300億美元,復(fù)合增長(zhǎng)率達(dá)34%,但同期GPU市場(chǎng)仍將保持20%以上的增速。

這意味著,ASIC的崛起是在做大AI算力市場(chǎng)的[蛋糕],而非單純搶奪GPU的份額。

算力革命的本質(zhì)是效率與創(chuàng)新的平衡

ASIC與GPU的博弈,本質(zhì)上是AI產(chǎn)業(yè)從[通用算力]向[專用效率]進(jìn)化的縮影。

當(dāng)大模型訓(xùn)練成本從GPT-3時(shí)代的千萬(wàn)級(jí)飆升至Grok3的數(shù)十億美元級(jí),效率成為不可忽視的核心命題,這為ASIC的崛起提供了土壤。

但技術(shù)創(chuàng)新的不確定性,又讓通用GPU的靈活性不可或缺。

未來(lái)的AI算力江湖,不會(huì)是[非此即彼]的零和博弈,而是[各擅其長(zhǎng)]的共生生態(tài)。

英偉達(dá)憑借技術(shù)、生態(tài)與供應(yīng)鏈優(yōu)勢(shì),繼續(xù)主導(dǎo)通用算力市場(chǎng);

谷歌、AWS、Meta等巨頭通過(guò)ASIC在垂直場(chǎng)景構(gòu)建壁壘;

而博通、Marvell等廠商則在定制芯片領(lǐng)域分一杯羹。

這場(chǎng)變革的深層意義,在于重新定義算力經(jīng)濟(jì)的成本結(jié)構(gòu)與技術(shù)路線。

部分資料參考:

算力之光:《ASIC芯片狂飆,英偉達(dá)慌嗎?》

證券之星:《ASIC的時(shí)代即將到來(lái)?》

硬AI:《谷歌之后Meta需求爆發(fā),ASIC明年就超英偉達(dá)GPU?》

電子發(fā)燒友網(wǎng):《OpenAI甩出"王炸":一個(gè)APP干翻整個(gè)辦公室,ASIC開始逆襲GPU?》

中國(guó)電子報(bào):《2026年出貨量超GPU?ASIC時(shí)代加速到來(lái)》

電子工程世界:《DeepSeek時(shí)代,ASIC芯片加冕為王》

半導(dǎo)體產(chǎn)業(yè)縱橫:《GPU王座動(dòng)搖?ASIC改寫規(guī)則》

       原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨ASIC,趕超GPU?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)