訂閱
糾錯
加入自媒體

通用計算時代已經(jīng)結(jié)束!黃仁勛深度訪談,首次揭秘投資OpenAI的原因

圖片

編輯 重點君

9月26日,英偉達黃仁勛在最新訪談中,就AI行業(yè)趨勢、計算的未來、英偉達的護城河等話題展開討論,并首次揭秘其千億美元投資OpenAI背后的原因。

他認為,摩爾定律失效導(dǎo)致晶體管的成本和能耗不再有顯著改進,傳統(tǒng)計算無法繼續(xù)提供必要的性能提升。在此背景下,AI需求正經(jīng)歷著雙重指數(shù)級復(fù)合增長。首先,AI的用戶使用量呈指數(shù)級爆發(fā)。其次,AI推理(Inference)的方式發(fā)生了質(zhì)變,從簡單的一次性回答升級為復(fù)雜的“思考”(thinking)過程,這種推理范式的升級使得AI每次使用所需的計算量呈指數(shù)級增長,預(yù)計將帶來10億倍的推理需求增長。

AI基礎(chǔ)設(shè)施正在引發(fā)一場工業(yè)革命。通用計算(general purpose computing)已經(jīng)終結(jié),全球數(shù)萬億美元的現(xiàn)有計算基礎(chǔ)設(shè)施(包括搜索、推薦引擎、數(shù)據(jù)處理等)正從使用CPU遷移至AI加速計算。NVIDIA的AI基礎(chǔ)設(shè)施將生成tokens來增強人類智能,最終帶來的巨大經(jīng)濟效益。當(dāng)前每年4000億美元的市場規(guī)模,在未來有望增長至少10倍。

NVIDIA的戰(zhàn)略重心不是單純的芯片公司,而是AI基礎(chǔ)設(shè)施伙伴,通過“極致協(xié)同設(shè)計”(Extreme Co-Design)構(gòu)建強大的競爭壁壘。由于單個芯片的性能提升受限,NVIDIA必須在算法、模型、系統(tǒng)、軟件、網(wǎng)絡(luò)、芯片等整個堆棧上進行同時創(chuàng)新和優(yōu)化。正是這種全棧設(shè)計,使NVIDIA能夠在短時間內(nèi)實現(xiàn)例如Hopper到Blackwell的性能飛躍。

黃仁勛強調(diào),戰(zhàn)略的核心價值在于提供最高的單位能耗性能。對于電力受限的超大規(guī)?蛻舳,即使競爭對手的芯片是免費的,放棄NVIDIA系統(tǒng)導(dǎo)致的巨大機會成本損失也是不可接受的。

在商業(yè)合作方面,NVIDIA視OpenAI為下一家萬億美元級超大規(guī)模公司,并與其合作建設(shè)AI基礎(chǔ)設(shè)施,包括協(xié)助OpenAI首次自建AI工廠。

  黃仁勛訪談內(nèi)容劃重點:

1.AI計算需求呈指數(shù)級增長,推理(Inference)是關(guān)鍵驅(qū)動力

目前AI訓(xùn)練已經(jīng)擁有三條法則:預(yù)訓(xùn)練(pre-training)、后訓(xùn)練(post-training)和推理(inference)。傳統(tǒng)的推理是“一次性”(one shot)的,但新一代推理已經(jīng)演變?yōu)?ldquo;思考”(thinking),即在回答之前進行研究、檢查真實情況并學(xué)習(xí)。“思考”導(dǎo)致AI每次使用所需的計算量呈指數(shù)級增長,因此,推理需求預(yù)計將增長10億倍。這種驚人的增長來自于兩個指數(shù)級復(fù)合效應(yīng):一是AI客戶數(shù)量和使用率的指數(shù)級增長,二是每次使用所需的計算量的指數(shù)級增長。

2.OpenAI有望成為下一家萬億美元級超大規(guī)模公司

黃仁勛認為OpenAI很可能成為下一家萬億美元級超大規(guī)模公司,它將同時提供消費級和企業(yè)級服務(wù)。NVIDIA對OpenAI的投資被認為是“能想象到的最明智的投資之一”,NVIDIA正在幫助OpenAI首次建設(shè)自己的AI基礎(chǔ)設(shè)施,涉及芯片、軟件、系統(tǒng)和AI工廠的各個層面。

3.AI基礎(chǔ)設(shè)施是新的工業(yè)革命,蘊含巨大市場潛力

AI基礎(chǔ)設(shè)施建設(shè)被視為一場工業(yè)革命。絕大多數(shù)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)處理目前仍運行在CPU上。黃仁勛預(yù)計,未來這些數(shù)據(jù)處理將全部遷移至AI,這是一個巨大的市場。全球數(shù)萬億美元的現(xiàn)有計算基礎(chǔ)設(shè)施,包括搜索、推薦引擎和購物等傳統(tǒng)的超大規(guī)模計算基礎(chǔ)設(shè)施,都需要從使用CPU轉(zhuǎn)向使用GPU進行AI加速計算。AI基礎(chǔ)設(shè)施將生成tokens來增強人類智能,最終產(chǎn)生巨大的經(jīng)濟效益,例如用1萬美元的AI使薪資10萬美元的員工生產(chǎn)力提高2到3倍。目前AI基礎(chǔ)設(shè)施市場的年規(guī)模約為4000億美元,但總體潛在市場規(guī)模未來有望增長至少10倍。

4.華爾街低估了NVIDIA增長速度

華爾街分析師預(yù)測NVIDIA的增長將在2027年趨于停滯。黃仁勛反駁了分析師的觀點,認為市場上的計算資源仍處于短缺狀態(tài)。他強調(diào)供應(yīng)過剩的可能性極低,直到所有通用計算都轉(zhuǎn)換為加速計算,所有推薦引擎都基于AI,所有內(nèi)容生成都由AI驅(qū)動,供給過剩的情況才有可能發(fā)生。NVIDIA響應(yīng)市場需求,未來市場對AI基礎(chǔ)設(shè)施的需求量非常大。

5.NVIDIA通過“極致協(xié)同設(shè)計(Co-Design)”構(gòu)建核心競爭優(yōu)勢

由于摩爾定律失效,晶體管成本和功耗基本不變,當(dāng)前無法通過傳統(tǒng)方式提升性能。為解決這一挑戰(zhàn),NVIDIA采用了極致協(xié)同設(shè)計(Co-Design),在系統(tǒng)、軟件、網(wǎng)絡(luò)和芯片層面同時進行優(yōu)化和創(chuàng)新。

黃仁勛認為,NVIDIA強大的系統(tǒng)平臺優(yōu)勢構(gòu)成了競爭護城河,甚至高于競爭對手ASIC芯片的潛在成本優(yōu)勢。因為客戶的運營受限于電力,他們希望從每瓦特電力中產(chǎn)生最高的收益。NVIDIA的深度和極致協(xié)同設(shè)計實現(xiàn)了最佳的每瓦特性能?蛻羧绻艞塏VIDIA系統(tǒng)去使用性能較低的芯片,即使芯片免費,由于機會成本過高(可能損失30倍的收入),他們?nèi)詴x擇NVIDIA。因此,NVIDIA認為其正在構(gòu)建的是復(fù)雜的AI工廠系統(tǒng),而非僅僅是芯片。

 

圖片

  以下為訪談原文:

1.AI計算的范式革命與指數(shù)級增長

主持人:Jensen,很高興你回來,當(dāng)然還有我的合伙人Clark Tang。

黃仁勛:歡迎來到NVIDIA。

主持人:你的眼鏡很漂亮。那些戴在你臉上真的很好看。現(xiàn)在每個人都會想讓你一直戴著它們。他們會說,“紅色眼鏡在哪里?”所以我們距離上次做播客已經(jīng)一年多了。你現(xiàn)在超過40%的收入來自推理(inference)。但由于思維鏈(chain of reasoning)的出現(xiàn),推理即將迎來爆發(fā)。

黃仁勛:是的,它即將要增長10億倍。這一點是大多數(shù)人還沒完全內(nèi)化的。這是工業(yè)革命。

主持人:說實話,自那以后我每天都在運營這個播客。在AI的時間尺度上,大約經(jīng)歷了100年。我在重看那集播客。最近,我們討論了很多事情,對我而言,最深刻的可能是你拍桌子的那一刻。那時你還記得嗎,在預(yù)訓(xùn)練方面確實有點低迷?人們都在說,“天哪,預(yù)訓(xùn)練走到頭了。”這是大約一年半之前。你還說過,推理不會是100倍、1000倍,它會增長10億倍。這把我們帶到了今天這個時刻。

黃仁勛:我們現(xiàn)在有三條擴展定律對吧?我們有預(yù)訓(xùn)練Scaling法則(Pre-training Scaling Law)、后訓(xùn)練Scaling法則(Post-Training Scaling Law)后訓(xùn)練就像AI在練習(xí),反復(fù)練習(xí)一項技能直到它做對為止。于是它嘗試了許多不同的方法。而且,為了做到那一點,你必須進行推理。所以現(xiàn)在在強化學(xué)習(xí)中,訓(xùn)練和推理已經(jīng)整合在一起了。這就是所謂的后訓(xùn)練(post-training)。第三個是推理(inference)。以前做推理的方式是一次性完成的。但是我們很感謝這種新的推理方式——思考,思考發(fā)生在模型回答之前。所以現(xiàn)在你有了三條縮放定律。你思考得越久,你得到的答案質(zhì)量越好。在你思考的同時,你會做調(diào)研,去核查一些事實依據(jù),你會學(xué)到一些東西,思考更多,學(xué)到更多,然后再生成一個答案。不要一開始就立即生成。所以思考、后訓(xùn)練、預(yù)訓(xùn)練,我們現(xiàn)在有三條擴展定律,而不是一條。

主持人:你去年就說過這些,但今年你對推理增長10億倍,以及把智能水平拉升何處的信心程度怎么樣?是更高嗎?你比一年前更有信心嗎?

黃仁勛:我今年更有信心,原因是看看現(xiàn)在的智能體系統(tǒng)(agentic systems)。而且AI已不再僅僅是一個語言模型,AI是一個由語言模型組成的系統(tǒng),它們都在并發(fā)運行。有些在使用工具,有些在做研究,還有很多東西。而且這一切都是多模態(tài)的,看看AI已經(jīng)生成的視頻。這真是不可思議的東西。

 

圖片

2.OpenAI 有望成為下一家萬億美元級超大規(guī)模公司

主持人:這確實把我們帶到了本周每個人都在談?wù)摰哪莻開創(chuàng)性時刻。幾天前你們宣布與OpenAI的星際之門(Stargate)項目達成的那筆巨額交易。你們將成為優(yōu)先合作伙伴,并向該公司投資1000億美元。在一段時間內(nèi),他們將建設(shè)至少 10 吉瓦規(guī)模的 AI 數(shù)據(jù)中心,以及如果他們?yōu)榱藬?shù)據(jù)中心的建設(shè)使用了NVIDIA,那對NVIDIA來說可能意味著高達4000億美元的收入。所以請幫我們理解一下,告訴我們一些關(guān)于那種合作關(guān)系的情況吧。這對你意味著什么,以及為什么這項投資對NVIDIA如此有意義。

黃仁勛:我先回答最后一個問題。我認為OpenAI很可能會成為下一個萬億美元級別的超大規(guī)模公司。超大規(guī)模公司就像Meta,Meta就是超大規(guī)模公司,Google也是一家超大規(guī)模公司。他們會同時擁有面向消費者和企業(yè)的服務(wù),OpenAI非常有可能成為下一個市值數(shù)萬億美元的公司。如果是這樣,那就是在他們實現(xiàn)這個預(yù)測之前投資的機會,這些可能是我們所能想象到的最聰明的投資之一,你得把錢投在自己懂的東西上。事實證明,我們恰好熟悉這個領(lǐng)域。因此有機會對其進行投資,那筆錢的回報將會非?捎^。所以我們非常樂意有投資的機會。我們并不一定非得投資,我們沒有義務(wù)投資,但他們在給我們提供投資的機會。

黃仁勛:現(xiàn)在讓我從頭開始。所以我們正在與OpenAI在多個項目上合作。首先,第一個項目是加速Microsoft Azure的構(gòu)建,我們將繼續(xù)這樣做。而且,這種合作進展得非常好,我們還有好幾年的建設(shè)要做,僅在那里就有數(shù)千億美元的工作要完成。其次是OCI(Oracle Cloud Infrastructure)的構(gòu)建。我想還有大約五、六、七個吉瓦將要構(gòu)建,我們將與OCI和OpenAI,以及與SoftBank合作。那些項目已簽合同,我們正在處理。有很多工作要做。然后第三個,第三個是CoreWeave。那么問題是,這是什么新的合作關(guān)系?這個新的合作關(guān)系是關(guān)于幫助OpenAI,與OpenAI合作,構(gòu)建他們自己的自建AI基礎(chǔ)設(shè)施。所以這是我們直接在芯片級別、在軟件級別、在系統(tǒng)級別、在AI工廠級別,去幫助他們成為一個全面運營的超大規(guī)模公司。這還會持續(xù)一段時間,你知道的他們正在經(jīng)歷兩個指數(shù)級增長。第一個指數(shù)級增長指的是客戶數(shù)量呈指數(shù)增長。其原因是AI在不斷變得更強,這些使用案例正在變得更好,幾乎每個應(yīng)用程序現(xiàn)在都連接到OpenAI,所以它們正在經(jīng)歷使用量的指數(shù)增長。第二個指數(shù)是每次使用的計算指數(shù)。它現(xiàn)在不是僅僅進行一次性推理,而是在回答之前先進行思考。因此這兩個指數(shù)級增長在其計算需求上相互疊加,所以我們,我們可以構(gòu)建出這些不同的項目。所以最后這個是一個疊加,在他們已經(jīng)宣布的所有內(nèi)容之上,我們已經(jīng)在與他們合作開展的所有工作,這是在其基礎(chǔ)上的疊加。

主持人:其中有一件讓我很感興趣的事,它在你心中將會有很高概率成為一家價值數(shù)萬億美元的公司,你認為這是一個很好的投資。與此同時,你知道的,他們在自建。你在幫助他們自建他們的數(shù)據(jù)中心。所以到目前為止,他們一直在外包給Microsoft來建設(shè)數(shù)據(jù)中心,F(xiàn)在他們想自己建立全棧工廠。

黃仁勛:他們基本上想和我們建立一種關(guān)系,就像Elon和X那種關(guān)系。

主持人:是的。當(dāng)你想到Colossus數(shù)據(jù)中心所擁有的優(yōu)勢時,他們正在打造全棧,那是一個超大規(guī)模云服務(wù)商,因為如果他們不自己使用這些容量,就可以把它賣給別的人。就像星際之門(Stargate)項目一樣,他們正在構(gòu)建巨大的容量,他們認為他們需要使用其中的大部分,但這也使他們可以將其出售給別人。聽起來很像AWS或GCP或Azure。你的意思是這樣嗎?

黃仁勛:是啊。我覺得他們很可能會自己使用,但他們希望與我們保持直接關(guān)系,直接的工作關(guān)系和直接的采購關(guān)系。就像Zuck和Meta對我們所做的那樣,這完全是直接的。我們與Sundar和Google之間的關(guān)系是直接的,我們與Satya和Azure的合作也是直接的。不是嗎?所以他們已經(jīng)達到了足夠大的規(guī)模,他們認為現(xiàn)在該開始建立這些直接關(guān)系了。我很高興能為他們支持這一點,而且大家都非常贊同這一點。

 

圖片

3.AI工業(yè)革命與市場潛力

主持人:所以有一件事我覺得很好奇。你剛才提到的Oracle,3000億,Colossus,他們正在構(gòu)建的東西。我們知道Sovereigns在構(gòu)建什么,我們知道超大規(guī)模云服務(wù)提供商正在構(gòu)建什么。Sam在談?wù)摰氖菙?shù)萬億美元的規(guī)模,但在華爾街覆蓋你們股票的25位賣方分析師中,如果我看一致預(yù)期,它基本上從2027年開始你的增長就停滯不前。8%的增長,2027年到2030年。就是那25個人,他們的唯一工作就是被付錢去預(yù)測NVIDIA的增長率。

黃仁勛:我們對這個情況很放心。我們對此很習(xí)以為常,我們完全有能力超越這些數(shù)字。

主持人:我理解這一點,但是,存在一個有趣的脫節(jié)。我每天在CNBC和Bloomberg上都能聽到這句話,我想它是指短缺最終變成供過于求的情況。他們說:“好吧,26年也許還是供不應(yīng)求,但27年也許你就不會需要那些了。”但對我來說這很有趣,我覺得重要的是要指出這些一致預(yù)測是不會發(fā)生,對吧?我們還會匯總預(yù)測,為公司做預(yù)測,考慮到所有這些數(shù)字。而這向我顯示的是,盡管我們已經(jīng)進入AI時代兩年半了,我們?nèi)匀淮嬖谝环N巨大的信念分歧。我們聽到的Sam Altman說的、你說的、Sundar說的、Satya說的,和華爾街仍然存在分歧。

黃仁勛:我不認為這前后矛盾。首先對于構(gòu)建者來說,我們的目標(biāo)應(yīng)該是為機會而構(gòu)建。讓我給你三個需要思考的要點,而且這三點會讓你在未來對NVIDIA更加放心。第一個要點,也是物理定律相關(guān)的觀點,這是最重要的一點,即通用計算(general purpose computing)已經(jīng)結(jié)束,未來屬于加速計算,以及AI計算。這是第一點。理解這一點的方式是,世界上需要更新的計算基礎(chǔ)設(shè)施價值是多少萬億美元。所以你首先要意識到這一點是無人爭議的。每個人都會說:“是的,我們完全同意這一點。通用計算已結(jié)束。摩爾定律已死。”那這意味著什么?通用計算將轉(zhuǎn)向加速計算。我們與Intel的合作認識到,通用計算需要與加速計算融合,以為它們創(chuàng)造機會。

黃仁勛:第二個要點,人工智能的第一個用例實際上已經(jīng)無處不在。它用于搜索、推薦引擎、在購物中。用于推薦的基礎(chǔ)超大規(guī)模計算基礎(chǔ)設(shè)施過去主要是由CPU來完成的,現(xiàn)在要轉(zhuǎn)向GPU了。所以對于經(jīng)典計算,它從通用計算轉(zhuǎn)向加速計算和AI;對于超大規(guī)模計算,它從CPU轉(zhuǎn)向加速計算和AI。這是第二點。Meta、Google、ByteDance、Amazon等公司,他們那種經(jīng)典的、傳統(tǒng)的超大規(guī)模擴展方式,轉(zhuǎn)移到AI上,那是數(shù)千億美元。我們甚至都不用考慮AI創(chuàng)造新的機會,這是關(guān)于AI改變你過去做事的方式,變成一種新的做事方式。然后現(xiàn)在,讓我們談?wù)勎磥。到目前為止,我只是大致地談過現(xiàn)存的事物,只是一些平常的事情,以前的做法現(xiàn)在不對了,你不再會去用,就像使用燃油燈要轉(zhuǎn)向使用電力,而且你不再去使用螺旋槳飛機了,你會轉(zhuǎn)而使用噴氣式飛機。就這樣。這就是我一直在談的全部內(nèi)容。

黃仁勛:然后現(xiàn)在令人難以置信的是,當(dāng)你轉(zhuǎn)向AI時,當(dāng)你轉(zhuǎn)向加速計算時,會發(fā)生什么?會出現(xiàn)哪些新的應(yīng)用?這就是我們所討論的所有AI相關(guān)內(nèi)容。那就是這個機會,它是指什么?那是什么樣子?簡單來說,電機取代了勞動和體力活動的那些地方,現(xiàn)在我們有了AI、AI超級計算機、AI工廠,他們要生成tokens來增強人類智能。而這些人類智能占比大約是多少?55%、65%的全世界GDP?我們就稱它為50萬億美元。而這50萬億美元將會被某些東西增強。讓我們回到個人上。假設(shè)我雇用了一名薪酬為100,000美元的員工,然后我又為那名100,000美元的員工添加了一個價值10,000美元的AI,而那個價值10,000美元的AI結(jié)果卻賺到了100,000美元員工效率提高兩倍,那么生產(chǎn)力提高三倍。我現(xiàn)在正對我們公司里的每一個人這么做。我們公司每一位軟件工程師、每一位芯片設(shè)計師,都已經(jīng)有AI與他們協(xié)同工作,100%覆蓋率。因此,我們制造的芯片數(shù)量更好,這個數(shù)字在增長。所以我們公司正在更快地成長。我們正在招聘更多人。我們的生產(chǎn)力更高。我們的營收更高。我們的盈利能力更強。還有什么不值得喜歡的呢?現(xiàn)在把NVIDIA的故事應(yīng)用到世界GDP上。很可能發(fā)生的情況是,那50萬億美元會被增加到,我們隨便選個數(shù)字,10萬億美元。那10萬億美元需要在一臺機器上運行,F(xiàn)在AI與過去的IT不同的是,在某種程度上,軟件是先驗寫好的,然后它在CPU上運行,一個人會操作它。將來當(dāng)然是由AI生成這些tokens,必須由機器來生成這些tokens,并且它在思考。所以那個軟件一直在運行,而在過去,軟件只需寫一次,F(xiàn)在軟件實際上是在不斷地寫入,它在思考。為了讓AI思考,它需要一個工廠。所以假設(shè)那10萬億美元的tokens被生成了,有50%的毛利率,而其中有5萬億需要一家工廠,對,需要一個AI基礎(chǔ)設(shè)施。所以如果你跟我說按年計算,世界上的資本支出大約是5萬億美元,是的我會說,數(shù)學(xué)上似乎說得通。這就是未來,從通用計算到加速計算,用AI取代所有超大規(guī)模計算,然后增強人類智能,以促進全球GDP增長。

主持人:現(xiàn)在我們估計這個市場每年的規(guī)模約為4000億美元,而潛在市場規(guī)模比現(xiàn)在預(yù)估的增長了4到5倍。

黃仁勛:昨晚,阿里巴巴的Eddie Wu說,從現(xiàn)在到10年后,他們將把數(shù)據(jù)中心的計算能力提高10倍。你剛才說的是多少?4倍?是10倍。他們要將計算能力提高10倍。我們將它與計算能力聯(lián)系起來,NVIDIA的收入幾乎和計算能力掛鉤。他還提到,tokens產(chǎn)量每隔幾個月就會翻一番。這意味著每瓦性能必須持續(xù)呈指數(shù)級增長。這就是為什么NVIDIA要大力提高每瓦性能,每瓦性能本質(zhì)上就代表未來的收入。

主持人:基于這個假設(shè),它的歷史背景非常有趣:兩千年來,GDP基本沒有增長,直到工業(yè)革命帶來加速,隨后數(shù)字革命進一步推動增長。這正如你所說,Scott Besson(美國財政部長)也提到,他認為明年GDP增長率將達到4%。世界GDP增長將會加速,因為我們?nèi)缃駬碛辛藬?shù)十億“AI同事”為我們工作。如果GDP是固定勞動力和資本的產(chǎn)出,那么它必須加速。我們必須考慮AI技術(shù)發(fā)展所帶來的影響。

黃仁勛:它正在創(chuàng)造一個新的AI Agent行業(yè),這是毫無疑問的。OpenAI是歷史上收入增長最高的公司,而且他們正在呈指數(shù)級增長。因此,AI本身是一個快速增長的行業(yè)。而AI需要背后有一個工廠,一個支撐它的基礎(chǔ)設(shè)施。這個行業(yè)正在成長。我的行業(yè)在增長。由于我的行業(yè)在增長,支撐我們的下游行業(yè)也在增長,能源在增長。這是對能源行業(yè)的復(fù)興,核能,燃氣輪機。看看我們下面基礎(chǔ)設(shè)施生態(tài)系統(tǒng)里那些公司,它們表現(xiàn)得非常出色,每家公司都在增長。

主持人:這些數(shù)據(jù)讓所有人都在談?wù)撆菽。扎克伯格上周在一次播客中說:“聽著,我認為在某個時候我們很可能會有一個空氣包,實際上Meta可能會超支100億美元或更多。”但他說這無關(guān)緊要。這對他業(yè)務(wù)的未來至關(guān)重要,以至于這是他們必須承擔(dān)的風(fēng)險。但當(dāng)你這么一想,這聽起來有點像囚徒困境,對吧?今天我們的估計是,到2026年我們將會有1000億美元的AI收入。它包括Meta,也包括那些運行推薦引擎的GPU,或者搜索之類的。

黃仁勛:那到底是什么行業(yè)?哪個行業(yè)已經(jīng)處于超大規(guī)模?超大規(guī)模是萬億級別。順便提一下,在任何人從零開始之前,行業(yè)就在向AI邁進,你必須從那里開始。

主持人:但我認為懷疑論者會說,我們需要從2026年1000億美元的AI收入增長到2030年至少1萬億美元的AI收入。你剛才一分鐘前還在談到大約5萬億,如果你做了,是自下而上的估算,你能設(shè)想在未來五年內(nèi)把AI驅(qū)動的收入從1000億增長到1萬億美元嗎?我們增長得有這么快嗎?

黃仁勛:是的,我還要說我們已經(jīng)到那里了。因為那些超大規(guī)模云服務(wù)提供商,他們已經(jīng)從CPU轉(zhuǎn)向了AI。他們的全部收入基礎(chǔ)現(xiàn)在都由AI驅(qū)動。沒有AI你就做不了TikTok,沒有AI就無法做YouTube Short,沒有AI的話你做不了這些東西。那些令人驚嘆的事情。Meta在為定制內(nèi)容、個性化內(nèi)容所做的工作,沒有AI你做不到。那些事情以前都是由人來完成的,之前是人們在做,內(nèi)容的先驗準(zhǔn)備,創(chuàng)建四個由推薦引擎隨后選取的選項,而現(xiàn)在,則是由AI生成的無限數(shù)量的選項。

主持人:但那些東西已經(jīng)存在了。比如,我們從CPU轉(zhuǎn)向GPU很大程度上是為了那些推薦引擎。

黃仁勛:不,那其實相當(dāng)新。Meta的GPU是多少年了?這是非常新的。而搜索的GPU呢?也是非常新的。

主持人:所以你的論點會是,到2030年我們將擁有1萬億美元的AI收入的概率幾乎是確定的,因為我們幾乎我們已經(jīng)達到了那個程度了。

黃仁勛:我們就從現(xiàn)在的基礎(chǔ)上討論增量改進,F(xiàn)在我們可以談?wù)撛隽苛恕?/p>

主持人:當(dāng)你從下而上或從上而下進行分析時,我剛剛聽到你說的從上而下,關(guān)于全球GDP的百分比。你認為出現(xiàn)供過于求的概率是多少?我們在未來三年、四年或五年內(nèi)會遇到供過于求的概率是多少?

黃仁勛:直到我們將所有通用計算完全轉(zhuǎn)向加速計算和AI為止。直到我們做到這點,我認為機會極低。直到所有推薦引擎都基于AI,直到所有內(nèi)容生成都基于AI,因為面向消費者的內(nèi)容生成在很大程度上就是推薦系統(tǒng),諸如此類。直到所有這些以前典型的超大規(guī)模現(xiàn)在轉(zhuǎn)向AI,從購物到電子商務(wù)的一切到所有那些東西,直到一切結(jié)束為止。

主持人:但這一切都是新的構(gòu)建,對吧?當(dāng)我們談?wù)撊f億時,我們是在為比我們現(xiàn)在更遠的未來進行投資。那是你的職責(zé)嗎?即使你看到放緩或某種過剩即將到來,你是否仍有義務(wù)投資這些資金?還是這是那種你只是向生態(tài)系統(tǒng)揮旗號召說:“出去建設(shè)吧,如果到某個時候我們看到這種放緩,我們隨時可以減少投資規(guī)模。”

黃仁勛:實際上,情況正好相反。因為我們處在供應(yīng)鏈的末端,所以我們響應(yīng)需求。而且現(xiàn)在,所有的風(fēng)投都會這么跟你說,世界的計算資源是短缺的。不是因為全世界缺乏GPU,如果他們給我一個訂單,我就會去制造。在過去的幾年里,我們已經(jīng)徹底梳理了供應(yīng)鏈,從晶圓到共同組裝HBM存儲器,所有在我身后的供應(yīng)鏈,所有那些技術(shù),我們真的已經(jīng)做好了充分準(zhǔn)備。如果需要翻倍,我們就翻倍,因此供應(yīng)鏈已準(zhǔn)備就緒,F(xiàn)在我們只是在等待需求信號。

黃仁勛:當(dāng)CSP和大型云服務(wù)商以及我們的客戶,把他們的年度計劃給我們時,我們會按那個計劃去構(gòu)建。現(xiàn)在的情況是,華爾街給我們的每一項預(yù)測,結(jié)果都被證明是錯的,因為他們預(yù)測不足。所以近年來我們總是在緊急應(yīng)對狀態(tài),無論給出的預(yù)測是什么,總是比去年有顯著增長,但是還是不夠。去年Satya的表現(xiàn)似乎有點退步,似乎是這樣的,有些人稱他房間里的成年人。幾周前他說:“嘿,我今年也建造了2個吉瓦,我們未來會加速發(fā)展。”你是否看到一些傳統(tǒng)的大型云服務(wù)商(hyperscalers)似乎動作有點慢,或者比我們所說的Elon 的X,還有星際之門項目稍慢一點?對我來說他們現(xiàn)在都更投入了,而且都在加速。

黃仁勛:因為第二個指數(shù)增長。我們已經(jīng)經(jīng)歷過一次指數(shù)級增長,那就是AI的采用率和參與度的增長。第二個被觸發(fā)的指數(shù)級增長是推理能力的提升。這正是我們一年前的對話。那時我們說,“嘿,聽著。當(dāng)你讓AI記住和概括一個答案,這基本上就是預(yù)訓(xùn)練。”一年前,推理出現(xiàn)了,研究出現(xiàn)了,工具使用也出現(xiàn)了,而現(xiàn)在你是一個會思考的人工智能。這將會消耗更多的計算資源。

主持人:正如你所說,某些超大規(guī)?蛻舸_實有必須遷移的內(nèi)部工作量,從通用計算遷移到加速計算,因此他們在整個周期中進行了構(gòu)建。我認為,或許有些超大規(guī)模云服務(wù)商的工作量不同,因此他們不太確定能多快消化這些需求。但現(xiàn)在大家都得出結(jié)論:他們遠遠低估了所需的規(guī)模。

黃仁勛:我最喜歡的其中一個案例,就是傳統(tǒng)的數(shù)據(jù)處理,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),只是老式的數(shù)據(jù)處理。而且很快,我們將宣布一項大規(guī)模的加速數(shù)據(jù)處理計劃。數(shù)據(jù)處理代表了當(dāng)今世界上絕大多數(shù)的CPU使用,它仍然完全在CPU上運行。如果你去Databricks,大多數(shù)都是CPU;你去Snowflake,大多是CPU。Oracle的SQL處理,大多是CPU。每個人都在用CPU來做,將來,這些都會遷移到AI數(shù)據(jù)上。那是一個我們將要轉(zhuǎn)入的龐大市場。NVIDIA做的所有事情都需要加速層,需要特定領(lǐng)域的數(shù)據(jù)處理配方(recipes),我們得去構(gòu)建它,但這即將到來。

主持人:所以人們提出的反對意見之一是,我昨天打開了CNBC,他們說,“哦,供過于求,泡沫。”當(dāng)我打開彭博時,談?wù)摰氖茄h(huán)往返交易和循環(huán)收入。這些安排是在企業(yè)進行一種誤導(dǎo)性的交易時,這類安排會人為地抬高收入,而沒有任何實質(zhì)性的經(jīng)濟基礎(chǔ)。換句話說,就是通過金融工程支撐起來的增長。不是由客戶需求驅(qū)動的。當(dāng)然,大家引用的典型案例是25年前上一次泡沫時期的Cisco和Nortel。所以,當(dāng)你們或者Microsoft或者Amazon投資于那些也是你們大客戶的公司時,在這種情況下,你們投資于OpenAI。與此同時,OpenAI正在購買數(shù)百億級美元的芯片。當(dāng)彭博的分析師和其他人對循環(huán)收入或回流交易大驚小怪時,他們到底哪里錯了?

黃仁勛:10吉瓦大約相當(dāng)于4000億美元,對吧?而且那4000億美元將不得不主要由他們的購售協(xié)議(offtake)來提供資金。他們的收入正在呈指數(shù)增長,必須由他們的資本來資助,他們通過股權(quán)募集的資金,以及他們能籌到的任何債務(wù)。這就是三種融資工具。他們能籌集到的股權(quán)和債務(wù),與他們能夠維持的收入的可信度有關(guān)。因此,精明的投資者和精明的放款人會考慮所有這些因素。從根本上說,這就是他們會做的事。那是他們的公司,不是我的事。當(dāng)然,我們必須與他們保持非常緊密的聯(lián)系,以確保我們構(gòu)建的支持能夠促進他們的持續(xù)增長。這是收入方面的事,跟投資方面毫無關(guān)系。這方面的投資并不與任何事物掛鉤。這是一個投資他們的機會。正如我們之前提到的,這很可能會成為下一個市值數(shù)萬億美元的超大規(guī)模公司。誰不想成為那里的投資者呢?我唯一的遺憾是,早些時候邀請我們投資。我記得那些談話。我們當(dāng)時太窮,投資不足你知道嗎?而我本該把所有錢都給他們。

主持人:現(xiàn)實是,如果你們不做好自己的工作并跟上進度,如果Vera Rubin不能變成一個好的芯片,他們可以去買其他芯片并把它們放進這些數(shù)據(jù)中心。他們沒有義務(wù)必須使用你的芯片。就像你說的,你把這看作一次機會性的股權(quán)投資。

黃仁勛:我們在這方面做了大量出色的投入。我們投資了xAI、CoreWeave,我們太明智了。

 

圖片

4.NVIDIA的競爭優(yōu)勢與戰(zhàn)略

主持人:那我們就深入一點討論系統(tǒng)設(shè)計吧。在2024年,你改回了年度發(fā)布周期,然后你進行了大規(guī)模升級,這需要和Grace Blackwell一起對數(shù)據(jù)中心進行重大改造。在2026年下半年,我們將會得到Vera Rubin。2027年,將發(fā)布Ultra,然后2028年,將發(fā)布Feynman。年度發(fā)布周期進行得怎么樣,順利嗎?采用這個年度發(fā)布周期的主要目標(biāo)是什么?而且NVIDIA內(nèi)部的AI是否讓你能夠執(zhí)行年度發(fā)布周期?

黃仁勛:是的。沒有AI,NVIDIA的速度、我們的節(jié)奏我們的規(guī)模將受到限制。因此,沒有現(xiàn)在的AI,根本不可能構(gòu)建出我們所構(gòu)建的東西。我們?yōu)槭裁匆@么做?Satya已經(jīng)說過,Sam也說過,tokens生成速率正在呈指數(shù)級上升,而且客戶使用量呈指數(shù)增長。我記得他們大概有8億每周活躍用戶之類的。我的意思是,我們從距離ChatGPT興起還不到2年,對吧?所以,第一件事是,因為tokens生成速率正在以驚人的速度上升,兩個指數(shù)疊在一起,除非我們以驚人的速度提升性能,tokens生成的成本將持續(xù)增長,因為摩爾定律已經(jīng)死了,因為晶體管基本上現(xiàn)在每年都差不多價錢,功率大體相同。在這兩個基本規(guī)律之間,除非我們想出新的技術(shù)來降低成本,即使增長有些許差異,你給某人幾個百分點的折扣,那怎么能彌補兩個指數(shù)級增長的差距?所以我們必須每年以能夠跟上那種指數(shù)增長的速度提高我們的性能。所以在這種情況下,我想從Kepler一直到Hopper,性能提升大概是100,000倍。那就是NVIDIA AI之旅的起點,10年內(nèi)提升100,000倍。在Hopper和Blackwell之間,由于NVLink 72,我們實現(xiàn)了增長,一年增長30倍。然后我們會因Rubin再次獲得另一個X因素,然后我們會因Feynman再獲得另一個X因素。而我們這樣做的原因是,因為晶體管對我們幫助并不大,對吧?摩爾定律在很大程度上是如此。密度在上升,但性能卻沒有隨之提升。因此,如果情況是這樣,我們必須面對的挑戰(zhàn)之一,就是必須在系統(tǒng)層面把整個問題拆解開,并同時更改每一塊芯片,以及所有的軟件堆棧和所有系統(tǒng),全部同時進行。極致的極限代碼設(shè)計。以前從未有人在這個層次上進行過設(shè)計。我們改變CPU,徹底革新CPU,GPU、網(wǎng)絡(luò)芯片、NVLink擴展,Spectrum X擴展。我聽到有人說,“哦,是的,這只是以太網(wǎng)。”Spectrum X不僅僅是以太網(wǎng)。人們開始發(fā)現(xiàn),“我的天啊,X因素相當(dāng)驚人。”NVIDIA的以太網(wǎng)業(yè)務(wù),是全球增長最快的以太網(wǎng)業(yè)務(wù)。因此,要擴大規(guī)模,當(dāng)然,現(xiàn)在我們必須構(gòu)建更大的系統(tǒng),所以我們向外擴展,多個AI工廠互相連接在一起。然后我們以年度速度來做這件事。因此我們現(xiàn)在擁有一個指數(shù)的指數(shù),從技術(shù)層面上自我加速。這讓我們的客戶能夠降低token成本,通過預(yù)訓(xùn)練和后訓(xùn)練以及思考,不斷讓這些token變得越來越智能。結(jié)果是,隨著AI變得更聰明,它們會被更多地使用。隨著使用量增加,它們將呈指數(shù)增長。

主持人:對于可能不太熟悉的人來說,極限協(xié)同設(shè)計(co-design)是什么意思?

黃仁勛:極限協(xié)同設(shè)計意味著你必須對模型進行優(yōu)化,算法、系統(tǒng)和芯片同時進行。你必須跳出框框進行創(chuàng)新。因為摩爾定律就是說,你只需要不斷把CPU做得越來越快,一切都變得更快了,你在一個框框里進行創(chuàng)新,讓那顆芯片更快就行。如果那顆芯片提速不了的話,那你打算怎么辦?在框外創(chuàng)新。所以NVIDIA真的改變了很多,因為我們做了兩件事。我們發(fā)明了CUDA,發(fā)明了GPU,并且在很大規(guī)模上提出了大規(guī)模協(xié)同設(shè)計的理念。這就是為什么我們涉足了所有這些行業(yè)。我們正在創(chuàng)建所有這些庫并進行協(xié)同設(shè)計,首先是全棧極限,它甚至超越了軟件和GPU,現(xiàn)在是在數(shù)據(jù)中心級別,交換機和網(wǎng)絡(luò)以及交換機里所有那些軟件,在網(wǎng)絡(luò)、在NIC(網(wǎng)卡)中,縱向擴展,橫向擴展,在所有這些方面進行優(yōu)化。因此,從Hopper到Blackwell,相當(dāng)于提升了30倍。沒有任何摩爾定律能夠?qū)崿F(xiàn)這一點。所以這就是極限的協(xié)同設(shè)計。這是來自極限協(xié)同設(shè)計的結(jié)果嗎?那是因為NVIDIA做到了。這就是我們涉足網(wǎng)絡(luò)、交換、縱向擴展、橫向擴展和跨域擴展的原因,以及制造CPU、制造GPU和制造網(wǎng)卡。你知道,那就是為什么NVIDIA在軟件和人才上如此富有的原因。我們在世界上提交的開源軟件貢獻,比幾乎任何人都多。除了另外一家公司,我想是AI2之類的。因此,我們有如此豐富的軟件資源,而這還僅僅是在AI領(lǐng)域。別忘了計算機圖形學(xué)、數(shù)字生物學(xué)和自動駕駛車輛,我們作為一家公司所產(chǎn)出的軟件數(shù)量非常驚人。這使我們能夠進行深入且極限的共同設(shè)計。

主持人:我從你們的一個競爭對手那里聽說,這么做是因為這有助于降低tokens生成的成本,但與此同時,你們的年度發(fā)布周期幾乎讓競爭對手無法跟上。供應(yīng)鏈被鎖定得更厲害,因為你給了供應(yīng)鏈三年的可見性。所以現(xiàn)在供應(yīng)鏈——

黃仁勛:在你問問題之前,先考慮一下這個。為了讓我們每年做出數(shù)千億美元的交易,關(guān)于AI基礎(chǔ)設(shè)施建設(shè)的建設(shè),想想一年前我們有多少產(chǎn)能可以開始。我們在談?wù)摻ㄔO(shè)數(shù)千億美元級別的晶圓開工和DRAM采購,等等,F(xiàn)在的規(guī)模幾乎沒有任何公司能跟得上。

主持人:那么你會說你們現(xiàn)在的競爭優(yōu)勢比三年前更強嗎?

黃仁勛:首先,競爭比以往任何時候都更多,但現(xiàn)在比以往任何時候都更困難。我之所以這么說是因為,晶圓成本在上升。這意味著除非你在極大規(guī)模上進行協(xié)同設(shè)計,否則你就無法實現(xiàn)那種“x因子”級別的增長。除非你一年要處理六、七、八顆芯片,這不是在制造ASIC,這是在建立一個AI工廠。而且這個系統(tǒng)里面有很多芯片,它們都是共同設(shè)計的,并且結(jié)合在一起,它們帶來了我們獲得的那個10倍效應(yīng),幾乎是定期的。第一,協(xié)同設(shè)計非常極限。第二,規(guī)模也非常極限。當(dāng)你的客戶部署1吉瓦時,那是40萬、50萬塊GPU,讓50萬塊GPU協(xié)同工作是一種奇跡。你的客戶在你身上承擔(dān)著巨大的風(fēng)險,你得問自己,哪位客戶會在一個新的架構(gòu)上下達一份價值500億美元的采購訂單?你剛剛設(shè)計出了一款全新的芯片,你為此感到既興奮又激動,而且你剛剛展示了第一個硅片,誰會給你500億美元的采購訂單?為什么你要為一款剛剛流片的芯片啟動價值500億美元的晶圓生產(chǎn)?但對于NVIDIA,我們可以那樣做。因為我們的架構(gòu)經(jīng)過充分驗證。我們的客戶規(guī)模令人難以置信,現(xiàn)在我們的供應(yīng)鏈規(guī)模令人難以置信。誰會為一家公司開始做所有那些東西,預(yù)先構(gòu)建所有那些東西,除非他們知道NVIDIA能夠交付。不是嗎?他們相信我們能夠為全球所有客戶提供服務(wù)。他們愿意一次投入數(shù)千億美元。

主持人:你知道,世界上最大的一場關(guān)鍵辯論和爭議之一就是GPU與ASIC的問題。Google的TPUs、Amazon的Trainium,似乎從ARM到OpenAI再到Anthropic的每個人都在參與。去年你說,你知道,我們在構(gòu)建系統(tǒng),而不是芯片,并且你正在通過堆棧的每一個部分推動性能提升。你還說過,這些項目中的許多可能永遠無法達到生產(chǎn)規(guī)模,但鑒于Google的TPU看起來似乎取得了成功,你現(xiàn)在如何看待這個不斷演變的格局?

黃仁勛:谷歌具備的優(yōu)勢是前瞻性。記住,他們在一切開始之前就啟動了TPU1。這和創(chuàng)業(yè)公司沒什么不同。你應(yīng)該去創(chuàng)建一個創(chuàng)業(yè)公司,你應(yīng)該在市場增長之前建立一個創(chuàng)業(yè)公司。當(dāng)市場規(guī)模達到數(shù)萬億美元時,你不應(yīng)該還以一家創(chuàng)業(yè)公司的身份出現(xiàn)。這個謬論,所有風(fēng)險投資家都知道的,這種謬論認為,只要占據(jù)幾個百分點的市場份額,龐大的市場就能帶來成功,你可以成為一家大型公司,那實際上從根本上就是錯的。你本該拿下這家小公司的全部,這正是NVIDIA做的,不是嗎?這就是TPU所做的,當(dāng)時只有我們兩個人。

主持人:不過你最好希望那個行業(yè)真的變得非常大。你在創(chuàng)造一個產(chǎn)業(yè)。

黃仁勛:沒錯。這就是對正在構(gòu)建ASIC的人的挑戰(zhàn)?雌饋磉@是個誘人的市場,但請記住,這個誘人的市場是從一種叫GPU的芯片演變而來的。所以我剛才描述了一個AI工廠,你們剛才看到,我剛宣布了一款名為CPX的芯片,用于上下文處理和擴散視頻生成,這是一個非常專業(yè)的工作量,但是在數(shù)據(jù)中心內(nèi)部這是一個重要的工作量。我剛才提到可能是用于AI數(shù)據(jù)處理的處理器,因為你猜怎么著?你需要長期記憶,你需要短期記憶,KV緩存的處理確實非常密集,AI記憶是件大事,你希望你的AI有良好的記憶能力。而且處理系統(tǒng)中所有與KV緩存相關(guān)的內(nèi)容,真的很復(fù)雜,也許它需要一個專用的處理器。也許還有其他的東西,對吧?所以你看到NVIDIA,我們的觀點現(xiàn)在不再是GPU,我們的視角是看整個AI基礎(chǔ)設(shè)施。這些了不起的公司需要什么多樣的基礎(chǔ)設(shè)施才能完成他們所有的工作量?纯磘ransformer。transformer架構(gòu)正在發(fā)生巨變。如果不是因為CUDA操作和迭代都很方便,他們?nèi)绾螄L試那么多實驗來決定哪個transformer版本?使用哪種注意力算法?你如何進行拆解?CUDA可以幫助你完成所有這些,因為它高度可編程。因此,思考我們方式的方法是,我們的業(yè)務(wù)現(xiàn)在是你看看當(dāng)下,當(dāng)所有這些ASIC公司或ASIC項目在3、4、5年前開始,那時候這個行業(yè)非常可愛而且簡單,涉及到一塊GPU。但現(xiàn)在,它變得龐大而復(fù)雜。再過兩年,這將變得非常巨大。規(guī)模會非常龐大。所以我認為作為一個新興玩家,進入一個非常大的市場的那場斗爭確實很艱難。

主持人:他們的計算機群中是否存在最佳平衡?投資者是二元生物,他們只想要一個黑白分明的“是”或“否”的答案。但即使你讓ASIC工作起來,難道沒有最佳平衡嗎?你認為我正在購買Nvidia平臺,CPX將會進行預(yù)填充,用于視頻生成,也許是解碼,一個平臺視頻。因此將會有許多不同的芯片或部件添加到Nvidia生態(tài)系統(tǒng)、加速計算集群中。隨著新的工作量的出現(xiàn),它們正在誕生。而且今天試圖推出新芯片的人們并沒有真正預(yù)料到一年后會發(fā)生什么,他們只是想讓芯片工作起來。換句話說,谷歌是GPU的大客戶。

黃仁勛:谷歌就是一個非常特殊的例子。我們必須對真正值得尊重的人表示尊重,TPU在TPU7上。是的,這對他們來說也是一個挑戰(zhàn),所以他們所做的工作非常辛苦。記住,芯片有三類。有一類是架構(gòu)類的芯片,X86 CPU、ARM CPU、NVIDIA GPU,屬于架構(gòu)類。并且它上面還有一個生態(tài)系統(tǒng),擁有豐富的IP和豐富的生態(tài)系統(tǒng),非常復(fù)雜的技術(shù)。它由擁有者構(gòu)建,就像我們一樣。還有ASIC。我曾在最初發(fā)明了ASIC的概念的公司LSI Logic工作,如你所知,LSI Logic已經(jīng)不復(fù)存在。原因是ASIC非常出色,但當(dāng)市場規(guī)模不是很大時,作為承包商幫你把所有那些東西的包裝搞定并代表你進行制造是很容易的,他們會向你收取50到60個點的利潤。但是當(dāng)ASIC的市場變大時,就出現(xiàn)了一種新的做事方式,叫作CoT。Apple的王牌,那款手機芯片,規(guī)模如此之大,他們絕不會花錢支付別人50%、60%的毛利率來成為ASIC。他們?yōu)榭蛻糁谱髯约旱墓ぞ摺.?dāng)它變成一個大生意時,TPU會去哪里?客戶自己的工具。這是毫無疑問的。但ASIC還有其用武之地。視頻轉(zhuǎn)碼器的規(guī)模永遠不會太大。SmartNIC的規(guī)模永遠不會太大。所以當(dāng)有十個、十二個,在一家ASIC公司同時進行15個ASIC項目時,我對那種情況并不感到驚訝。因為那里可能有五個SmartNIC和四個轉(zhuǎn)碼器。它們都是AI芯片嗎?當(dāng)然不會。而且,如果有人要針對特定推薦系統(tǒng)構(gòu)建一個嵌入式向量處理器,那當(dāng)然那是一個ASIC,你當(dāng)然可以那樣做,但你會把它作為不斷變化的AI的基礎(chǔ)計算引擎來使用嗎?你有低延遲工作負載,你有高吞吐量工作負載,你有用于聊天的tokens生成,你有思考工作負載,你有AI視頻生成工作負載。那就是NVIDIA的全部所在。

主持人:再簡單點說,就像下國際象棋和跳棋。對吧?事實上,今天開始設(shè)計ASIC的那些人,無論是Trainium還是其他一些這些廠商,他們正在設(shè)計一款作為更大機器組件的芯片。你已經(jīng)構(gòu)建了一個非常復(fù)雜的系統(tǒng)、平臺、工廠,隨你怎么稱呼,現(xiàn)在你稍微開放一點,對吧?所以你提到CPX GPU,也就是說,在我看來,你在某種程度上將工作負載拆分到最適合該特定需求的硬件片段上。

黃仁勛:看看我們做了什么。我們發(fā)布了一個叫作Dynamo的東西,分解式 orch AI工作負載編排。我們將其開源,因為未來的AI工廠是分解式的。

主持人:然后你們發(fā)布了NV Fusion。甚至和你的競爭對手說了,包括你剛剛投資的Intel。你知道,就是你以這種方式參與我們正在建設(shè)的這個工廠。因為沒有別人傻到去試圖建造整個工廠,但如果你的產(chǎn)品足夠好,你可以接入那套系統(tǒng),足夠有吸引力,讓最終用戶說:“嘿,我們想用這個來替代ARM GPU。”或者:“我們想用這個來替代你的推理加速器”等等。這是正確的嗎?

黃仁勛:是的。我們很高興能為您服務(wù)。NV Link Fusion,真是個很棒的主意。我們非常高興能與Intel合作。這需要Intel生態(tài)系統(tǒng)的參與。世界上大多數(shù)企業(yè)仍然依賴Intel運行,這需要Intel生態(tài)系統(tǒng),結(jié)合NVIDIA AI、生態(tài)系統(tǒng)、加速計算單元,然后我們把它們?nèi)诤显谝黄。我們就是用ARM做到這一點的。還有好幾個項目我們也會用它來做。這為我們雙方都打開了機會。這對我們雙方都是雙贏。我將成為他們的大客戶,他們會讓我們接觸到一個遠遠更大的市場機會。

主持人:讓人震驚的是,你說我們的競爭對手在制造ASIC。今天所有的芯片已經(jīng)更便宜了,但他們實際上可以把價格定為零,我們的目標(biāo)是他們可以把價格定為零,而你仍然會購買一套NVIDIA系統(tǒng),因為運行該系統(tǒng)的總體成本、電力、數(shù)據(jù)中心、土地等、情報輸出仍然比購買芯片更值得。即便那顆芯片是免費送給你的,也還是一顆芯片。

主持人:因為土地、電力和外殼已經(jīng)花費了150億美元。

主持人:所以我們已經(jīng)嘗試去做這方面的數(shù)學(xué)計算,但給我們講講你的數(shù)學(xué)推導(dǎo),因為我覺得對于那些不;〞r間在這里的人來說,他們就是無法理解。怎么可能你把競爭對手的芯片定價為零,考慮到你們芯片的成本,竟然它仍然更值得賭一把?

黃仁勛:有兩種思路來考慮這個問題。一種方式是,我們就從收入的角度來考慮。所以每個人都受功率限制,假設(shè),你設(shè)法再獲得了兩吉瓦的動力。那么,你希望擁有的那兩吉瓦動力會轉(zhuǎn)化為收入。你的性能或每瓦token數(shù)是別人的兩倍,因為進行了深度且極限的協(xié)同設(shè)計,而且性能要高得多。然后我的客戶可以從他們的數(shù)據(jù)中心獲得兩倍的收入。誰不想獲得兩倍的收入呢?而且如果有人給他們15%的折扣,你知道,我們的毛利率大約75個基點,而別人的毛利率,大約在50到65個基點,并不足以彌補Blackwall和Hopper之間30倍的差距。我們假設(shè)Hopper是一款驚人的芯片,假設(shè)別人的ASIC是Hopper。所以你在那1吉瓦里得放棄30倍的收入,放棄太多了。所以即使他們免費送給你,你只有兩吉瓦可用,你的機會成本高得驚人,你會始終選擇每瓦性能最優(yōu)的方案。

主持人:我是在一家超大規(guī)模云服務(wù)商的首席財務(wù)官那里聽到這句話的。他說鑒于你芯片帶來的性能提升正在出現(xiàn),再次正好到那個點,每個token的每吉兆,以及功率是限制因素,他們不得不升級到新的周期。所以當(dāng)你展望Rubin、Rubin Ultra和Feynman,這種軌跡會持續(xù)下去嗎?

黃仁勛:我們現(xiàn)在每年大概在制造六、七塊芯片,對吧?而且每一塊作為該系統(tǒng)的一部分。而且那個系統(tǒng)、軟件無處不在,并且它需要在這六個方面進行整合和優(yōu)化,才能實現(xiàn)Blackwell的30倍性。現(xiàn)在,想象我每年都在做這件事。因此,如果你在那片ASIC的混合體中制造一個ASIC,在那片芯片大雜燴中,我們在其間進行優(yōu)化,你知道的,這是一個難以解決的問題。

主持人:這確實把我?guī)Щ氐轿覀円婚_始討論的競爭優(yōu)勢護城河的問題。我們已經(jīng)在關(guān)注這一點和投資者有一段時間了。我們在整個生態(tài)系統(tǒng)中都是投資者,從Google到Broadcom。但當(dāng)我真正從第一性原理來審視這個問題時,并且問,你是在擴大還是縮小你的競爭護城河?你會轉(zhuǎn)為按年度節(jié)奏進行,你正在與一個供應(yīng)鏈共同開發(fā),規(guī)模遠遠超出任何人的預(yù)期。這需要規(guī)模,無論是在資產(chǎn)負債表上,還是在開發(fā)方面,對吧?你所做的那些舉措,無論是通過收購,還是像NV Fusion這樣的內(nèi)部有機發(fā)展,這些所有事加在一起讓我相信你們的競爭模式正在增強,至少在建設(shè)工廠或系統(tǒng)方面是如此。這至少令人驚訝。但是我覺得有趣的是,你的倍數(shù)遠低于那些大多數(shù)其他人。我認為這在某種程度上與大數(shù)法則有關(guān)。一家市值4.5萬億美元的公司不可能再大了。但我在一年半前就問過你這個問題。當(dāng)你今天坐在這里,如果市場對AI工作負載將是10倍或5倍增長,我們知道資本支出在做什么等等,在你看來有沒有任何想象空間,你五年后的營收頂部不是比2025年大兩倍或三倍?或者實際上不增長的概率有多大?

黃仁勛:我會這樣回答。正如我所描述的那樣,這是我們的機遇,機遇遠遠大于共識。

主持人:我認為NVIDIA很可能會成為首家市值10萬億美元的公司。就在十年前,人們曾說過不可能出現(xiàn)一家市值萬億美元的公司,F(xiàn)在我們有10家了,對吧?而且今天世界變得更大了。這就是回到關(guān)于GDP的指數(shù)增長點。

黃仁勛:世界更大了。而且人們誤解我們所做的事情。他們記得我們是一家芯片公司,而我們確實,我們制造芯片,還設(shè)計世界上最了不起的芯片。但NVIDIA實際上是一家AI基礎(chǔ)設(shè)施公司。我們是你的AI基礎(chǔ)設(shè)施合作伙伴,而我們與OpenAI的合作正是這種情況的完美體現(xiàn)。我們是他們的AI基礎(chǔ)設(shè)施合作伙伴。我們以多種不同方式與人們合作。我們不要求任何人全部從我們這里購買,我們不要求他們購買整機架。他們可以購買一顆芯片。他們可以購買一個組件。他們可能會買我們的網(wǎng)絡(luò)設(shè)備。我們有客戶只購買我們的CPU,直接買我們的GPU,別人的CPU以及別人的網(wǎng)絡(luò)設(shè)備。我們基本上可以接受你以任何喜歡的方式購買。你知道,我唯一的請求就是在我們這里買點東西,你知道嗎?

主持人:你說過,這不僅僅是關(guān)于更好的模型。我們也必須構(gòu)建。我們必須擁有世界級的建設(shè)者。你說過,或許我們國內(nèi)最世界級的建設(shè)者是Elon Musk。我們還談到了Colossus 1,以及他在那兒做什么,那時的H100、H200在一個連貫的集群中,現(xiàn)在他正在開發(fā)Colossus 2,你知道那可能是500,000 GB,相當(dāng)于數(shù)百萬個H100的等效算力,組成一個協(xié)同工作的集群。

黃仁勛:如果他比別人更早達到吉瓦級,我不會感到驚訝。

主持人:是的,所以稍微多說一點關(guān)于那件事。作為構(gòu)建者的優(yōu)勢,這不僅僅是構(gòu)建軟件和模型,還要理解實現(xiàn)它所需的一切,構(gòu)建那些集群。

黃仁勛:這些AI超級計算機是很復(fù)雜的東西。這項技術(shù)很復(fù)雜。因為融資問題,采購也很復(fù)雜。確保土地、電力和機殼的安全,為其供電很復(fù)雜。我的意思是,這是無可置疑的人類有史以來最復(fù)雜的系統(tǒng)問題。而且,埃隆有一個很大的優(yōu)勢,就是在他腦子里,所有這些系統(tǒng)都是相互協(xié)作的,并且和那些相互依賴的關(guān)系,都在一個人腦子里,包括融資。

主持人:所以他是個大型GPT。他本身就是一臺大型超級計算機。

黃仁勛:他是終極GPU。所以,他在那里有很大優(yōu)勢。而且,他有很強的緊迫感。他確實有一種真切的渴望去構(gòu)建它,當(dāng)愿望被技能實現(xiàn)時,難以置信的事情就會發(fā)生。是的,挺獨特的。

       原文標(biāo)題 : 通用計算時代已經(jīng)結(jié)束!黃仁勛深度訪談,首次揭秘投資OpenAI的原因

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號