速度提升數十倍,用光子計算重塑AI算力集群
前言:
要實現(xiàn)超強的AI能力,需要超大規(guī)模的模型,要訓練超大規(guī)模的AI模型,需要數千,甚至上萬的GPU協(xié)同工作。
這就帶來幾個問題:更多的GPU造成的高能耗,計算卡與計算卡之間的通信延遲,計算集群與計算集群之間的通信延遲和算力損耗。
那么,如果用光來計算,用光來傳輸,會怎么樣?
作者 | 方文三
圖片來源 | 網 絡
光子計算初創(chuàng)公司Lightmatter
Lightmatter近日宣布成功融資4億美元,這一巨額資金將用于突破現(xiàn)代數據中心的瓶頸。
Lightmatter作為一家在光學領域具有創(chuàng)新實力的公司,其研發(fā)的光學技術成功應用于AI算力集群,實現(xiàn)了性能的飛躍。
傳統(tǒng)的電子傳輸在數據處理速度上逐漸面臨瓶頸,而Lightmatter的光學技術則利用光子的特性,以光速進行數據傳輸和處理,大大減少了數據傳輸的延遲,從而顯著提高了整個算力集群的運行效率。
這種技術突破并非一蹴而就,是Lightmatter團隊長期投入研發(fā)的成果。他們在光學芯片設計、光通信協(xié)議等關鍵領域進行了深入研究和創(chuàng)新,克服了諸多技術難題,最終實現(xiàn)了將光學技術與AI算力集群的完美融合。
Lightmatter由Nicholas Harris、Darius Bunandar和Thomas Graham于2017年創(chuàng)立。Nicholas Harris是麻省理工學院量子光子實驗室的成員,2012年,他與合作者實現(xiàn)了“可編程納米光子處理器”(PNP),這是一種基于硅光子學的光學處理器,可以對光進行矩陣變換。
光子計算重塑AI算力集群
Lightmatter有光子計算單元,有光學芯片封裝和傳輸技術,能夠系統(tǒng)化提升整個AI計算集群的計算力,計算效率,并降低功耗。
Lightmatter的光學互連層技術允許數百個GPU同步工作,極大地簡化了AI模型訓練和運行的復雜性和成本。
AI技術的迅猛發(fā)展,數據中心行業(yè)迎來了前所未有的增長,但并非簡單的增加GPU數量就能解決問題。
高性能計算專家早已指出,如果超級計算機的節(jié)點在等待數據輸入時處于空閑狀態(tài),那么節(jié)點的速度再快也無濟于事。
互連層是將CPU和GPU架構成一個巨大計算機的關鍵,而Lightmatter通過其自2018年以來開發(fā)的光子芯片,構建了目前最快的互連層。
公司CEO兼創(chuàng)始人Nick Harris表示,超大規(guī)模計算需要更高效的光子互連技術,而傳統(tǒng)的Cisco交換機無法滿足這一需求。
目前,數據中心行業(yè)的頂尖技術是NVLink和NVL72平臺,但這些技術在網絡速度和延遲方面仍存在瓶頸。
Lightmatter的光子互連技術通過純光學接口,每根光纖可達到1.6 terabits,顯著提升了數據中心的性能。
創(chuàng)始人Harris指出,光子技術的發(fā)展速度遠超預期,經過七年的艱苦研發(fā),Lightmatter已經準備好迎接市場的挑戰(zhàn)。
超快計算,超快連接,軟件兼容
Lightmatter的產品分為光子計算平臺(Envise),芯片互連產品( Passage)和適配軟件(Idiom)三部分。
Envise:是世界首個光子計算平臺,每個Envise處理器擁有256個RISC內核,提供400Gbps的芯片間互連帶寬,而且支持PCI-E 4.0標準接口,具有不錯的兼容性。
Envise處理器的原理是光通過波導進行計算,而每增加一種顏色的光源,就能相應增加運算速度。
同樣是一個計算核心,當光源種類達到8種,就能提升8倍的計算性能,同時計算效率也達到普通計算核心的2.6倍。當計算核心和光源種類同步提升時,計算性能可以提升數十倍。
Passage:是一種利用光子進行芯片互連的技術,屬于I/O技術的一種。任何超級計算機都由許多小型獨立計算機組成,為了發(fā)揮性能,它們必須不斷相互通信,確保每個核心都知道其他核心的進展,并協(xié)調超級計算機設計應對的極其復雜的計算問題。
Lightmatter的技術利用波導(wave guide)而非光纖在一個大的芯片間為各個不同種類的計算核心互連并傳輸數據,這提供了極高的并行互連帶寬。
Idiom:是一個工作流工具,它可以讓基于Pytorch、TensorFlow或ONNX等框架構建的模型,直接在Envise計算基礎設施上使用。無需更改 Pytorch、TensorFlow或ONNX文件。
此外,它還為開發(fā)者提供一系列方便的工具,例如可以自動虛擬化每個 Envise服務器,在多個Envise服務器之間執(zhí)行分區(qū),為多個不同的用戶個性化分配使用的芯片數量。
市場競爭格局
Lightmatter的光子互連技術不僅提升了數據中心的性能,還吸引了包括微軟、亞馬遜、xAI和OpenAI在內的眾多大型數據中心公司的關注。
此次4億美元的D輪融資使Lightmatter的估值達到44億美元,成為光子計算領域的領軍企業(yè)。
但專注于光子計算的公司,不止Lightmatter一家,Celestial AI也在今年3月獲得了1.75億美元的C輪融資,它主要利用光在芯片內部和芯片之間進行數據移動,與Lightmatter的Passage類似。
中國市場上也有不少在光子計算領域耕耘的公司,只是它們的發(fā)展規(guī)模相對較小。
目前,中國市場的AI算力硬件公司們,其實面臨著彎道超車的機會。這個局面有些像中國的新能源汽車行業(yè),不在舊有的體系架構上追趕國外巨頭,而用新技術去滿足新需求,建立自己的優(yōu)勢。
一方面AI計算是一個相對較新的領域,海外的公司有領先,但是并沒有構建很難逾越的壁壘,另一方面AI是專有計算,有不少開源的計算架構適合AI。
中國公司只要能研發(fā)出一些自有的IP,再利用本身就具有的強工程能力,就很有可能開發(fā)出至少不遜于海外的算力硬件。
結尾:
未來,Lightmatter不僅將繼續(xù)優(yōu)化互連技術,還將開發(fā)新的芯片基板,進一步提升光子計算的性能。Harris預測,未來十年,互連技術將成為摩爾定律的核心。
內容來源于:阿爾法公社:用光學讓AI算力集群提速數十倍,Lightmatter融資4億美元|AlphaFounders;安特恩:光子計算新紀元:Lightmatter融資4億美元,引領AI數據中心革命
原文標題 : AI芯天下丨趨勢丨速度提升數十倍,用光子計算重塑AI算力集群

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網產業(yè)大會
-
10 大模型的盡頭是開源
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 人形機器人廠商,正在批量復刻宇樹G1
- 4 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 5 華為公布昇騰芯片三年計劃,自研HBM曝光
- 6 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 7 機器人9月大事件|3家國產機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 8 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 10 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?