訂閱
糾錯(cuò)
加入自媒體

趨勢(shì)丨HBM升級(jí)=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”

前言:當(dāng)AI大模型的參數(shù)規(guī)模邁向萬億級(jí),上下文窗口突破百萬token,HBM(高帶寬內(nèi)存)雖快,但容量有限且成本高昂;NAND閃存雖大,但帶寬不足。在這個(gè)算力與存儲(chǔ)的斷層之間,一種名為HBF(高帶寬閃存)的新型存儲(chǔ)技術(shù)正從實(shí)驗(yàn)室走向產(chǎn)業(yè)前臺(tái)。

從HBM到HBF的“升級(jí)”邏輯

HBF(High Bandwidth Flash,高帶寬閃存)并非HBM的簡單替代,而是以NAND堆疊之軀,實(shí)現(xiàn)接近HBM的帶寬,試圖在AI推理時(shí)代扮演“二級(jí)緩存”的戰(zhàn)略角色。一場(chǎng)圍繞HBF的技術(shù)競(jìng)賽,已在存儲(chǔ)巨頭之間悄然打響。其核心設(shè)計(jì)理念是:在GPU或AI加速器旁,部署一層容量遠(yuǎn)超HBM、帶寬又遠(yuǎn)高于傳統(tǒng)SSD的“中間層”存儲(chǔ)。

從技術(shù)實(shí)現(xiàn)看,HBM堆疊的是DRAM,而HBF堆疊的是NAND閃存。第一代HBF產(chǎn)品預(yù)計(jì)將堆疊16層32GB NAND閃存,總?cè)萘靠蛇_(dá)512GB,帶寬則有望超過1638GB/s(相當(dāng)于PCIe 6.0×4的50倍)。在AI計(jì)算架構(gòu)中,HBF扮演的是HBM的“容量擴(kuò)展”角色。

AI推理時(shí)代的“內(nèi)存墻”困局

HBF的誕生,直指當(dāng)前AI計(jì)算體系中最棘手的矛盾——HBM的容量增長遠(yuǎn)跟不上模型參數(shù)的膨脹速度。在AI大模型的推理階段,特別是長上下文、多輪對(duì)話、智能體調(diào)用等場(chǎng)景中,系統(tǒng)需要頻繁讀寫鍵值緩存(KV cache)來維持上下文記憶。當(dāng)上下文窗口達(dá)到百萬token級(jí)別時(shí),HBM很快被這些緩存數(shù)據(jù)占滿,進(jìn)而影響核心計(jì)算任務(wù)的效率。

傳統(tǒng)解決方案是通過向量重計(jì)算或訪問遠(yuǎn)端SSD來應(yīng)對(duì)溢出數(shù)據(jù),但這兩種方式都會(huì)引入顯著的延遲開銷。HBF的介入,正是為了填補(bǔ)HBM與SSD之間的巨大空白。SK海力士提出的H3(HBM+HBF)混合存儲(chǔ)架構(gòu),將HBF作為HBM的“二級(jí)擴(kuò)展”,專門存儲(chǔ)只讀數(shù)據(jù)或鍵值緩存。經(jīng)過模擬表明,以前需要32個(gè)GPU才能完成的工作負(fù)載,在HBF的輔助下僅需2個(gè)GPU即可完成。這意味著HBF不僅能突破容量瓶頸,更可能從根本上改變AI算力集群的經(jīng)濟(jì)模型。

技術(shù)特征:容量、帶寬與成本的再平衡

HBF之所以被寄予厚望,源于其在容量、帶寬和成本三個(gè)維度上實(shí)現(xiàn)了獨(dú)特的再平衡。其中,容量優(yōu)勢(shì)最為突出。HBF的存儲(chǔ)容量可達(dá)HBM的8至16倍。這意味著原本需要多個(gè)GPU分?jǐn)偟哪P蛥?shù)和緩存數(shù)據(jù),可以更集中地由單個(gè)GPU配合HBF處理,大幅降低系統(tǒng)復(fù)雜度和互連開銷。

帶寬表現(xiàn)上,HBF能夠?qū)崿F(xiàn)HBM約80%至90% 的傳輸速度。雖然仍有一定差距,但考慮到其容量優(yōu)勢(shì),這一帶寬水平已足以支撐絕大多數(shù)推理場(chǎng)景的數(shù)據(jù)供給需求。功耗方面與HBM相比,HBF的功耗可降低約40%。這對(duì)于功耗密度日益失控的AI集群而言,意義重大。

成本上,基于NAND閃存的HBF,其單位容量的成本遠(yuǎn)低于基于DRAM的HBM。廣發(fā)證券分析認(rèn)為,HBF有望將GPU的存儲(chǔ)容量擴(kuò)展至4TB,成為滿足AI大模型內(nèi)存容量要求的最佳方案。

當(dāng)然,HBF也存在先天短板:由于NAND閃存的物理特性,其寫入耐久性較差,訪問延遲高于DRAM。因此,當(dāng)前的主流設(shè)計(jì)思路是將HBF用于只讀數(shù)據(jù)或低頻寫入的鍵值緩存,而將頻繁讀寫的動(dòng)態(tài)數(shù)據(jù)留在HBM中。

全球巨頭入局競(jìng)爭,韓系雙雄領(lǐng)跑

面對(duì)HBF的戰(zhàn)略價(jià)值,全球存儲(chǔ)巨頭已紛紛入局,其中韓國廠商占據(jù)領(lǐng)跑位置。SK海力士是當(dāng)前HBF研發(fā)最為積極的廠商,計(jì)劃最早于2026年推出HBF1樣品,目標(biāo)是在2027年實(shí)現(xiàn)量產(chǎn)。在戰(zhàn)略路徑上,SK海力士采取HBM中心策略,將HBF作為HBM的補(bǔ)充而非替代,通過兩者的協(xié)同配置優(yōu)化AI推理能效。

三星電子則展現(xiàn)出更宏大的野心,依托其在邏輯代工領(lǐng)域的優(yōu)勢(shì),三星正在探索通過自家4nm工藝生產(chǎn)HBF控制邏輯,并優(yōu)化下一代NAND方案的能效與控制性能。三星的目標(biāo)是將HBF整合進(jìn)更廣泛的AI內(nèi)存層級(jí)重構(gòu)中,其與閃迪的合作正向2027年底至2028年初應(yīng)用于英偉達(dá)、AMD、谷歌實(shí)際產(chǎn)品的目標(biāo)邁進(jìn)。

閃迪(SanDisk) 是HBF技術(shù)的最早倡導(dǎo)者之一,公司與韓國KAIST金正浩教授團(tuán)隊(duì)緊密合作,推動(dòng)HBF的技術(shù)標(biāo)準(zhǔn)化。閃迪認(rèn)為,HBF是解決GPU HBM內(nèi)存墻問題的關(guān)鍵答案,但其成功需要行業(yè)標(biāo)準(zhǔn)的確立和英偉達(dá)等主流客戶的采納。

值得注意的是,三大廠商已就HBF標(biāo)準(zhǔn)化展開合作。繼SK海力士之后,三星電子也加入了閃迪首創(chuàng)的HBF技術(shù)陣營,三方正共同推動(dòng)HBF成為行業(yè)通用標(biāo)準(zhǔn)。

從“HBM附庸”到“AI內(nèi)存新支柱”的未來展望

盡管前景廣闊,HBF的產(chǎn)業(yè)化仍面臨多重挑戰(zhàn)。技術(shù)層面,HBF需要GPU制造商重新設(shè)計(jì)架構(gòu),開發(fā)者需要修改軟件以優(yōu)化軟硬件協(xié)同,這些涉及大量半導(dǎo)體級(jí)別的復(fù)雜工作。

生態(tài)層面,英偉達(dá)的態(tài)度至關(guān)重要。目前,英偉達(dá)尚未對(duì)HBF表達(dá)公開興趣,而是開發(fā)了ICMSP技術(shù)作為替代方案,使用DPU連接的NVMe SSD處理溢出數(shù)據(jù)。不過,隨著SK海力士、三星等核心供應(yīng)商持續(xù)推動(dòng),以及HBF在仿真測(cè)試中展現(xiàn)的驚人能效提升,英偉達(dá)的態(tài)度可能出現(xiàn)轉(zhuǎn)變。

證券機(jī)構(gòu)預(yù)測(cè),HBF市場(chǎng)規(guī)模將從2027年的10億美元增長至2030年的120億美元。金正浩教授更預(yù)測(cè),從2038年起,HBF的需求將超過HBM。在商業(yè)化時(shí)間表上,SK海力士有望在本月晚些時(shí)候展示HBF早期測(cè)試版本,而HBF的廣泛應(yīng)用預(yù)計(jì)將等到HBM6時(shí)代——屆時(shí)單個(gè)基礎(chǔ)裸片將集成多組存儲(chǔ)堆棧。

結(jié)語

在推理成為AI算力新主戰(zhàn)場(chǎng)的2026年,誰能率先構(gòu)建HBM+HBF的混合存儲(chǔ)體系,誰就可能在這場(chǎng)算力效率的終極競(jìng)賽中占得先機(jī),開啟AI算力的下一個(gè)黃金十年。

網(wǎng)絡(luò)援引:

搜狐網(wǎng):《SK海力士探索H3存儲(chǔ):發(fā)揮HBM、HBF各自優(yōu)勢(shì),優(yōu)化推理能效 》

中關(guān)村在線:《全球存儲(chǔ)巨頭加速AI驅(qū)動(dòng)產(chǎn)能擴(kuò)張,美光2000億美元建最大潔凈室》

IT之家:《消息稱美光痛失英偉達(dá)HBM4 大單,韓系雙雄 SK 海力士、三星瓜分市場(chǎng)》

       原文標(biāo)題 : 趨勢(shì)丨HBM升級(jí)=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)