訂閱
糾錯(cuò)
加入自媒體

熱點(diǎn)丨DeepSeek V3.2重磅更新,從模型層向系統(tǒng)層躍遷

前言

近日,DeepSeek的一場突發(fā)更新,這個(gè)以代碼生成和硬核推理著稱的[極客首選],一口氣拋出兩款正式版模型DeepSeek-V3.2與DeepSeek-V3.2-Speciale。

不僅在推理能力上對標(biāo)GPT-5、硬剛Gemini 3.0 Pro,更以完全開源的姿態(tài),直接打破了[開源模型永遠(yuǎn)落后閉源8個(gè)月]的行業(yè)魔咒,2026年AI Agent元年的硝煙已提前點(diǎn)燃。

圖片來源 |  網(wǎng) 絡(luò) 

圖片

技術(shù)炸場,三大突破重構(gòu)AI能力邊界

DeepSeek此次發(fā)布的兩款模型,如同精準(zhǔn)打擊不同戰(zhàn)場的[雙子星],背后是一套經(jīng)過實(shí)戰(zhàn)驗(yàn)證的硬核技術(shù)體系。

V3.2聚焦[平衡實(shí)用],適用于日常問答、通用Agent任務(wù)與工具調(diào)用,推理能力比肩GPT-5。

Speciale版本則劍指[極致推理],融合DeepSeek-Math-V2的定理證明能力,在主流推理基準(zhǔn)測試中媲美Gemini 3.0 Pro,成為復(fù)雜數(shù)學(xué)推理、編程競賽與學(xué)術(shù)研究的[金牌收割機(jī)]。

長期以來,傳統(tǒng)大模型的注意力機(jī)制在處理長序列時(shí)面臨計(jì)算復(fù)雜度指數(shù)級(jí)增長的死結(jié),O(L²)的算法邏輯讓128K上下文推理成為[高成本奢侈品]。

DeepSeek團(tuán)隊(duì)創(chuàng)新性提出的DSA(DeepSeek Sparse Attention)稀疏注意力機(jī)制,徹底顛覆了這一現(xiàn)狀。

DSA通過[閃電索引器]與[細(xì)粒度token選擇]兩大核心組件,將計(jì)算復(fù)雜度從O(L²)驟降至O(L·k)(k遠(yuǎn)小于L)。

簡單來說,傳統(tǒng)模型處理長文本如同逐字閱讀整本百科全書,而DSA更像智能搜索引擎,先快速掃描建立索引,再精準(zhǔn)定位關(guān)鍵信息。

在H800集群測試中,128K序列的預(yù)填充階段每百萬token成本從0.7美元降至0.2美元,解碼階段從2.4美元降至0.8美元,推理速度提升3.5倍,內(nèi)存占用減少70%,且無明顯性能損失。

這種效率革命的意義深遠(yuǎn),當(dāng)長文本推理成本低到可忽略不計(jì),AI處理整本書籍、完整項(xiàng)目代碼的場景將全面普及,為后續(xù)復(fù)雜Agent任務(wù)落地掃清了最大障礙。

開源模型與閉源模型的差距,往往藏在[后訓(xùn)練]的資源投入里。

DeepSeek團(tuán)隊(duì)發(fā)現(xiàn),此前開源模型在復(fù)雜任務(wù)中乏力,核心原因之一是后訓(xùn)練階段計(jì)算資源不足。

為此,他們打破行業(yè)常規(guī),將強(qiáng)化學(xué)習(xí)(RL)的計(jì)算預(yù)算提升至預(yù)訓(xùn)練成本的10%以上,這在開源模型中極為罕見。

圖片

為了讓大規(guī)模RL訓(xùn)練穩(wěn)定落地,團(tuán)隊(duì)在GRPO算法基礎(chǔ)上進(jìn)行三重優(yōu)化,通過無偏KL估計(jì)修正系統(tǒng)性誤差,用離線序列掩碼策略過濾偏離過大的負(fù)樣本,為MoE模型設(shè)計(jì)Keep Routing操作確保參數(shù)優(yōu)化一致性。

更關(guān)鍵的是,他們采用[專家蒸餾]策略,先為數(shù)學(xué)、編程、通用推理等6個(gè)領(lǐng)域訓(xùn)練專用模型,再用這些專家模型生成高質(zhì)量數(shù)據(jù)訓(xùn)練最終模型,讓V3.2在硬核任務(wù)中實(shí)現(xiàn)質(zhì)的飛躍。

實(shí)測數(shù)據(jù)印證了這套策略的有效性,在SWE-Verified代碼修復(fù)基準(zhǔn)中,V3.2解決率達(dá)73.1%,與GPT-5 High的74.9%幾乎持平。

在Terminal Bench 2.0復(fù)雜編碼任務(wù)中,46.4%的準(zhǔn)確率顯著超越GPT-5 High的35.2%。

而Speciale版本更是在AIME 2025數(shù)學(xué)競賽中以96.0%的通過率,超越GPT-5 High的94.6%和Gemini 3.0 Pro的95.0%,展現(xiàn)出開源模型的極致潛力。

如果說DSA解決了[效率問題],那么[思考融入工具調(diào)用]的機(jī)制則解決了AI Agent狀態(tài)漂移(State Drift)的[核心痛點(diǎn)]。

傳統(tǒng)智能體在多輪工具調(diào)用中容易[忘記初衷],比如規(guī)劃帶老人的旅行時(shí),后期突然推薦高強(qiáng)度徒步,本質(zhì)是推理過程與工具執(zhí)行的斷裂。

DeepSeek V3.2創(chuàng)新性地引入[思考保留]模式,成為首個(gè)在[思考模式]下支持工具調(diào)用的開源模型。

其核心邏輯是,只有引入新的用戶消息時(shí)才丟棄歷史推理內(nèi)容,若僅添加工具相關(guān)消息,推理過程會(huì)持續(xù)保留。

這種設(shè)計(jì)如同給AI裝上[海馬體],讓模型在調(diào)用工具時(shí)能記住[為什么這么做],基于歷史執(zhí)行結(jié)果持續(xù)優(yōu)化決策,無需重啟推理流程。

為了錘煉這種能力,DeepSeek構(gòu)建了大規(guī)模Agent任務(wù)合成管線,生成1827個(gè)任務(wù)導(dǎo)向環(huán)境和85000個(gè)復(fù)雜指令。

圖片

告別技術(shù)炫技,進(jìn)入應(yīng)用爭奪階段

過去兩年,ChatBot模式讓用戶體驗(yàn)了AI的新奇,但[只能說不能做]的局限逐漸顯現(xiàn)。

用戶疲于在不同窗口復(fù)制粘貼,企業(yè)抱怨AI無法閉環(huán)解決問題,這種邊際效應(yīng)遞減的模式,注定了商業(yè)價(jià)值的天花板。

DeepSeek顯然看透了這一點(diǎn),V3.2版本特意強(qiáng)調(diào)[通用Agent任務(wù)場景],本質(zhì)上是宣告其戰(zhàn)略轉(zhuǎn)向。

這場AI轉(zhuǎn)型背后,是中美兩國在技術(shù)賽道上的深層博弈。

過去三年,美國試圖通過高端芯片禁令鎖死中國AI的進(jìn)化上限,寄希望于物理層面的封鎖讓中國AI永遠(yuǎn)停留在二流水平。

但DeepSeek V3及國內(nèi)頭部模型的迭代,已然證明這種封鎖的階段性失效。

中國廠商走出了一條[應(yīng)用驅(qū)動(dòng)底層]的特色道路,買不到頂級(jí)單卡,就通過算法優(yōu)化彌補(bǔ);算力集群互聯(lián)受限,就用MoE架構(gòu)創(chuàng)新提升參數(shù)利用率;硬件有短板,就通過軟硬協(xié)同極致壓榨效率。

圖片

在這樣的苛刻條件下,中國AI不僅訓(xùn)練出對標(biāo)GPT-4.5乃至GPT-5級(jí)別的模型,更在應(yīng)用落地層面形成獨(dú)特優(yōu)勢。

而博弈的焦點(diǎn),正從硬件封鎖轉(zhuǎn)向生態(tài)壁壘。

硅谷巨頭的打法極具侵略性,OpenAI用Sora扼住短視頻內(nèi)容生產(chǎn)咽喉,Google試圖建立由其定義的[全球AI操作系統(tǒng)],一旦成功,所有依附于APP生態(tài)的企業(yè)都將面臨降維打擊。

中國廠商則抱團(tuán)構(gòu)建本土生態(tài),從阿里千問、螞蟻靈光到字節(jié)豆包、DeepSeek,雖路徑不同,但目標(biāo)一致。

在系統(tǒng)級(jí)Agent賽道建立中國標(biāo)準(zhǔn),讓AI從[顯性對話者]變成[隱性掌控者],滲透到購物、支付、物流、社交等全場景。

DeepSeek V3.2的發(fā)布,正是高性能模型成本下探與實(shí)用性飆升的縮影,當(dāng)推理成本低到可忽略不計(jì),當(dāng)模型上下文能容納整本書籍,量變終于引發(fā)質(zhì)變。

Agent與ChatBot的本質(zhì)區(qū)別,在于對物理世界的重構(gòu)能力。

在軟件層面,AI將徹底顛覆現(xiàn)有工作流。過去我們購買CRM系統(tǒng)自己錄入客戶信息,未來將雇傭[銷售Agent]自動(dòng)完成全流程。

過去依賴SaaS軟件處理事務(wù),未來將進(jìn)入[Service as a Software]時(shí)代,服務(wù)本身就是軟件。

DeepSeek V3.2的平衡推理能力,正是為這種長鏈條復(fù)雜決策量身打造。

圖片

打破壟斷,AI進(jìn)入[免費(fèi)頂配]時(shí)代

DeepSeek V3.2最具顛覆性的舉動(dòng),并非技術(shù)參數(shù)的突破,而是選擇完全開源。

模型權(quán)重、聊天模板、本地運(yùn)行指南在Hugging Face全面開放,讓中小企業(yè)乃至個(gè)人開發(fā)者都能零成本使用對標(biāo)GPT-5的能力。

這種[頂級(jí)性能+免費(fèi)開源]的組合,正在重塑全球AI的權(quán)力結(jié)構(gòu)。

長期以來,閉源模型憑借海量算力投入和數(shù)據(jù)優(yōu)勢,在復(fù)雜任務(wù)中占據(jù)絕對主導(dǎo)地位。但DeepSeek V3.2的發(fā)布,終結(jié)了[開源永遠(yuǎn)落后]的神話。

在推理基準(zhǔn)測試中,V3.2與GPT-5各有勝負(fù),僅略遜于Gemini 3.0 Pro。

在Agent評(píng)測中,其得分高于同為開源的Kimi-K2-Thinking和MiniMax M2;

而Speciale版本更是在國際競賽中超越部分閉源模型,證明開源模型完全有能力躋身第一梯隊(duì)。

這種突破的核心邏輯,在于DeepSeek找到了[后訓(xùn)練的正確打開方式]。

后訓(xùn)練的瓶頸,是靠優(yōu)化方法和數(shù)據(jù)而不是靠等待一個(gè)更強(qiáng)的基礎(chǔ)模型來解決的。

通過DSA架構(gòu)創(chuàng)新、超配的強(qiáng)化學(xué)習(xí)資源、大規(guī)模Agent任務(wù)合成,開源模型終于擺脫了對[暴力算力]的依賴,走出了一條效率更高、成本更低的進(jìn)化路徑。

DSA機(jī)制帶來的成本下降遠(yuǎn)比想象中影響深遠(yuǎn),這種成本優(yōu)勢將加速[AI工具取代傳統(tǒng)軟件]的趨勢。

當(dāng)AI能以極低成本幫普通人規(guī)劃行程、處理工作、解決專業(yè)問題,AI將真正滲透到操作系統(tǒng)層級(jí),成為像水電一樣的基礎(chǔ)服務(wù)。

圖片

結(jié)尾:

當(dāng)Google Gemini 3.0 Pro橫掃多模態(tài)評(píng)測,當(dāng)OpenAI Sora下載量持續(xù)攀升,當(dāng)中美科技巨頭集體押注Agent,一個(gè)確定性的趨勢已然形成。

當(dāng)開源模型打破閉源壟斷,當(dāng)Agent技術(shù)重構(gòu)物理世界,當(dāng)中美廠商在系統(tǒng)層展開深度博弈,2026年的AI戰(zhàn)場注定精彩紛呈。

部分資料參考:節(jié)點(diǎn)財(cái)經(jīng):《Deepseek重磅更新背后:AI大戰(zhàn)一觸即發(fā),再不行動(dòng)就晚了》,量子位:《DeepSeek-V3.2系列開源,性能直接對標(biāo)Gemini-3.0-Pro》,雷科技:《又強(qiáng)大又便宜!DeepSeek V3.2又要讓谷歌和OpenAI慌了》,網(wǎng)易科技:《硬剛Gemini 3.0 Pro!DeepSeek V3.2實(shí)測性能確實(shí)猛,但這三個(gè)[硬傷[不得不防》,機(jī)器之心:《從MiniMax到DeepSeek:為何頭部大模型都在押注「交錯(cuò)思維」?》

       原文標(biāo)題 : 熱點(diǎn)丨DeepSeek V3.2重磅更新,從模型層向系統(tǒng)層躍遷

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請輸入評(píng)論內(nèi)容...

請輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)