什么是 DeepSeek?為什么它會(huì)顛覆人工智能領(lǐng)域?
今年,中國(guó)農(nóng)歷蛇年的春節(jié)假期,對(duì)于 AI 科技界最火的兩個(gè)東西,莫非和Open AI ChatGPT 類似的 Deepseek 以及春晚表演節(jié)目的人形機(jī)器人。其中Deepseek 推理模型R1的推出更是讓美國(guó)總統(tǒng)川普說成“A wakeup call”,而且此模型推出更是讓AI芯片巨頭英偉達(dá)股價(jià)暴跌17%,市值縮水 6000 億美元,創(chuàng)下股市歷史上公司單日最大跌幅。芯片設(shè)備制造商 ASML 股價(jià)下跌 6%,另一家芯片公司博通股價(jià)也下跌 17%。對(duì)美國(guó)AI科技界來講類似于珍珠港事件。
什么是 DeepSeek
DeepSeek 是成立于2023年的中國(guó)初創(chuàng)公司推出的最新的人工智能模型,據(jù)稱這些模型與美國(guó)行業(yè)領(lǐng)先的模型例如ChatGPT,Gemini,Claude,Llama 相當(dāng)甚至更好,而成本卻只是其一小部分,這一舉措有可能顛覆科技世界秩序。根據(jù)DeepSeek 發(fā)布的論文信息,其DeepSeek-V3 的訓(xùn)練只需要價(jià)值不到 600 萬(wàn)美元的 Nvidia H800 芯片的計(jì)算能力,此舉引起了全球人工智能界的關(guān)注。在蘋果 App Store 上由 DeepSeek-V3 提供支持的 DeepSeek 人工智能助手已超越競(jìng)爭(zhēng)對(duì)手 ChatGPT 以及谷歌的Gemini,成為美國(guó)蘋果 App Store 上評(píng)分最高的免費(fèi)應(yīng)用程序。
這引發(fā)了人們對(duì)一些美國(guó)科技公司決定在人工智能領(lǐng)域投入數(shù)十億美元的理由的懷疑,包括英偉達(dá)在內(nèi)的幾家大型科技公司的股價(jià)也受到?jīng)_擊。DeepSeek 與 OpenAI 比較表特征DeepSeekOpenAI創(chuàng)立梁文峰 創(chuàng)立于 20232015 年,由 Elon Musk、Sam Altman 等人創(chuàng)立。使命開源人工智能助力無(wú)障礙發(fā)展確保 AGI 造福全人類主要型號(hào)DeepSeek-R1GPT-4開發(fā)成本<600萬(wàn)美元數(shù)億美元方法完全開源所有權(quán)績(jī)效(數(shù)學(xué))AIME 基準(zhǔn)測(cè)試結(jié)果為 79.8%AIME 基準(zhǔn)測(cè)試結(jié)果為 79.2%績(jī)效(一般)專業(yè)(數(shù)學(xué)、編碼)多才多藝,在多個(gè)領(lǐng)域表現(xiàn)出色速度破紀(jì)錄的推理速度速度快但資源密集使用案例解決問題、編碼、數(shù)學(xué)任務(wù)創(chuàng)意寫作、翻譯、通用 NLP使用權(quán)對(duì)所有人免費(fèi)開放付費(fèi) API 和商業(yè)合作伙伴關(guān)系市場(chǎng)影響以經(jīng)濟(jì)高效的模型顛覆人工智能規(guī)范與微軟合作的行業(yè)領(lǐng)導(dǎo)者道德/安全促進(jìn)透明度和共擔(dān)責(zé)任專注于可控、安全的人工智能部署目標(biāo)受眾開發(fā)人員、初創(chuàng)企業(yè)、研究人員企業(yè)、大型企業(yè)著名合作開源社區(qū)微軟、Azure創(chuàng)新經(jīng)濟(jì)高效的大規(guī)模人工智能開創(chuàng)大規(guī)模專有模型
DeepSeek 為何會(huì)引起轟動(dòng)?
2022 年底,OpenAI ChatGPT 的發(fā)布引發(fā)了 AI 落到的新浪潮,其大語(yǔ)言模型,可以類人的對(duì)話和生產(chǎn)內(nèi)容震驚了科技界,中國(guó)的科技公司們也紛紛創(chuàng)建自己的人工智能聊天機(jī)器人。但在搜索引擎巨頭百度發(fā)布首個(gè)中文版 ChatGPT 之后,中國(guó)國(guó)內(nèi)對(duì)中美企業(yè)在人工智能能力方面的差距普遍感到失望。直到去年,DeepSeek 模型的質(zhì)量和成本效率徹底顛覆了這種說法。DeepSeek 表示,DeepSeek-V3 和 DeepSeek-R1 這兩個(gè)模型受到了硅谷高管和美國(guó)科技公司工程師的一致好評(píng),與 OpenAI 和 Meta 等上文講到的最先進(jìn)的模型不相上下。它們使用起來也更便宜。據(jù)DeepSeek官方微信賬號(hào)上的一篇文章稱,上周發(fā)布的DeepSeek-R1的使用成本比OpenAI o1模型低20到50倍。DeepSeek 質(zhì)疑的聲音
當(dāng)然,一些人公開對(duì) DeepSeek 的成功故事表示懷疑。首先,根據(jù)馬斯克推特上轉(zhuǎn)發(fā)的 Gavin Baker 內(nèi)容,500 萬(wàn)到 600 萬(wàn)美元的訓(xùn)練成本具有誤導(dǎo)性。它來Deepseek 論文中自稱 “2048塊H800 卡用于*一次*訓(xùn)練”,按市場(chǎng)價(jià)格計(jì)算,這筆費(fèi)用高達(dá) 500 萬(wàn)到 600 萬(wàn)美元。其實(shí),開發(fā)這樣的模型需要多次運(yùn)行這種訓(xùn)練或其某種變體,還需要進(jìn)行許多其他實(shí)驗(yàn)。這使得成本高出很多倍,更不用說數(shù)據(jù)收集和其他事情,這個(gè)過程可能非常昂貴。此外,購(gòu)買 2048 塊 H800 的成本在 5000 萬(wàn)到 1 億美元之間。DeepSeek的算力來自于名叫“幻方量化”一家大型中國(guó)投資基金所有,該公司的 GPU 數(shù)量是 2048塊 H800 的很多倍。根據(jù) Scale AI 首席執(zhí)行官亞歷山大·王 (Alexandr Wang) 在接受媒體采訪時(shí)候的表述,DeepSeek 擁有 50,000 塊 Nvidia H100 芯片。當(dāng)然科技界都知道美國(guó)已經(jīng)禁止向中國(guó)公司出售此類先進(jìn) AI 芯片,但是不少人擺出數(shù)據(jù),英偉達(dá)的收入有20%以上來自于新加坡,另外還有不少來自于沙特,那么這些算力芯片為誰(shuí)提供服務(wù)?當(dāng)然以上都是猜測(cè)和懷疑論者的推論,沒有確認(rèn)。
此外美國(guó)伯恩斯坦分析師周一在一份研究報(bào)告中強(qiáng)調(diào),DeepSeek 的 V3 模型總訓(xùn)練成本尚不清楚,但遠(yuǎn)高于該公司聲稱的 558 萬(wàn)美元的計(jì)算能力成本。分析師還表示,同樣廣受好評(píng)的 R1 模型的訓(xùn)練成本并未披露。除了成本懷疑之外,不少人表示 DeepSeek 采用“蒸餾”的策略趕上美國(guó)人工智能公司,“蒸餾”即使用另一個(gè)模型例如大語(yǔ)言生成的數(shù)據(jù)對(duì)自己的模型大語(yǔ)言模型進(jìn)行訓(xùn)練,這樣可以極大減少模型訓(xùn)練中的人工監(jiān)督以及調(diào)整。當(dāng)然 Jack 在 DeepSeek 剛釋放出其早期版本時(shí)候試過,確實(shí)出現(xiàn)Open AI等信息,所以“蒸餾”這個(gè)應(yīng)該確實(shí)存在,特別是在早期,但是在后期 DeepSeek從 AI 算法結(jié)構(gòu)到 AI 硬件架構(gòu)都有不少創(chuàng)新,或許 DeepSeek 并不完全是一項(xiàng)突破性的科學(xué)創(chuàng)新,但從工程應(yīng)用角度來講是史詩(shī)級(jí)的突破”
DeepSeek 事件的影響
DeepSeek 在 AI 科技史上一定是一個(gè)重大具有里程碑的產(chǎn)品和事件。
首次,DeepSeek事件,將加快 AI 的落地應(yīng)用,因?yàn)镈eepSeek 的訓(xùn)練和使用成本極大降低,這為大規(guī)模商用和家用奠定的基礎(chǔ),可以預(yù)見接下來 AI 應(yīng)用將會(huì)滲透到生活的方方面面,成為繼日常水電煤之后的通訊。其次,DeepSeek事件將加快中美 AI 競(jìng)爭(zhēng),從投入上,中美等大國(guó)在 AI 投資上的競(jìng)爭(zhēng)加劇,而此次DeepSeek在美國(guó)的大肆炒作,可能是美國(guó)為了增加對(duì) AI 的投入搬出的假想敵,美國(guó)投資如果要?jiǎng)蛹{稅人的錢,肯定是要師出有名的,必須要造勢(shì);美國(guó)除了增加投資或許會(huì)更加注重在 AI 技術(shù)方面對(duì)中國(guó)的封鎖,從教育到商業(yè)的全面提防中國(guó)。
所以,AI將會(huì)滲透到我們生活的每個(gè)角落,但同時(shí)AI將可能會(huì)更加地緣政治,引發(fā)不同的 AI 形態(tài)。
*未經(jīng)準(zhǔn)許嚴(yán)禁轉(zhuǎn)載和摘錄-參考資料:
原文標(biāo)題 : 什么是 DeepSeek?為什么它會(huì)顛覆人工智能領(lǐng)域?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 6 特朗普要求英特爾首位華人 CEO 辭職
- 7 AI版“四萬(wàn)億刺激”計(jì)劃來了
- 8 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 9 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 10 騰訊米哈游押寶的中國(guó)AI應(yīng)用,正在海外悶聲發(fā)財(cái)