訂閱
糾錯
加入自媒體

OpenAI刺破了中國AI的幻想

2024-06-28 16:28
腦極體
關(guān)注

OpenAI在6月25日凌晨宣布,將從7月9日起,將阻止來(lái)自不支持其服務(wù)的國家和地區的API流量,而中國也在禁用名單之列。

圖片

消息一出,國產(chǎn)大模型們應聲而動(dòng),立刻推出了相應的“搬家”或“遷移”方案。有的還提出了與OpenAl 使用規模對等的 Token 贈送計劃(不設上限),坊間戲稱(chēng),“這下中國做AI的可以實(shí)現token自由了”。

我們知道,海外對于中國AI的限制一直存在。但此前針對AI的禁令,主要是限制英偉達和AMD的高性能AI算力卡,而OpenAI此次強勢禁用,則讓AI軟件算法層面的“另一只靴子落地”。

從硬件到軟件,越來(lái)越擴大的禁用范圍,以及越來(lái)越嚴格的限制,無(wú)時(shí)無(wú)刻不在提醒著(zhù)我們,在A(yíng)I這一關(guān)鍵科技領(lǐng)域,全方位阻隔中國的進(jìn)步,已經(jīng)是一張明牌了。

面對這個(gè)不可逆的AI封鎖大趨勢,中國企業(yè)受的影響到底有多大?AI全面國產(chǎn)化,中國做好準備了嗎?

放棄幻想:OpenAI禁用到底影響了誰(shuí)?

自ChatGPT發(fā)布以來(lái),OpenAI的API已向近190個(gè)國家和地區開(kāi)放,其中并不包括中國。不過(guò),一直以來(lái),一些國內企業(yè)和用戶(hù),可以通過(guò)技術(shù)手段來(lái)繼續使用OpenAI的服務(wù)。

對于這些來(lái)自中國的流量,OpenAI并非檢測不出,只是以前可能“槍口抬高了一寸”。

而就在6月22日,美國財政部發(fā)布了一份規則草案,進(jìn)一步限制美國個(gè)人和企業(yè)投資中國的半導體、量子計算和人工智能業(yè)務(wù)。新規則草案推出,面對越來(lái)越明確的AI封鎖態(tài)勢,OpenAI也主動(dòng)明哲保身,選擇了加強區域限制,采取額外措施阻止來(lái)自不受支持地區的API流量。

圖片

到底是什么人和公司“明知不可為而為之”,在使用OpenAI的API呢?主要有三類(lèi):

一是部分自研模廠(chǎng)。一部分模廠(chǎng)會(huì )在研發(fā)階段,調用OpenAI的API,使用其GPT產(chǎn)品進(jìn)行模型訓練、數據對比迭代等。實(shí)際上,谷歌Gemini-Pro大模型的訓練也曾用到了百度文心生成的數據。此前就有國內某互聯(lián)網(wǎng)公司,被爆出經(jīng)常達到OpenAI API的最大訪(fǎng)問(wèn)上限,不過(guò)對方也表示,僅在年初的初期探索階段使用了OpenAI的API,而在今年4月已經(jīng)停止了這種做法。

二是套殼AI公司。一些初創(chuàng )公司為了快速推出AI產(chǎn)品或服務(wù),可以通過(guò)技術(shù)手段,對OpenAI的API進(jìn)行封裝,“改頭換面”作為自己的產(chǎn)品推向市場(chǎng)。實(shí)際上用戶(hù)的每次交互,都會(huì )通過(guò)API調用OpenAI的模型來(lái)完成。

三是面向海外市場(chǎng)的應用開(kāi)發(fā)者。在OpenAI所支持的國家和地區,為了跟海外開(kāi)發(fā)者“站在同一起跑線(xiàn)”,而選擇OpenAI API。

目前來(lái)看,上述群體受OpenAI禁令的影響程度都不高。

隨著(zhù)國內模廠(chǎng)的模型基本完善,不用再通過(guò)調用API的方式收集數據。海外應用的開(kāi)發(fā),應用往往需要對本地市場(chǎng)的深入了解,因此國內開(kāi)發(fā)者數量規模也較小。相比之下,“套殼API”的初創(chuàng )公司可能受到的打擊是最大的,不過(guò)通過(guò)“搬家”切換到國產(chǎn)大模型,快速找到能力接近的替代方案,也能一定程度上規避風(fēng)險。

圖片

所以總體來(lái)說(shuō),OpenAI更嚴格的API限制,并不會(huì )給中國AI帶來(lái)很大的動(dòng)蕩。

但這并不意味著(zhù),中國AI可以高枕無(wú)憂(yōu)了。從“英偉達禁令”到“OpenAI禁令”,發(fā)出了一個(gè)鮮明的信號:“潘多拉魔盒”一旦開(kāi)啟,就不會(huì )關(guān)上,針對中國AI的封鎖,也不可能在短時(shí)間內被撤回。

是時(shí)候摒棄“槍口抬高一寸”的僥幸心理和幻想了,事實(shí)證明,槍口隨時(shí)可以朝下扣動(dòng)扳機。

認清現實(shí):不可逆的AI封鎖,還有哪些牌可出?

在封鎖烈度上,美國官方和AI企業(yè)的行動(dòng)在不斷加強;在封鎖廣度上,從高性能AI芯片的底層算力,到大模型的底層算法,“釜底抽薪式”的封鎖正逐漸延伸到AI基礎設施的各個(gè)關(guān)鍵部分。

那么,在算力禁運、算法禁用之后,海外想要阻隔中國AI的發(fā)展,還有哪些牌可以打?梳理一下AI軟件基礎設施:

  1. 框架。深度學(xué)習框架,是支持AI算法模型開(kāi)發(fā)和部署的軟件平臺,對AI應用的開(kāi)發(fā)效率和性能有重要影響。目前國內深度學(xué)習框架市場(chǎng)主要由飛槳(由百度開(kāi)發(fā))、TensorFlow(由Google開(kāi)發(fā))、PyTorch(由Meta開(kāi)發(fā))三家主導,共同占據了超過(guò)80%的市場(chǎng)份額。這三家均為開(kāi)源框架,允許開(kāi)發(fā)者自由地查看、修改和使用其源代碼,不過(guò)TensorFlow、PyTorch作為開(kāi)源平臺也需要遵守所在國法律法規,并可以通過(guò)開(kāi)源許可證等方式,限制開(kāi)發(fā)者的訪(fǎng)問(wèn)。

圖片

2.算子庫。包含各種數學(xué)和邏輯運算函數的庫,在深度學(xué)習框架中扮演著(zhù)至關(guān)重要的角色,為各種算法提供了基礎的計算單元。如果算子庫是閉源的,又歸屬于海外公司,那么可以直接限制使用。開(kāi)源的算子庫也要遵循一定的開(kāi)源協(xié)議,協(xié)議中往往會(huì )規定代碼的使用、修改和分發(fā)規則,如果開(kāi)發(fā)者沒(méi)有獲得適當的許可或權限,也無(wú)法使用。目前,國內飛槳、昇思等AI開(kāi)發(fā)平臺都發(fā)布了算子庫。

3.數據集。AI界有句名言“garbage in,garbage out(垃圾進(jìn),垃圾出)”,高質(zhì)量的數據集,對于A(yíng)I算法模型的性能至關(guān)重要,在大模型時(shí)代也不例外。各個(gè)領(lǐng)域和應用場(chǎng)景都有專(zhuān)有數據集,比如計算機視覺(jué)領(lǐng)域的MNIST、CIFAR、ImageNet等。NLP領(lǐng)域的SQuAD、GLUE等,再比如AI蛋白質(zhì)結構預測任務(wù)所需要的數據集,如CASP、AlphaFold DB、PDB等,這些數據集為AI研究提供了豐富的數據資源,大多由海外研究機構建立。

近年來(lái),中國AI領(lǐng)域的高質(zhì)量數據集也在快馬加鞭地建設,數據治理體系也在不斷完善,數據作為核心生產(chǎn)要素的戰略地位不斷提升。但現階段,與海外一流水平還有差距。而AI算法的特別之處在于,不像傳統軟件能一次開(kāi)發(fā)完成,模型需要不斷學(xué)習、迭代和進(jìn)化,依賴(lài)于持續更新的數據集進(jìn)行訓練。一旦數據集被阻止訪(fǎng)問(wèn),就如同剝奪了模型成長(cháng)的土壤,甚至可能變得停滯不前。

此外還有編譯器、IDE等,這些軟件工具可以大大提高開(kāi)發(fā)者的編程效率。如果被禁用,開(kāi)發(fā)者將需要手動(dòng)完成這些工作,從而導致開(kāi)發(fā)效率降低,團隊協(xié)作困難,甚至影響項目的進(jìn)度和質(zhì)量。

圖片

“英偉達禁令”執行以后,一位國內某計算廠(chǎng)商向腦極體表示,“雖然我們還可以用特供版的AI芯片,但確實(shí)支持不了英偉達最新的平臺了”。

所以說(shuō),硬件、軟件基礎設施共同構成了AI產(chǎn)業(yè)的支撐體系。面對阻隔中國AI的封鎖禁令,一定要有“底線(xiàn)思維”,軟件并不比硬件更安全,開(kāi)源軟件并不比閉源軟件更安全。

準備應對:中國AI,必須兩條腿走路

提到國產(chǎn)化替代,總有人擔憂(yōu)這是在閉門(mén)造車(chē)、與世界脫節。AI作為高度全球化的高新技術(shù)產(chǎn)業(yè),這種擔憂(yōu)確實(shí)不無(wú)道理。

但也必須看到,“沒(méi)有一次AI斷鏈是我們先動(dòng)的手”。

實(shí)際上,中國AI產(chǎn)學(xué)界始終保持著(zhù)開(kāi)放心態(tài),積極吸收國際先進(jìn)技術(shù),與世界接軌。斯坦福大學(xué)發(fā)布的《2024 年人工智能指數報告》顯示,自2011年以來(lái),GitHub上的開(kāi)源人工智能項目,中國參與度不斷增長(cháng),直到2019年在科技領(lǐng)域遭受不合理打壓之后,才開(kāi)始走低。

圖片

無(wú)論是芯片禁運,還是API禁用,都是海外以“國家安全”“保證美國AI領(lǐng)先地位”等理由,發(fā)起的單方面阻隔。而在短時(shí)間內,這種單方面動(dòng)手的“AI封鎖”,并不會(huì )告一段落。

這種情況下,中國AI將面臨一個(gè)重要抉擇:是徹底國產(chǎn)化替代,底層軟硬件全用自己的?還是繼續參與全球AI大市場(chǎng),更多利用國外技術(shù)?

小孩子才做選擇,成年人全都要。中國AI,必須學(xué)會(huì )“兩條腿走路”。

第一條腿,是基礎軟硬件的自主創(chuàng )新,做好全棧AI技術(shù)國產(chǎn)化的準備。

中國AI在底層軟硬件的關(guān)鍵“卡脖子”環(huán)節,都積累了不少力量。以軟件為例,百度、華為云等頭部大模型廠(chǎng)商,都建立了“AI大底座”,從底層算力(百度昆侖、華為昇騰)、基礎模型(文心、盤(pán)古)、深度學(xué)習框架(飛槳、昇思)、全棧AI開(kāi)發(fā)工具平臺(千帆平臺、昇騰AI云服務(wù))等。

這些全棧自研的AI軟硬件基礎設施,可以讓中國AI做好“最壞的準備”,無(wú)懼來(lái)自海外的斷鏈風(fēng)險。

但正如經(jīng)濟學(xué)家江小涓所說(shuō)的,在當今科技全球化、產(chǎn)業(yè)全球化的格局下,“會(huì )做的全部自己做”并不是最優(yōu)選項。

圖片

所以中國AI的第二條腿,是保持與全球最新趨勢的緊密聯(lián)系,確保信息通暢、創(chuàng )新同步。

還記得芯片禁運之時(shí),有網(wǎng)友義憤填膺地表示要“對等制裁”“不用也沒(méi)有損失”,但一位資深從業(yè)者卻說(shuō)“別人小心眼,我們自己不能小心眼”。美國封閉但我們不能封閉,不能自己把路走窄了。

緊密貼近全球趨勢、充分利用全球資源,是中國AI保持領(lǐng)先的必要條件。一方面,吸收全球最先進(jìn)的技術(shù),中國AI可以在更高的起點(diǎn)上推動(dòng)技術(shù)自主創(chuàng )新,避免產(chǎn)業(yè)鏈割裂帶來(lái)方向迷失,錯過(guò)主流的AI發(fā)展機會(huì )。

另一方面,中國AI是科技競賽中排名全球前列的一個(gè)領(lǐng)域,這種領(lǐng)先優(yōu)勢十分關(guān)鍵,且不容失去,必須與全球創(chuàng )新保持同步,因此要積極擁抱國際市場(chǎng)和科技合作。

隨著(zhù)國產(chǎn)算力的突破,“英偉達禁令”不再讓AI算力束手無(wú)策,就在大家覺(jué)得中國AI穩了的時(shí)候,OpenAI的禁令猶如一道閃電,劃破了中國AI界對“限AI=限卡”的幻想。

國產(chǎn)算力固然是底氣所在,但絕非高枕無(wú)憂(yōu)的保證,來(lái)自OpenAI的API限制說(shuō)明,海外AI軟件也并不完全可靠,同理,開(kāi)源軟件也并非絕對安全的屏障。

圖片

AI產(chǎn)業(yè)鏈封鎖,如同懸在頭頂的達摩克利斯之劍。但換個(gè)角度看,逐漸加碼的禁令,恰恰是之前的措施勞而無(wú)功,沒(méi)能起到徹底阻攔中國AI進(jìn)步的效果,這也間接反映出中國AI產(chǎn)業(yè)的生存活力,是不會(huì )輕易被阻隔在世界之外的。

中國AI,唯有認清現實(shí),把一張張產(chǎn)業(yè)鏈王牌都握在自己手心里,才能繼續留在全球大市場(chǎng)的牌桌上。

       原文標題 : OpenAI刺破了中國AI的幻想

聲明: 本文由入駐維科號的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權或其他問(wèn)題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長(cháng)度6~500個(gè)字

您提交的評論過(guò)于頻繁,請輸入驗證碼繼續

暫無(wú)評論

暫無(wú)評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號