上海 AI 實(shí)驗(yàn)室發(fā)布“書生·浦語(yǔ)”大模型
6 月 7 日,上海人工智能實(shí)驗(yàn)室(上海 AI 實(shí)驗(yàn)室)、商湯科技聯(lián)合香港中文大學(xué)、復(fù)旦大學(xué)及上海交通大學(xué)發(fā)布千億級(jí)參數(shù)大語(yǔ)言模型“書生·浦語(yǔ)”(InternLM)。
“書生·浦語(yǔ)”具有 1040 億參數(shù),是在包含 1.6 萬(wàn)億 token 的多語(yǔ)種高質(zhì)量數(shù)據(jù)集上訓(xùn)練而成。
上海人工智能實(shí)驗(yàn)室稱,全面評(píng)測(cè)結(jié)果顯示,“書生·浦語(yǔ)”不僅在知識(shí)掌握、閱讀理解、數(shù)學(xué)推理、多語(yǔ)翻譯等多個(gè)測(cè)試任務(wù)上表現(xiàn)優(yōu)秀,而且具備很強(qiáng)的綜合能力,因而在綜合性考試中表現(xiàn)突出,在多項(xiàng)中文考試中取得超越 ChatGPT 的成績(jī),其中就包括中國(guó)高考各科目的數(shù)據(jù)集(GaoKao)。
聯(lián)合團(tuán)隊(duì)選取了 20 余項(xiàng)評(píng)測(cè)對(duì)其進(jìn)行檢驗(yàn),其中包含全球最具影響力的四個(gè)綜合性考試評(píng)測(cè)集——由伯克利加州大學(xué)等高校構(gòu)建的多任務(wù)考試評(píng)測(cè)集 MMLU;由微軟研究院推出的學(xué)科考試評(píng)測(cè)集 AGIEval(含中國(guó)高考、司法考試及美國(guó) SAT、LSAT、GRE 和 GMAT 等);由上海交通大學(xué)、清華大學(xué)和愛丁堡大學(xué)合作構(gòu)建的面向中文語(yǔ)言模型的綜合性考試評(píng)測(cè)集 C-Eval;由復(fù)旦大學(xué)研究團(tuán)隊(duì)構(gòu)建的高考題目評(píng)測(cè)集 Gaokao。
“書生·浦語(yǔ)”在考試評(píng)測(cè)上取得優(yōu)秀成績(jī),但仍然存在不少局限性。
比如,“書生·浦語(yǔ)” 受限于 2K 的語(yǔ)境窗口長(zhǎng)度(GPT-4 的語(yǔ)境窗口長(zhǎng)度為 32K),在長(zhǎng)文理解、復(fù)雜推理、撰寫代碼以及數(shù)理邏輯演繹等方面還存在明顯局限。另外,在實(shí)際對(duì)話中,大語(yǔ)言模型還普遍存在幻覺、概念混淆等問(wèn)題。
這些局限使得大語(yǔ)言模型“書生·浦語(yǔ)”在開放場(chǎng)景中的使用還有很長(zhǎng)的路要走。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 3 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 4 2025年8月人工智能投融資觀察
- 5 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 6 自動(dòng)駕駛誰(shuí)將笑傲江湖?如何把握無(wú)人駕駛“財(cái)富密碼”?
- 7 華為公布昇騰芯片三年計(jì)劃,自研HBM曝光
- 8 人形機(jī)器人廠商,正在批量復(fù)刻宇樹G1
- 9 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 10 Manus跑路,大廠掉線,只能靠DeepSeek了