123,123,123

<td id="agmlh"></td>

<strong id="agmlh"></strong>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

大模型時(shí)代進(jìn)入尾聲：場景式模型接棒

2023-04-20 13:37

華爾街科技眼

文/彭藝信

編輯/侯煜

ChatGPT像里科技行業(yè)里的鲇魚，攪動(dòng)一池春水。自從它出現(xiàn)之后，中國科技企業(yè)扎堆發(fā)布AI大模型。

有人嘲諷，ChatGPT在中國即將“畝產(chǎn)過萬”；也有人調(diào)侃，下個(gè)階段該是“全民大模型，ChatGPT進(jìn)萬家”了吧；還有人直言，ChatGPT是十月懷胎，中國大模型一個(gè)月成型。

中國大模型為何能飛速成型？究竟是養(yǎng)在深閨人未識(shí)，還是跟風(fēng)造概念？阿里云CTO周靖人說過，動(dòng)輒超千億參數(shù)的大模型研發(fā)，不是單一的算法問題，也不是靠簡單堆積GPU就能實(shí)現(xiàn)的。大模型是囊括了底層算力、網(wǎng)絡(luò)、存儲(chǔ)、大數(shù)據(jù)、AI框架、AI模型等復(fù)雜技術(shù)的系統(tǒng)性工程，需要AI-云計(jì)算的全棧技術(shù)能力。

在當(dāng)下增長乏力的科技互聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)中，互聯(lián)網(wǎng)企業(yè)把大模型當(dāng)做救命草。不過，盡管市場火熱，但潮退后才能見識(shí)真實(shí)力。

中國科技圈，大模型的大躍進(jìn)如火如荼，但在本月初， OpenAI 的 CEO 在演講中警告稱：我們已經(jīng)處在大模型時(shí)代的尾聲，并表示如今的生成式AI （AIGC ）發(fā)展中，將數(shù)據(jù)模型進(jìn)一步做大，塞進(jìn)更多數(shù)據(jù)的方式，已經(jīng)是目前人工智能發(fā)展中最后一項(xiàng)重大進(jìn)展，并且還聲稱目前還不清楚未來的發(fā)展方向如何。

可以預(yù)言的是，當(dāng)下大模型技術(shù)對(duì)于 AIGC 的發(fā)展至關(guān)重要，但從長遠(yuǎn)來講，AI 的發(fā)展絕不會(huì)永遠(yuǎn)依賴大模型的參數(shù)提升和算力的堆砌。未來，針對(duì)更具體的應(yīng)用場景，開發(fā)更小更精準(zhǔn)、針對(duì)應(yīng)用場景的模型才是發(fā)展的方向。

本文將盤點(diǎn)目前市場上呼聲較高的大模型，中國大模型究竟是曇花一現(xiàn)，還是千錘百煉不斷精進(jìn)，讓我們持續(xù)關(guān)注。

OpenAI

2021年11月，OpenAI推出了GPT3.0。它是運(yùn)用1759億個(gè)參數(shù)所實(shí)現(xiàn)的預(yù)訓(xùn)練語言模型。去年年底ChatGPT問世，該系統(tǒng)發(fā)布后五天內(nèi)就吸引了超過100萬用戶。

ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具，其使用的人類反饋的強(qiáng)化學(xué)習(xí)技術(shù)，可以更容易推斷出用戶的意圖，產(chǎn)生更自然和更合理的回答，像人類一樣來聊天交流，完成撰寫視頻腳本、文案、代碼、論文等任務(wù)。

今年2月OpenAl投資人微軟宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing（必應(yīng)）和Edge瀏覽器，到今年3月15日，OpenAI推出GPT-4文本生成AI系統(tǒng)，但僅向Plus付費(fèi)訂閱用戶及企業(yè)和開發(fā)者開放。

OpenAI公布的訓(xùn)練GPT模型由于訓(xùn)練過程復(fù)雜，數(shù)據(jù)不透明，加上長期的技術(shù)迭代等，其在算法層和硬件層積累起巨大優(yōu)勢，外界想要復(fù)制ChatGPT并不容易，ChatGPT目前在大模型領(lǐng)域的霸主地位無人能夠撼動(dòng)，OpenAI市場估值已經(jīng)達(dá)到290億美元，成為世界上估值最高的初創(chuàng)公司。

現(xiàn)在的ChatGPT面對(duì)的不只是商業(yè)化和監(jiān)管的壓力，由馬斯克、圖靈獎(jiǎng)得主Bengio等千人聯(lián)名的“暫停高級(jí)AI研發(fā)”的公開信，目前簽名數(shù)量已有9000多人，此外，它也受到越來越多的國家的抵制，在其出現(xiàn)的兩個(gè)月后，意大利就宣布禁止使用ChatGPT，原因是認(rèn)為ChatGPT平臺(tái)不安全并且會(huì)非法收集大量用戶信息。

特點(diǎn)：可以直接面向C端用戶群體。

參數(shù)量大：ChatGPT-3模型使用了1750億個(gè)參數(shù)， ChatGPT-4的參數(shù)量更大，

迭代快：OpenAI在原本官網(wǎng)產(chǎn)品下拉菜單中的ChatGPT已換成了GPT-4。

百度“文心一言”大模型

作為國內(nèi)人工智能（AI）領(lǐng)域的旗手，今年3月，百度就推出直接對(duì)標(biāo)ChatGPT的文心一言。

文心一言也擁有文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成的能力。百度文心一言的發(fā)布會(huì)后一小時(shí)內(nèi)，排隊(duì)申請(qǐng)文心一言企業(yè)版 API 調(diào)用服務(wù)測試的企業(yè)用戶超 3 萬家，申請(qǐng)產(chǎn)品測試網(wǎng)頁多次被擠爆。

根據(jù)后期大量試用的反饋，文心一言也暴露出通過模式和規(guī)則來生成文本等問題，對(duì)比之下，業(yè)界出現(xiàn)了“百度搶占大模型市場的心態(tài)操之過急”的看法，也讓大家看到了國內(nèi)外自然語言處理大模型方面的差距。

事實(shí)上百度在大模型領(lǐng)域沉淀已久，百度早在2019年就推出了文心大模型ERNIE 1.0，而目前，ERNIE 3.0每天接受數(shù)十億用戶的搜索請(qǐng)求。文心一言會(huì)基于飛槳深度學(xué)習(xí)平臺(tái)和文心知識(shí)增強(qiáng)大模型，持續(xù)從海量數(shù)據(jù)和大規(guī)模知識(shí)中融合學(xué)習(xí)，具有知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)的技術(shù)特色。

已有650家企業(yè)伙伴加入文心一言生態(tài)，包括小度和自動(dòng)駕駛Apollo等產(chǎn)品，以及愛奇藝等公司也已經(jīng)接入百度的文心一言模型。

特點(diǎn)：擁有三級(jí)大模型技術(shù)體系

形成了“基礎(chǔ)-任務(wù)-行業(yè)”三級(jí)大模型技術(shù)體系，擁有NLP、計(jì)算機(jī)視覺（CV）、跨模態(tài)等基礎(chǔ)大模型，以及對(duì)話、跨語言、搜索等任務(wù)大模型，還有生物計(jì)算領(lǐng)域大模型、各行業(yè)大模型及支撐大模型應(yīng)用的工具平臺(tái)。

阿里通義大模型

4月11日，阿里云智能首席技術(shù)官周靖人在阿里云峰會(huì)上正式官宣阿里巴巴“通義千問”。

打開通義千問，是一個(gè)聊天對(duì)話框，與競品相似，通義千問在作為“問答機(jī)器人”基礎(chǔ)上還新增了圖片生成應(yīng)用功能，通過拍照上傳一張功能草圖，便可以自動(dòng)生成低代碼業(yè)務(wù)應(yīng)用。

實(shí)際上，早在2022年9月阿里巴巴達(dá)摩院就發(fā)布了“通義”大模型，打造了國內(nèi)首個(gè)AI統(tǒng)一底座，并且通義M6使用的參數(shù)規(guī)模超過了ChatGPT，是全球參數(shù)規(guī)模最大的AI模型。

去年11月阿里還正式提出“Model as a Service”理念，牽頭搭建了國內(nèi)規(guī)模最大的AI模型服務(wù)社區(qū)“魔塔”，公布的數(shù)據(jù)顯示，魔塔社區(qū)目前已有超100萬活躍用戶，模型累計(jì)下載次數(shù)超1600萬，模型總數(shù)達(dá)800個(gè)，與十幾個(gè)頂尖人工智能機(jī)構(gòu)合作。

接下來，阿里所有App，包括天貓、淘寶、釘釘?shù)任磥矶紩?huì)接入通義千問，進(jìn)行全面改造。

通義大模型更偏向?yàn)锽端服務(wù)，周靖人在峰會(huì)上強(qiáng)調(diào)，未來每一個(gè)企業(yè)在阿里云上既可以調(diào)用“通義千問”的全部能力，也可以結(jié)合企業(yè)自己的行業(yè)知識(shí)和應(yīng)用場景，訓(xùn)練自己的企業(yè)大模型。在2022年阿里就將AI應(yīng)用于電力調(diào)度，聯(lián)合電網(wǎng)研發(fā)出高精度電網(wǎng)負(fù)荷預(yù)測模型，現(xiàn)已在山東德州落地。

特點(diǎn)：服務(wù)B端、瞄準(zhǔn)企業(yè)客戶

商湯“日日新大模型”

在4月10日的商湯技術(shù)交流日活動(dòng)上，商湯“日日新SenseNova”大模型體系正式問世，作為中文大模型，其包含自然語言處理、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力，商湯還公布了基于該體系的AI內(nèi)容生成式平臺(tái)——包括秒畫、如影、瓊宇、格物等。

目前商湯在AI領(lǐng)域的投入規(guī)模已經(jīng)超過百億，商湯已打造CV（計(jì)算機(jī)視覺）、NLP（自然語言處理）、AIGC（人工智能內(nèi)容生成）多個(gè)AI大模型，歷時(shí)五年，商湯一直秉持“模型重在能力而非規(guī)模”的看法，在2019年于上海臨港建設(shè)的商湯人工智能計(jì)算中心，共有5000Ｐ算力，大裝置擁有2.7萬塊GPU芯片卡，實(shí)現(xiàn)自供算力以訓(xùn)練大模型。

商湯也發(fā)布了自研類ChatGPT產(chǎn)品“商量”，作為千億級(jí)參數(shù)的自然語言處理模型，其能夠提供以下功能：編程助手，幫助開發(fā)者編寫和調(diào)試代碼；健康咨詢助手，為用戶提供個(gè)性化的醫(yī)療建議；PDF文件閱讀助手，能輕松從復(fù)雜文檔中提取和概括信息等能力，商湯科技聯(lián)合創(chuàng)始人王曉剛則表示“商量”大模型未來主要面向To B端。

此外商湯的大模型研發(fā)體系在多種行業(yè)場景中落地，比如為政企客戶提供包括視覺感知通用任務(wù)與標(biāo)注服務(wù)等多種靈活的API接口和服務(wù)，客戶根據(jù)實(shí)際應(yīng)用需求調(diào)用大模型的各種AI技術(shù)能力。“日日新SenseNova”應(yīng)用在智能駕駛領(lǐng)域，實(shí)現(xiàn)了可識(shí)別3000類物體的BEV環(huán)視通用感知算法的實(shí)車量產(chǎn)，也構(gòu)建了感知決策一體化的自動(dòng)駕駛多模態(tài)模型，能夠給環(huán)境、行為、動(dòng)機(jī)解碼能力帶來突破。

特點(diǎn)：場景式大模型，關(guān)注具體的使用場景

Meta

2023年2月25日，作為硅谷三巨頭之一的Meta，在官網(wǎng)公布了一個(gè)新的大型語言模型 LLaMA（Large Language Model Meta AI），Meta提供了70億、130億、330億和650億四種參數(shù)規(guī)模的 LLaMA 模型，由Meta的FAIR團(tuán)隊(duì)開發(fā)，接受了20種語言的訓(xùn)練。Guillaume Lample 在其Twitter上聲稱：LLaMA130億參數(shù)版本的表現(xiàn)，在大多數(shù)測試上表現(xiàn)優(yōu)于GPT-31750億參數(shù)版。

為了區(qū)別于ChatGPT，Meta首席執(zhí)行官馬克·扎克伯格表示，LLaMA 模型旨在幫助研究人員推進(jìn)工作，在生成文本、對(duì)話、總結(jié)書面材料、證明數(shù)學(xué)定理或預(yù)測蛋白質(zhì)結(jié)構(gòu)等更復(fù)雜的任務(wù)方面有很大的前景。

據(jù)了解，LLaMA 模型也有著其他大語言模型的通病：會(huì)產(chǎn)生偏見性、虛假的內(nèi)容。Meta會(huì)向非商用的研究機(jī)構(gòu)開放 LLaMA源代碼，根據(jù)具體情況授予學(xué)術(shù)研究人員訪問權(quán)限，開源吸引來的更多的研究者可以幫助解決這些問題。

除此之外，Meta AI在官網(wǎng)發(fā)布了圖像分割大模型SAM，該模型在圖片元素識(shí)別與分割上的表現(xiàn)遠(yuǎn)超預(yù)期。英偉達(dá)AI科學(xué)家Jim Fan在社交媒體上表示，SAM讓計(jì)算機(jī)視覺（CV）迎來“GPT-3時(shí)刻”，它已經(jīng)了解了物體的一般概念，即使對(duì)于未知對(duì)象、不熟悉的場景（例如水下圖像）和在模棱兩可的情況下也能很好地進(jìn)行圖像分割。

特點(diǎn)：開源、圖像識(shí)別能力強(qiáng)

谷歌

2023年2月，Google發(fā)布了Bard大模型，這是一款用于對(duì)抗ChatGPT、在一個(gè)大型語言模型（LLM）基礎(chǔ)上推出的智能聊天機(jī)器人，Bard作為谷歌對(duì)話應(yīng)用語言模型，可以說是LLaMDA的一個(gè)輕量和優(yōu)化版本。3月21日，谷歌向公眾開放了Bard的訪問權(quán)限，但目前僅支持年滿18歲的美英用戶注冊(cè)試用，且只支持英文提問。

Bard也為用戶提供了一個(gè)單獨(dú)的聊天界面，從AI功能上來看，Bard跟其他AI模型大同小異，用戶可以在文本框中進(jìn)行提問和搜索，比如讓Bard幫你寫一篇文章、列一個(gè)計(jì)劃、解決一個(gè)題目得出結(jié)果等。

然而在谷歌短短的幾秒展示里，Bard就出現(xiàn)了大問題：被問到“我可以告訴我 9 歲的孩子關(guān)于詹姆斯·韋伯太空望遠(yuǎn)鏡（簡稱JWST）的哪些新發(fā)現(xiàn)？”時(shí)， Bard的回答里面有一個(gè)巨大的錯(cuò)誤：回答里提到“ JWST 拍攝到了太陽系外行星的第一張照片”，事實(shí)上，第一張系外行星照片應(yīng)該是2004年由歐洲南方天文臺(tái)的Very Large Telescope拍攝的。

由于有了上線后曾出現(xiàn)的混亂和批評(píng)的前車之鑒，現(xiàn)在谷歌Bard整個(gè)界面都透露出谷歌滿滿的求生欲。在你開始使用Bard之前，會(huì)有一個(gè)免責(zé)聲明，明確提醒你Bard目前還只處于實(shí)驗(yàn)階段。無論是在提問的文本框下面還是答案生成框下方，時(shí)刻都寫著一行小字，提醒用戶“Bard可能生成不準(zhǔn)確或者略帶攻擊性的信息，但并不代表谷歌官方觀點(diǎn)”。

特點(diǎn)：聊天大模型、準(zhǔn)確性不佳

360

3月29日，在“2023數(shù)字安全與發(fā)展高峰論壇”上，周鴻祎現(xiàn)場演示了360自研的人工智能語言模型在360瀏覽器上的應(yīng)用，并宣布了360的人工智能發(fā)展戰(zhàn)略。

360于4月9日公告，基于360GPT大模型開發(fā)的人類智能產(chǎn)品矩陣“360 智能腦”將落地搜索場景，面向企業(yè)用戶開放內(nèi)測。據(jù)了解，企業(yè)用戶在PC端360 搜索首頁申請(qǐng)并獲得測試資格后，可通過企業(yè)安全云體驗(yàn)使用。未來，360 智腦將與瀏覽器、數(shù)字助理、蘇打辦公、智能營銷等場景應(yīng)用深度結(jié)合，全面提升用戶工作效率。

特點(diǎn)：面向B端

昆侖萬維

昆侖萬維公眾號(hào)在4月10日宣布：由昆侖萬維和奇點(diǎn)智源合作自研的，中國第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型——“天工3.5”發(fā)布在即，并于4月17日啟動(dòng)邀請(qǐng)測試。

昆侖萬維甚至宣稱“天工”大模型已經(jīng)非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型，所以把這個(gè)版本命名為“天工3.5”。昆侖萬維研發(fā)團(tuán)隊(duì)2020年從一億級(jí)模型做起，上升至十億級(jí)模型，再到百億級(jí)模型，在三年后將研究成果放入大模型之戰(zhàn)，選擇開源的方式入局。

特點(diǎn)：偏向C端的語言大模型

原文標(biāo)題 : 大模型時(shí)代進(jìn)入尾聲：場景式模型接棒

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

暫無評(píng)論

暫無評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

999精品视频在这里

欧洲精品卡1区2卡三卡四卡被黑人调教性奴俱乐部久久这里只有精品6 久久久综合视频一本

<rt id="ciy9p"></rt><address id="ciy9p"></address>