123,123,123

<bdo id="2mkwe"><source id="2mkwe"></source></bdo>

<strike id="2mkwe"></strike>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 機(jī)器學(xué)習(xí) > 正文

AI芯天下丨熱點(diǎn)丨OpenAI即將推出Agent模式，AI能力又進(jìn)一步

2025-07-22 10:01

前言：

2025年下半年伊始，始終致力于定義AI領(lǐng)域的OpenAI，正式推出了其Agent模式的解決方案。

這一方案使ChatGPT能在虛擬沙盒中調(diào)用文本瀏覽器、可視化瀏覽器和終端工具，自主完成多步驟復(fù)雜任務(wù)，實(shí)現(xiàn)從信息檢索到在線購(gòu)物等操作，開(kāi)啟了從Chat到Agent的跨越。

作者 | 方文三

OpenAI自己的Agent模式亮相

近日，薩姆·奧爾特曼與四位OpenAI研究員通過(guò)直播形式介紹了即將發(fā)布的Agent模式。

觀其演示過(guò)程可發(fā)現(xiàn)，該模式在用戶交互層面的直觀體驗(yàn)，與數(shù)月前引發(fā)廣泛關(guān)注的Manus模式極為相似。

當(dāng)用戶提出需求后，系統(tǒng)均會(huì)自動(dòng)創(chuàng)建一個(gè)虛擬環(huán)境，并開(kāi)始執(zhí)行任務(wù)。

任務(wù)執(zhí)行期間，Agent會(huì)反復(fù)請(qǐng)求用戶確認(rèn)操作步驟，并允許用戶隨時(shí)手動(dòng)接管進(jìn)程。

同時(shí)，用戶亦可在任務(wù)執(zhí)行過(guò)程中插入新的需求指令，實(shí)現(xiàn)實(shí)時(shí)交互。

OpenAI首席執(zhí)行官山姆奧特曼表示，目睹ChatGPT智能體運(yùn)用計(jì)算機(jī)執(zhí)行復(fù)雜任務(wù)，使其真切感受到AGI的存在。計(jì)算機(jī)自主完成思考、規(guī)劃與執(zhí)行的過(guò)程，將產(chǎn)生顯著差異的體驗(yàn)。

所有操作均在ChatGPT Agent專屬虛擬計(jì)算機(jī)中完成，此舉可在調(diào)用多工具時(shí)完整保留任務(wù)上下文信息。

該智能體可根據(jù)需求選擇文本瀏覽器或可視化瀏覽器訪問(wèn)網(wǎng)頁(yè)，執(zhí)行文件下載操作，通過(guò)終端命令處理文件，并借助可視化瀏覽器審閱輸出結(jié)果。

同時(shí)能夠動(dòng)態(tài)調(diào)整任務(wù)策略，以實(shí)現(xiàn)高效、精準(zhǔn)的快速執(zhí)行。

ChatGPTAgent專為迭代式、協(xié)同式工作流程設(shè)計(jì)，其交互性與靈活性遠(yuǎn)超既往模型。

任務(wù)執(zhí)行過(guò)程中，用戶可隨時(shí)中斷進(jìn)程：進(jìn)一步澄清指令以修正執(zhí)行方向，或直接變更任務(wù)目標(biāo)。智能體將基于新增信息繼續(xù)推進(jìn)工作，且完整保留先前進(jìn)度。

同理，ChatGPT亦會(huì)在必要時(shí)主動(dòng)要求用戶補(bǔ)充細(xì)節(jié)，確保任務(wù)執(zhí)行不偏離既定目標(biāo)。

若任務(wù)耗時(shí)超出預(yù)期或陷入停滯，用戶可選擇暫停進(jìn)程、獲取進(jìn)度摘要，或終止任務(wù)以提取現(xiàn)有成果。

當(dāng)用戶安裝移動(dòng)端ChatGPT應(yīng)用時(shí)，系統(tǒng)將在任務(wù)完成后推送通知。

由Operator+Deep Research工具整合而成

根據(jù)OpenAI的介紹，Agent模式可調(diào)用三種工具：文本瀏覽器、可視化瀏覽器及終端。模型具備自主選擇并切換這些工具的能力。

此工具組合的設(shè)計(jì)頗具巧思：文本瀏覽器專司大量文本信息的瀏覽與檢索，可視化瀏覽器則負(fù)責(zé)在定位信息后執(zhí)行鍵鼠操作或讀取圖像信息。

而終端工具，則用于運(yùn)行代碼、生成包括演示文稿與電子表格在內(nèi)的文件，并調(diào)用特定的云端應(yīng)用程序接口。

OpenAI此次推出的新型Agent模式，并非一項(xiàng)全新的技術(shù)創(chuàng)新，實(shí)則由該公司上半年發(fā)布的兩項(xiàng)工具——Operator與Deep Research整合而成。

Operator原為僅向Pro用戶開(kāi)放的瀏覽器Agent工具，具備分析圖形操作界面并執(zhí)行基礎(chǔ)操作的能力。

Deep Research則是一款深度研究分析工具，可讀取大量網(wǎng)頁(yè)內(nèi)容并直接生成調(diào)研報(bào)告。

OpenAI在分別推廣這兩項(xiàng)工具時(shí)發(fā)現(xiàn)，許多用戶通過(guò)Operator提交的提示指令更趨近于DeepResearch的任務(wù)范疇，例如[規(guī)劃旅行行程并進(jìn)行預(yù)訂]；

而Deep Research用戶強(qiáng)烈呼吁的[登錄網(wǎng)站、訪問(wèn)受保護(hù)資源]功能，實(shí)為Operator已具備的能力。

這兩個(gè)從不同維度推進(jìn)的Agent項(xiàng)目最終實(shí)現(xiàn)整合，產(chǎn)生了顯著的協(xié)同效應(yīng)。

既規(guī)避了單純依賴瀏覽器圖形界面處理文本材料的低效問(wèn)題，又使得生成深度研究報(bào)告所需時(shí)長(zhǎng)顯著縮短。

實(shí)現(xiàn)了通用智能體能力的關(guān)鍵升級(jí)

與過(guò)往的基礎(chǔ)大模型迭代不同，通用Agent能夠自主調(diào)用多種工具進(jìn)行任務(wù)規(guī)劃，協(xié)助用戶完成復(fù)雜操作，包括自動(dòng)查閱用戶日歷、生成可編輯的PPT文檔、運(yùn)行代碼等。

ChatGPT Agent可連接用戶的Gmail、GitHub等平臺(tái)獲取信息并解決問(wèn)題，同時(shí)通過(guò)API接口訪問(wèn)各類應(yīng)用程序。

OpenAI采用模擬復(fù)雜現(xiàn)實(shí)任務(wù)的基準(zhǔn)測(cè)試對(duì)該模型進(jìn)行評(píng)估。

經(jīng)Agent技術(shù)增強(qiáng)后，AI智能水平實(shí)現(xiàn)大幅提升。

基于ChatGPTAgent的模型在HLE基準(zhǔn)測(cè)試中獲得41.6%的評(píng)分，達(dá)到O3與O4-mini模型性能的近兩倍。

在部構(gòu)建的復(fù)雜經(jīng)濟(jì)價(jià)值知識(shí)型任務(wù)評(píng)估體系中，ChatGPTAgent的產(chǎn)出質(zhì)量約半數(shù)情況下達(dá)到甚至超越人類水平，任務(wù)完成時(shí)間存在浮動(dòng)區(qū)間，且顯著優(yōu)于o3與o4-mini模型。

在SpreadsheetBench表格操作測(cè)試中，該智能體處理復(fù)雜電子表格的編輯、函數(shù)應(yīng)用及格式規(guī)范能力取得顯著突破，以45.5%的得分達(dá)到GPT4o性能的兩倍，首次逼近ExcelCopilot商業(yè)級(jí)解決方案水平。

網(wǎng)頁(yè)操作領(lǐng)域，ChatGPT Agent在WebArena測(cè)試中成功執(zhí)行賬戶登錄、頁(yè)面跳轉(zhuǎn)、數(shù)據(jù)采集等現(xiàn)實(shí)任務(wù)，其表現(xiàn)已接近人類平均水準(zhǔn)。

信息檢索能力方面，該智能體于BrowseComp基準(zhǔn)測(cè)試中以68.9分創(chuàng)下當(dāng)前最高記錄。此項(xiàng)指標(biāo)直接決定其自主執(zhí)行任務(wù)時(shí)的可靠性水平。

結(jié)尾：

OpenAI的正式入場(chǎng)，或?qū)⒅厮蹵gent創(chuàng)業(yè)領(lǐng)域的整體敘事框架。

數(shù)月前，Manus尚被譽(yù)為[國(guó)產(chǎn)Agent的希望]：其于業(yè)界尚未充分理解Agent概念之際，率先向市場(chǎng)展示了未來(lái)圖景，實(shí)證了AI執(zhí)行復(fù)雜任務(wù)的現(xiàn)實(shí)潛力。

然今年7月初，Manus官網(wǎng)悄然關(guān)閉，中國(guó)大陸業(yè)務(wù)全面暫停，僅保留海外產(chǎn)品線——此舉促使外界重新審視Agent初創(chuàng)企業(yè)的真實(shí)生存狀態(tài)。

數(shù)日前，朱嘯虎曾公開(kāi)斷言：大模型將吞噬90%的Agent市場(chǎng)。

毋庸置疑，此現(xiàn)象背后交織著監(jiān)管政策、合規(guī)要求與資本環(huán)境等多重復(fù)雜因素。

但現(xiàn)在的問(wèn)題又來(lái)到了，當(dāng)OpenAI親自下場(chǎng)，初創(chuàng)通用型Agent的機(jī)會(huì)已經(jīng)不多了。

部分資料參考：

極客公園：《剛剛，OpenAI發(fā)布了自己的Agent模式，ManusStyle》

機(jī)器之心：《剛剛，OpenAI通用智能體ChatGPTAgent正式登場(chǎng)》

果殼：《終于來(lái)了，OpenAI的智能體，但這次掌聲不多》

網(wǎng)易科技：《凌晨，OpenAI卷進(jìn)[通用Agent]，Manus們算白忙活嗎？》

原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨OpenAI即將推出Agent模式，AI能力又進(jìn)一步

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪問(wèn)所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

高級(jí)軟件工程師廣東省/深圳市
自動(dòng)化高級(jí)工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級(jí)銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

999精品视频在这里

日本黄色网站无马赛克免费看亚洲福利精品亚洲乱码日产精品BD 国产99视频精品免视看7

<fieldset id="uu2ek"></fieldset>