訂閱
糾錯
加入自媒體

豆包手機的“生死劫”:權(quán)限、邊界與生態(tài)

2025-12-09 10:06
聽潮TI
關(guān)注

圖片

豆包碰了誰的奶酪?

文/郭佳哿

編輯/張曉

發(fā)布僅一周時間,豆包手機助手就已經(jīng)引來輿論層面的幾輪沖擊。

12月5日,豆包團隊發(fā)布公告,稱為了讓技術(shù)發(fā)展與行業(yè)接受度良性適配,將對AI操作手機的能力進(jìn)行“規(guī)范化調(diào)整”。其中包括限制金融類應(yīng)用和部分游戲的使用。

圖片圖/豆包手機助手官微

此前12月1日,字節(jié)跳動豆包團隊發(fā)布豆包手機助手技術(shù)預(yù)覽版,是在豆包大模型基礎(chǔ)上和手機廠商在操作系統(tǒng)層面合作的AI助手軟件,并官宣率先落地中興旗下的努比亞M153,這款真正接近“AI手機”的產(chǎn)品,3499元的價格一度在二級市場炒至萬元高價。

隨后不少業(yè)內(nèi)人士抨擊,豆包擁有的跨應(yīng)用操作能力,是因為獲取了一項操作系統(tǒng)高危權(quán)限INJECT_EVENTS,直接引來抖音副總裁李亮的公開發(fā)聲:“只要是用戶許可就不存在侵犯隱私的行為。豆包手機助手是經(jīng)過用戶授權(quán),才能完成操作手機的任務(wù)”。

圖片圖/@抖音集團李亮個人微博

短短一周,這一系列喧囂不僅將系統(tǒng)級AI推上風(fēng)口,也讓外界看清了AI Agent在終端上的潛力與局限——讓每個用戶真正擁有自己的“賈維斯”,遠(yuǎn)比想象中要難。

01

一個無限接近AI Agent的產(chǎn)品

豆包手機助手的直觀功能并不復(fù)雜。

除了基礎(chǔ)的多模態(tài)能力和本地工具調(diào)用,它最核心的能力其實是跨應(yīng)用自動執(zhí)行和全局記憶功能。

在豆包最早發(fā)布的演示視頻中,在不同電商平臺比價下單、調(diào)取用戶放進(jìn)微信、小紅書、大眾點評等App收藏夾的地點,并在地圖上進(jìn)行標(biāo)注,都是典型案例。

類似早期單個AI搜索軟件中的上下文感知能力,豆包手機助手的全局記憶相當(dāng)于把這種記憶能力擴展到用戶平時對手機的所有操作上:你保存的某個日程、關(guān)注的某家餐廳、記錄的某人生日,全局記憶讓助手能夠把分散在不同應(yīng)用或時間點的任務(wù)整合在一起,實現(xiàn)跨應(yīng)用的連續(xù)操作,比如通過喚醒記憶幫你訂餐廳、訂機票等。

如果說早期的豆包像個聰明的語音助手,如今卻更接近直接把你的秘書塞進(jìn)了系統(tǒng)里。它能理解屏幕內(nèi)容、判斷界面狀態(tài)、自己尋找任務(wù)路徑,而非依賴某個插件或API。以往的語音助手只是替你發(fā)出指令,豆包開始替你實際“動手”。

某種程度來說,它其實是一個無限接近AI Agent的產(chǎn)品。

但從技術(shù)層面來看,豆包手機助手的核心功能邏輯不外乎兩部分:讀取屏幕+模擬用戶操作。

即它可以通過操作系統(tǒng)提供的無障礙接口獲取當(dāng)前屏幕的界面結(jié)構(gòu)和元素信息,換句話說,它能“看到”屏幕上每個可交互元素的位置、屬性和文本信息。

圖片圖/豆包手機助手官網(wǎng)

事實上,這種功能并不新鮮,大多數(shù)安卓手機早期的無障礙功能就已經(jīng)可以讀屏并控制應(yīng)用了——一種最初設(shè)計給視障用戶的系統(tǒng)權(quán)限。區(qū)別在于豆包手機助手本質(zhì)是把AI大模型做成系統(tǒng)級的手機助手,預(yù)裝在手機里,以最高權(quán)限直接插進(jìn)系統(tǒng),讓操作不再只是機械執(zhí)行,而是可以根據(jù)上下文和任務(wù)目標(biāo)自主判斷和規(guī)劃,從而完成更復(fù)雜、跨應(yīng)用的自動化任務(wù)。

這種產(chǎn)品模式看起來確實性感,如果是過去的手機是“你點”,語音助手是“你說,我?guī)湍愦蜷_”;那現(xiàn)在就是“你說,我整個事情全部做好”。

說到底,這從用戶體驗上是質(zhì)變,但從技術(shù)底座上,只是量變的疊加,并沒有顛覆性的底層技術(shù)突破。

那問題來了:這套能力為什么現(xiàn)在才出現(xiàn)?

一方面,大模型的多模態(tài)理解能力在這兩年提升明顯,另一方面,推理成本下降,讓模型常駐后臺變得現(xiàn)實,不再像過去那樣昂貴、卡頓甚至不穩(wěn)定。

這個節(jié)點落在2024年底,模型能力、算力成本與用戶需求共同逼近閾值,用戶場景開始成為AI大模型們的共同目標(biāo)。豆包踩中了這樣一個窗口,它與其他AI產(chǎn)品的關(guān)鍵區(qū)別并不在算力水平,而在于其把錨點瞄準(zhǔn)更與用戶息息相關(guān)的移動終端——手機。

豆包手機助手的出現(xiàn),顯然不是為了證明技術(shù)實力,而是為了占據(jù)這個潛在的超級入口。在應(yīng)用增長見頂、內(nèi)容平臺競爭白熱化的當(dāng)下,“入口”比“功能”重要得多。一旦模型能穩(wěn)當(dāng)?shù)爻袚?dān)跨應(yīng)用執(zhí)行任務(wù),它就擁有了重新分配移動生態(tài)流量的可能性。

同時隨著App越做越復(fù)雜、生態(tài)越來越臃腫,用戶被擠壓的耐心反而催生了對“簡單直接快速”的渴望,整個手機行業(yè)給AI讓出了一個可被替換的鏈路。

這也解釋了為什么豆包手機助手在短時間內(nèi)激起如此多討論:它觸碰的不只是產(chǎn)品,而是互聯(lián)網(wǎng)大廠們多年構(gòu)建起的底層生態(tài)。而下一步能否走下去,要看它如何穿越更復(fù)雜的生態(tài)摩擦。

02

核心應(yīng)用們的集體圍剿

輿論的導(dǎo)火索始于微信對豆包手機助手的突然“隔離”。

僅正式發(fā)布一天,就陸續(xù)有用戶發(fā)現(xiàn),在使用這臺搭載了豆包手機助手的手機操作微信時,直接觸發(fā)了微信“登錄環(huán)境異常”提示,導(dǎo)致微信被強制下線且無法正常登錄。

緊接著阿里系也緊跟其后,有用戶反饋在登錄淘寶、閑魚、大麥等App時,也遭到了強彈窗提醒,被強制推出并顯示登陸環(huán)境異常,要求更換設(shè)備重新登陸。與此同時,該手機上的農(nóng)業(yè)銀行、建設(shè)銀行等App也被直接拒絕登陸。

這些核心應(yīng)用的罷工,讓這臺在二手市場溢價已經(jīng)高達(dá)近4倍的努比亞工程機,短短幾天內(nèi)直接變成一塊“磚頭”。

雖然對此微信方的公開回復(fù)是,“沒有什么特別的動作,可能是觸發(fā)了本來就有的安全風(fēng)控措施”,但如果把視角拉回到豆包手機助手本身,它所依賴的系統(tǒng)級權(quán)限正是這些風(fēng)控敏感的關(guān)鍵所在。

要實現(xiàn)“像人一樣操作其他應(yīng)用”,AI助手必須獲得較高權(quán)限或廠商級接入,尤其是連續(xù)跨應(yīng)用調(diào)用會觸及大量第三方數(shù)據(jù),包括聊天記錄、聯(lián)系人、支付信息等等,這些個人信息都需要非常明確的用戶授權(quán)、最小權(quán)限原則、以及本地化數(shù)據(jù)保護(hù)。

而AI Agent在真實環(huán)境中面對App版本迭代、網(wǎng)絡(luò)波動等復(fù)雜情況,一旦出現(xiàn)執(zhí)行失敗或誤操作,尤其涉及支付等重要設(shè)置時,用戶容錯成本極高。

這不僅關(guān)乎用戶數(shù)據(jù)安全,也關(guān)系到產(chǎn)品的穩(wěn)定性和風(fēng)控體系完整性。對微信而言,每一次消息發(fā)送、每一個操作流程,都嵌入了復(fù)雜的反作弊、反濫用和數(shù)據(jù)監(jiān)控邏輯,一旦被外部工具繞開,就可能打亂系統(tǒng)設(shè)計,增加異常事件和責(zé)任歸屬風(fēng)險。

值得注意的是,今年4月,微信剛發(fā)布公告提醒用戶切勿使用第三方工具管理微信聊天記錄。此后,包括Siri、小愛同學(xué)、華為小藝等手機語音助手均無法再通過語音直接調(diào)用微信功能。

圖片圖/微信安全中心官微

這也能解釋為何此次微信動作跟進(jìn)得如此迅速的原因,這個窗口一旦打開,便意味著潛在的濫用可能。對于微信等核心應(yīng)用,它們必須重新評估每一個外部調(diào)用行為的安全性與可信度,這也是為何會選擇直接阻斷的原因。

這種擔(dān)心并非微信獨有。對整個App生態(tài)而言,當(dāng)外部助手掌握了系統(tǒng)級操作能力,就意味著任何應(yīng)用的控制權(quán)都有可能被分流或代替。

這也是豆包手機助手面臨的行業(yè)級矛盾:入口之爭必然帶來動作邊界之爭。

用戶想象中的“便利”,對應(yīng)用開發(fā)者而言可能是潛在的安全漏洞或者運營風(fēng)險。無論是社交、支付還是電商應(yīng)用,每一次操作都可能牽扯到賬戶安全、交易完整性、用戶體驗等多重考量。

從市場角度看,這類限制也揭示了決策權(quán)的歸屬——無論系統(tǒng)權(quán)限多么高,最終能否執(zhí)行任務(wù),取決于App是否允許。

即使系統(tǒng)層的AI助手具備多高的系統(tǒng)權(quán)限,最終能否真正執(zhí)行任務(wù),仍要看各個App是否在業(yè)務(wù)鏈路、相應(yīng)接口與風(fēng)控體系上給予“可被自動化”的空間。如果沒有應(yīng)用方的配合,AI助手的“全局執(zhí)行”就會遇到天花板。

更廣義地說,這種沖突反映了整個行業(yè)在系統(tǒng)級AI入口上的博弈。大廠都希望保留對用戶操作鏈路的掌控權(quán),因為這是流量、數(shù)據(jù)、風(fēng)控與用戶體驗的根基。

一個簡單的例子,如果豆包這類系統(tǒng)層智能體能夠“代替用戶”在多個應(yīng)用之間直接執(zhí)行操作,意味著用戶不再需要進(jìn)入各個平臺完成這些動作。原本打開ABC平臺→搜索關(guān)鍵詞→瀏覽、比價商品→完成下單的傳統(tǒng)路徑,變成只需要說一句“幫我買一包50元以內(nèi)、銷量高、明天能送達(dá)的貓糧”,AI助手就會自動去各電商平臺比價、選品并完成下單。

用戶不再進(jìn)入平臺首頁,平臺就會失去搜索入口的流量;AI抽取內(nèi)容后,平臺本身的“推薦流”不再是用戶入口,內(nèi)容價值鏈被上游截斷;而用戶瀏覽時間下降,廣告曝光就會減少;平臺的“貨架邏輯”和推薦流量分發(fā)也會失效。

當(dāng)AI助手嘗試跨越應(yīng)用邊界,它實際上挑戰(zhàn)的是現(xiàn)有App生態(tài)的權(quán)力分布。豆包手機助手的嘗試雖然顯示了技術(shù)可行性,但真正能否長期運行,取決于能否在在系統(tǒng)權(quán)限與App生態(tài)之間找到商業(yè)操作上的平衡點。

03

軟硬一體才是真正入口

AI發(fā)展了近3年,從算力到多模態(tài)能力,再到AI硬件落地,產(chǎn)業(yè)格局逐漸回到可持續(xù)性商業(yè)模式的考量上。

正如豆包明知跨應(yīng)用自動執(zhí)行存在隱私合規(guī)與平臺關(guān)系的多重風(fēng)險,卻仍要執(zhí)意往前推進(jìn),原因非常直接:跑馬圈地之后,入口之爭進(jìn)入了新的階段,AI 廠商和手機廠商都意識到,未來真正能沉淀商業(yè)價值的,不是一個個獨立的 AI 服務(wù),而是真正與用戶場景相關(guān)的超級入口。

AI Agent的發(fā)展初期,豆包、元寶、Kimi、通義千問等產(chǎn)品都曾試圖通過嵌入應(yīng)用內(nèi)功能占據(jù)用戶場景。

豆包初期曾嵌入到抖音、今日頭條等應(yīng)用內(nèi),提供智能推薦、內(nèi)容生成等功能;今年初騰訊甚至在微信里幾乎能放廣告的所有地方,都給元寶上了廣告位……

而AI搜索軟件和手機廠商上一次深度合作還是Deepseek爆火后,華為、榮耀、小米等主流國產(chǎn)手機廠商都先后宣布在其原有的語音助手中接入DeepSeek。

事實上,系統(tǒng)級AI也并非豆包“首發(fā)”。

早在今年6月華為開發(fā)者大會上,鴻蒙系統(tǒng)6展示的AI智能體驗,就已出現(xiàn)系統(tǒng)級AI的雛形,但當(dāng)時華為強調(diào)的仍是調(diào)度多個智能體協(xié)同完成任務(wù)。

蘋果方面,Siri正在向系統(tǒng)層執(zhí)行能力升級,未來的Apple Intelligence同樣瞄準(zhǔn)跨App協(xié)作和操作路徑重構(gòu)。小米、華為、OPPO等廠商也在持續(xù)改進(jìn)語音助手的全局操作能力,逐步向中心化、一體化方向靠攏。

硬件端同樣在布局未來入口,從早前的網(wǎng)紅AI穿戴設(shè)備Humane的AI Pin,到阿里在11月最新發(fā)布的夸克AI眼鏡,都曾被視作可能的替代入口。但至少目前尚未獲得用戶心智占領(lǐng),手機仍是最穩(wěn)定、使用頻次最高的終端。因此,大部分廠商仍將手機作為核心入口下注。

這也是為什么各大廠在AI生態(tài)布局中,軟硬件同步推進(jìn):軟件確保系統(tǒng)級操作能力落地,硬件探索未來交互形態(tài),二者結(jié)合才可能形成對用戶行為路徑的長期控制。

AI的洪流滾滾向前,當(dāng)技術(shù)變得愈加通用,企業(yè)要么上車,要么被拋棄。

頭圖/豆包AI生成

       原文標(biāo)題 : 豆包手機的“生死劫”:權(quán)限、邊界與生態(tài)

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號