一份端側(cè)AI的內(nèi)部紀(jì)要:投資人應(yīng)真正關(guān)心的3個(gè)被忽略的問題!
當(dāng)谷歌在Pixel 10上演示“實(shí)時(shí)AI摳圖”功能,以及蘋果預(yù)告將在2025秋季發(fā)布會(huì)推出“重新定義的AI手機(jī)”時(shí),從供應(yīng)鏈傳出的每一個(gè)風(fēng)聲,到華爾街連夜上調(diào)的出貨量預(yù)測(cè),一個(gè)近乎完美的劇本已經(jīng)寫好:
一個(gè)由端側(cè)AI驅(qū)動(dòng)的、史詩級(jí)的消費(fèi)電子“超級(jí)升級(jí)周期”,即將到來。
但當(dāng)市場(chǎng)的喧囂散去,一個(gè)更冷靜、也更致命的問題浮現(xiàn)出來:
當(dāng)一個(gè)機(jī)會(huì)變得如此確定無疑,如果所有人都在談?wù)摱藗?cè)AI、所有芯片財(cái)報(bào)都在重復(fù)“On-Device AI”、所有品牌都在預(yù)告“革命性體驗(yàn)”,它會(huì)不會(huì)已經(jīng)變成了一個(gè)“共識(shí)陷阱”?
今天,硅兔君結(jié)合近期與其專家團(tuán)隊(duì)的交流成果就來聊聊共識(shí)之外,那三個(gè)決定未來勝負(fù)的“非共識(shí)”。
共識(shí)告訴你: 硬件環(huán)節(jié)確定性最高,是肉眼可見的紅利。
這個(gè)邏輯非常清晰。高通的驍龍8 Gen 3集成了Hexagon NPU,AI性能提升98%;聯(lián)發(fā)科的天璣9300號(hào)稱擁有330億參數(shù)大模型處理能力;蘋果的A17 Pro神經(jīng)引擎速度翻倍。
這場(chǎng)算力軍備競(jìng)賽,直接體現(xiàn)在了產(chǎn)業(yè)鏈的財(cái)報(bào)上:瑞芯微、恒玄科技等公司的業(yè)績(jī)?cè)鲩L(zhǎng)曲線,陡峭得讓人心動(dòng)。
這塊蜜糖,真實(shí)而甜美。但這會(huì)是常態(tài)嗎?
你需要追問的第一個(gè)非共識(shí)是:這場(chǎng)“算力內(nèi)卷”的盡頭是什么?
我們都經(jīng)歷過PC時(shí)代的CPU主頻大戰(zhàn),和智能手機(jī)早期的核戰(zhàn)。歷史一再證明,當(dāng)硬件性能超越了主流應(yīng)用的需求,就會(huì)出現(xiàn)“性能過剩”,硬件溢價(jià)隨之消失,行業(yè)進(jìn)入殘酷的存量搏殺。
今天手機(jī)NPU算力從50 TOPS卷到100 TOPS,除了讓AI修圖更快零點(diǎn)幾秒,對(duì)絕大多數(shù)用戶的體驗(yàn)改善,是否正在邊際遞減?一旦體驗(yàn)改善的曲線被算力增長(zhǎng)的曲線追上,高昂的硬件溢價(jià)還能維持多久?
第二個(gè)更致命的問題是:誰在定義“有效算力”?
讓我們回顧一下NVIDIA是如何封神的。它的護(hù)城河,從來都不是GPU那塊芯片本身,而是CUDA——那個(gè)讓開發(fā)者欲罷不能的軟件開發(fā)生態(tài)。CUDA用十余年的時(shí)間,統(tǒng)一了AI開發(fā)的“語言”,讓數(shù)百萬開發(fā)者為NVIDIA的硬件“鎖定”。
真正的護(hù)城河,不是參數(shù)表上那個(gè)冷冰冰的TOPS數(shù)字,而是能讓開發(fā)者低成本、高性能地將算法跑起來的、充滿活力的軟件生態(tài)。
最后,別忘了手機(jī)之外的廣闊戰(zhàn)場(chǎng)。在智能汽車領(lǐng)域,Ambarella、瑞薩電子這類廠商,正通過高度定制化的AI視覺芯片(ASIC)搶占市場(chǎng),它們不追求通用算力,而是在特定場(chǎng)景(如ADAS)下把能效比做到極致。這種“專用化”的降維打擊,是否會(huì)對(duì)手機(jī)芯片廠商“一芯多用”的平臺(tái)化策略構(gòu)成威脅?
硬件的戰(zhàn)爭(zhēng),上半場(chǎng)是參數(shù),下半場(chǎng)是生態(tài)。當(dāng)你還在為那20%的溢價(jià)歡呼時(shí),真正聰明的錢,已經(jīng)在思考那個(gè)未來的生態(tài)霸主會(huì)是誰。
共識(shí)告訴你: 模型輕量化技術(shù),是讓大模型在終端設(shè)備運(yùn)行的關(guān)鍵。
沒錯(cuò)。通過模型剪枝、量化、知識(shí)蒸餾等一系列“手術(shù)”,百億參數(shù)的模型可以被壓縮到原來的十分之一,同時(shí)保持可接受的性能。我們已經(jīng)看到了Google的Gemini Nano被塞進(jìn)Pixel手機(jī),Meta的Llama 3也推出了適合端側(cè)運(yùn)行的小參數(shù)版本。
但這個(gè)過程,遠(yuǎn)比聽上去要復(fù)雜。
第一個(gè)被忽略的現(xiàn)實(shí)是:目前的模型壓縮,很大程度上還是個(gè)“手工作坊”。
它高度依賴頂尖AI科學(xué)家和工程師的經(jīng)驗(yàn)、直覺和反復(fù)試錯(cuò),俗稱“煉丹”。這個(gè)過程成本高昂、周期漫長(zhǎng),且結(jié)果難以保證。這極大地限制了端側(cè)AI應(yīng)用的創(chuàng)新速度和普及廣度。
真正的行業(yè)爆發(fā)點(diǎn),在于“自動(dòng)化模型壓縮”(AutoML for Compression)工具鏈的成熟。
想象一下,開發(fā)者不再需要是算法專家,只需將自己的大模型上傳到一個(gè)平臺(tái),平臺(tái)就能自動(dòng)嘗試數(shù)千種壓縮方案,并找到那個(gè)在特定硬件上(比如某款手機(jī)芯片)性能和精度的最佳平衡點(diǎn)。這才是“工業(yè)化”的革命。
一些嗅覺敏銳的初創(chuàng)公司,如Deci AI(被英偉達(dá)收購)、Neural Magic(被 RedHat收購),已經(jīng)在嘗試將這個(gè)過程產(chǎn)品化。這才是AI時(shí)代的未來,他們不生產(chǎn)模型,但他們讓所有模型都能更便宜、更高效地運(yùn)行在你的設(shè)備上。
第二個(gè)深水區(qū),是開源與閉源的路線之爭(zhēng)。以llama.cpp為代表的開源社區(qū),用驚人的速度,讓各種開源大模型在Mac、PC甚至手機(jī)上跑了起來,極大推動(dòng)了技術(shù)的普及。
但另一邊,蘋果和谷歌則在自己的操作系統(tǒng)里,內(nèi)置了高度優(yōu)化的、不對(duì)外的模型和推理引擎。
這像極了移動(dòng)互聯(lián)網(wǎng)的開端。未來,是安卓當(dāng)年對(duì)iOS的“開放戰(zhàn)勝封閉”重演,讓百花齊放的開源方案占領(lǐng)市場(chǎng)?還是巨頭憑借軟硬一體的極致體驗(yàn)和隱私保護(hù),牢牢守住高端生態(tài)位,賺取最高的利潤?這兩種路徑,指向了完全不同的產(chǎn)業(yè)鏈投資機(jī)會(huì)。
最后,是數(shù)據(jù)的“隱形戰(zhàn)爭(zhēng)”。 輕量化后的模型,性能或多或少會(huì)有損失。如何彌補(bǔ)?答案是“端側(cè)微調(diào)”(On-device Fine-tuning)。利用你在設(shè)備上的個(gè)人數(shù)據(jù),讓模型變得更懂你。
但這又引出了終極難題:如何在利用數(shù)據(jù)的同時(shí),絕對(duì)保護(hù)用戶隱私?聯(lián)邦學(xué)習(xí)(Federated Learning)等技術(shù)雖然被寄予厚望,但成熟度依然面臨挑戰(zhàn)。誰能率先解決“自動(dòng)化工具鏈”、“生態(tài)路線”和“隱私數(shù)據(jù)”這三個(gè)問題,誰就掌握了端側(cè)AI軟件的“命脈”。
共識(shí)告訴你: 手機(jī)、汽車、IoT是三大落地場(chǎng)景,前景無限。
這當(dāng)然是對(duì)的。但“場(chǎng)景”這個(gè)詞,最容易滋生泡沫。
第一個(gè)需要警惕的陷阱,就是“為了AI而AI”的功能堆砌。
還記得之前的Humane AI Pin和Rabbit R1嗎?它們被譽(yù)為“后智能手機(jī)時(shí)代”的硬件,但上市后的市場(chǎng)反應(yīng)卻相當(dāng)冷淡。
為什么?因?yàn)樗鼈儧]有找到一個(gè)無可替代的“殺手級(jí)應(yīng)用”。用戶不會(huì)為炫酷的技術(shù)概念買單,只會(huì)為它實(shí)實(shí)在在解決的問題付費(fèi)。
現(xiàn)在手機(jī)上的AI消除路人、AI生成壁紙,汽車?yán)锏恼Z音助手,是很好,但它們是能讓你下定決心多花2000塊錢的理由嗎?恐怕還不夠。
第二個(gè)需要建立的認(rèn)知框架是:“殺手級(jí)應(yīng)用”的三個(gè)演進(jìn)層次。
層次1 - 增強(qiáng)(Co-pilot): 這是目前的主流。無論是幫你潤色郵件,還是實(shí)時(shí)翻譯,AI的角色是你的“副駕駛”,提升現(xiàn)有任務(wù)的效率。這個(gè)層次的應(yīng)用價(jià)值在于“更好”,而非“從無到有”。
層次2 - 代理(Agent): 這才是未來的趨勢(shì)。當(dāng)你能對(duì)手機(jī)說,“幫我訂一張明晚去上海的機(jī)票,找一家徐家匯附近評(píng)分4.5以上的酒店,然后把行程發(fā)給我老婆”,而它能自主調(diào)用航旅App、地圖App、微信來完成這一切時(shí),革命才真正發(fā)生。這是對(duì)現(xiàn)有App孤島生態(tài)的徹底顛覆,也是對(duì)操作系統(tǒng)入口的終極爭(zhēng)奪。
層次3 - 預(yù)判(Guardian): 這是AI與個(gè)人數(shù)據(jù)深度結(jié)合的終極形態(tài)。它不再是被動(dòng)響應(yīng),而是主動(dòng)服務(wù)。比如你的智能手表在你心臟出現(xiàn)異常搏動(dòng)前幾小時(shí)發(fā)出預(yù)警,你的智能家居在你回家前就調(diào)節(jié)到你最舒服的狀態(tài)。這個(gè)層次的應(yīng)用,壁壘最高,用戶粘性也最強(qiáng)。
由此,引出了那個(gè)價(jià)值萬億的終極拷問:價(jià)值最終歸屬于誰?
如果一個(gè)AI Agent幫你完成了所有事,那么,是這個(gè)Agent的開發(fā)者(比如一家新的超級(jí)App公司)賺走了大部分利潤?還是提供底層能力和分發(fā)渠道的操作系統(tǒng)(蘋果/谷歌)來“收稅”?那些被它調(diào)用的傳統(tǒng)App,又將淪為“管道”還是能分一杯羹?
這將是科技史上規(guī)模空前的一場(chǎng)“價(jià)值重分配”。投資端側(cè)AI,你本質(zhì)上是在對(duì)未來的人機(jī)交互形態(tài),以及這場(chǎng)價(jià)值分配的最終格局下注。
你看,從共識(shí)到非共識(shí),我們只多問了三個(gè)問題。
但這三個(gè)問題,恰恰是區(qū)分平庸和卓越的試金石。
原文標(biāo)題 : 一份端側(cè)AI的內(nèi)部紀(jì)要:投資人應(yīng)真正關(guān)心的3個(gè)被忽略的問題!

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 8 AI版“四萬億刺激”計(jì)劃來了
- 9 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 10 蘋果把身家押在Siri上:一場(chǎng)輸不起的自我革命