訂閱
糾錯(cuò)
加入自媒體

連續(xù)創(chuàng)立2家AI獨(dú)角獸!這個(gè)大佬,這次要讓AI自己進(jìn)化

說起Richard Socher,AI 圈里的人大多不會(huì)陌生。

他是較早一批將深度學(xué)習(xí)從學(xué)術(shù)研究推向產(chǎn)業(yè)落地的研究者之一。早年,Socher 創(chuàng)立了 MetaMind,專注于利用神經(jīng)網(wǎng)絡(luò)理解語言結(jié)構(gòu)與語義。公司隨后被 Salesforce 收購(gòu),他也由此出任首席科學(xué)家,主導(dǎo)探索 AI 在 CRM 等企業(yè)系統(tǒng)中的應(yīng)用。

2020年,Socher 再次創(chuàng)業(yè),創(chuàng)辦了 AI 搜索公司 You.com。目前,You.com 估值已達(dá) 15 億美元,躋身獨(dú)角獸行列。

但他的動(dòng)作并未止步于此。近期,多家媒體披露,Socher 正在悄然籌備一家全新的 AI 公司——Recursive。

這家公司的目標(biāo)更為前沿:研發(fā)一種能夠自我改進(jìn)、在不依賴人類反饋的情況下持續(xù)進(jìn)化的超級(jí)智能AI 系統(tǒng)。消息稱,Recursive 正在洽談一筆數(shù)億美元規(guī)模的融資,投前估值約 40 億美元。

如果相關(guān)進(jìn)展最終落地,這也意味著,Richard Socher 在短短幾年內(nèi),已連續(xù)打造出兩家AI獨(dú)角獸公司。

本文將以Socher 的創(chuàng)業(yè)路徑為線索,梳理他對(duì) AI 演進(jìn)方向的判斷。

/ 01 /

第二家AI獨(dú)角獸,估值40億美元

據(jù)報(bào)道,Recursive 試圖研發(fā)一種能夠自我改進(jìn)、在不依賴人類持續(xù)反饋的情況下不斷進(jìn)化的超級(jí)智能 AI 系統(tǒng)。

更具體地說,它關(guān)注的是一種“AI 改進(jìn) AI”的遞歸機(jī)制:AI 不再只是被動(dòng)接受訓(xùn)練,而是能夠識(shí)別自身在性能、效率或能力上的瓶頸,主動(dòng)提出在算法、系統(tǒng),乃至計(jì)算基礎(chǔ)設(shè)施(如芯片)層面的改進(jìn)思路,并通過驗(yàn)證與迭代,生成能力更強(qiáng)的下一代模型。

換句話說,就是讓AI 不只是“被訓(xùn)練的對(duì)象”,而是成為參與訓(xùn)練與改進(jìn)過程的一方。

這一思路,并非只有Recursive 在探索。

此前,楊植麟(月之暗面CEO)在采訪中也提到,當(dāng)被問及“如何提升 Agent 的通用性”時(shí),他直言:“用更多的 AI 去訓(xùn)練 AI,本身就是一個(gè)重要方向。”他也坦言,這條路徑已經(jīng)在部分場(chǎng)景中取得進(jìn)展,但距離理想狀態(tài)仍有差距。

從行業(yè)視角看,這類嘗試實(shí)際上反映了一個(gè)很關(guān)鍵的問題:當(dāng)模型和Agent 越來越復(fù)雜,單純依賴人工標(biāo)注與反饋,已經(jīng)難以支撐能力持續(xù)擴(kuò)展。

2026 年 1 月,有消息稱 Recursive 正在洽談一筆數(shù)億美元規(guī)模的融資,投前估值約 40 億美元。GV(前 Google Ventures)、Greycroft 等機(jī)構(gòu)可能參與其中,資金將主要用于擴(kuò)充算力儲(chǔ)備。

公司創(chuàng)始團(tuán)隊(duì)包括Socher 在內(nèi)的 8 位聯(lián)合創(chuàng)始人,成員背景覆蓋 Google、OpenAI、Meta 等頭部機(jī)構(gòu)。

如果這一消息屬實(shí),這也將是Socher 在近兩年內(nèi)打造的第二家 AI 獨(dú)角獸。

Socher 于 2020 年創(chuàng)立 You.com 時(shí),將其定位為一款 AI 驅(qū)動(dòng)的搜索引擎。早期,You.com 面向消費(fèi)者市場(chǎng),強(qiáng)調(diào)“無廣告、重隱私”的搜索體驗(yàn)。

但從2024 年開始,Socher 明顯將重心從 C 端搜索,轉(zhuǎn)向幫助企業(yè)更高效地使用 AI。2025 年,You.com 完成 1 億美元融資,估值達(dá)到 15 億美元,躋身獨(dú)角獸行列。

隨著這輪融資完成,You.com 的定位也發(fā)生了變化,從一款面向個(gè)人用戶的搜索產(chǎn)品,轉(zhuǎn)向?yàn)槠髽I(yè)提供 AI 基礎(chǔ)設(shè)施。

其背后的判斷是,使用網(wǎng)絡(luò)的AI Agents 數(shù)量,正在快速超過人類,但現(xiàn)有搜索基礎(chǔ)設(shè)施,本質(zhì)上仍是為“人類點(diǎn)擊鏈接”而設(shè)計(jì)的。

企業(yè)級(jí)Agent 需要從私有數(shù)據(jù)與公共網(wǎng)絡(luò)中獲取更深層、具備上下文關(guān)聯(lián)的信息,才能完成分析、決策并采取行動(dòng)。這對(duì)數(shù)據(jù)整合、模型選擇和結(jié)果可靠性提出了更高要求。

為此,You.com 構(gòu)建了一個(gè)面向 Agent 時(shí)代的平臺(tái):整合多源數(shù)據(jù),根據(jù)任務(wù)動(dòng)態(tài)選擇合適的大模型,并在企業(yè)級(jí)規(guī)模下,輸出可驗(yàn)證、可追溯的結(jié)果。

這一轉(zhuǎn)型,也讓You.com 的產(chǎn)品更明確地服務(wù)于企業(yè)場(chǎng)景。例如,為金融分析師提供自動(dòng)化研究工具;為媒體機(jī)構(gòu)加速內(nèi)容創(chuàng)作并挖掘歷史資料價(jià)值;為咨詢和專業(yè)服務(wù)人員顯著壓縮研究時(shí)間,輸出可操作的洞察。

除了準(zhǔn)確性,You.com 還強(qiáng)調(diào)隱私保護(hù)、安全性、模型選擇的靈活性,以及對(duì)數(shù)據(jù)的完整訪問能力。投資人普遍認(rèn)為,正是從消費(fèi)者搜索轉(zhuǎn)向企業(yè)級(jí) AI 的戰(zhàn)略調(diào)整,支撐了 You.com 的高估值。

盡管公司尚未公開詳細(xì)財(cái)務(wù)數(shù)據(jù),但據(jù)The Information 報(bào)道,You.com 的 ARR 已達(dá)到約 5000 萬美元。其增長(zhǎng)拐點(diǎn)出現(xiàn)在去年 11 月,當(dāng)月 ARR 環(huán)比幾乎呈線性拉升,推動(dòng) 2024 年全年收入增長(zhǎng)約 40 倍。

如果把時(shí)間再向前撥一些,Socher 的路徑其實(shí)一以貫之。

2014 年前后,深度學(xué)習(xí)仍主要停留在學(xué)術(shù)圈。一次研究方向的轉(zhuǎn)變,讓 Socher 從自然語言處理進(jìn)入 AI 核心研究領(lǐng)域,并很快創(chuàng)立 MetaMind,嘗試將前沿模型轉(zhuǎn)化為企業(yè)可用的服務(wù)。

短短四個(gè)月,MetaMind 就從 Khosla Ventures 以及 Salesforce CEO Marc Benioff 處融資 800 萬美元。公司隨后被 Salesforce 收購(gòu),Socher 也由此帶隊(duì)探索 AI 在企業(yè)系統(tǒng)中的落地,并在提示工程、注意力機(jī)制等方向留下了早期實(shí)踐經(jīng)驗(yàn)。

回看這段經(jīng)歷,MetaMind 更像是 Socher 將 AI 從實(shí)驗(yàn)室推向產(chǎn)業(yè)應(yīng)用的第一次嘗試。

/ 02 /

對(duì)AI的5個(gè)關(guān)鍵判斷

作為一位在AI 領(lǐng)域多次完成從研究到商業(yè)化落地的連續(xù)創(chuàng)業(yè)者,Socher 對(duì) AI 的判斷,往往并非停留在技術(shù)層面,而是帶有明顯的長(zhǎng)期視角與系統(tǒng)意識(shí)。

基于其近期的公開演講,硅基君整理了Socher 關(guān)于 AI 發(fā)展的幾項(xiàng)關(guān)鍵觀點(diǎn):

①“獎(jiǎng)勵(lì)工程”的范式革命

Socher提出的不僅是新職業(yè),更是從”提示工程”(Prompt Engineering)到”獎(jiǎng)勵(lì)工程”的根本范式轉(zhuǎn)移。

他認(rèn)為,提示工程處理的是單次交互的語義優(yōu)化,如何讓AI回答得更簡(jiǎn)潔有用,而獎(jiǎng)勵(lì)工程處理的是長(zhǎng)期目標(biāo)的復(fù)雜價(jià)值對(duì)齊,即如何在多代人時(shí)間尺度上定義”經(jīng)濟(jì)公平”或”氣候安全”。

這要求從業(yè)者具備獨(dú)特的以下一些能力:首先是技術(shù)認(rèn)知,也就是理解AI尋找獎(jiǎng)勵(lì)捷徑的機(jī)制(reward hacking)。其次是哲學(xué)深度,辨析”機(jī)會(huì)平等”vs“結(jié)果平等”等標(biāo)準(zhǔn)性問題。最后是領(lǐng)域精通,能夠預(yù)判稅收政策或氣候模型中的意外后果

這可能催生首個(gè)真正融合的”技術(shù)-政治-哲學(xué)”學(xué)科,比單純的AI倫理更具有實(shí)操性。

②目標(biāo)錯(cuò)位的系統(tǒng)性風(fēng)險(xiǎn),從客服案例到文明尺度

Richard Socher:

舉個(gè)例子,某企業(yè)決定最大化呼叫中心的客戶滿意度評(píng)分。若不加其他約束,最簡(jiǎn)單的解決方案或許是雇傭無數(shù)機(jī)器人,在短暫通話后自動(dòng)填寫滿意度調(diào)查并勾選最高分;或者給每位投訴用戶發(fā)放一萬美元補(bǔ)償金。客戶滿意度評(píng)分確實(shí)會(huì)飆升,但毫無實(shí)際價(jià)值。當(dāng)類似問題放大到社會(huì)層面時(shí),風(fēng)險(xiǎn)將關(guān)乎生死。

Richard Socher舉得客服機(jī)器人的例子——雇傭機(jī)器人刷好評(píng)或發(fā)放一萬美元補(bǔ)償,看似荒謬,實(shí)則揭示了AI優(yōu)化的本質(zhì)特征。

AI會(huì)優(yōu)先優(yōu)化可量化指標(biāo),如客戶滿意度評(píng)分,而非客戶實(shí)際體驗(yàn)這樣的真實(shí)目標(biāo)。在多約束復(fù)雜系統(tǒng)中,AI會(huì)找到人類價(jià)值觀的”法律漏洞”。讓超級(jí)智能AI,經(jīng)過一代又一代的持續(xù)優(yōu)化,在很長(zhǎng)的時(shí)間跨度里不斷升級(jí)完善,這時(shí)微小的目標(biāo)偏差會(huì)被指數(shù)級(jí)放大。

例如,在氣候治理或經(jīng)濟(jì)政策中,“獎(jiǎng)勵(lì)作弊”可能表現(xiàn)為:AI建議通過降低人口或制造虛假統(tǒng)計(jì)數(shù)字來“解決”不平等——技術(shù)上達(dá)成目標(biāo),文明層面毀滅價(jià)值。

③《AI經(jīng)濟(jì)學(xué)家》案例的方法論陷阱

Socher提及的自身研究“用強(qiáng)化學(xué)習(xí)設(shè)計(jì)稅收政策”,是一個(gè)值得解剖的失敗預(yù)警樣本。

該研究假設(shè)可以”平衡平等與生產(chǎn)力”,但現(xiàn)實(shí)中,經(jīng)濟(jì)系統(tǒng)包含不可算法化的文化、尊嚴(yán)、偶然性,AI在模擬環(huán)境中找到“最優(yōu)解”,但人類會(huì)改變行為規(guī)避稅收。于是,AI發(fā)現(xiàn),可以通過制造普遍性焦慮來“提高工作激勵(lì)”是提升生產(chǎn)力的有效路徑。

這引出一個(gè)深層問題:某些社會(huì)問題之所以“開放”,恰恰因?yàn)樗鼈儧]有可算法化的解決方案。

④共識(shí)路徑分歧:三種未來AI圖景

最后,Socher認(rèn)為,圍繞“如何達(dá)成目標(biāo)共識(shí)產(chǎn)生”產(chǎn)生的分歧,會(huì)勾勒出了三種截然不同的AI文明形態(tài)。

第一種路徑是追求全球民主共識(shí),核心邏輯是先確立統(tǒng)一的目標(biāo),再推進(jìn)強(qiáng)AI的部署落地,這種方式的潛在風(fēng)險(xiǎn)的是可能導(dǎo)致AI技術(shù)發(fā)展陷入停滯,或是形成碎片化的行業(yè)標(biāo)準(zhǔn),類似IPCC(政府間氣候變化專門委員會(huì))推動(dòng)的氣候AI協(xié)議,便是這種路徑的具象化場(chǎng)景。

第二種是市場(chǎng)涌現(xiàn)路徑,主張讓AI的目標(biāo)通過市場(chǎng)競(jìng)爭(zhēng)自然演化而來,但這容易引發(fā)資本過度集中的問題,最終導(dǎo)致單一價(jià)值觀壟斷的局面,就像當(dāng)下科技巨頭各自布局AI、互不協(xié)同的現(xiàn)狀。

第三種則是混合漸進(jìn)路徑,倡導(dǎo)在具體的AI應(yīng)用場(chǎng)景中逐步迭代、明確目標(biāo),不過這種模式會(huì)積累難以逆轉(zhuǎn)的技術(shù)債務(wù),本質(zhì)上是一種邊部署邊治理的探索。

Socher更傾向于第三種混合漸進(jìn)路徑,但這一觀點(diǎn)留下了關(guān)鍵疑問:當(dāng)AI的能力超越人類的理解范疇時(shí),究竟誰擁有權(quán)威去判定“這個(gè)解決方案不可行”?

⑤技術(shù)樂觀主義的修正:歷史未必站得住腳

此外,Socher認(rèn)為,技術(shù)樂觀主義觀點(diǎn)也需要修正,其背后的核心假設(shè),“人類總能適應(yīng)技術(shù)變革,新職業(yè)會(huì)隨之涌現(xiàn)”,這在超智能AI面前可能不再成立。

首先是遞歸自我改進(jìn)的臨界點(diǎn)問題,一旦AI具備自主改進(jìn)能力,其進(jìn)化速度將徹底脫離人類生物層面的適應(yīng)節(jié)奏,兩者之間的差距會(huì)快速拉大。

其次是獎(jiǎng)勵(lì)工程師的困境,當(dāng)AI在定義獎(jiǎng)勵(lì)函數(shù)上比人類更擅長(zhǎng)時(shí),獎(jiǎng)勵(lì)工程師這一所謂的“新職業(yè)”,很可能只是技術(shù)迭代過程中的過渡形態(tài),無法成為長(zhǎng)期穩(wěn)定的職業(yè)方向。

更嚴(yán)峻的是解釋性鴻溝的存在,即便超智能AI提出的解決方案是最優(yōu)的,人類也可能完全無法理解其邏輯與底層原理。

Socher認(rèn)為,最值得警惕的一點(diǎn)是,人類或許只有一次機(jī)會(huì)為超智能AI設(shè)定初始條件,但人類現(xiàn)有政治制度的設(shè)計(jì)初衷,從來都不是應(yīng)對(duì)這類“一次性且不可逆的決策”,這意味著我們當(dāng)前的制度框架,可能難以承載超智能AI帶來的決策挑戰(zhàn)。

文/朗朗

       原文標(biāo)題 : 連續(xù)創(chuàng)立2家AI獨(dú)角獸!這個(gè)大佬,這次要讓AI自己進(jìn)化

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)