訂閱
糾錯
加入自媒體

字節(jié)“挖角”阿里千問核心骨干

3月12日,原阿里巴巴通義實驗室Qwen大模型后訓(xùn)練負(fù)責(zé)人郁博文,已正式加入字節(jié)跳動,擔(dān)任Seed團(tuán)隊視覺模型與多模態(tài)交互團(tuán)隊后訓(xùn)練負(fù)責(zé)人。

這距離郁博文3月7日透露離職消息僅過去五天,沒錯,他的離職和阿里千問靈魂人物林俊旸的告別發(fā)生在同一天。而郁博文并非第一位從阿里千問核心團(tuán)隊出走并加入字節(jié)的骨干——2024年7月,原通義千問技術(shù)負(fù)責(zé)人周暢已被字節(jié)以千萬年薪收入囊中。

連續(xù)兩次技術(shù)骨干離職后加入字節(jié),這讓人不得不懷疑字節(jié)背后的AI戰(zhàn)略意圖?還有,后訓(xùn)練專家為何成為大模型競爭中的關(guān)鍵稀缺資源?

從“阿里星”到后訓(xùn)練負(fù)責(zé)人

公開資料顯示,郁博文本科畢業(yè)于中南大學(xué),后考入中國科學(xué)院信息工程研究所攻讀研究生,2022年獲得中國科學(xué)院大學(xué)博士學(xué)位。在讀期間,他專注于自然語言處理與信息抽取領(lǐng)域研究,曾在ACL、EMNLP等國際頂級學(xué)術(shù)會議上發(fā)表多篇論文,并提出將信息抽取任務(wù)轉(zhuǎn)化為圖結(jié)構(gòu)問題的創(chuàng)新思路。憑借突出的學(xué)術(shù)表現(xiàn),他曾榮獲中國科學(xué)院院長獎。

2022年博士畢業(yè)后,郁博文以阿里集團(tuán)最高級別校招項目“阿里星”身份加入阿里巴巴達(dá)摩院,擔(dān)任算法專家(P7)。入職初期即深度參與通義千問大模型的早期訓(xùn)練與研發(fā),迅速成長為千問團(tuán)隊核心骨干,并最終擔(dān)任后訓(xùn)練(Post-training)負(fù)責(zé)人。

作為后訓(xùn)練負(fù)責(zé)人,郁博文在大模型的“對齊”與“精調(diào)”領(lǐng)域貢獻(xiàn)卓著。他主導(dǎo)了Qwen系列Chat模型的研發(fā),通過監(jiān)督微調(diào)(SFT)、強化學(xué)習(xí)(RLHF)、直接偏好優(yōu)化(DPO)等技術(shù),將通用大模型轉(zhuǎn)化為符合人類價值觀和使用習(xí)慣的對話模型。

針對不同規(guī)模模型,他設(shè)計了“四階段進(jìn)化論”和“知識蒸餾”策略,使Qwen模型在長文本生成、復(fù)雜推理及多模態(tài)理解等任務(wù)上表現(xiàn)優(yōu)異。

從“阿里星”到后訓(xùn)練負(fù)責(zé)人,郁博文的成長軌跡映射出中國AI人才培養(yǎng)的縮影,也讓他發(fā)展成行業(yè)爭搶的稀缺資源。

離職導(dǎo)火索

業(yè)內(nèi)猜測,郁博文的離職導(dǎo)火索在于阿里的架構(gòu)調(diào)整。

3月初,阿里通義實驗室啟動了組織架構(gòu)調(diào)整,計劃將原本垂直整合的Qwen團(tuán)隊拆分為預(yù)訓(xùn)練、后訓(xùn)練、文本、多模態(tài)等多個平行的水平分工模塊。這一調(diào)整導(dǎo)致郁博文的管理范圍大幅縮小,且與其堅持的“預(yù)訓(xùn)練與后訓(xùn)練必須深度耦合”的技術(shù)理念產(chǎn)生沖突。

與此同時,阿里高層對千問團(tuán)隊施加的商業(yè)化考核壓力也在加劇團(tuán)隊內(nèi)部的分歧。有內(nèi)部人士透露,阿里讓基礎(chǔ)大模型研發(fā)的開源團(tuán)隊將日活躍用戶數(shù)(DAU)作為重要考核指標(biāo),這讓團(tuán)隊被迫將大量精力放在做紅包活動、簡化模型功能、對接阿里生態(tài)的消費場景上。

這種從技術(shù)優(yōu)先轉(zhuǎn)向業(yè)務(wù)優(yōu)先的調(diào)整,與林俊旸、郁博文等核心技術(shù)人員堅持的“極致開源、商用零成本”理念有著直接的沖突。林俊旸曾多次在內(nèi)部強調(diào),預(yù)訓(xùn)練、后訓(xùn)練乃至Infra和訓(xùn)練團(tuán)隊?wèi)?yīng)該更緊密地結(jié)合和溝通。

字節(jié)的算盤

郁博文加入的字節(jié)Seed團(tuán)隊,是字節(jié)跳動AI研發(fā)的核心部門,目前負(fù)責(zé)人為吳永輝博士,此前曾任Google DeepMind研究副總裁,參與Gemini大模型研發(fā)。吳永輝于2025年2月正式加入字節(jié)跳動,并接管Seed團(tuán)隊,直接向字節(jié)跳動CEO梁汝波匯報。

Seed部門研究方向涵蓋大語言模型(LLM)、語音、視覺、世界模型、基礎(chǔ)架構(gòu)、AI Infra及下一代AI交互等領(lǐng)域,其研發(fā)的豆包大模型已應(yīng)用于50余個場景。該團(tuán)隊聚焦多模態(tài)技術(shù)突破,已迭代推出Seed 2.0系列基礎(chǔ)模型、Seedance 2.0視頻生成模型、Seed3D 1.0 3D生成模型等核心成果。

郁博文的加入無疑將強化字節(jié)在視覺與多模態(tài)交互方面的后訓(xùn)練能力。他在Qwen系列Chat模型研發(fā)中積累的監(jiān)督微調(diào)、強化學(xué)習(xí)、直接偏好優(yōu)化等技術(shù)經(jīng)驗,正是字節(jié)在多模態(tài)模型對齊和精調(diào)方面急需的核心能力。

值得注意的是,郁博文將加入的“多模態(tài)交互與世界模型”部門,正是由前阿里千問技術(shù)負(fù)責(zé)人周暢所在。也就是說,字節(jié)正在系統(tǒng)性地構(gòu)建一個由阿里千問核心骨干組成的多模態(tài)技術(shù)團(tuán)隊。

在大模型競爭進(jìn)入深水區(qū)的今天,后訓(xùn)練專家的價值正在被重新評估和爭奪。

預(yù)訓(xùn)練決定了模型的知識廣度和基礎(chǔ)能力,而后訓(xùn)練則決定了模型的實際可用性、安全性和用戶體驗。一個優(yōu)秀的后訓(xùn)練專家,能夠通過精妙的算法設(shè)計和工程實現(xiàn),將龐大的基礎(chǔ)模型轉(zhuǎn)化為真正可用的產(chǎn)品。

字節(jié)連續(xù)挖角阿里千問后訓(xùn)練核心骨干,反映出其在AI戰(zhàn)略上的清晰思路。不僅要追趕基礎(chǔ)模型能力,更要在模型實用化、產(chǎn)品化方面建立優(yōu)勢。這與字節(jié)一貫的產(chǎn)品驅(qū)動文化高度契合。

后記

在這場沒有終點的AI競賽中,唯一不變的是對頂尖人才的渴望與爭奪。而那些能夠為頂尖人才提供技術(shù)理想與成長空間的企業(yè),將在長期競爭中占據(jù)優(yōu)勢。

正如《三體》中所言,“給歲月以文明,而不是給文明以歲月”。在AI這場技術(shù)革命中,真正稀缺的不是算力與數(shù)據(jù),而是那些能夠“給模型以靈魂”的后訓(xùn)練專家。當(dāng)大模型從“大力出奇跡”走向“精雕細(xì)琢”時,決定勝負(fù)的已不再是參數(shù)規(guī)模,而是讓AI真正理解人類意圖的那雙“看不見的手”。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮瑒(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號