123,123

當(dāng)前位置： OFweek 人工智能網(wǎng) > 自然語言處理 > 正文

字節(jié)“挖角”阿里千問核心骨干

2026-03-12 17:39

來源： OFweek人工智能網(wǎng)

3月12日，原阿里巴巴通義實驗室Qwen大模型后訓(xùn)練負(fù)責(zé)人郁博文，已正式加入字節(jié)跳動，擔(dān)任Seed團(tuán)隊視覺模型與多模態(tài)交互團(tuán)隊后訓(xùn)練負(fù)責(zé)人。

這距離郁博文3月7日透露離職消息僅過去五天，沒錯，他的離職和阿里千問靈魂人物林俊旸的告別發(fā)生在同一天。而郁博文并非第一位從阿里千問核心團(tuán)隊出走并加入字節(jié)的骨干——2024年7月，原通義千問技術(shù)負(fù)責(zé)人周暢已被字節(jié)以千萬年薪收入囊中。

連續(xù)兩次技術(shù)骨干離職后加入字節(jié)，這讓人不得不懷疑字節(jié)背后的AI戰(zhàn)略意圖？還有，后訓(xùn)練專家為何成為大模型競爭中的關(guān)鍵稀缺資源？

從“阿里星”到后訓(xùn)練負(fù)責(zé)人

公開資料顯示，郁博文本科畢業(yè)于中南大學(xué)，后考入中國科學(xué)院信息工程研究所攻讀研究生，2022年獲得中國科學(xué)院大學(xué)博士學(xué)位。在讀期間，他專注于自然語言處理與信息抽取領(lǐng)域研究，曾在ACL、EMNLP等國際頂級學(xué)術(shù)會議上發(fā)表多篇論文，并提出將信息抽取任務(wù)轉(zhuǎn)化為圖結(jié)構(gòu)問題的創(chuàng)新思路。憑借突出的學(xué)術(shù)表現(xiàn)，他曾榮獲中國科學(xué)院院長獎。

2022年博士畢業(yè)后，郁博文以阿里集團(tuán)最高級別校招項目“阿里星”身份加入阿里巴巴達(dá)摩院，擔(dān)任算法專家(P7)。入職初期即深度參與通義千問大模型的早期訓(xùn)練與研發(fā)，迅速成長為千問團(tuán)隊核心骨干，并最終擔(dān)任后訓(xùn)練(Post-training)負(fù)責(zé)人。

作為后訓(xùn)練負(fù)責(zé)人，郁博文在大模型的“對齊”與“精調(diào)”領(lǐng)域貢獻(xiàn)卓著。他主導(dǎo)了Qwen系列Chat模型的研發(fā)，通過監(jiān)督微調(diào)(SFT)、強化學(xué)習(xí)(RLHF)、直接偏好優(yōu)化(DPO)等技術(shù)，將通用大模型轉(zhuǎn)化為符合人類價值觀和使用習(xí)慣的對話模型。

針對不同規(guī)模模型，他設(shè)計了“四階段進(jìn)化論”和“知識蒸餾”策略，使Qwen模型在長文本生成、復(fù)雜推理及多模態(tài)理解等任務(wù)上表現(xiàn)優(yōu)異。

從“阿里星”到后訓(xùn)練負(fù)責(zé)人，郁博文的成長軌跡映射出中國AI人才培養(yǎng)的縮影，也讓他發(fā)展成行業(yè)爭搶的稀缺資源。

離職導(dǎo)火索

業(yè)內(nèi)猜測，郁博文的離職導(dǎo)火索在于阿里的架構(gòu)調(diào)整。

3月初，阿里通義實驗室啟動了組織架構(gòu)調(diào)整，計劃將原本垂直整合的Qwen團(tuán)隊拆分為預(yù)訓(xùn)練、后訓(xùn)練、文本、多模態(tài)等多個平行的水平分工模塊。這一調(diào)整導(dǎo)致郁博文的管理范圍大幅縮小，且與其堅持的“預(yù)訓(xùn)練與后訓(xùn)練必須深度耦合”的技術(shù)理念產(chǎn)生沖突。

與此同時，阿里高層對千問團(tuán)隊施加的商業(yè)化考核壓力也在加劇團(tuán)隊內(nèi)部的分歧。有內(nèi)部人士透露，阿里讓基礎(chǔ)大模型研發(fā)的開源團(tuán)隊將日活躍用戶數(shù)(DAU)作為重要考核指標(biāo)，這讓團(tuán)隊被迫將大量精力放在做紅包活動、簡化模型功能、對接阿里生態(tài)的消費場景上。

這種從技術(shù)優(yōu)先轉(zhuǎn)向業(yè)務(wù)優(yōu)先的調(diào)整，與林俊旸、郁博文等核心技術(shù)人員堅持的“極致開源、商用零成本”理念有著直接的沖突。林俊旸曾多次在內(nèi)部強調(diào)，預(yù)訓(xùn)練、后訓(xùn)練乃至Infra和訓(xùn)練團(tuán)隊?wèi)?yīng)該更緊密地結(jié)合和溝通。

字節(jié)的算盤

郁博文加入的字節(jié)Seed團(tuán)隊，是字節(jié)跳動AI研發(fā)的核心部門，目前負(fù)責(zé)人為吳永輝博士，此前曾任Google DeepMind研究副總裁，參與Gemini大模型研發(fā)。吳永輝于2025年2月正式加入字節(jié)跳動，并接管Seed團(tuán)隊，直接向字節(jié)跳動CEO梁汝波匯報。

Seed部門研究方向涵蓋大語言模型(LLM)、語音、視覺、世界模型、基礎(chǔ)架構(gòu)、AI Infra及下一代AI交互等領(lǐng)域，其研發(fā)的豆包大模型已應(yīng)用于50余個場景。該團(tuán)隊聚焦多模態(tài)技術(shù)突破，已迭代推出Seed 2.0系列基礎(chǔ)模型、Seedance 2.0視頻生成模型、Seed3D 1.0 3D生成模型等核心成果。

郁博文的加入無疑將強化字節(jié)在視覺與多模態(tài)交互方面的后訓(xùn)練能力。他在Qwen系列Chat模型研發(fā)中積累的監(jiān)督微調(diào)、強化學(xué)習(xí)、直接偏好優(yōu)化等技術(shù)經(jīng)驗，正是字節(jié)在多模態(tài)模型對齊和精調(diào)方面急需的核心能力。

值得注意的是，郁博文將加入的“多模態(tài)交互與世界模型”部門，正是由前阿里千問技術(shù)負(fù)責(zé)人周暢所在。也就是說，字節(jié)正在系統(tǒng)性地構(gòu)建一個由阿里千問核心骨干組成的多模態(tài)技術(shù)團(tuán)隊。

在大模型競爭進(jìn)入深水區(qū)的今天，后訓(xùn)練專家的價值正在被重新評估和爭奪。

預(yù)訓(xùn)練決定了模型的知識廣度和基礎(chǔ)能力，而后訓(xùn)練則決定了模型的實際可用性、安全性和用戶體驗。一個優(yōu)秀的后訓(xùn)練專家，能夠通過精妙的算法設(shè)計和工程實現(xiàn)，將龐大的基礎(chǔ)模型轉(zhuǎn)化為真正可用的產(chǎn)品。

字節(jié)連續(xù)挖角阿里千問后訓(xùn)練核心骨干，反映出其在AI戰(zhàn)略上的清晰思路。不僅要追趕基礎(chǔ)模型能力，更要在模型實用化、產(chǎn)品化方面建立優(yōu)勢。這與字節(jié)一貫的產(chǎn)品驅(qū)動文化高度契合。

后記

在這場沒有終點的AI競賽中，唯一不變的是對頂尖人才的渴望與爭奪。而那些能夠為頂尖人才提供技術(shù)理想與成長空間的企業(yè)，將在長期競爭中占據(jù)優(yōu)勢。

正如《三體》中所言，“給歲月以文明，而不是給文明以歲月”。在AI這場技術(shù)革命中，真正稀缺的不是算力與數(shù)據(jù)，而是那些能夠“給模型以靈魂”的后訓(xùn)練專家。當(dāng)大模型從“大力出奇跡”走向“精雕細(xì)琢”時，決定勝負(fù)的已不再是參數(shù)規(guī)模，而是讓AI真正理解人類意圖的那雙“看不見的手”。

本地收藏打印推薦給朋友

聲明： 本網(wǎng)站所刊載信息，不代表OFweek觀點�？帽菊靖寮瑒�(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像，違者將依法追究法律責(zé)任。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標(biāo)題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

999精品视频在这里

精品日韩国产无码一区二区国产一级毛片午夜福亚洲av永久无无码精品一区二区国产男女猛烈无遮掩免费视频