2026年字节“挖角”阿里千问核心骨干

字节“挖角”阿里千问核心骨干3 月 12 日 原阿里巴巴通义实验室 Qwen 大模型后训练负责人郁博文正式加入字节跳动 担任 Seed 团队视觉模型与多模态交互团队后训练负责人 此举距其 3 月 7 日透露离职消息仅五天 而该时间点恰与阿里千问核心人物林俊旸离职同日 2 此前 2024 年 7 月 原通义千问技术负责人周畅已以千万年薪加盟字节 2 郁博文 2022 年博士毕业后以 阿里星 身份加入达摩院 深度参与通义千问早期研发

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



3月12日,原阿里巴巴通义实验室Qwen大模型后训练负责人郁博文正式加入字节跳动,担任Seed团队视觉模型与多模态交互团队后训练负责人。此举距其3月7日透露离职消息仅五天,而该时间点恰与阿里千问核心人物林俊旸离职同日 [2] 。此前,2024年7月,原通义千问技术负责人周畅已以千万年薪加盟字节 [2]

郁博文2022年博士毕业后以“阿里星”身份加入达摩院,深度参与通义千问早期研发,后成长为后训练负责人 [3] 。他主导Qwen系列Chat模型开发,运用监督微调(SFT)、强化学习(RLHF)、直接偏好优化(DPO)等技术实现模型对齐与精调;提出“四阶段进化论”与“知识蒸馏”策略,显著提升模型在长文本生成、复杂推理及多模态理解任务上的表现 [3]

业内普遍认为,其离职主因系阿里通义实验室3月初启动的架构调整:Qwen团队由垂直整合拆分为预训练、后训练、文本、多模态等平行模块,致其管理范围大幅收窄,且与其主张的“预训练与后训练必须深度耦合”理念产生冲突 [4] 。叠加高层日益加大的商业化考核压力,技术优先与业务优先路径分歧加剧,最终与林俊旸等人坚持的“极致开源、商用零成本”理念形成直接张力 [4]

郁博文加入的Seed团队是字节AI研发核心部门,由前Google DeepMind研究副总裁吴永辉博士领衔,聚焦大语言模型、语音、视觉、世界模型、AI Infra及下一代AI交互 [5] 。团队已推出Seed 2.0系列基础模型、Seedance 2.0视频生成模型、Seed3D 1.0 3D生成模型等成果,豆包大模型落地超50个场景 [5]

郁博文将加入“多模态交互与世界模型”部门,该部门正由前阿里千问技术负责人周畅负责——字节正系统性组建一支源自阿里千问核心的多模态技术力量 [6] 。其在后训练领域积累的SFT、RLHF、DPO等实战经验,直击字节在多模态模型对齐与精调环节的关键短板 [6]

当前大模型竞争已进入深水区,后训练能力正被重新评估:预训练决定模型的知识广度与基础能力,而后训练则决定实际可用性、安全性和用户体验。一位优秀后训练专家,能通过算法设计与工程实现,将通用大模型转化为真正可用的产品 [7] 。字节连续吸纳阿里千问后训练骨干,体现其清晰AI战略——不仅追赶基础模型能力,更着力构建模型实用化与产品化的差异化优势,契合字节一贯的产品驱动文化 [7]

在持续演进的AI竞赛中,顶尖人才争夺已成为长期主线。能够为人才提供技术理想与成长空间的企业,将在竞争中占据结构性优势 [8] 。正如《三体》所启示,“给岁月以文明”,AI革命中最稀缺的并非算力与数据,而是能“给模型以灵魂”的后训练专家——当大模型从“大力出奇迹”转向“精雕细琢”,决胜关键已是那双让AI真正理解人类意图的“看不见的手” [8]

小讯
上一篇 2026-03-15 11:04
下一篇 2026-03-15 11:02

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/233917.html