引言
在AI大模型的激烈角逐中,一个名叫Kimi的智能助手凭借“200万字无损上下文”一夜爆红,让无数打工人实现了“秒读《三体》”的自由。
而在Kimi的背后,站着一位90后年轻面孔——杨植麟。他是清华学霸、卡内基梅隆大学博士、Transformer-XL与XLNet的第一作者,也是一位热爱摇滚、曾梦想成为流浪诗人的技术极客。
从广东汕头的少年,到中国大模型创业公司的灵魂人物,杨植麟的精彩人生,正如他钟爱的Pink Floyd专辑一样,充满了探索“月之暗面”的勇气。
1992年出生的杨植麟,在广东汕头金山中学读书时,就展现出了与众不同的两面性:他既是狂热的摇滚乐迷,高中时当过鼓手、组建过乐队;又是一个毫无编程基础,却能在全国青少年信息学奥林匹克联赛中夺得广东赛区一等奖的“天才少年”。
凭借这个奖项,他获得了清华大学的保送资格。但杨植麟的执拗劲儿上来了,他觉得“不参加高考的人生不完整”,硬是走进了考场,最终以667分的成绩,远超清华录取线,光明正大地走进了清华园。
在清华大学,他起初被调剂到了热能工程系(也就是大家常说的“烧锅炉”专业),但大二时,他遵循内心对计算机的热爱,毅然转入计算机系,师从智源研究院学术副院长唐杰教授。在清华,他不仅以满分成绩通过所有程序设计课程,以年级第一毕业,还延续了他的摇滚梦——组建了校园乐队Splay,担任鼓手和词曲作者,一路晋级到校园歌手大赛的原创决赛。
左手代码,右手鼓槌,这就是杨植麟青春时代的缩影。
2015年,杨植麟远赴卡内基梅隆大学(CMU)攻读博士学位,师从苹果AI负责人Ruslan Salakhutdinov和Google AI首席科学家William W. Cohen。在CMU的语言技术研究所,他开始在自然语言处理(NLP)领域崭露头角。
在谷歌大脑实习期间,他做出了两项影响深远的工作:
- Transformer-XL:作为共同第一作者,他提出了这项 Transformer 的改进架构,让模型能够学习更长的依赖关系,突破了固定长度上下文的瓶颈。
- XLNet:2019年,作为第一作者,杨植麟联合谷歌和CMU发布了XLNet模型。该模型在20个标准任务上超越了当时如日中天的Google BERT,并在18个任务上取得了历史最好结果,被业内誉为“BERT之后的重要进展”。
凭借这些成就,杨植麟在学术圈名声大噪。他的谷歌学术引用量迅速突破数万次,成为中国35岁以下NLP领域引用量最高的研究者。他还参与了Google Gemini、Google Bard、华为盘古NLP、智源悟道等多个国内外大模型的早期研发。
尽管在学术圈功成名就,杨植麟并不满足于在实验室里发论文。他先是在2016年参与创立了循环智能(Recurrent AI),一家面向B端的企业服务公司。
然而,2022年底ChatGPT的横空出世,彻底点燃了他心中的火种。他意识到,真正的通用人工智能(AGI)时代来了,而To B的商业模式无法让他All in AGI的梦想。
“真正的窗口期可能只有一个月。”杨植麟回忆道。他做了一个大胆的决定:离开自己参与创立的循环智能,重新出发。
2023年4月,他成立了北京月之暗面科技有限公司(Moonshot AI) 。公司名字来源于他挚爱的Pink Floyd专辑《The Dark Side of the Moon》。他甚至将自己的英文名取为“Kimi”,直接赋予了公司核心产品的灵魂。
这一次,他赌上了全部声誉。凭借他在学术界的地位,月之暗面在极短的时间内就筹集了巨资,投资人名单里站着阿里、腾讯、红杉中国等巨头,公司估值一度飙升至超过200亿元人民币。著名科技媒体The Information在评选“最有可能做出中国OpenAI”的候选者时,杨植麟是唯一一个以个人身份、而非公司名义上榜的。
在众多大模型拼参数、卷榜单的时候,杨植麟为Kimi选择了一条极其聚焦的差异化道路——“长文本”。
杨植麟有一个形象的比喻:“参数量决定了大模型能支持多复杂的‘计算’,而能接收多长文本,则决定了大模型有多大的‘内存’。”
2023年10月,Kimi初次亮相,支持20万汉字的上下文,这是当时GPT-4的8倍。仅仅5个月后,Kimi再次震惊业界,将这一数字提升到了200万字,相当于可以一次性读完《三体》三部曲,还能记住所有细节。
这种“无损长上下文”处理能力,让Kimi迅速出圈。无论是研读几百页的PDF财报,还是分析复杂的中医诊疗手册,Kimi都能游刃有余。华大基因CEO尹烨也曾公开点赞Kimi在文献处理上的强大能力。
2024年,Kimi的月活跃用户从几十万跃升至数千万,成为国内AI应用中的顶流。
如果说Kimi是产品的名字,那么K2则是杨植麟团队的又一座里程碑。
2025年7月,月之暗面开源了万亿参数的MoE模型Kimi K2。K2不仅是乔戈里峰的名字,也象征着攀登的难度。在行业普遍看淡基础模型、转向应用层时,杨植麟坚持回归基座模型,基于第一性原理进行底层创新。
K2的发布再次为中国AI争光,它不仅登顶全球开源模型榜单,更被《自然》杂志评价为迎来了“又一个DeepSeek时刻”。硅谷知名投资人查马斯·帕里哈皮蒂亚甚至表示:“我们把大量工作负载都转到了Kimi K2上,因为它的性能足够强,而且比OpenAI便宜太多了。”
杨植麟深知,攀登AGI这座大山,不能走捷径。他的团队研发了MUON二阶优化器和Kimi Linear架构,让AI学习效率翻倍,处理长文本的速度比传统架构快6-10倍。
创业之路并非全是鲜花和掌声。2024年底,一场由前投资方发起的仲裁案,将杨植麟推向了舆论的风口浪尖。争议涉及他从循环智能到月之暗面过渡期间的商业合规性问题。
有人评价杨植麟“很聪明,有技术号召力”,但也有人质疑其在处理资本关系上的“手段”。面对质疑,杨植麟选择正面回应,强调手续的合法性。这场风波也揭示了一个现实:即便是在技术狂飙的AI赛道,商业世界的规则仍是不可逾越的护栏。
但或许正是这种“摇滚明星”般的叛逆与冒险精神,成就了今天的月之暗面。正如他公司门口那架白色雅马哈钢琴和那张《The Dark Side of the Moon》专辑所昭示的:探索未知,总要直面阴影。
展望未来,杨植麟的目光已经投向了更远处。
在2026年初的峰会上,杨植麟透露,月之暗面已完成C轮融资,手握超过100亿人民币现金储备,全球付费用户月增速高达170%。他放言:“希望在接下来的十年、二十年的时间,继续把K4、K5做到K100。”
对于AI的终极意义,杨植麟有着诗人般的浪漫。他引用了与Kimi对话时得到的一段话:“AI可能是人类探索未知的钥匙,能帮我们攻克癌症、解决能源危机、探索宇宙。虽然有风险,但放弃发展就等于放弃人类文明的上限。 ”
结语
从汕头少年到清华翘楚,从CMU博士到大模型创业领军人,杨植麟的人生轨迹充满了极致的理性与感性的碰撞。他写下的每一行代码,敲下的每一个鼓点,都在试图回应一个问题:在智能的“月之暗面”,人类究竟能看见什么?
而Kimi,正是他递给我们的一只手电筒。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/243291.html