月之暗面AMA:Kimi K3将迎重大升级,杨植麟回应23个热议问题!

月之暗面AMA:Kimi K3将迎重大升级,杨植麟回应23个热议问题!p 在 2026 年 3 月的一个凌晨 全球科技爱好者的目光聚焦在了月之暗面核心团队的问答活动上 此次活动在社交媒体平台 Reddit 上举行 联合创始人杨植麟 周昕宇和吴育昕与全球网友展开了深入的交流 活动持续了整整三小时 涉及的主题涵盖模型技术 行业趋势及公司未来发展等多个方面 成为了当下的热点话题 p p 活动伊始 网友们就抛出了多个尖锐问题 p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

在2026年3月的一个凌晨,全球科技爱好者的目光聚焦在了月之暗面核心团队的问答活动上。此次活动在社交媒体平台Reddit上举行,联合创始人杨植麟、周昕宇和吴育昕与全球网友展开了深入的交流,活动持续了整整三小时,涉及的主题涵盖模型技术、行业趋势及公司未来发展等多个方面,成为了当下的热点话题。

活动伊始,网友们就抛出了多个尖锐问题,首先引起关注的是关于Kimi K2.5自称Claude的争议。对此,杨植麟进行了详细的解释,称这一现象源于预训练阶段对最新编程数据的上采样,而这些数据与“Claude”这个token具有较强的关联性。他同时强调,Kimi K2.5在多个基准测试中表现优于Claude,展示了其强大的技术实力。

对于备受期待的Kimi K3,杨植麟虽然没有透露过多细节,但表示K3将会在KimiLinear的基础上进行大幅度的架构优化。他坚信,即便K3的性能没有达到K2.5的十倍提升,肯定会有显著的增强,令用户期待。

在算力储备方面,杨植麟被问及与其他企业的GPU数量差距是否会在2026年缩小时,他坦言目前的差距并未缩小,而实现通用人工智能(AGI)所需的算力仍需进一步观察。周昕宇对此补充道,可用算力受多种因素的影响,创新往往是在约束中诞生的。

针对技术架构的相关问题,一名网友询问了对DeepSeek的Engram架构的看法,以及是否考虑采用。周昕宇表示,Scaling嵌入是值得探索的方向,但在测试前缺乏可靠的数据支持。他强调,团队鼓励质疑,并会将实验结果与技术人员分享,深入讨论决定项目的走向。

在模型训练的挑战方面,杨植麟提到,训练视觉语言模型(VLM)的主要挑战在于如何同时提升文本和视觉性能,但二者可以相互促进。他还谈到开发KimiCode的原因,表示需要一个与模型最匹配的框架,KimiCode具备视频输入等独特功能,video2code则代表了前端开发的未来。

吴育昕在强化学习基础设施方面介绍,团队致力于在保持灵活性的同时实现高效能,智能体蜂群的部署逻辑虽然复杂,但系统灵活性高,可集成不同的框架和子智能体设置。周昕宇提到的Scaling阶梯,强调了从小规模开始实验的重要性,核心目标是预测系统的可扩展性。他指出,有些架构、优化器和数据无法扩展,而在低FLOPs下评估可扩展性需要深入理解训练过程的数学动态。

关于KimiK2.5的算力分配,杨植麟表示,强化学习的计算量将持续增长,未来可能出现更多新的目标函数用于强化训练。他进一步解释K2.5自称Claude的现象,表示在正确的系统提示词下,模型会回答“Kimi”,而系统提示为空时则反映预训练数据分布。

对于降低K2的幻觉问题,吴育昕表示,通过提高数据质量和奖励机制来改善,但仍有改进空间。谈到K2.5使用较高参数比例是否“浪费”计算资源,吴育昕和周昕宇认为过度训练是为了获得更优的整体权衡而主动支付的成本。

在“智能体蜂群”功能方面,吴育昕介绍,该功能中各子智囊团可独立执行子任务,拥有各自的工作记忆,只在必要时返回结果给调度器,这扩展了整体上下文长度。

在权衡强化编程能力与非编程能力的问题上,杨植麟表示,在模型参数规模足够的情况下,二者并不存在根本性冲突,但保持“写作品味”是一个挑战,团队依赖内部基准评测来调整奖励模型。

针对K2.5个性变化的问题,吴育昕承认每次新版本发布时模型的“个性”会有所变化,团队正在努力解决以满足用户的个性化需求。

关于KimiK3的规划,杨植麟表示,团队正在尝试新的架构和新功能。他肯定了线性架构的应用,希望在KimiLinear的基础上加入更多的架构优化,坚信K3将会有显著的提升。

在在线/持续学习计划方面,周昕宇提到,持续学习可以提升模型的自主性,KimiLinear是与K2.5并行开展的项目,线性注意力机制将是未来模型的关键方向。

关于模型角色塑造,杨植麟认为模型的核心在于“品味”,K2.5展现了独特的审美取向,其性格也是“品味”的体现,较少迎合用户或许是好的性格特征。

对于是否开源“智能体蜂群”或添加到Kimi-cli中,杨植麟表示,目前处于测试阶段,稳定后会向开发者提供框架。吴育昕则提到小型编码器有利于Scaling,而关于推出带原生音频输入功能的模型,杨植麟表示目前资源有限,可能会重点放在训练更好的智能体上。

此次AMA活动,不仅让网友们更加了解月之暗面团队的技术研发进展,也展现了团队在人工智能领域的坚定信念与持续创新的决心。未来,随着KimiK3的推出,人工智能的应用将更加广泛,值得期待。

小讯
上一篇 2026-04-06 18:07
下一篇 2026-04-06 18:05

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/220242.html