近日,月之暗面发布并开源大模型Kimi K2。《自然》杂志16日发文称,中国AI模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。
月之暗面新一代MoE架构基础模型Kimi K2现已上线超算互联网,包括未经过指令微调的基础预训练模型Kimi-K2-Base和通用指令微调版本Kimi-K2-Instruct(非思考模型)。前者适合科研与自定义场景,后者则可用于大多数问答与Agent任务。在“算力+模型”一体化交付模式下,开发者、企业可在超算互联网下载模型文件进行快速开发。
超算互联网AI社区上线Kimi K2系列模型
Kimi-K2-Instruct:通用指令微调版本(非思考模型),在大多数问答与 Agent 任务中表现卓越
https://www.scnet.cn/ui/aihub/models/sugon_scnet/Kimi-K2-Instruct
Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数1T,激活参数32B。Kimi K2使用MuonClip优化器稳健支撑万亿参数模型训练,显著提升token利用效率。结合大规模Agentic Tool Use数据合成与通用强化学习,模型在通用智能能力上不断取得进展。
在SWE Bench Verified、Tau2、AceBench等基准性能测试中,Kimi K2均取得开源模型中的SOTA成绩,展现出在代码、Agent、数学推理任务上的领先能力。
此外,Kimi K2在通用知识推理、数学、规划等任务中的表现亦有提升。
继国家超算互联网AI社区正式发布《国产大模型应用生态图谱》后,最新上线的Kimi K2系列模型,进一步丰富了图谱的内容生态。社区将持续完善国产大模型生态建设,确保用户能够第一时间体验、部署最前沿的AI应用。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/217180.html