中国AI模型Kimi K2继DeepSeek之后再次惊艳世界
初创公司月之暗面科技(Moonshot AI)最新升级的这个AI助手已向研究人员开放。
月之暗面科技(Moonshot AI)推出的Kimi K2模型,其写作和编程能力大获好评。来源:CFOTO/Future Publishing via Getty
继DeepSeek在今年1月推出R1之后,来自中国的第二款强大AI模型正让研究人员激动不已。
北京月之暗面科技公司(Moonshot AI)表示,7月11日推出的Kimi K2在多个基准上的表现对标或超过了西方对手以及DeepSeek的部分模型。它的编程能力尤其出色,在LiveCodeBench这类测试中得分很高——LiveCodeBench通过让模型挑战代码相关任务来评估AI的能力。
Kimi K2和DeepSeek模型一样为公开权重(open-weight),意味着研究人员能免费下载并扩展。K2还能通过一个应用编程接口(API)使用,其价格仅为主流专有模型的一小部分,这类模型包括加州Anthropic公司的Claude 4。
“整个社区可免费使用、微调、扩展,无需从头开始训练它们自己的模型,”开放科学论坛Hugging Face的AI研究员Adina Yakefu表示。Hugging Face的数据显示,Kimi K2在推出一天之后,其在该论坛的下载量就超过了其他所有模型。Yakefu说,它的发布是“又一个‘DeepSeek时刻’”。
与许多其他的强大模型不同,K2不是一个“推理器”——推理器是一种训练后利用逐步式逻辑回答问题的模型。事实上,K2是一个agentic大模型(LLM),即能利用各种工具完成多步骤任务,比如浏览网页或访问数学软件。有些模型已经有此功能,包括ChatGPT的某些版本,但它们都是专有模型。AI研究人员正在尝试重复该公司声称Kimi K2所能执行的agentic行为。
下一个顶尖模型
中国在不到6个月的时间里,就推出了第二款技惊四座的模型,说明不是昙花一现。“DeepSeek R1在年初的发布,更像是AI发展的前传,而不是一次偶然成功。”艾伦人工智能研究所(Allen Institute for AI)的机器学习研究员Nathan Lambert在他的简报Interconnects上写道。Kimi K2是“最新一款全球**开放模型”,他在社交媒体网站Bluesky上写道。
月之暗面科技成立于2023年3月,在此之前是个在西方世界默默无名的初创公司。但它基于早先一个大语言模型开发的Kimi AI助手,2024年11月的使用率已在中国排第三,香港的市场研究公司Counterpoint的数据显示。有报道称,中国科技巨头阿里巴巴和腾讯都是它的投资方。
Kimi K2模型与其投资者一样强大,有1万亿参数——参数是表示模型内部关联强度的可调整值。这么多参数对于小实验室来说,运行难度巨大,Lambert说。不过,K2利用“混合专家”(mixture-of-experts)架构,每次只激活320亿参数,该架构只为每项任务调用模型相关部分,能有效缓解算力需求。
除了编程,Kimi K2的写作能力也很强。一些AI评论员在社交平台X上称赞其写作风格很不AI。该模型目前位居Creative Writing v3和EQ-bench 3基准的排行榜榜首——Creative Writing v3的测试标准包括人物真实性和避免陈词滥调,EQ-bench 3评估模型在角色扮演中的情商。
科学感差一点
不过,K2并非在每项任务上都出类拔萃。SciMuse基准用于评估AI是否能准确预测人类研究员会认为有意思的概念,而K2在该基准上落后于谷歌前沿的Gemini算法以及OpenAI的一组推理模型,德国马克斯·普朗克光科学研究所所长Mario Krenn表示。
不过,月之暗面科技是决定公开发布其模型的多个中国公司之一,Yakefu说。Lambert认为,美国需要一个DeepSeek以及月之暗面这种级别的开放模型,才能补救美国在开源和学术社区日益下降的地位,他称之为“美国的DeepSeek计划”。
“很显然,有一大批顶尖机器学习研究员和工程师带着非常出色的硬件已经在为此努力,”Krenn说,“如果接下来几个月有更多模型【来自中国】,我也不会意外。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/226157.html