继在今年1月推出R1之后,来自中国的第二款强大AI模型正让研究人员激动不已。
北京月之暗面科技公司(Moonshot AI)表示,7月11日推出的Kimi K2在多个基准上的表现对标或超过了西方对手以及DeepSeek的部分模型。它的编程能力尤其出色,在LiveCodeBench这类测试中得分很高——LiveCodeBench通过让模型挑战代码相关任务来评估AI的能力。
Kimi K2和DeepSeek模型一样为公开权重(open-weight),意味着研究人员能免费下载并扩展。K2还能通过一个应用编程接口(API)使用,其价格仅为主流专有模型的一小部分,这类模型包括加州Anthropic公司的Claude 4。
“整个社区可免费使用、微调、扩展,无需从头开始训练它们自己的模型,”开放科学论坛Hugging Face的AI研究员Adina Yakefu表示。Hugging Face的数据显示,Kimi K2在推出一天之后,其在该论坛的下载量就超过了其他所有模型。Yakefu说,它的发布是“又一个‘DeepSeek时刻’”。
与许多其他的强大模型不同,K2不是一个“推理器”——推理器是一种训练后利用逐步式逻辑回答问题的模型。事实上,K2是一个agentic大模型(LLM),即能利用各种工具完成多步骤任务,比如浏览网页或访问数学软件。有些模型已经有此功能,包括ChatGPT的某些版本,但它们都是专有模型。AI研究人员正在尝试重复该公司声称Kimi K2所能执行的agentic行为。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/222609.html