<p cms-style="font-L"> 来源:环球网 </p><p cms-style="font-L"> 【环球网科技报道 记者 李文瑶】6月20日晚间,月之暗面Kimi对外宣布发布首个Agent产品Kimi-Researcher(深度研究),并开始小范围灰度测试。</p><p cms-style="font-L"> Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,在HLE测试中,超过Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,与Gemini-Pro的Deep Research Agent打平。</p><div class="img_wrapper"><img src="https://k.sinaimg.cn/n/sinakds/363/w640h523//11fc-8c12aceae431d8fc062b90ecff.png/w700d1q75cms.jpg?by=cms_fixed_width" w="640" h="523" wh="1.22"/></div><p cms-style="font-L"> 从功能来看,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果。Kimi-Researcher是一个零结构 Agent,没有复杂的提示词,也没有预设流程。在动态的环境里,Kimi-Researcher 自己学会了如何思考:当信息冲突时,如何权衡判断;面对任务节点,何时切换工具;哪些中间信息值得保留,哪些可以舍弃。模型的唯一驱动力,是任务本身是否被真正解决。据其介绍,作为深度研究模型,Kimi-Researcher引入大量数据来源,同时每条引用都能直接点击追溯,拥有文献严谨性,帮助告别幻觉。</p><p cms-style="font-L"> 月之暗面表示, Kimi-Researcher 基础预训练模型及强化学习后的模型将逐步开源,以推动Agent强化学习方向的探索。</p> <div style="font-size: 0px; height: 0px; clear: both;"></div>
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/216712.html