强化Agent能力,为何成为国产基础大模型2026年重要发展方向?

强化Agent能力,为何成为国产基础大模型2026年重要发展方向?近期 国产大模型动作频频 4 月 2 日 阿里发布千问新一代大语言模型 Qwen3 6 Plus 4 月 8 日 DeepSeek 深度求索 上线专家模式 这是 DeepSeek 走红以来首次在产品端引入模式分层设计 此前 3 月份 DeepSeek 释放了和 Agent 智能体 相关多个岗位的招聘需求 每日经济新闻 记者注意到 不论是阿里千问还是 DeepSeek 大模型

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



  近期,国产大模型动作频频。

  4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus。4月8日,DeepSeek(深度求索)上线专家模式,这是DeepSeek走红以来首次在产品端引入模式分层设计,此前3月份,DeepSeek释放了和Agent(智能体)相关多个岗位的招聘需求。

  《每日经济新闻》记者注意到,不论是阿里千问还是DeepSeek大模型,都在强化基础大模型Agent的能力。2026年初,以OpenClaw(一款开源体框架,俗称“龙虾”)为代表的“龙虾热”火爆国内外,如果说2025年还是“千模混战”,2026年AI()主战场已全面转向智能体,Agent 对Token(词元)的消耗正以百倍、千倍速度狂飙。

  IDC(国际数据公司)中国研究总监卢言霞向《每日经济新闻》记者表示,强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。

  中科院计算所客座博士生导师、中国学会数字金融分会常务执委白硕在接受《每日经济新闻》记者采访时表示,随着爆发,对基础大模型Agent能力,未来将更重视在Harness Engineering(直译为驾驭工程)领域的提升。据了解,Harness Engineering是一个不强调模型性能,更强调工程环境,通过让“驾驭模型的系统环境”更专业而提升使用效果的范式。

  下一代OpenClaw将支持视频生成

  有“龙虾之父”之称的OpenClaw创始人彼得·斯坦伯格(Peter Steinberger)近日在社交平台宣称,下一代OpenClaw智能体产品将迎来两大核心升级——全新融入AI视频生成能力,并成为全球首个官方适配阿里千问大模型的智能体框架。

  4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus,其中最引人注目的是,新模型显著增强了模型的智能体编程能力。在代码智能体领域以及通用智能体与工具使用方面,新模型表现突出。

  4月4日,OpenRouter官方数据显示,Qwen3.6-Plus的日调用量突破1.4万亿Token。

  Agent对Token的消耗正以前所未有的速度激增。国家数据局局长刘烈宏披露了一组数据,到今年3月,我国日均词元调用量已超过140万亿,相比2024年初的1000亿增长1000多倍,相比2025年底的100万亿,3个月时间又增长40%多。

  在GTC开发者大会上,黄仁勋给出了一个极具冲击力的定义:Token是AI时代的新大宗商品,是新货币,也是衡量企业竞争力的核心标尺。

  而OpenClaw这类Agent产品彻底改变了AI交互形态,使其能落地完成复杂任务,也让Token需求迎来爆发式增长。

  不只是阿里千问基础大模型强化了Agent能力,DeepSeek通用大模型自2025年以来也强化了Agent能力。

  《每日经济新闻》记者注意到,在DeepSeek官网上,3月24日发布的一系列招聘岗位中,有不少和Agent相关的岗位。譬如Agent全栈开发工程师、Agent深度学习算法研究员、Agent数据策略工程师等。

  2025年12月,DeepSeek更新V3.2正式版,就强调其新模型强化Agent能力,融入思考推理。在这个版本的模型中,DeepSeek提出了一种大规模Agent训练数据合成方法,构造了大量“难解答,易验证”的强化学习任务(“1800+”环境,“85000+”复杂指令),大幅提高了模型的泛化能力。

  专家模式具备领域深度增强等特点

  当前,AI Agent(体)能力很大程度上依赖于基础大模型能力的提升,基础大模型提供核心能力,而Agent通过系统化设计将这些能力转化为实际应用价值,国产基础大模型正在强化Agent能力。

  横向对比来看,不论是千问大模型还是DeepSeek,均实现支持高达1M Tokens(100万个词元)上下文长度,大模型在长文档、多轮对话信息提取上更精准。

  卢言霞认为,当前基础大模型竞争的关键是编程能力、智能体能力等。强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。

  在端,浙江华通云数据科技有限公司副总裁林建龙在接受《每日经济新闻》记者采访时坦言,当前AI Agent仍面临一些问题。譬如大多数AI系统仍然停留在“工具”“技能”层面,无法真正成为企业的“数字化员工”。传统工作流编排和简单对话系统虽然能够完成一些预定义的任务,但缺乏深度理解业务场景、独立思考和持续学习的能力,难以满足企业复杂多变的业务需求。

  林建龙表示,未来的AI Agent不是简单的工具,而是一个基于大模型之上的各个行业领域专家。这种专家Agent具备以下核心特征:第一,具备深厚的行业专业知识,能够理解并处理复杂的业务问题;第二,能够深度融入企业业务流程,与现有系统无缝对接;第三,具备持续学习和自我优化能力,能够在实践中不断提升;第四,能够独立完成特定任务,而不仅仅是提供建议或答案。

  4月8日,DeepSeek上线的专家模式就提到,专家模式具备领域深度增强、多步推理可视化、引用溯源强化、自定义专家组合、长上下文压缩优化等特点。专家模式沿用了 R1的长思维链推理能力,但针对专业领域做了定向蒸馏和微调,使“快思考”与“慢思考”在领域内更平衡。

  林建龙也强调了未来“专家 Agent”理念的实现,需要系统化和工程化的方法。他表示,当前华通云正围绕底座模型、数据管理、提示词工程、长期记忆等核心技术要素,构建了一套完整的AI Agent开发框架。

  其中底座模型提供基础的认知和推理能力,数据管理完成对企业数据的链接和交互,提示词工程负责将业务需求转化为模型可理解的任务指令,MCP Tools(用于与外部系统进行交互的工具集或协议)提供与外部系统交互的能力,Skills(技能)封装了特定领域的专业技能,长期记忆机制则使Agent能够在多轮交互中积累经验、实现智能的个性化服务。

小讯
上一篇 2026-04-09 21:32
下一篇 2026-04-09 21:30

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/253042.html