2025年AI发展趋势预测:Agent元年、后训练与MultiAgent协同

2025年AI发展趋势预测:Agent元年、后训练与MultiAgent协同2025 年开年以来 人工智能 AI 领域呈现爆炸式增长 DeepSeek R1 OpenAI CUA Manus 等创新成果令人目不暇接 本文将对近一个月来的思考进行总结 并对 2025 年 AI 发展趋势做出几点预判 Manus 的推出引发了广泛关注 经过深入体验测评 我们认为 Manus 的产品设计理念极具创意 虽有不足 但值得肯定 Manus 的核心架构基于 虚拟机 多 Agent 协同 模式

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



2025年开年以来,人工智能(AI)领域呈现爆炸式增长,DeepSeek R1、OpenAI CUA、Manus等创新成果令人目不暇接。本文将对近一个月来的思考进行总结,并对2025年AI发展趋势做出几点预判。

Manus的推出引发了广泛关注。经过深入体验测评,我们认为Manus的产品设计理念极具创意,虽有不足,但值得肯定。

ai agent

Manus的核心架构基于“虚拟机+多Agent协同”模式,整合了GPT-4、Claude 3等底层大模型的API,实现了任务的动态分配与模型调用。它突破了传统AI助手仅提供建议的限制,实现了从需求输入到成果交付的闭环。

Manus提倡“Less Structure, More Intelligence”的交互理念,通过无代码化的自然语言接口降低用户门槛。

manus

此外,Manus使用外置markdown文件管理Agent的任务规划,并将阶段性成果存储为独立文件,这是一种有趣的创新。

manus ai

ai agent

尽管Manus在MultiAgent领域提供了有益的思路,但仍存在一些明显的不足。

首先是“幻觉累加”问题。由于Agent本质是多次大模型问答的串并联,单次问答准确率的下降会导致最终结果的准确性大幅降低。

例如,在对某上市公司进行财务数据分析的任务中,Manus虽然成功导入了data_api模块,但却将revenue、gross_profit等数据“硬编码”到代码中,且部分数据存在错误,这使得后续分析毫无意义。

manus

其次,Manus面临工具不足的挑战。在撰写“小米Su7”市场分析报告PPT的任务中,Manus能够完美拆解任务并检索大量新闻,但却无法生成PPT,因为它无法调用Office软件。目前Manus主要输出纯文本或网页内容,难以与人类工作流融合。

manus

此外,互联网生态的“小院高墙”也对Manus造成阻碍。当Manus尝试分析AI智能眼镜的性价比时,虽然找到了淘宝页面,但却被淘宝判定为机器人而拒绝访问。类似地,在为非上市公司撰写商业分析报告时,Manus访问CrunchBase数据库也被拒绝。这些“围栏”内的优质信息难以获取,影响了Manus的工作效果。

manus

manus

总而言之,尽管面临挑战,Manus依然展示了MultiAgent的巨大潜力,为Agent元年奠定了基础。

OpenAI发布了由CUA(Computer-Using Agent)驱动的AI智能体Operator。CUA融合了GPT-4o的视觉能力和通过强化学习实现的高级推理能力,能够将任务分解为多步骤计划,并在遇到挑战时进行调整和纠正。CUA本质上就是一个会操作电脑的Agent。

manus

CUA同时接受文本指令和屏幕截图两种模态的输入,并生成一系列动作指令,例如“点击屏幕上坐标为(300,200)的点,并且输入XXX,按回车”。电脑执行指令后,将新的屏幕截图与新的任务指令返回给CUA,循环往复,直至获得最终答案。

OpenAI的官方测评显示,CUA在操作电脑和浏览器方面相比上一代SOTA有了显著提升,但与人类相比仍有差距。不过,这种差距有望在今年内得到质的改变。

manus

Anthropic推出了MCP(Model Context Protocol)来解决AI面临的“工具不足”问题。MCP定义了应用程序和AI模型之间交换上下文信息的方式,使开发者能够以一致的方式将各种数据源、工具和功能连接到AI模型。

MCP之于AI,类似于TCP/IP之于互联网。

manus

MCP有三个重要特点:标准协议(统一AI与工具的交互接口)、动态发现(AI能够按需寻找并调用工具或服务)和双向通信(AI与工具之间双向有状态的通信)。

越来越多的工具和服务开始接入MCP,包括Google Maps、PGSQL、ClickHouse、Atlassian、Stripe等。

manus

manus

在Smithery平台上,你可以轻松查找不同功能对应的工具和服务。随着更多Server接入MCP协议,未来AI能够直接调用的工具将呈现指数级增长,从根本上打开Agent能力的天花板。

manus

结合近几个月来的观察和思考,以下是2025年AI发展的几点重要趋势:

预训练即将终结,后训练成为重点。这已成为行业共识。Ilya认为数据是AI时代的化石燃料,而DeepSeek R1的论文也强调了后训练在大模型训练管线中的重要性。

manus

针对后训练而言,强化学习将成为主流,监督学习的重要性逐渐下降。DeepSeek R1的启发在于:纯粹的RL可能是通向AGI的正确路径。随着TTS的增加,大模型会自我涌现出复杂的推理行为,而无需刻意引导。

研究表明,随着大模型RL步数的增加,大模型会自主地从“快思考”变成“慢思考”,从每次回答100个token到接近10000个token。

manus

DeepSeek团队将这种现象称为“self-evolution”,并认为是“the emergence of sophisticated behaviors”,例如self-verification, reflection等。

这意味着未来监督学习在AI训练中扮演的角色将发生转变,或许不应该让AI模仿人类的思维方式来获得智能,而是让AI发展出更加原生的智能。

MultiAgent是确定性的大趋势。如果将AI和人脑进行类比,大模型就像是人脑中的“前额叶”。但仅仅有前额叶,大脑是无法处理复杂任务的。我们需要颞叶、顶叶、小脑和海马体等。

MultiAgent的定义恰恰就是让多个不同的模型之间互相协调,从单独的“前额叶”走向“完整的大脑”,从而处理更加复杂的现实任务。MCP在此蓝图中起到了协调统一数据通信接口的关键作用。

manus

2025年是AI Agent元年,Manus的出现是第一声号角。OpenAI的CUA和Anthropic的MCP都指向了一个共同的未来,未来2年AI的发展速度将非常迅猛,让我们共同迎接AI新时代的到来!

小讯
上一篇 2026-03-26 18:38
下一篇 2026-03-26 18:36

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/246590.html