从Java转行大模型应用，多Agent系统及AutoGen、CrewAI框架学习

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

1.1 定义

多Agent系统（MAS）是由多个相互交互的智能体（Agent）组成的计算系统，这些智能体具备一定的自主性、感知能力和交互能力，通过协同合作或竞争，共同完成单个智能体或单体系统难以解决的复杂任务。其核心是“分布式智能协作”，将复杂任务拆解为多个子任务，由不同功能的智能体分工完成，最终实现整体目标。

需要注意的是，多Agent系统（MAS）与基于Agent的模型（ABM）有所区别：ABM的目标是探究遵循简单规则的Agent群体行为，多用于自然系统研究；而MAS更侧重解决实际工程和应用问题，多用于技术领域。

1.2 核心组成

智能体（Agent）：系统的基本单元，可分为被动Agent（无目标，如模拟中的障碍物）、主动Agent（有简单目标，如蜂群中的个体）和认知Agent（具备信念、欲望、意图，可通过逻辑、概率等方式推理）三类，具体可是软件程序、机器人或人类团队等实体。每个Agent通常包含感知模块、计算模块、通信模块，能自主感知环境、处理信息、做出决策并与其他Agent交互。
环境（Environment）：Agent生存和交互的空间，可分为虚拟/真实、离散/连续等类型，还具备可访问性、决定性、动态性等属性，直接影响Agent的决策和行为。
通信协议：规范Agent之间信息交换的规则，包括消息格式、通信规则、安全认证等，确保Agent能准确理解彼此意图，常见方式有消息传递、发布/订阅等。
协作与协调机制：解决Agent之间的任务分配、资源冲突问题，确保系统高效运行，主要实现方式有无通信协调、中心控制协调和协商三种。

1.3 核心特点

自主性：每个Agent可独立完成子任务，自主推理、规划和行动，无需外部强制干预。
协同性：Agent之间通过交互协作，弥补单个Agent的能力局限，实现“1+1>2”的效果。
灵活性与可扩展性：系统模块化程度高，可根据任务需求增减Agent，适配不同规模的复杂场景。
适应性：Agent能感知环境变化，通过学习机制（如强化学习）调整自身行为，适应动态场景。

1.4 典型应用场景

涵盖多个领域，包括在线交易、灾难响应、目标监控、社会结构建模、工业自动化、交通控制、软件开发、客户支持等，尤其在大型语言模型（LLM）兴起后，LLM-based多Agent系统成为研究热点，实现了更复杂的交互协作。

多Agent即“多个智能体”，是多Agent系统的核心组成单元，这里的“智能体”（Agent）是具备自主决策、环境感知、信息交互能力的独立实体，本质是“能自主完成特定任务、并与其他实体交互的智能单元”。

2.1 智能体（Agent）的核心能力

感知能力：获取环境信息（如其他Agent的状态、任务需求、环境变化），是决策的基础。
决策能力：基于感知到的信息和自身目标，通过算法（如强化学习、逻辑推理）做出行动选择。
交互能力：通过通信协议与其他Agent交换信息，协同完成任务，可实现合作、竞争等多种交互模式。
学习能力：通过反馈（如任务完成情况、环境变化）优化自身行为，提升任务执行效率，常见方式有强化学习、遗传编程等。

2.2 多Agent的协作逻辑

多Agent之间并非孤立存在，而是通过“任务拆解-分工协作-信息同步-结果汇总”的逻辑工作：

拆解复杂任务：将整体任务拆分为多个可独立完成的子任务（如“数据分析报告”可拆分为“数据采集、数据清洗、分析建模、报告撰写”）。
分配子任务：根据每个Agent的能力（如擅长数据处理、擅长文字撰写），分配对应的子任务。
协同执行：Agent各自完成子任务，过程中通过通信同步进度、解决冲突（如数据不一致、任务衔接问题）。
汇总结果：将所有Agent的子任务结果整合，形成最终的任务成果。

2.3 多Agent与单Agent的区别

单Agent仅能独立完成简单任务，能力单一、适应性弱；而多Agent通过分工协作，可解决复杂、多维度的任务，且具备更强的容错性（单个Agent故障时，其他Agent可补位）和扩展性。例如，单Agent可完成简单的文本翻译，而多Agent可协同完成“从外文文献检索、翻译、摘要提炼到报告撰写”的完整流程。

3.1 框架简介

AutoGen是由微软研究院开源的多Agent框架，基于Python开发，核心定位是“通过多Agent对话驱动，实现复杂工作流的自动化”，支持LLM、代码执行器、人类输入等多种组件的灵活组合，适用于从简单对话到企业级复杂场景的各类需求。

其设计理念源于“整体大于部分之和”，通过Agent之间的异步对话协商，简化复杂工作流的实现，同时具备良好的可扩展性和可组合性，可根据需求自定义Agent组件，适配不同应用场景。

3.2 核心特性

对话驱动协作：Agent之间通过发送、接收消息实现交互，无需复杂的流程配置，核心是“对话协商”，适合动态任务场景。
组件可定制化：支持为Agent配置LLM、代码执行器、工具执行器、人类交互模块等，可灵活开关、自定义组件，满足不同任务需求（如代码开发场景开启代码执行器，纯对话场景关闭）。
易扩展性：可通过“registered_reply”为Agent添加自定义组件，也可组合多个简单Agent形成复杂Agent，实现模块化开发和维护。
丰富的应用场景：已被广泛应用于广告、数据分析、软件开发、 cybersecurity、教育、金融等多个领域，支持AI员工、博客撰写、代码调试等具体需求。

3.3 核心组件与核心概念

3.3.1 核心组件

LLM模块：提供自然语言理解和生成能力，支持GPT-4等主流大模型，是Agent对话和决策的基础。
代码执行器：支持IPython内核，可执行代码、处理数据，适用于数据分析、代码开发等场景。
工具执行器：支持调用外部工具，扩展Agent的能力边界。
人类交互模块：支持“人类在环”，可在关键节点插入人类输入，提升任务准确性。

3.3.2 核心概念

ConversableAgent（可对话Agent）：AutoGen内置的核心Agent类型，支持上述所有组件，可灵活配置，是构建多Agent系统的基础。
GroupChat（群聊）：多个Agent协同交互的场景，可设置最大对话轮次，实现多Agent的群体协商。
GroupChatManager（群聊管理器）：负责管理群聊中的Agent交互，协调对话流程，确保任务有序推进。

3.4 快速上手（基础实操）

3.4.1 安装

通过pip安装，命令如下：

pip install autogen-agentchat~=0.2

3.4.2 简单示例（双Agent对话）

import os from autogen import ConversableAgent # 定义可对话Agent（仅开启LLM，关闭其他组件） chatbot = ConversableAgent( "chatbot", llm_config=]}, code_execution_config=False, # 关闭代码执行 ) # 定义用户代理Agent（无人类输入） user_proxy = ConversableAgent( "user_proxy", human_input_mode="NEVER", # 不接收人类输入 code_execution_config=False, ) # 启动对话 user_proxy.initiate_chat(chatbot, message="请简单介绍AutoGen框架")

3.5.1 优势

开发效率高：无需手动设计复杂协作流程，通过对话驱动简化多Agent交互逻辑。
组件灵活：可根据任务需求灵活组合LLM、代码执行器等组件，适配不同场景。
社区活跃：由微软研究院主导，社区贡献丰富，迭代速度快，具备完善的文档支持。

3.5.2 适用场景

代码开发与调试、数据分析、对话机器人、多步骤任务自动化（如报告生成、市场调研）、科研协作等，尤其适合需要动态协商的场景。

4.1 框架简介

CrewAI是一个开源的Python框架，核心定位是“通过角色分配和任务管理，编排协作的自主AI代理团队”，专注于多Agent的结构化协作，轻量、高性能，支持多种LLM和外部工具集成，适用于从简单任务到企业级复杂场景的自动化需求。

其设计理念是“角色驱动协作”，通过为每个Agent定义明确的角色、目标和背景，实现任务的结构化分配和高效协作，独立于LangChain等框架，可灵活部署。

4.2 核心特性

角色驱动设计：为每个Agent定义明确的角色、目标和背景故事，让Agent的行为更贴合任务需求，分工更清晰。
自主协作能力：Agent可自主委托任务、相互交流，无需手动干预，提升问题解决效率。
灵活的任务管理：支持动态分配任务，可定义任务依赖关系，支持自定义工具集成，适配复杂任务流程。
多LLM支持：兼容开源和专有模型，支持本地模型（如通过Ollama、LM Studio部署），灵活性高。
轻量高效：优化执行速度和资源使用，部署简单，适合快速上手和大规模应用。

4.3 核心组件与核心概念

4.3.1 核心组件

Agent（智能体）：核心执行单元，由角色、目标、背景故事、工具等属性组成，可根据角色定位完成对应任务。
Task（任务）：需要完成的具体工作，包含任务描述、预期输出、关联Agent等属性，可定义任务依赖关系。
Crew（代理团队）：由多个Agent和Task组成，负责编排Agent的协作流程，支持顺序执行、分层执行等多种流程模式。
Tools（工具）：可集成外部工具（如搜索工具、数据处理工具），扩展Agent的能力，支持自定义工具开发。

4.3.2 核心概念

角色定义：Agent的核心属性，包括role（角色）、goal（目标）、backstory（背景故事），直接决定Agent的行为逻辑和任务优先级。
任务编排：通过定义Task的依赖关系，实现任务的有序执行（如“先完成调研，再撰写报告”），支持sequential（顺序）、hierarchical（分层）等流程模式。
环境配置：通过.env文件配置LLM API密钥等环境变量，确保框架正常运行，同时支持本地模型部署。

4.4 快速上手（基础实操）

4.4.1 安装

确保Python版本≥3.8，通过pip安装：

pip install crewai

若使用Poetry管理依赖，执行：

poetry add crewai

4.4.2 环境配置

创建.env文件，存储API密钥（避免泄露）：

OPENAI_API_KEY=your_openai_api_key SERPER_API_KEY=your_serper_api_key

将.env文件添加到.gitignore中，防止密钥泄露。

4.4.3 简单示例（AI研究与报告生成团队）

from crewai import Crew, Agent, Task import os from dotenv import load_dotenv # 加载环境变量 load_dotenv() # 1. 定义Agent（研究员和报告撰写者） researcher = Agent( role="Senior Data Researcher", goal="Uncover cutting-edge developments in AI", backstory="You're a seasoned researcher with a knack for uncovering the latest developments in AI. Known for your ability to find relevant information and present it clearly.", verbose=True, allow_delegation=False # 不允许委托任务 ) writer = Agent( role="Report Writer", goal="Create a comprehensive report based on research findings", backstory="You're an expert writer skilled in transforming complex data into clear, engaging reports.", verbose=True, allow_delegation=False ) # 2. 定义Task（调研任务和撰写任务） research_task = Task( description="Research the latest advancements in AI for 2025", expected_output="A detailed summary of recent AI developments", agent=researcher ) writing_task = Task( description="Write a comprehensive report based on the research findings", expected_output="A markdown-formatted report", agent=writer, context=[research_task] # 依赖调研任务的结果 ) # 3. 创建代理团队并启动任务 crew = Crew(agents=[researcher, writer], tasks=[research_task, writing_task]) result = crew.kickoff() # 输出结果 print("任务执行结果：") print(result)

4.5 优势与适用场景

4.5.1 优势

分工清晰：角色驱动的设计让每个Agent的职责明确，任务分配更合理，适合结构化任务场景。
部署灵活：支持本地模型和云端模型，轻量无依赖，可快速部署到各类环境。
任务编排能力强：支持复杂的任务依赖关系，可实现分层、顺序等多种协作模式，适配企业级复杂任务。

4.5.2 适用场景

市场调研与报告生成、内容创作、项目管理、数据分析、客户支持、法律咨询等，尤其适合需要明确分工和结构化流程的场景。

对比维度

AutoGen

CrewAI

开发团队

微软研究院

CrewAI Team（社区驱动）

核心设计理念

对话驱动，异步协商

角色驱动，任务编排

Agent定义方式

功能导向，可灵活配置组件

角色导向，强调角色、目标、背景

协作机制

Agent之间通过对话协商协作，动态性强

通过任务依赖和角色分工协作，结构化强

优势

对话交互灵活，组件可定制，社区活跃

分工清晰，任务编排能力强，轻量易部署

适用场景

代码开发、动态协商任务、多步骤对话交互

结构化任务、明确分工的团队协作、企业级流程自动化

多Agent系统的核心是“分布式智能协作”，通过多个具备自主性、交互性的Agent协同，解决单个Agent无法完成的复杂任务，其关键在于Agent的分工、通信和协作机制。
 多Agent（多个智能体）是系统的基础，每个Agent具备感知、决策、交互、学习能力，通过任务拆解和分工协作，实现整体目标。 
AutoGen和CrewAI是两大主流多Agent框架，均基于Python开发、开源免费，但设计理念不同：AutoGen侧重“对话驱动”，适合动态协商场景；CrewAI侧重“角色驱动”，适合结构化任务场景。 
实操层面，两者均支持LLM集成和工具扩展，上手门槛较低，可根据任务的类型（动态/结构化）选择合适的框架，也可结合两者的优势进行二次开发。