「AI Agent」无疑是当下最炙手可热的技术风口。但究竟什么样的 Agent 才算成功?是追求极致的自主复杂系统,还是有更切实际的路径?
在近日 LangChain 举办的 LangChain Interrupt 活动中,吴恩达与 LangChain CEO Harrison Chase 展开了一场精彩的炉边对话。
在这场围绕 AI Agent 现状与未来的「炉边谈话」中,吴恩达深入剖析了为何当前多数成功的 AI Agent 应用并非始于复杂的自治系统,而是源自简单的线性工作流。他更是形象地提出了「乐高积木」理论,揭示了加速智能体开发的秘诀。
这场对话干货满满,先划重点:
「Agent」还是「Agentic」?吴恩达:告别定义之争,拥抱「程度」差异
讨论伊始,Harrison Chase 提及了 吴恩达此前提出的一个重要观点:用「agenticness」(智能体特性)来描述应用的智能化程度,而非简单粗暴地判断「是不是 agent」。
吴恩达回忆道,大约一年半前,许多人热衷于争论某个系统「是不是真正的 agent」、「是否足够自主」。他认为这种争论意义不大。「我们作为一个社区,如果能接受事物具有不同程度的『智能体特性』,将会发展得更好。」吴恩达解释说,「无论你想构建一个具有少量自主性还是大量自主性的智能体系统,都没问题。无需浪费时间争论它是否『真正』是一个 agent。让我们称它们为具有不同自主程度的『agentic systems』(智能体系统),然后继续前进。」
他认为这种提法有助于减少不必要的争论,让大家更专注于构建本身。
线性工作流的巨大潜力:Agent 应用的「低垂果实」
当被问及目前人们在构建何种自主程度的智能体系统时,吴恩达指出,虽然他的团队会使用 LangGraph 这样的工具来处理具有复杂流程的高难度问题,但他同时看到了大量商业机会潜藏在相对线性的工作流中。
「许多商业场景中,现有的流程是这样的:员工查看网站表单,进行网站搜索,检查其他数据库以确认合规性或客户风险,然后复制粘贴信息,可能再进行一次网页搜索,最后粘贴到另一个表单中。」吴恩达描述道,「这些商业流程中,实际上存在大量相当线性的工作流,或者只是偶尔带有分支的线性流程。」
他认为,尽管这些简单工作流的机会很多,但企业面临的一大挑战是如何将现有业务流程有效地转化为智能体工作流。「如何确定将任务分解到多细的粒度?原型构建后如果效果不佳,又该改进哪些步骤?」吴恩达认为,这种审视现有流程、将其分解为顺序步骤、并设置评估体系的整体技能,目前仍然「非常稀缺」。
AI Agent 开发的「乐高」心法:组合与迭代
谈及智能体构建者应掌握的技能,吴恩达提出了一个生动的比喻——「乐高积木」。
他认为,过去几年 AI 公司创造了大量优秀的 AI 工具,包括 LangGraph 这样的编排工具,以及 RAG(检索增强生成)、聊天机器人构建方法、多种记忆系统、评估(evals)和护栏(guardrails)等理念和技术。「我脑海中常有一个画面:如果你只有紫色的乐高积木,你搭建不出太多有趣的东西。」吴恩达说,「这些工具就像不同颜色、不同形状的乐高积木。当你拥有了红色、黑色、黄色、绿色的积木,你就能非常迅速地将它们组装成非常酷的东西。」
他强调,成功的智能体构建者就像乐高积木的组装者,能够快速组合这些专业工具,而不是一切从零开始。掌握并熟练运用这些「积木块」,能够极大提升开发效率和决策速度。
吴恩达还特别提到,随着大语言模型(LLM)上下文窗口的不断扩大,一些曾经的**实践也在发生变化。「例如,一年半前 RAG 的很多**实践,今天可能就不那么重要了。随着 LLM 上下文记忆的增长,我们现在可以直接向 LLM 的上下文中填充更多内容。RAG 并没有消失,但其超参数调整变得容易多了。」
被低估的机会:Evals、语音与全民编程
在众多「乐高积木」中,吴恩达点名了几个他认为被低估或应用不足的关键领域:
MCP:数据整合的革新,但仍需进化
对于近期备受关注的 MCP(Model Context Protocol,模型上下文协议),吴恩达给予了积极评价,认为它填补了市场的明显空白,OpenAI 的采用也证明了其重要性。DeepLearning.AI 也与 Anthropic 合作推出了相关课程。
「我们花费了大量时间在『管道』上,也就是数据集成,以便将正确的上下文信息提供给 LLM。」吴恩达指出,MCP 是一个尝试标准化接口的「奇妙方式」,旨在实现 N 个模型/智能体与 M 个数据源集成时,付出 N+M 而非 N*M 的努力。
但他同时坦言,MCP 及其服务目前尚处于早期阶段。「很多网上的 MCP 服务并不可用,认证系统也有些笨拙。」协议本身也需要进化,例如,当 LangGraph 这样的工具拥有大量 API 调用时,简单的列表式资源呈现难以满足需求,未来可能需要层级化的发现机制。
「Vibe Coding」正名与 AI 创业成功秘诀
当谈及「Vibe Coding」(氛围编程)这一流行词时,吴恩达认为这个名称具有误导性,让人以为编程可以仅凭感觉。「坦白说,当我使用 AI 编程系统进行一整天编程后,我会非常疲惫。这是一项深度智力活动。」他认为这种现象本身是真实且积极的,AI 辅助编程使得更多人能够编程,未来最重要的技能之一就是「准确告诉计算机你想要什么」。
对于 AI 创业者,吴恩达给出了两条 AI Fund 观察到的成功关键预测指标:
吴恩达强调,AI Fund 非常乐于与那些拥有良好技术直觉和理解力的深度技术人才合作。
整场对谈,吴恩达以其一贯的务实与前瞻,为我们描绘了 AI Agent 发展的清晰图景。从推崇「agentic systems」的灵活定义,到强调线性工作流的即时价值;从「乐高积木」式的开发哲学,到对评估、语音、全民编程等领域的独到见解,无不展现出他对技术趋势的深刻洞察和对实践应用的深切关注。
正如 Harrison Chase 在开场时所言,吴恩达的课程和理念已成为许多人踏入 LangChain 和 AI Agent 世界的引路灯。而这次的分享,无疑又为在 AI 浪潮中探索的开发者们,提供了宝贵的航向指引。
参考链接:https://www.youtube.com/watch?v=4pYzYmSdSH4
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/253886.html