数字经济研究院同事把Agent落地中遇到的常见问题归纳为失忆、流程失控、作恶/欺骗三类。对应这三类问题,他提出了三层解法:上下文与记忆管理、流程与编排控制、验证与护栏。他介绍了数研院的两个产品实践:SurgeFlow和SurgePix。他认为,CLI的核心优势不是“命令行”本身,而是可组合性——Agent可以把多个原子命令像搭积木一样组合成新功能,而API很难做到这一点。
成都研发中心的另一位同事带来了拓尔思技能库建设中的一线经验。团队从实际问题出发,逐步总结出六条核心原则:避免AI自我评估、限制重试次数、使用Checklist管理状态、不默认AI已知任何未明确告知的信息、确保每一步可观测、以上条件满足后,AI才能一次输出可用的Skill。
六位同事的接力分享,从不同角度指向同一个结论:大模型的能力正在趋同,真正的护城河正在向Harness Engineering转移。分享尾声,曹辉向内部团队提出了明确的技术演进要求:拓尔思的智能底座必须加速完成Harness能力的工程化封装,让前线业务能感知到工程约束带来的稳定性跃迁。这条路没有捷径,但每一步的积累都会沉淀为组织真正可控的生产力。对于拓尔思而言,这正是将“驾驭工程”写入技术基因的起点。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/260737.html