香港中文大学、UC Berkeley 和 UCLA 的研究团队提出了 Gen-Searcher,这是一种为图像生成任务训练“深度搜索”智能体的新方法。该方法旨在解决传统文生图模型在处理需要真实世界知识、最新信息或复杂细节的 prompt 时容易出错的问题。与传统的“直接出图”模式不同,Gen-Searcher 赋予模型像 Agent 一样进行搜索、推理、找图和浏览网页的能力,从而输出更可靠的生成结果。研究团队构建了包含约 20 个类别的真实世界生成数据,并提出了新的 benchmark —— KnowGen,用于评估图像生成 Agent。Gen-Searcher 通过 SFT 训练学会工具使用,再通过 agentic RL 优化搜索策略和长程决策,配备了文本搜索、图像搜索和网页浏览三类工具。实验结果表明,Gen-Searcher 能够显著提高模型生图的准确性和质量,并能迁移到其他图像生成器上。
2026年Gen-Searcher:为图像生成模型注入 Agent 能力,告别直接生成
Gen-Searcher:为图像生成模型注入 Agent 能力,告别直接生成香港中文大学 UC Berkeley 和 UCLA 的研究团队提出了 Gen Searcher 这是一种为图像生成任务训练 深度搜索 智能体的新方法 该方法旨在解决传统文生图模型在处理需要真实世界知识 最新信息或复杂细节的 prompt 时容易出错的问题 与传统的 直接出图 模式不同 Gen Searcher 赋予模型像 Agent 一样进行搜索 推理 找图和浏览网页的能力
大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。
2026年我花 3 天实测 Hermes Agent:这波热度值不值得跟?(附新手选型结论)
上一篇
2026-04-10 12:11
2026最新如何用LM Studio加载本地模型?新手教程3步学会实操指南
下一篇
2026-04-10 12:09
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/254038.html