2025年bs4解析html(bs4解析器有哪些)

bs4解析html(bs4解析器有哪些)p id 34ENURD6 工具调用是 AI 智能体的关键功能之一 AI 智能体根据场景变化动态地选择和调用合适的工具 从而实现对复杂任务的自动化处理 例如 在智能办公场景中 模型可同时调用文档编辑工具 数据处理工具和通信工具 完成文档撰写 数据统计和信息沟通等多项任务 p

大家好,我是讯享网,很高兴认识大家。




讯享网

 <p id="34ENURD6">工具调用是 AI 智能体的关键功能之一,AI 智能体根据场景变化动态地选择和调用合适的工具,从而实现对复杂任务的自动化处理。例如,在智能办公场景中,模型可同时调用文档编辑工具、数据处理工具和通信工具,完成文档撰写、数据统计和信息沟通等多项任务。</p><p class="f_center"><img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F1027%2F3d79bc57j00slz26n0073d000ic007up.jpg&thumbnail=660x&quality=80&type=jpg"/><br/><br/></p><p id="34ENURDA">业界已发布的工具调用模型,在特定评测基准上有接近甚至超越闭源 SOTA 模型(比如 GPT-4)的表现,但在其他评测基准上下降明显,难以泛化到新工具和新场景。为应对这一挑战,来自OPPO 研究院和上海交通大学的研究团队提出函数掩码(Function Masking) 方法,构建了具备强大泛化能力的轻量化工具调用系列模型:Hammer,并开源了完整的技术栈,旨在帮助开发者构建个性化的终端智能应用。</p><p id="34ENURDC">文章转载:[kkd.fs-hanvic.com)</p><p id="34ENURDE">在工具调用典型评测基准上,包括 Berkeley Function-Calling Leaderboard(BFCL)、API-Bank、Seal-Tools 等,Hammer 系列模型展现了出色的总体性能,特别是 Hammer-7B 模型,综合效果仅次于 GPT-4 等闭源大模型,在工具调用模型中综合排名第一,具备强大的新场景和新工具泛化能力。</p><p id="34ENURDG">文章转载:[dxj.air999.org)</p><p id="34ENURDI">工具调用任务说明</p><p id="34ENURDK">文章转载:[xe.yylnz.com)</p><p id="34ENURDM">工具调用作为 AI 智能体执行复杂任务所必备的核心能力,要求模型不仅能够识别正确的函数,还要准确填写函数的输入参数;如果给定函数列表无法满足用户的意图,模型也应具备拒绝任务的能力。下图是工具调用模型输入输出的一个样例:</p><p id="34ENURDO">文章转载:[ho.tongsee.com)</p><p id="34ENURDQ">Hammer 训练方法</p><p id="34ENURDS">文章转载:[ze.zhenshou.net)</p><p id="34ENURDU">研究团队在 Hammer 的训练过程中引入了一项关键技术:函数掩码(Function Masking)和一个增强数据集:不相关性检测增强数据集(Irrelevance-Augmented Dataset)。</p><p id="34ENURE0">文章转载:[nxz.xiangongshe.com)</p><p id="34ENURE2">Hammer 总体表现</p><p id="34ENURE4">文章转载:[kwb.hf0328.com)</p><p id="34ENURE6">Hammer 系列模型在工具调用典型评测基准上均展现了出色的性能,具体表现如下面的两张表格所示。可以看到,在 BFCL 榜单上,Hammer-7B 模型的总体准确率达到 83.92%,接近闭源 SOTA 模型 GPT-4 的 95.79%,优于其他工具调用模型。同时,在其他评测基准上,Hammer-7B 模型的平均 F1 达到 76.21%,接近闭源模型 GPT-4 的 78.79%,大幅领先其他工具调用模型。Hammer-7B 能够在参数规模较小的情况下,在不同评测基准上与闭源 SOTA 大模型竞争,充分展示了 Hammer 模型在各种工具调用任务中的准确性和稳定性。</p><p id="34ENURE8">文章转载:[oaz.66ziyuan.com)</p><p id="34ENUREA">函数掩码技术的通用性</p><p id="34ENUREC">文章转载:[wvh.yingu.cc)</p><p id="34ENUREE">研究团队还将函数掩码和数据增强技术应用于不同的基础模型,以验证其通用性。实验选择了 Qwen 系列和 Deepseek-Coder 系列模型作为基准,并在相同的训练和测试条件下进行比较。下表中的结果显示,经过函数掩码技术调优后的 Hammer 版本显著提升了基础模型的工具调用准确性,远高于未调优版本,证明了函数掩码和不相关性数据增强对不同模型架构均有显著的优化效果。同时,在使用相同的基座模型和基础数据的情况下,与 xLAM(同样基于 Deepseek 微调而来的工具调用模型)的对比,也体现了函数掩码及不相关性数据增强的作用。</p><p id="34ENUREG">文章转载:[wk.zgsyb2b.com)</p><p id="34ENUREI">不相关性数据增强比例的权衡</p><p id="34ENUREK">文章转载:[xx.oycgroup.com)</p><p id="34ENUREM">在设计不相关性数据增强时,研究团队测试了不同比例的不相关性数据样本对模型表现的影响。下图实验结果表明,合理比例的不相关性增强数据(约占总数据的 10%)能够在提升工具调用准确性的同时,显著增强模型在不相关检测场景中的识别能力,降低错误调用的风险。实验结果还显示,进一步增加不相关性数据会略微降低功能调用的准确性,因此找到适当的平衡点至关重要。</p><p id="34ENUREO">文章转载:[ft.gold-domain.net)</p><p id="34ENUREQ">总结</p><p id="34ENURES">文章转载:[xc..com)</p><p id="34ENUREU">Hammer 模型通过函数掩码技术和不相关性检测数据增强,在多个评测基准中取得了良好的效果,表现出强大的泛化能力和稳定性,为轻量化工具调用模型在终端应用向前迈了一步。</p><p id="34ENURF0">文章转载:[tz.buddytype.com)</p><p id="34ENURF2">Hammer 系列目前已更新至 2.0 版本,欢迎感兴趣的读者通过 huggingface 进行体验!</p><p id="34ENURF4">文章转载:[bv.jybzh.com)</p> 

讯享网
小讯
上一篇 2025-05-26 19:34
下一篇 2025-05-24 11:04

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/163307.html