<p> OpenAI推出旗舰模型GPT5.4,成为超越人类专家,转向“能干活”的知识员工</p> <p> 北京时间3月6日凌晨,OpenAI正式发布新一代旗舰模型GPT-5.4,融合了近期在推理、编码和智能体工作流方面的最新进展。GDPval基准测试中,GPT-5.4在83%的任务上达到或超过行业专业人士水平;OSWorld桌面操控测试成功率75%,首次超过人类基线(72.4%);编程能力与GPT-5.3-Codex持平,世界知识比GPT-5.2更强。我们认为,GPT-5.4的发布,是大模型演进史上的一个分水岭。它证明了AI竞争的终点不是更聪明的聊天机器人,而是一种新的软件形态,即可以理解任务、规划步骤并执行操作的智能工作代理。</p> <p> GPT5.4为首个拥有原生电脑使用能力模型,更长上下文、更低幻觉率助推Agent发展</p> <p> 1)从“理解”到“执行”,原生计算机操作。GPT-5.4首次将电脑操作能力融入通用模型,可直接根据屏幕截图发出鼠标点击和键盘指令,完成跨应用任务。在OSWorld-Verified测试中,其操作成功率达75%,远超GPT-5.2的47.3%,并略高于人类平均水平(72.4%)</p> <p> 2)从“片段”到“全景”,百万Token上下文。100万Token的上下文窗口,在企业场景中意味着能读完整个项目文档库或完整代码仓库,无需依赖复杂的RAG系统,从而理解完整项目而非零散片段。</p> <p> 3)token消耗下降同时事实性提升。在Scale的MCP Atlas基准中,启用36个MCP服务器、测试250个任务时,tool-search配置在不降低准确率的情况下,把总token使用量减少了47%;幻觉率方面其单个声明的错误率降低了33%,完整回答的错误率降低了18%。</p> <p> GPT5.4精准适配OpenClaw,token消耗有望进一步增长</p> <p> 我们认为,GPT5.4几乎是在执行、记忆、成本、智能四个维度上,为OpenClaw这个智能体产品提供了原生**实践。1)执行层面原生电脑操作能力,让桌面自动化无需复杂适配;2)记忆层面:百万Token上下文,解决长任务记忆丢失问题;3)成本层面:Tool Search机制,按需调用工具,Token消耗降低47%;4)能力层面:推理跃升胜任财务分析等高价值复杂任务。目前,OpenClaw在GitHub Star的Star已突破25万,GPT5.4原生Agent能力的提升有望进一步激增OpenClaw调用需求,加速token消耗,提升算力基础设施及模型服务商的需求。</p> <p> 投资建议</p> <p> 建议关注:1)Agent:金山办公、鼎捷数智、博睿数据、视源股份、蓝色光标、泛微网络、致远互联、普元信息、用友网络、汉得信息、赛意信息、合合信息、福昕软件、税友股份、润达医疗、同花顺恒生电子、万兴科技、科大讯飞、金桥信息;</p> <p> 2)国内算力:大位科技、东方国信、润建股份、润泽科技、东阳光、世纪互联、光环新网、数据港、万国数据、杭钢股份、浙大网新宝信软件、科华数据、奥飞数据、优刻得、网宿科技、寒武纪、海光信息、摩尔线程、沐曦股份、云天励飞、浪潮信息、曙光数创、亿都(国际控股)、超讯通信、瑞晟智能、华丰科技、神州数码、软通动力烽火通信、拓维信息、四川长虹、安博通;</p> <p> 3)海外算力:新易盛、中际旭创、天孚通信、东山精密、长光华芯、腾景科技、福晶科技、长芯博创、源杰科技、华工科技、光迅科技、太辰光、仕佳光子、胜宏科技、景旺电子、沪电股份、生益电子深南电路、兴森科技、工业富联、英维克、高澜股份、申菱环境、巨化股份、川环科技、同飞股份、飞荣达、鸿腾精密、麦格米特、欧陆通、禾望电器、盛弘股份、杰华特、紫光股份、锐捷网络、中兴通讯菲菱科思等。。</p> <p> 风险提示:</p> <p> 技术迭代不及预期、国内AI Agent商业化进展不及预期、算力供应不及预期、行业竞争加剧风险等。</p> <p></p>
GPT plus 代充 只需 145
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/213247.html