2026年OpenAI推出GPT-5.4 mini与nano:性能显著提升,定价最高上涨4倍

OpenAI推出GPT-5.4 mini与nano:性能显著提升,定价最高上涨4倍文丨苏扬 编辑丨徐青阳 3 月 18 日凌晨 OpenAI 正式发布两款新模型 和 它们是截至目前 OpenAI 能力最强的小模型 将 GPT 5 4 的诸多优势引入速度更快 效率更高的版本中 主要面向编码助手 子智能体和计算机使用等应用场景 从核心数据来看 GPT 5 4 mini 在编码 推理 多模态理解和工具使用方面相较上一代 GPT 5 mini 有显著提升 运行速度提高 2 倍以上 在

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



文丨苏扬

编辑丨徐青阳 

图片

3月18日凌晨,OpenAI正式发布两款新模型——

它们是截至目前OpenAI能力最强的小模型,将GPT-5.4的诸多优势引入速度更快、效率更高的版本中,主要面向编码助手、子智能体和计算机使用等应用场景。

图片

从核心数据来看,GPT-5.4 mini在编码、推理、多模态理解和工具使用方面相较上一代GPT-5 mini有显著提升,运行速度提高2倍以上。 

图片

● 在编程测试中,GPT-5.4 mini取得54.4%的成绩,与GPT-5.4的57.7%差距不大,但明显高于GPT-5 mini的45.7%。

● 在衡量计算机使用能力的测试中,GPT-5.4 mini得分为72.1%,接近GPT-5.4的75.0%,而GPT-5 mini仅为42.0%。

图片

GPT-5.4 nano是该系列中最小的版本,主打速度和成本优先的任务场景。相较GPT-5 nano,性能亦有明显升级。 

当然,性能提升的同时,定价也相应上调。

GPT-5.4 mini在API中定价为每百万输入token 0.75美元,每百万输出4.50美元;与之相比,GPT-5.4 nano为每百万输入0.20美元,每百万输出1.25美元。

图片

对比上一代,GPT-5.4 mini输入价格是GPT-5 mini的3倍,输出价格的2.25倍;GPT-5.4 nano输入价格是GPT-5 nano的4倍,输出价格的3.125倍。

OpenAI在Codex平台中展示了一种子智能体架构的应用方式。在该架构中,GPT-5.4等大模型负责规划、协调和最终判断,同时将并行的子任务分派给GPT-5.4 mini或nano子智能体处理,例如搜索代码库、审查大文件或处理支持文档。

OpenAI表示,在Codex中,GPT-5.4 mini仅消耗GPT-5.4配额的30%,开发者处理简单编码任务的成本可降至约三分之一。这种分工模式的价值在于,随着小模型能力的增强,开发者可以构建更高效的系统——大模型负责决策,小模型快速执行。

GitHub产品高级总监布里坦尼·奥谢(Brittany O‘Shea)在测试后表示,GPT-5.4 mini在OpenAI的mini模型中首个token生成时间处于领先地位,浏览代码库顺畅,在类似grep(命令行文本搜索工具)的工作流程中表现突出。 

Rox首席执行官伊珊·穆克吉(Ishan Mukherjee)分享了更具体的测试结果。他们在Rox的一系列真实工作流程中测试了GPT-5.4 mini,从网络研究智能体到对杂乱的CRM数据进行推理。穆克吉表示,该模型在需要连接多个来源并理解业务上下文的任务中,可以连续产生最有用的答案。 

Mercor进行的评估显示,GPT-5.4 mini在xhigh推理能力下达到24.5%的Pass@1,优于Gemini 3.1 Flash Lite的12.8%和Sonnet 4.6的23.7%,但价格仅为后者的四分之一。

图片

Mercor AI研究员伯蒂·韦根(Bertie Vidgen)指出,该模型在智能体任务上表现强劲,提高推理效率和token预算时,性能提升更为明显。 

GPT-5.4 mini在多模态任务上也展现出较强能力,特别是与计算机使用相关的场景。 

这款模型可以快速解读密集用户界面的屏幕截图,完成计算机使用任务。OSWorld-Verified测试中72.1%的成绩,使其性能接近GPT-5.4,并显著超过GPT-5 mini。

图片

Hebbia首席技术官阿比拉什·夏尔马‌(Aabhas Sharma)对比测试后发现,GPT-5.4 mini在处理多项输出任务时,不仅成本更低,生成的答案质量和对引文的准确度也能与竞品媲美甚至更胜一筹。

同时,与参数规模更大的GPT-5.4模型相比,mini版本的任务完成率更高,生成内容的依据也更扎实可靠。

GPT-5.4 nano作为最小版本,主要面向分类、数据提取、排序等任务,以及处理简单支持任务的编码子智能体。 

CodeRabbit AI副总裁David Loker评价称,GPT 5.4 nano相较上一代有大幅提升,不仅速度快了4倍以上、延迟更低,指令跟随能力也显著增强,成为其团队大部分上下文工程流程中的理想选择。 

Whoop AI技术负责人维维亚诺·坎图(Viviano Cantu)在测试中发现,GPT-5.4 nano在提示词未作任何改动的情况下,表现优于当前基线和GPT-5.1、GPT-4.1等更大模型,且接近GPT-5.2的水平,同时输出token使用量极低。基于早期测试结果,他认为这是具有吸引力的生产候选模型。 

Notion AI工程负责人阿比谢克·莫迪(Abhisek Modi)表示,GPT-5.4 mini在处理编辑页面等定义明确的任务时精度很高,尤其是在处理复杂格式时,以极少的计算量匹配并常超过GPT-5.2。

他还指出,过去只有最昂贵的模型能可靠处理智能体工具调用,如今GPT-5.4 mini和nano这类小模型已能轻松胜任,这让Notion上构建自定义智能体的用户可以精确选择所需的智能水平。

GPT-5.4 mini即日起在API、Codex和ChatGPT中上线。API版本支持400k上下文窗口,涵盖文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用和技能等功能。

在ChatGPT中,免费和Go用户可通过“+菜单中的‘Thinking’功能”使用GPT-5.4 mini。对于其他用户,GPT-5.4 mini作为GPT-5.4 Thinking的选项。GPT-5.4 nano则仅在API中提供。

AI交互聚合平台Poe已上线这两款模型。

图片

Poe方面建议,GPT-5.4 nano适合快速大批量任务,如转写录音、给工单打标签、重写内容、快速RAG问答等对延迟和成本敏感的场景。

GPT-5.4 mini则适合需要一定推理能力的任务,如将杂乱的邮件整理成JSON、修复函数但不重写整个文件,或执行需要计划、检查结果并采取下一步的智能体任务。 

Perplexity副CTO Jerry Ma总结称,GPT-5.4让mini和nano两款模型均有明显进步:mini推理能力强,nano在实时对话场景中响应迅速且高效。

特约编译金鹿对本文亦有贡献

小讯
上一篇 2026-03-20 08:18
下一篇 2026-03-20 08:16

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/244586.html