2026年OpenAI推出GPT-5.4 mini与nano：性能显著提升，定价最高上涨4倍

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

文丨苏扬

编辑丨徐青阳

3月18日凌晨，OpenAI正式发布两款新模型——和。

它们是截至目前OpenAI能力最强的小模型，将GPT-5.4的诸多优势引入速度更快、效率更高的版本中，主要面向编码助手、子智能体和计算机使用等应用场景。

从核心数据来看，GPT-5.4 mini在编码、推理、多模态理解和工具使用方面相较上一代GPT-5 mini有显著提升，运行速度提高2倍以上。

● 在编程测试中，GPT-5.4 mini取得54.4%的成绩，与GPT-5.4的57.7%差距不大，但明显高于GPT-5 mini的45.7%。

● 在衡量计算机使用能力的测试中，GPT-5.4 mini得分为72.1%，接近GPT-5.4的75.0%，而GPT-5 mini仅为42.0%。

GPT-5.4 nano是该系列中最小的版本，主打速度和成本优先的任务场景。相较GPT-5 nano，性能亦有明显升级。

当然，性能提升的同时，定价也相应上调。

GPT-5.4 mini在API中定价为每百万输入token 0.75美元，每百万输出4.50美元；与之相比，GPT-5.4 nano为每百万输入0.20美元，每百万输出1.25美元。

对比上一代，GPT-5.4 mini输入价格是GPT-5 mini的3倍，输出价格的2.25倍；GPT-5.4 nano输入价格是GPT-5 nano的4倍，输出价格的3.125倍。

OpenAI在Codex平台中展示了一种子智能体架构的应用方式。在该架构中，GPT-5.4等大模型负责规划、协调和最终判断，同时将并行的子任务分派给GPT-5.4 mini或nano子智能体处理，例如搜索代码库、审查大文件或处理支持文档。

OpenAI表示，在Codex中，GPT-5.4 mini仅消耗GPT-5.4配额的30%，开发者处理简单编码任务的成本可降至约三分之一。这种分工模式的价值在于，随着小模型能力的增强，开发者可以构建更高效的系统——大模型负责决策，小模型快速执行。

GitHub产品高级总监布里坦尼·奥谢（Brittany O‘Shea）在测试后表示，GPT-5.4 mini在OpenAI的mini模型中首个token生成时间处于领先地位，浏览代码库顺畅，在类似grep（命令行文本搜索工具）的工作流程中表现突出。

Rox首席执行官伊珊·穆克吉（Ishan Mukherjee）分享了更具体的测试结果。他们在Rox的一系列真实工作流程中测试了GPT-5.4 mini，从网络研究智能体到对杂乱的CRM数据进行推理。穆克吉表示，该模型在需要连接多个来源并理解业务上下文的任务中，可以连续产生最有用的答案。

Mercor进行的评估显示，GPT-5.4 mini在xhigh推理能力下达到24.5%的Pass@1，优于Gemini 3.1 Flash Lite的12.8%和Sonnet 4.6的23.7%，但价格仅为后者的四分之一。

Mercor AI研究员伯蒂·韦根（Bertie Vidgen）指出，该模型在智能体任务上表现强劲，提高推理效率和token预算时，性能提升更为明显。

GPT-5.4 mini在多模态任务上也展现出较强能力，特别是与计算机使用相关的场景。

这款模型可以快速解读密集用户界面的屏幕截图，完成计算机使用任务。OSWorld-Verified测试中72.1%的成绩，使其性能接近GPT-5.4，并显著超过GPT-5 mini。

Hebbia首席技术官阿比拉什·夏尔马‌（Aabhas Sharma）对比测试后发现，GPT-5.4 mini在处理多项输出任务时，不仅成本更低，生成的答案质量和对引文的准确度也能与竞品媲美甚至更胜一筹。

同时，与参数规模更大的GPT-5.4模型相比，mini版本的任务完成率更高，生成内容的依据也更扎实可靠。

GPT-5.4 nano作为最小版本，主要面向分类、数据提取、排序等任务，以及处理简单支持任务的编码子智能体。

CodeRabbit AI副总裁David Loker评价称，GPT 5.4 nano相较上一代有大幅提升，不仅速度快了4倍以上、延迟更低，指令跟随能力也显著增强，成为其团队大部分上下文工程流程中的理想选择。

Whoop AI技术负责人维维亚诺·坎图（Viviano Cantu）在测试中发现，GPT-5.4 nano在提示词未作任何改动的情况下，表现优于当前基线和GPT-5.1、GPT-4.1等更大模型，且接近GPT-5.2的水平，同时输出token使用量极低。基于早期测试结果，他认为这是具有吸引力的生产候选模型。

Notion AI工程负责人阿比谢克·莫迪（Abhisek Modi）表示，GPT-5.4 mini在处理编辑页面等定义明确的任务时精度很高，尤其是在处理复杂格式时，以极少的计算量匹配并常超过GPT-5.2。

他还指出，过去只有最昂贵的模型能可靠处理智能体工具调用，如今GPT-5.4 mini和nano这类小模型已能轻松胜任，这让Notion上构建自定义智能体的用户可以精确选择所需的智能水平。

GPT-5.4 mini即日起在API、Codex和ChatGPT中上线。API版本支持400k上下文窗口，涵盖文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用和技能等功能。

在ChatGPT中，免费和Go用户可通过“+菜单中的‘Thinking’功能”使用GPT-5.4 mini。对于其他用户，GPT-5.4 mini作为GPT-5.4 Thinking的选项。GPT-5.4 nano则仅在API中提供。

AI交互聚合平台Poe已上线这两款模型。

Poe方面建议，GPT-5.4 nano适合快速大批量任务，如转写录音、给工单打标签、重写内容、快速RAG问答等对延迟和成本敏感的场景。

GPT-5.4 mini则适合需要一定推理能力的任务，如将杂乱的邮件整理成JSON、修复函数但不重写整个文件，或执行需要计划、检查结果并采取下一步的智能体任务。

Perplexity副CTO Jerry Ma总结称，GPT-5.4让mini和nano两款模型均有明显进步：mini推理能力强，nano在实时对话场景中响应迅速且高效。

特约编译金鹿对本文亦有贡献

2026年OpenAI推出GPT-5.4 mini与nano：性能显著提升，定价最高上涨4倍

相关推荐