随着人工智能技术的飞速发展,OpenAI 再次震撼发布了针对专业化工作负载能力最强、效率最高的前沿模型——GPT-5.4 及专为复杂任务设计的 GPT-5.4 Pro。这次更新不仅整合了顶尖的推理与编程能力,更是首次原生支持了“计算机使用”功能。
- 直连测试地址: chat.aigc.bar
- 平台优势: 数据同步更新,支持体验最新模型。无论是寻求 Chatgpt官方中文版 的流畅体验,还是需要高频调用 API 的开发者,ChatGpt镜像 都能提供极大的便利,完美解决 CHATGPT国内使用 的痛点。
- 在与行业专业人士的横向评测中,GPT-5.4 在 83.0% 的案例里达到了持平或更优的水准(GPT-5.2 为 71.0%)。
- 在初级投行分析师水平的电子表格建模任务内部基准测试中,GPT-5.4 平均得分达到 87.5% (GPT-5.2 为 68.4%)。
- 在演示文稿(PPT)评估中,其审美水平和视觉元素运用大幅提升。
全新 Thinking 模式: 目前在 ChatGPT 中,GPT-5.4 Thinking 现可预先提供其思考计划(前言 Preamble)。这允许用户在模型运行中途实时调整方向,无需额外多轮沟通即可获得契合需求的结果。
2. 突破性的“计算机使用”与视觉感知
GPT-5.4 是首款原生具备顶尖计算机使用能力的通用模型。它不仅能通过代码操作计算机,还能直接通过屏幕截图下达鼠标和键盘指令。
- OSWorld-Verified 测试: 评估模型导航桌面环境的能力,GPT-5.4 成功率高达 75.0% ,远超人类的 72.4% 及前代的 47.3%。
- 极致视觉保真度: 全新支持最高 1000 万总像素或 6K 分辨率的原始图像输入精度,定位、理解与点击准确度显著提升。
- 文档解析: 在 OmniDocBench 测试中,GPT-5.4 的平均误差降至 0.109(越低越好)。
以往调用工具需要将所有定义预加载到提示词中,极其消耗 Token。现在,模型只需接收精简列表,即时查找并调用所需工具定义。在内部基准测试中,保持同等准确率的前提下,该功能将总 Token 使用量降低了 47% 。
此外,更强大的联网搜索能力让 GPT-5.4 Pro 在 BrowseComp 测试中创下了 89.3% 的惊人纪录,极擅长处理“大海捞针”式的复杂查询。
4. 编程能力进化
全面继承了 Codex 的编程优势,在长时间运行的代码任务、迭代与调试中表现卓越。开启 API 或 Codex 中的 /fast 模式后,可获得高达 1.8 倍的性能提升。
| API 模型 | 输入价格 (每百万 token) | 缓存输入价格 (每百万 token) | 输出价格 (每百万 token) |
|---|---|---|---|
| gpt-5.4 | \(2.50 | \)0.25 | \(15 |
| gpt-5.2 | \)1.75 | \(0.175 | \)14 |
| gpt-5.4-pro | \(30 | - | \)180 |
| gpt-5.2-pro | \(21 | - | \)168 |
(注:Batch 和 Flex 价格为标准费率的 50%,Priority 优先处理为标准费率的 2 倍)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/223414.html