OpenAI发布GPT-5.4模型，专注智能代理与办公场景能力提升

大家好，我是讯享网，很高兴认识大家。

新闻要点：OpenAI正式发布GPT-5.4模型，这是该公司首个专门为智能代理（AI Agents）设计的基础模型。新模型在推理、编码和专业工作场景（如电子表格、文档和演示文稿处理）方面有显著提升，并首次具备原生计算机操作能力。

具体工具/模型：GPT-5.4系列包括三个版本：基础版（API）、GPT-5.4 Thinking（ChatGPT增强版）和GPT-5.4 Pro（企业高性能版）。

能力说明：

• 可以直接操作计算机，跨应用程序完成任务

• 能根据屏幕截图发出键盘和鼠标指令

• 改进的网页浏览器使用能力

• 更精准地调用工具和API

• 在ChatGPT中，复杂查询时会提供工作大纲，允许用户中途调整请求

该模型现已面向ChatGPT、Codex和API用户推出，其中Thinking版本面向Plus、Team和Pro订阅用户，Pro版本则面向企业级用户。

来源链接：https://www.theverge.com/ai-artificial-intelligence//openai-gpt-5-4-model-release-ai-agents

新闻要点：OpenAI针对办公场景特别优化了GPT-5.4模型，使其在电子表格处理方面表现突出。据公司测试，新模型在GDPval基准测试中83%的情况下表现优于普通办公人员。

具体工具/模型：GPT-5.4办公版、OpenAI for Financial Services（金融服务工具包）

能力说明：

• 创建文件所需的尝试次数和交互轮次减少

• 使用更少的token解决问题，响应更快成本更低

• 可直接在Excel和Google Sheets中运行

• 合作伙伴包括FactSet、MSCI等金融数据公司

来源链接：https://www.axios.com/2026/03/05/openai-gpt-54-chatgpt-office

新闻要点：在发布GPT-5.4的同时，OpenAI还推出了GPT-5.3 Instant模型，专注于优化ChatGPT日常交互的流畅度和可靠性。

具体工具/模型：GPT-5.3 Instant

能力说明：

• 减少不必要的免责声明

• 对实际问题给出更清晰的回答

• 提供更有条理的解释

• 采用分层架构，简单问题由轻量模型快速响应，复杂问题才调用大型模型

该更新反映了AI行业从能力展示向基础设施优化的转变，重点提升系统在规模化应用中的性价比和可靠性。

来源链接：https://thenextweb.com/news/openai-launches-gpt-5-3-instant-to-improve-chatgpts-most-used-model

新闻要点：OpenAI公布的数据显示，GPT-5.4在多项专业工作基准测试中创下新高，特别是在计算机操作和专业知识工作方面表现突出。

具体工具/模型：GPT-5.4 Pro

能力说明：

• 在Mercor APEX-Agents测试中表现优异

• 新的工具搜索系统(Tool Search)可减少47%的token使用量

• 改进了思维链(Chain-of-Thought)安全性评估

• 在36台MCP服务器上的250项任务测试中证实其效率提升

来源链接：https://thenextweb.com/news/openai-gpt-54-launch-computer-use-benchmarks

新闻要点：随着GPT-5.4的发布，OpenAI与Anthropic之间的竞争进入新阶段。近期数据显示，Anthropic的Claude移动应用在苹果和谷歌应用商店登顶，网络论坛上出现大量从ChatGPT迁移到Claude的教程。

背景信息：

• Anthropic此前通过超级碗广告直接挑战ChatGPT

• 部分用户因OpenAI与美国政府的合作争议而转向Claude

• OpenAI CEO Sam Altman澄清不会向NSA等情报机构提供技术

• 公司此前宣布与国防部达成2亿美元合作协议

来源链接：https://www.cnet.com/tech/services-and-software/openai-chatgpt-5-4-thinking-news/

新闻要点：GPT-5.4的API版本引入了全新的工具搜索(Tool Search)系统，改变了以往需要一次性加载所有工具定义的模式，转而按需查找工具定义。

具体工具/模型：GPT-5.4 API、Tool Search系统

能力说明：

• 在工具数量庞大的系统中可显著降低token消耗

• 内部测试显示总token使用量减少47%

• 带来更快的响应速度和更低的开发成本

• 特别适合具有大量集成的大型代理系统

来源链接：https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/

新闻要点：OpenAI在一周内先后发布GPT-5.3 Instant和GPT-5.4两个重要模型更新，显示出AI行业竞争进入白热化阶段。目前各主要AI公司在不同领域各有所长：Anthropic的Claude在编码方面领先，Google的Gemini 3.1 Pro在抽象推理方面占优，而GPT-5.4则在计算机操作和专业工作场景表现**。

行业动态：

• OpenAI发布节奏加快，可能意在保持媒体关注度

• 基准测试更新速度加快，任何技术领先优势都难以持久

• 2026年将成为前沿AI竞争最激烈的年份之一

来源链接：https://thenextweb.com/news/openai-gpt-54-launch-computer-use-benchmarks

OpenAI发布GPT-5.4模型，专注智能代理与办公场景能力提升

相关推荐