新闻要点:OpenAI正式发布GPT-5.4模型,这是该公司首个专门为智能代理(AI Agents)设计的基础模型。新模型在推理、编码和专业工作场景(如电子表格、文档和演示文稿处理)方面有显著提升,并首次具备原生计算机操作能力。
具体工具/模型:GPT-5.4系列包括三个版本:基础版(API)、GPT-5.4 Thinking(ChatGPT增强版)和GPT-5.4 Pro(企业高性能版)。
能力说明:
• 可以直接操作计算机,跨应用程序完成任务
• 能根据屏幕截图发出键盘和鼠标指令
• 改进的网页浏览器使用能力
• 更精准地调用工具和API
• 在ChatGPT中,复杂查询时会提供工作大纲,允许用户中途调整请求
该模型现已面向ChatGPT、Codex和API用户推出,其中Thinking版本面向Plus、Team和Pro订阅用户,Pro版本则面向企业级用户。
来源链接:https://www.theverge.com/ai-artificial-intelligence//openai-gpt-5-4-model-release-ai-agents
新闻要点:OpenAI针对办公场景特别优化了GPT-5.4模型,使其在电子表格处理方面表现突出。据公司测试,新模型在GDPval基准测试中83%的情况下表现优于普通办公人员。
具体工具/模型:GPT-5.4办公版、OpenAI for Financial Services(金融服务工具包)
能力说明:
• 创建文件所需的尝试次数和交互轮次减少
• 使用更少的token解决问题,响应更快成本更低
• 可直接在Excel和Google Sheets中运行
• 合作伙伴包括FactSet、MSCI等金融数据公司
来源链接:https://www.axios.com/2026/03/05/openai-gpt-54-chatgpt-office
新闻要点:在发布GPT-5.4的同时,OpenAI还推出了GPT-5.3 Instant模型,专注于优化ChatGPT日常交互的流畅度和可靠性。
具体工具/模型:GPT-5.3 Instant
能力说明:
• 减少不必要的免责声明
• 对实际问题给出更清晰的回答
• 提供更有条理的解释
• 采用分层架构,简单问题由轻量模型快速响应,复杂问题才调用大型模型
该更新反映了AI行业从能力展示向基础设施优化的转变,重点提升系统在规模化应用中的性价比和可靠性。
来源链接:https://thenextweb.com/news/openai-launches-gpt-5-3-instant-to-improve-chatgpts-most-used-model
新闻要点:OpenAI公布的数据显示,GPT-5.4在多项专业工作基准测试中创下新高,特别是在计算机操作和专业知识工作方面表现突出。
具体工具/模型:GPT-5.4 Pro
能力说明:
• 在Mercor APEX-Agents测试中表现优异
• 新的工具搜索系统(Tool Search)可减少47%的token使用量
• 改进了思维链(Chain-of-Thought)安全性评估
• 在36台MCP服务器上的250项任务测试中证实其效率提升
来源链接:https://thenextweb.com/news/openai-gpt-54-launch-computer-use-benchmarks
新闻要点:随着GPT-5.4的发布,OpenAI与Anthropic之间的竞争进入新阶段。近期数据显示,Anthropic的Claude移动应用在苹果和谷歌应用商店登顶,网络论坛上出现大量从ChatGPT迁移到Claude的教程。
背景信息:
• Anthropic此前通过超级碗广告直接挑战ChatGPT
• 部分用户因OpenAI与美国政府的合作争议而转向Claude
• OpenAI CEO Sam Altman澄清不会向NSA等情报机构提供技术
• 公司此前宣布与国防部达成2亿美元合作协议
来源链接:https://www.cnet.com/tech/services-and-software/openai-chatgpt-5-4-thinking-news/
新闻要点:GPT-5.4的API版本引入了全新的工具搜索(Tool Search)系统,改变了以往需要一次性加载所有工具定义的模式,转而按需查找工具定义。
具体工具/模型:GPT-5.4 API、Tool Search系统
能力说明:
• 在工具数量庞大的系统中可显著降低token消耗
• 内部测试显示总token使用量减少47%
• 带来更快的响应速度和更低的开发成本
• 特别适合具有大量集成的大型代理系统
来源链接:https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/
新闻要点:OpenAI在一周内先后发布GPT-5.3 Instant和GPT-5.4两个重要模型更新,显示出AI行业竞争进入白热化阶段。目前各主要AI公司在不同领域各有所长:Anthropic的Claude在编码方面领先,Google的Gemini 3.1 Pro在抽象推理方面占优,而GPT-5.4则在计算机操作和专业工作场景表现**。
行业动态:
• OpenAI发布节奏加快,可能意在保持媒体关注度
• 基准测试更新速度加快,任何技术领先优势都难以持久
• 2026年将成为前沿AI竞争最激烈的年份之一
来源链接:https://thenextweb.com/news/openai-gpt-54-launch-computer-use-benchmarks
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/208831.html