亦心木:深夜炸场!OpenAI发布GPT

亦心木:深夜炸场!OpenAI发布GPT深夜炸场 OpenAI 发布 GPT 5 4 能自己操作电脑 做 PPT 写代码 打工人真的慌了 3 月 6 日凌晨 OpenAI 突然甩出 王炸 全新大模型 GPT 5 4 正式发布 这可不是一次普通的升级 它能把编程 推理 电脑操控 网页搜索全部整合进同一个模型 而且官方号称 十次对比中有八次以上 AI 的产出超过人类专业人士 01 一夜之间 AI 从 聊天 变成 干活 这次发布有点突然 但看点十足

大家好,我是讯享网,很高兴认识大家。



深夜炸场!
OpenAI发布GPT-5.4:
能自己操作电脑、做PPT、写代码,打工人真的慌了

3月6日凌晨,OpenAI突然甩出“王炸”——全新大模型GPT-5.4正式发布。
这可不是一次普通的升级。它能把编程、推理、电脑操控、网页搜索全部整合进同一个模型,而且官方号称:十次对比中有八次以上,AI的产出超过人类专业人士。

01 一夜之间,AI从“聊天”变成“干活”

这次发布有点突然,但看点十足。

OpenAI一口气推出了两个版本:
- GPT-5.4 Thinking:面向ChatGPT付费用户,擅长复杂推理
- GPT-5.4 Pro:面向企业客户,性能更强

但真正炸裂的,不是版本本身,而是它干的事——

GPT-5.4能自己操作电脑了。

这是OpenAI首个原生内置“计算机使用”能力的通用模型。

什么意思?

它不只是输出文字,而是能“看懂”你的屏幕:识别按钮、移动鼠标、敲键盘、在软件之间切换。发邮件、排日程、填表格、跑流程,这些以前需要你亲手点来点去的活儿,现在它自己就能干。

AI操作电脑,已经比人类更熟练了。

02 十个任务里八个,AI做得比你好

如果说电脑操作是“硬功夫”,那知识工作就是GPT-5.4的“软实力”。

OpenAI搞了个很狠的测试叫GDPval,覆盖美国GDP贡献最大的9个行业、44种职业,让AI真刀真枪地干真实的活儿:做销售演示文稿、做会计电子表格、排急诊班表、做制造图表。

然后把AI的成果交给行业里的真专业人士盲测打分。

结果:GPT-5.4在83.0%的任务中,达到或超过了人类专业水平。

对比一下上代GPT-5.2的70.9%,直接拉开12个百分点。

还有幻觉问题——AI“编瞎话”一直是进专业场景的最大拦路虎。这次GPT-5.4单条陈述出错的概率降低了33%,完整回复含有错误的概率降低18%,成为OpenAI迄今为止最“讲事实”的模型。

03 代码能力:写代码、测代码,一条龙全包了

以前用AI写代码,经常得在“聪明的模型”和“能写代码的模型”之间来回切换。

GPT-5.4把这事给终结了。

它完整继承了GPT-5.3-Codex的编程能力,在SWE-Bench Pro基准测试中得分57.7%,比上代还略高一点。

而且不止是写代码。新推出的Playwright Interactive实验功能,让GPT-5.4能边写代码、边在浏览器里实时调试自己正在构建的应用——它同时承担了开发者和测试员两个角色。

有人用一条提示词,让GPT-5.4生成了一个完整的主题公园模拟经营游戏:路径铺设、景点建设、游客AI寻路、排队行为、资金和满意度动态更新……全自动跑起来。

还有人让它写了个Minecraft克隆版,花了约24分钟,运行流畅。

04 百万Token+工具搜索:能一口气读完整本书

GPT-5.4的上下文窗口升级到了100万token。

啥概念?

差不多能一次性处理一套《三体》三部曲的长度。对于企业来说,意味着可以把一个完整项目的代码库、整套财务记录、全部相关文档,一次性塞进同一次对话。

但OpenAI也提醒:超过27万token之后,会按两倍用量计入配额,用之前得想清楚是不是真需要这么长。

更聪明的设计是工具搜索。

以前AI要调用工具,得把所有工具说明一股脑塞进提示词里,占地方还费钱。现在GPT-5.4先拿一份简单的工具清单,真正需要用哪个,再去查详细说明。

05 定价和可用性

当然,好东西不便宜。

GPT-5.4 API的定价:
- 输入:2.5美元/百万token
- 输出:15美元/百万token

GPT-5.4 Pro更贵:输入30美元/百万token,输出180美元/百万token。

但因为token效率提升,许多任务的总成本反而会降低。

目前,GPT-5.4 Thinking已向ChatGPT Plus、Team和Pro用户开放,取代此前的GPT-5.2 Thinking。GPT-5.4 Pro面向Pro和Enterprise用户。

上代GPT-5.2 Thinking将在2026年6月5日正式退役。

有人说,这次发布的真正意义,不是分数,是方向。

过去两年,大模型竞争集中在规模、参数与价格。现在,重心正在转向另一件事:谁能真正让AI完成任务。

百万token上下文 + 推理计算 + 原生计算机使用,三条技术路线第一次汇合在一起。

AI不再只是“聊天助手”,正在变成可以理解任务、规划步骤并执行操作的数字员工。

发邮件、做表格、写代码、跑流程——这些活儿,以后可能真的不用你亲自干了。

问题已经不是AI能不能理解工作。

而是:你准备好了吗?



你用过GPT-5.4了吗?感觉怎么样?评论区聊聊~














































































































































































































































































































小讯
上一篇 2026-03-09 07:46
下一篇 2026-03-09 07:51

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/208760.html