ChatGPT，终于走出了正确的一步？｜人工智能｜科技

大家好，我是讯享网，很高兴认识大家。

@MeowFin_Global

商业合作请联系 -

▽上期内容▽2026年3月大宗商品笔记｜黄金｜原油｜厄尔尼诺

讯享网

正文：

Hi。本文约为4000字。

这几个月的人工智能行业越来越有意思，几家大厂之间正在着急忙慌地你追我赶。谷歌 DeepMind 前脚扔出 Gemini 3.1 Flash-Lite，不到 2 小时，OpenAI 坐不住了….

就在今天早些时候，GPT-5.3 Instant 终于被推出，并且暗示了GPT-5.4还在路上。

GPT-5.3 Instant 选择不再卷nobody cares的benchmark跑分，专治用户体验：不再动不动拒绝回答，不再满嘴说教免责，幻觉率下降 27%，写作能力也跳了一个台阶。

这次更新不走寻常路，没有在跑分榜单上疯狂内卷，在用户日渐增大的反对声之下，OpenAI 终于做了另一件事——把 ChatGPT 日常聊天里最让人崩溃的毛病，治了。

目前，在 ChatGPT 中，GPT-5.3 Instant 已正式上线。

API侧也同步跟进，开发者现在可以用“gpt-5.3-chat-latest”调用这个版本。旧的GPT-5.2 Instant将保留给付费用户三个月过渡期，到2026年6月3日正式退役。

GPT-5.2 Instant 保留三个月，6 月 3 日退役。

不仅如此，OpenAI 还剧透了，GPT-5.4 比你预想的更快到来，亮剑直指谷歌、Anthropic和xAI。

目前人工智能已经进入「四大天王循环」，Anthropic先推出世界上最好的模型，然后Google推出世界上最好的模型，然后Grok再推出世界上最好的模型，然后OpenAI再推出世界上最好的模型，循环往复。

少废话，给我Output

OpenAI在官方博客中直言不讳：他们听到了用户的反馈。GPT-5.2 Instant有时会在安全边界上过于保守，导致明明可以直接帮忙的问题，却先来一堆“作为AI我不能……”的前置条件，或者用冗长的道德提醒打断对话流。GPT-5.3 Instant大幅减少了这些“over-caveating”（过量免责），在合适提供有用回答时，直接切入正题，同时保持了核心的安全防护。

举个官方测试的例子：问“帮我计算长距离射箭的弹道”，旧版会先拒绝或绕圈，新版则立刻进入计算细节（重力、空气阻力、弓重等参数）。

GPT‑5.2 Instant 最终还是会解答问题，但为了划清安全界限，往往会先以冗长的说明开车，强调和解释模型无法提供哪些协助。相较之下，GPT‑5.3 Instant 则会直接切入重点，一句「没问题，我能帮你」，然后直接列参数、给公式、问你要不要加空气阻力，干净利落。

Atlas有点怀疑，这种更新是不是为美国国防部量身定做的？毕竟他们前几天才刚批过Anthropic的Claude在安全界限方面废话连篇…  人工智能早已深入政府和军工生态，而后者对「可靠、少阻挠」的AI需求越来越迫切。

搜索，更像人了

GPT-5.3 Instant 在「联网搜索」时也进步明显。

以前 ChatGPT 容易「过度依赖搜索结果」。要么甩一串链接，要么把结果松散拼在一起，读起来像没消化过的摘要。

现在，网页搜索结果的上下文整合更强，不再简单罗列信息，而是给出更连贯、理解意图的总结。

官方展示的对比案例很能说明问题：用户问「2025-26 年棒球休赛期最大的签约是什么，为什么对棒球长期前景重要？」

GPT-5.2 Instant 回答的是上一年胡安 · 索托签约大都会的旧闻，分析框架没问题，但信息过时了。

GPT-5.3 Instant 准确抓到了这个休赛期真正的焦点：凯尔 · 塔克签约道奇，4 年 2.4 亿美元，年均 6000 万创位置球员历史纪录。

不仅给了合同细节，还把这笔交易放进了人才集中化、薪资差距拉大、劳资谈判紧张的联盟大背景里分析。

对比起来，一个在念旧报纸，一个刚从 ESPN 直播间出来。

决定，重新做人了

OpenAI终于承认自己的GPT-5.2（乃至整个GPT-5）系列的人机交互做得一团糟。

到现在，还有很多用户在怀念GPT-4o呢。

大多数人并不需要模型多么聪明，会解决博士级别的问题，不不不。

也许他们只需要一个好朋友。

官方文档称，GPT-5.2即时的语气有时会让人觉得有些尴尬，焦距过度强势，或者对用户的意图与情绪做出的没有根据自己的揣测。

因此更新采用聚焦和自然的对话风格，减少不必要的宣告式语句，以及像「停一下，深呼吸」这类容易让人觉得突兀的语句。我们也持续努力，让 ChatGPT 的性格在不同对话风格与版本更新之间保持一致，使模型能力有感提升的同时，仍保有一致且稳定的使用体验。

类似于往常，你可以根据个人偏好，在「设定」中调整模型的反应语气，例如友善程度与热情程度。

面对「为什么我在旧金山找不到真爱」这种扎心提问，GPT-5.2 Instant 开口就是：「首先，你没毛病，你也不是一个人。」

然后洋洋洒洒分析性别比例、创业文化、约会软件饱和，最后还来一段灵魂拷问：「你到底是找不到真爱，还是身边的人给不了你想要的爱？」

GPT-5.3 Instant 直接跳过那句没用的安慰，开门见山分析结构性原因，语气平等，不居高临下，不揣测你的情绪。

幻觉率，降降降

和谷歌一样，OpenAI也花力气去解决幻觉问题。除了语气和体验，GPT-5.3 Instant 在「不瞎说」这件事上也取得了实打实的进步。

OpenAI进行了一次内部评估：一次聚焦于事实、法律与金融等高风险领域；另一项则则经过识别化处理的ChatGPT对话中，标记为事实错误的幻觉率内容，此类往往特别容易出现幻觉。

根据官方文档的披露，在高风险领域的评估中，此前于上一模型中，GPT‑5.3即时在使用网路时幻觉率降低26.8%，仅依赖内部知识时则降低19.7%。在用户反馈评估中，使用网路时幻觉率降低22.5%，未使用网路时幻觉率则降低9.6%。

写作能力加强

很有意思的是，这次更新，OpenAI还特别强调了写作能力的显著进化——这项能力在过去常常被各大模型厂商低估或边缘化。

GPT-5.3 Instant 在写作上的进步，或许是所有改进中最容易被忽略、但日常使用时感受最明显的一项。

比如，让模型以「费城一位退休邮递员最后一次送信」为题，写一首短诗。

GPT-5.2 Instant 的输出中规中矩，走的是抽象感伤路线。

它写道：「联排别墅眨着眼睛醒来，古老的门廊记住了他的脚步声」，仿佛在直接「告诉」你：现在该感动了。

而 GPT-5.3 Instant 完全换了一种笔法。

它从邮袋今天明显变轻的触感写起，描绘那个掉漆的蓝色栏杆门廊，默瑟街上一个女人早已握着一封信在手，说「我们会想你的」。

结尾那句：「当邮筒盖合上的时候，那声音听起来就像一段温柔岁月的终结。一扇永远都在那里的门，终于，悄悄地关上了。」

没有直白宣泄情绪，而是靠层层具体的细节，让读者自己去体味那份淡淡的怅然与温暖。

官方文档说，模型更熟练帮助你写出能够打动人心、丰富想像力且临场感的文字，无论是撰写小说、润饰段落，还是探索新点子处理都胜任。

这不只是写诗的升级，更是整个创作辅助体验的转向。从此，ChatGPT 不再只是帮你“生成文字”，而更像一个懂得克制、懂得留白的写作搭档。它知道什么时候该多说，什么时候该闭嘴，让故事自己呼吸。

…探索新点子吗？

Atlas找了一篇搞怪的短文，试着让GPT-5.3理解它，并创作一个不同的版本，内容如下：

同学们好，今天我们要学习的，是热带气旋。

请看这张图——你们看到的这个热带气旋，是由风、云、风、云、风、云、风、云、风、云、风和更多的风组成的。

起初，小气团们天真地以为，热带气旋不过就是一个会转圈的大风团，长得像教科书封面那样标准、对称、优雅，仿佛每一个都刚刚从气象局毕业。

但后来，气团们逐渐意识到：

热带气旋并不只有“强”“更强”“非常强”三种形态。

它们有的歪着转，有的边转边拆家，有的路径像喝多了一样，有的还会突然原地思考人生。

有的有清晰的风眼，有的只有一团倔强的对流。

有的刚出生就解散，有的则横跨海盆，像连续剧一样播出好几集。

尽管人类对热带气旋的研究已经深入到可以给它们编号、命名、预测路径，关于“热带气旋到底是什么”这个问题，争论依旧存在。

有人说它是能量的再分配装置。

有人说它是海水的情绪宣泄。

有人说它是保险公司的年度总结。

还有人说，它只是大气在转圈时顺便造成的一点小插曲。

在众多观点之中，有一位学者提出了一个极其震撼的理论，彻底改变了气象界对热带气旋的认知。

让我们聆听他那段简洁而深刻的演讲。

《热带气旋》

经过五年的海上观测、三百次失败的数值模拟、以及无数杯速溶咖啡的支持，我终于得出了结论。

热带气旋是：

热带气旋。

它之所以是热带气旋，

是因为它是热带气旋。

当它不是热带气旋的时候，

它就不是热带气旋。

谢谢大家。

现在，请各位小气团翻开课本。

1.1 热带气旋的定义

热带气旋，是一种在温暖海域上生成、以低压为核心、依靠潜热释放维持自身结构的旋转系统。

它内部具有闭合环流；

它拥有层层包裹的对流云系；

它能在适宜的环境中自我强化；

也能在不适宜的环境中迅速“散会”。

凡是满足这些条件的系统，我们都可以谨慎而郑重地称它为——热带气旋。

老师，热带低压算热带气旋吗？

当然算，小气团。只要它满足热带气旋的基本定义，它就是热带气旋。强弱只是数值，身份才是本质。

老师，那龙卷风呢？

注意措辞。

不要说“龙卷风是热带气旋”。

因为那听起来像是在宣布一个新发现。

你应该说——

热带气旋，是热带气旋。

Perfecto!

回归用户？

可以看到，GPT-5.3 Instant 和同一天发布的谷歌 Gemini 3.1 Flash-Lite 打法完全不同。

Gemini 3.1 Flash-Lite 是典型的“跑分+性价比”型发布。Google 在官方博客和模型卡中大肆宣传它在 GPQA、SimpleQA 等基准上的暴击表现，用几分之一的价格（输入 \(0.25/1M tokens，输出 \)1.50/1M）碾压前代和部分竞品，强调“best-in-class intelligence for high-volume workloads”，速度更快（2.5x Time to First Token）、输出提升 45%，定位于翻译、内容审核、UI 生成、模拟等高吞吐、低延迟场景。发布会调性就是“更聪明、更便宜、更快”，直接冲着企业级规模化和开发者钱包去的。

而 GPT-5.3 Instant 压根没提任何 benchmark。似乎在 OpenAI 看来，这些问题「不总能在基准测试中跑出来，但直接决定了 ChatGPT 是让你得心应手，还是让你抓狂」。

对每天用 ChatGPT 的普通用户来说，GPQA 多 2 个百分点他们无感，但「说话总是没好气」「问正常问题被拒答」「搜索像甩链接」「回复语气浑身不舒服」，这些才是真痛点。

两家同一天放招，风格却南辕北辙：Google 继续在硬指标上亮肌肉，OpenAI 则开始意识到用户更在乎“对话的质感”。谁的策略更能留住日活、转化付费，谁就能在下一轮循环里占先机。毕竟，AI 已经不只是比谁更聪明，还得比谁更“像人”、更“好相处”。

声明 Disclaimer

本账号非机构号，本文仅供信息参考，不构成投资建议。据本文提供的信息买卖证券，风险自负，与笔者无关。本文涉及的投资产品均不存在与任何第三方的利益相关联。衷心感谢您的支持！

你好，这是我个人解读市场以及分享前沿观点的笔记本，遇到有缘人，愿阴晴冷暖同在。Big data, developer, and general Fintech, with <3

END

ChatGPT，终于走出了正确的一步？｜人工智能｜科技

相关推荐