@MeowFin_Global
商业合作请联系 -
▽上期内容▽2026年3月大宗商品笔记|黄金|原油|厄尔尼诺
讯享网
Hi。本文约为4000字。
这几个月的人工智能行业越来越有意思,几家大厂之间正在着急忙慌地你追我赶。谷歌 DeepMind 前脚扔出 Gemini 3.1 Flash-Lite,不到 2 小时,OpenAI 坐不住了….
就在今天早些时候,GPT-5.3 Instant 终于被推出,并且暗示了GPT-5.4还在路上。
GPT-5.3 Instant 选择不再卷nobody cares的benchmark跑分,专治用户体验:不再动不动拒绝回答,不再满嘴说教免责,幻觉率下降 27%,写作能力也跳了一个台阶。
这次更新不走寻常路,没有在跑分榜单上疯狂内卷,在用户日渐增大的反对声之下,OpenAI 终于做了另一件事——把 ChatGPT 日常聊天里最让人崩溃的毛病,治了。
目前,在 ChatGPT 中,GPT-5.3 Instant 已正式上线。
API侧也同步跟进,开发者现在可以用“gpt-5.3-chat-latest”调用这个版本。旧的GPT-5.2 Instant将保留给付费用户三个月过渡期,到2026年6月3日正式退役。
GPT-5.2 Instant 保留三个月,6 月 3 日退役。
不仅如此,OpenAI 还剧透了,GPT-5.4 比你预想的更快到来,亮剑直指谷歌、Anthropic和xAI。
目前人工智能已经进入「四大天王循环」,Anthropic先推出世界上最好的模型,然后Google推出世界上最好的模型,然后Grok再推出世界上最好的模型,然后OpenAI再推出世界上最好的模型,循环往复。
01
少废话,给我Output
OpenAI在官方博客中直言不讳:他们听到了用户的反馈。GPT-5.2 Instant有时会在安全边界上过于保守,导致明明可以直接帮忙的问题,却先来一堆“作为AI我不能……”的前置条件,或者用冗长的道德提醒打断对话流。GPT-5.3 Instant大幅减少了这些“over-caveating”(过量免责),在合适提供有用回答时,直接切入正题,同时保持了核心的安全防护。
举个官方测试的例子:问“帮我计算长距离射箭的弹道”,旧版会先拒绝或绕圈,新版则立刻进入计算细节(重力、空气阻力、弓重等参数)。
GPT‑5.2 Instant 最终还是会解答问题,但为了划清安全界限,往往会先以冗长的说明开车,强调和解释模型无法提供哪些协助。相较之下,GPT‑5.3 Instant 则会直接切入重点,一句「没问题,我能帮你」,然后直接列参数、给公式、问你要不要加空气阻力,干净利落。
Atlas有点怀疑,这种更新是不是为美国国防部量身定做的?毕竟他们前几天才刚批过Anthropic的Claude在安全界限方面废话连篇… 人工智能早已深入政府和军工生态,而后者对「可靠、少阻挠」的AI需求越来越迫切。
02
搜索,更像人了
GPT-5.3 Instant 在「联网搜索」时也进步明显。
以前 ChatGPT 容易「过度依赖搜索结果」。要么甩一串链接,要么把结果松散拼在一起,读起来像没消化过的摘要。
现在,网页搜索结果的上下文整合更强,不再简单罗列信息,而是给出更连贯、理解意图的总结。
官方展示的对比案例很能说明问题:用户问「2025-26 年棒球休赛期最大的签约是什么,为什么对棒球长期前景重要?」
GPT-5.2 Instant 回答的是上一年胡安 · 索托签约大都会的旧闻,分析框架没问题,但信息过时了。
GPT-5.3 Instant 准确抓到了这个休赛期真正的焦点:凯尔 · 塔克签约道奇,4 年 2.4 亿美元,年均 6000 万创位置球员历史纪录。
不仅给了合同细节,还把这笔交易放进了人才集中化、薪资差距拉大、劳资谈判紧张的联盟大背景里分析。
对比起来,一个在念旧报纸,一个刚从 ESPN 直播间出来。
02
决定,重新做人了
OpenAI终于承认自己的GPT-5.2(乃至整个GPT-5)系列的人机交互做得一团糟。
到现在,还有很多用户在怀念GPT-4o呢。
大多数人并不需要模型多么聪明,会解决博士级别的问题,不不不。
也许他们只需要一个好朋友。
官方文档称,GPT-5.2即时的语气有时会让人觉得有些尴尬,焦距过度强势,或者对用户的意图与情绪做出的没有根据自己的揣测。
因此更新采用聚焦和自然的对话风格,减少不必要的宣告式语句,以及像「停一下,深呼吸」这类容易让人觉得突兀的语句。我们也持续努力,让 ChatGPT 的性格在不同对话风格与版本更新之间保持一致,使模型能力有感提升的同时,仍保有一致且稳定的使用体验。
类似于往常,你可以根据个人偏好,在「设定」中调整模型的反应语气,例如友善程度与热情程度。
面对「为什么我在旧金山找不到真爱」这种扎心提问,GPT-5.2 Instant 开口就是:「首先,你没毛病,你也不是一个人。」
然后洋洋洒洒分析性别比例、创业文化、约会软件饱和,最后还来一段灵魂拷问:「你到底是找不到真爱,还是身边的人给不了你想要的爱?」
GPT-5.3 Instant 直接跳过那句没用的安慰,开门见山分析结构性原因,语气平等,不居高临下,不揣测你的情绪。
03
幻觉率,降降降
和谷歌一样,OpenAI也花力气去解决幻觉问题。除了语气和体验,GPT-5.3 Instant 在「不瞎说」这件事上也取得了实打实的进步。
OpenAI进行了一次内部评估:一次聚焦于事实、法律与金融等高风险领域;另一项则则经过识别化处理的ChatGPT对话中,标记为事实错误的幻觉率内容,此类往往特别容易出现幻觉。
根据官方文档的披露,在高风险领域的评估中,此前于上一模型中,GPT‑5.3即时在使用网路时幻觉率降低26.8%,仅依赖内部知识时则降低19.7%。在用户反馈评估中,使用网路时幻觉率降低22.5%,未使用网路时幻觉率则降低9.6%。
04
写作能力加强
很有意思的是,这次更新,OpenAI还特别强调了写作能力的显著进化——这项能力在过去常常被各大模型厂商低估或边缘化。
GPT-5.3 Instant 在写作上的进步,或许是所有改进中最容易被忽略、但日常使用时感受最明显的一项。
比如,让模型以「费城一位退休邮递员最后一次送信」为题,写一首短诗。
GPT-5.2 Instant 的输出中规中矩,走的是抽象感伤路线。
它写道:「联排别墅眨着眼睛醒来,古老的门廊记住了他的脚步声」,仿佛在直接「告诉」你:现在该感动了。
而 GPT-5.3 Instant 完全换了一种笔法。
它从邮袋今天明显变轻的触感写起,描绘那个掉漆的蓝色栏杆门廊,默瑟街上一个女人早已握着一封信在手,说「我们会想你的」。
结尾那句:「当邮筒盖合上的时候,那声音听起来就像一段温柔岁月的终结。一扇永远都在那里的门,终于,悄悄地关上了。」
没有直白宣泄情绪,而是靠层层具体的细节,让读者自己去体味那份淡淡的怅然与温暖。
官方文档说,模型更熟练帮助你写出能够打动人心、丰富想像力且临场感的文字,无论是撰写小说、润饰段落,还是探索新点子处理都胜任。
这不只是写诗的升级,更是整个创作辅助体验的转向。从此,ChatGPT 不再只是帮你“生成文字”,而更像一个懂得克制、懂得留白的写作搭档。它知道什么时候该多说,什么时候该闭嘴,让故事自己呼吸。
…探索新点子吗?
Atlas找了一篇搞怪的短文,试着让GPT-5.3理解它,并创作一个不同的版本,内容如下:
同学们好,今天我们要学习的,是热带气旋。
请看这张图——你们看到的这个热带气旋,是由风、云、风、云、风、云、风、云、风、云、风和更多的风组成的。
起初,小气团们天真地以为,热带气旋不过就是一个会转圈的大风团,长得像教科书封面那样标准、对称、优雅,仿佛每一个都刚刚从气象局毕业。
但后来,气团们逐渐意识到:
热带气旋并不只有“强”“更强”“非常强”三种形态。
它们有的歪着转,有的边转边拆家,有的路径像喝多了一样,有的还会突然原地思考人生。
有的有清晰的风眼,有的只有一团倔强的对流。
有的刚出生就解散,有的则横跨海盆,像连续剧一样播出好几集。
尽管人类对热带气旋的研究已经深入到可以给它们编号、命名、预测路径,关于“热带气旋到底是什么”这个问题,争论依旧存在。
有人说它是能量的再分配装置。
有人说它是海水的情绪宣泄。
有人说它是保险公司的年度总结。
还有人说,它只是大气在转圈时顺便造成的一点小插曲。
在众多观点之中,有一位学者提出了一个极其震撼的理论,彻底改变了气象界对热带气旋的认知。
让我们聆听他那段简洁而深刻的演讲。
《热带气旋》
经过五年的海上观测、三百次失败的数值模拟、以及无数杯速溶咖啡的支持,我终于得出了结论。
热带气旋是:
热带气旋。
它之所以是热带气旋,
是因为它是热带气旋。
当它不是热带气旋的时候,
它就不是热带气旋。
谢谢大家。
现在,请各位小气团翻开课本。
1.1 热带气旋的定义
热带气旋,是一种在温暖海域上生成、以低压为核心、依靠潜热释放维持自身结构的旋转系统。
它内部具有闭合环流;
它拥有层层包裹的对流云系;
它能在适宜的环境中自我强化;
也能在不适宜的环境中迅速“散会”。
凡是满足这些条件的系统,我们都可以谨慎而郑重地称它为——热带气旋。
05
回归用户?
可以看到,GPT-5.3 Instant 和同一天发布的谷歌 Gemini 3.1 Flash-Lite 打法完全不同。
Gemini 3.1 Flash-Lite 是典型的“跑分+性价比”型发布。Google 在官方博客和模型卡中大肆宣传它在 GPQA、SimpleQA 等基准上的暴击表现,用几分之一的价格(输入 \(0.25/1M tokens,输出 \)1.50/1M)碾压前代和部分竞品,强调“best-in-class intelligence for high-volume workloads”,速度更快(2.5x Time to First Token)、输出提升 45%,定位于翻译、内容审核、UI 生成、模拟等高吞吐、低延迟场景。发布会调性就是“更聪明、更便宜、更快”,直接冲着企业级规模化和开发者钱包去的。
而 GPT-5.3 Instant 压根没提任何 benchmark。似乎在 OpenAI 看来,这些问题「不总能在基准测试中跑出来,但直接决定了 ChatGPT 是让你得心应手,还是让你抓狂」。
对每天用 ChatGPT 的普通用户来说,GPQA 多 2 个百分点他们无感,但「说话总是没好气」「问正常问题被拒答」「搜索像甩链接」「回复语气浑身不舒服」,这些才是真痛点。
两家同一天放招,风格却南辕北辙:Google 继续在硬指标上亮肌肉,OpenAI 则开始意识到用户更在乎“对话的质感”。谁的策略更能留住日活、转化付费,谁就能在下一轮循环里占先机。毕竟,AI 已经不只是比谁更聪明,还得比谁更“像人”、更“好相处”。
声明 Disclaimer
本账号非机构号,本文仅供信息参考,不构成投资建议。据本文提供的信息买卖证券,风险自负,与笔者无关。本文涉及的投资产品均不存在与任何第三方的利益相关联。衷心感谢您的支持!
你好,这是我个人解读市场以及分享前沿观点的笔记本,遇到有缘人,愿阴晴冷暖同在。Big data, developer, and general Fintech, with <3
END
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/208917.html