quyue858：一个匿名模型能否在一天之内改变一家AI公司的估值？代号为PonyAlpha的大模型本周突然出现在OpenRouter上，在该平台的搜索榜上排到第1名，被不少海外开发者拿来和GPT‑4、Claude对比测试，重点看编码与工具调用这两块的“硬指标”。从公开测评看，有开发者给出的粗略统计是，几十道中高难度代码题里，PonyAlpha一次性通过率明显高于他们手头的旧模

科技前沿 • 2026-03-10 18:17 • 阅读 16

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

一个匿名模型能否在一天之内改变一家AI公司的估值？

代号为PonyAlpha的大模型本周突然出现在OpenRouter上，在该平台的搜索榜上排到第1名，被不少海外开发者拿来和GPT‑4、Claude对比测试，重点看编码与工具调用这两块的“硬指标”。

从公开测评看，有开发者给出的粗略统计是，几十道中高难度代码题里，PonyAlpha一次性通过率明显高于他们手头的旧模型版本，这类用例占他们日常工作场景的70%以上，所以直观感受会被放大。

模型身份目前只有两种主流猜测：要么是DeepSeek‑V4，要么是智谱即将发布的GLM‑5。之所以直接联想到智谱，是因为GLM系列在全球开源模型调用量榜单中已经稳居前10，而GLM‑4.6在Code Arena上与GPT‑4并列第1，这两个数据给了市场充足的“联想空间”。

二级市场的反应更直接：在消息扩散的同一天，智谱股价盘中一度拉升近40%，单日市值增加超过100亿港元，而这家公司过去3年累计研发投入约44亿元人民币、营收据称翻了5倍，本就被视为“高投入、高不确定性”的典型样本。

这也暴露出一个现实：在大模型还缺乏长期稳定评测体系的阶段，少量性能样本、几条开发者评价，加上一段平台热度曲线，就足以在短时间内推动资金做出接近“满仓情绪化”的选择，技术信号和交易动机经常被混在同一个故事里讲。

如果PonyAlpha真的是GLM‑5，中国大模型在部分前沿指标上接近甚至短暂领跑并非不可能，但问题在于：你更看重一两次爆发式榜单成绩，还是看重3年以上、覆盖多行业的稳定表现？你会怎样平衡对匿名模型技术潜力的期待，与对相关公司股价波动的理性判断？

GPT plus 代充只需 145

相关推荐