quyue858:一个匿名模型能否在一天之内改变一家AI公司的估值?代号为PonyAlpha的大模型本周突然出现在OpenRouter上,在该平台的搜索榜上排到第1名,被不少海外开发者拿来和GPT‑4、Claude对比测试,重点看编码与工具调用这两块的“硬指标”。从公开测评看,有开发者给出的粗略统计是,几十道中高难度代码题里,PonyAlpha一次性通过率明显高于他们手头的旧模

quyue858:一个匿名模型能否在一天之内改变一家AI公司的估值?代号为PonyAlpha的大模型本周突然出现在OpenRouter上,在该平台的搜索榜上排到第1名,被不少海外开发者拿来和GPT‑4、Claude对比测试,重点看编码与工具调用这两块的“硬指标”。从公开测评看,有开发者给出的粗略统计是,几十道中高难度代码题里,PonyAlpha一次性通过率明显高于他们手头的旧模一个匿名模型能否在一天之内改变一家 AI 公司的估值 代号为 PonyAlpha 的大模型本周突然出现在 OpenRouter 上 在该平台的搜索榜上排到第 1 名 被不少海外开发者拿来和 GPT 4 Claude 对比测试 重点看编码与工具调用这两块的 硬指标 从公开测评看 有开发者给出的粗略统计是 几十道中高难度代码题里 PonyAlpha 一次性通过率明显高于他们手头的旧模型版本

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



一个匿名模型能否在一天之内改变一家AI公司的估值?

代号为PonyAlpha的大模型本周突然出现在OpenRouter上,在该平台的搜索榜上排到第1名,被不少海外开发者拿来和GPT‑4、Claude对比测试,重点看编码与工具调用这两块的“硬指标”。

从公开测评看,有开发者给出的粗略统计是,几十道中高难度代码题里,PonyAlpha一次性通过率明显高于他们手头的旧模型版本,这类用例占他们日常工作场景的70%以上,所以直观感受会被放大。

模型身份目前只有两种主流猜测:要么是DeepSeek‑V4,要么是智谱即将发布的GLM‑5。之所以直接联想到智谱,是因为GLM系列在全球开源模型调用量榜单中已经稳居前10,而GLM‑4.6在Code Arena上与GPT‑4并列第1,这两个数据给了市场充足的“联想空间”。

二级市场的反应更直接:在消息扩散的同一天,智谱股价盘中一度拉升近40%,单日市值增加超过100亿港元,而这家公司过去3年累计研发投入约44亿元人民币、营收据称翻了5倍,本就被视为“高投入、高不确定性”的典型样本。

这也暴露出一个现实:在大模型还缺乏长期稳定评测体系的阶段,少量性能样本、几条开发者评价,加上一段平台热度曲线,就足以在短时间内推动资金做出接近“满仓情绪化”的选择,技术信号和交易动机经常被混在同一个故事里讲。

如果PonyAlpha真的是GLM‑5,中国大模型在部分前沿指标上接近甚至短暂领跑并非不可能,但问题在于:你更看重一两次爆发式榜单成绩,还是看重3年以上、覆盖多行业的稳定表现?你会怎样平衡对匿名模型技术潜力的期待,与对相关公司股价波动的理性判断?







































小讯
上一篇 2026-03-10 18:16
下一篇 2026-03-10 18:19

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/211573.html