2026年科创001丨从拼参数到拼成本,大模型一周“集体出牌”

科创001丨从拼参数到拼成本,大模型一周“集体出牌”深圳商报 读创客户端首席记者 袁静娴 4 月下旬 全球大模型市场迎来一轮密集出牌 2026 年 4 月 20 日至 26 日 短短一周内 国内外多家头部机构集中发布或更新大模型版本 国内方面 Tencent 混元 月之暗面 小米 阿里等机构相继推出新模型 海外方面 OpenAI Anthropic 等公司也同步推进模型迭代与产品更新 具体来看 阿里 Qwen3 6 Max Kimi K2 6

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



深圳商报·读创客户端首席记者 袁静娴

4月下旬,全球大模型市场迎来一轮密集出牌。

2026年4月20日至26日,短短一周内,国内外多家头部机构集中发布或更新大模型版本。国内方面,、Tencent混元、月之暗面、小米、阿里等机构相继推出新模型;海外方面,OpenAI、Anthropic等公司也同步推进模型迭代与产品更新。

具体来看,阿里Qwen3.6-Max、Kimi K2.6、小米MiMo-V2.5-Pro、腾讯混元Hy3 preview、DeepSeek-V4等模型陆续发布;与此同时,OpenAI GPT-5.5、Claude Opus系列更新及多模态能力升级也相继落地。

在模型密集发布之外,资本市场同样动作频频。亚马逊与谷歌相继宣布拟加大对Anthropic的投资力度,SpaceX则传出拟收购AI编程公司的消息;国内方面,腾讯、阿里与DeepSeek的潜在合作亦引发关注。

密集发布、价格调整与资本加码几乎在同一时间发生。多位业内人士认为,这一轮变化标志着大模型竞争正在从“参数规模”转向“成本效率与场景落地”。

一周密集出牌:头部模型进入“

具体来看,本轮更新中,多款模型在能力与架构上呈现出一定共性。

4月23日,小米MiMo大模型一口气发布多款新模型,其中MiMo-V2.5-Pro定位为全模态,强调在复杂任务执行与软件工程场景中的能力提升。该项目负责人罗福莉曾参与DeepSeek核心模型研发,其团队在短时间内完成多轮迭代,也被业内视为终端厂商加速切入Agent赛道的一个信号。

同一天,腾讯发布并开源混元Hy3 preview。这是混元体系调整后的首个旗舰版本,也是姚顺雨出任腾讯AI首席科学家并掌舵混元后首次对外发布的重要成果。***息显示,该模型采用稀疏混合专家(MoE)架构,总参数规模约295B,支持,并在推理、代码与智能体能力等维度较上一代有所提升,目前已接入腾讯云及多条核心产品线。

紧接着,4月24日,DeepSeek发布V4系列模型。该系列同样采用,并进一步提升上下文长度与推理效率,且在发布初期即开放权重与接口。

从已发布模型来看,MoE架构与长上下文能力已成为当前主流配置。在算力约束背景下,通过“专家模块”按需激活,在控制推理成本的同时提升模型容量,成为多家厂商的共同选择。

有业内人士表示,头部厂商在短时间内集中发布新模型,并非偶然,而是大模型能力逐步收敛后的“窗口期竞争”。当基础能力差距缩小时,发布时间、架构选择与生态接入,开始成为新的竞争变量。

成本与效率成为关键变量:竞争打到“价格线”

与上一阶段强调参数规模和榜单成绩不同,本轮竞争中,成本与效率的权重明显上升。

以DeepSeek V4为例,其在优化推理效率的同时,对API调用价格进行了下调。根据***息,调价后,其输入与输出价格均有所降低,并推出阶段性优惠方案。这一策略被业内视为进一步拉低大模型使用门槛的重要信号。

值得关注的是,此轮价格调整已接近部分企业可规模化部署的临界点。在长上下文、多轮调用的Agent场景中,单次任务成本较此前明显下降,这意味着原本仅能用于演示或小规模试点的应用,有望进入实际生产环境。

与此同时,多款模型通过MoE架构实现“按需激活”,在不显著增加算力消耗的前提下扩展模型能力;长上下文能力的提升,也使得模型在代码库理解、合同审查等复杂场景中的实用性增强。

有AI行业从业者表示,大模型竞争正在从“能力上限”转向“与稳定性”。“过去企业更关心模型是否足够强,现在更关心的是,在多轮调用和复杂任务下,成本是否可控,结果是否稳定。”

此外,与以往“先闭源验证、后逐步开放”的路径不同,本轮多款模型在发布初期即开放权重或接口。开源策略的前移,也在改变行业竞争方式。有分析认为,开源模型在成本与可控性上的优势,正在对闭源商业模式形成一定挤压。

从模型到Agent:竞争转向“完成任务”的能力

在模型能力逐步收敛的背景下,行业竞争开始向应用形态延伸。

4月24日,OpenAI发布GPT-5.5,在多步推理、代码生成与工具调用等方面进一步强化,强调模型在复杂任务执行中的能力。这一变化被视为大模型向Agent形态演进的重要信号。

从全球竞争路径来看,头部厂商已逐步分化出不同方向。一类是以OpenAI为代表的“”,通过不断强化模型能力,并直接面向用户提**品服务,推动“AI即应用”的发展路径。第二类是以谷歌为代表的“”,将模型能力嵌入搜索、办公软件及操作系统,使其成为既有生态的一部分。第三类则是以为代表的“基础设施型”,通过算力、工具链与模型底座,构建支撑Agent开发的技术体系。

相比之下,中国厂商的竞争逻辑更偏向场景驱动。以腾讯、阿里等为代表的企业,普遍强调模型能力与具体业务场景的结合,通过产品线接入、行业解决方案等方式,加速落地。

从产业数据来看,这一趋势亦有支撑。全球开源社区Hugging Face发布的2026年春季报告显示,过去一年,该平台上约41%的大模型下载量来自中国研发的模型,中国已成为全球开源大模型供给最活跃的地区之一。与此同时,国产开源大模型全球累计下载量已突破100亿次。在专利与产业规模方面,中国人工智能专利申请量全球占比已达60%,AI企业数量超过6200家,2025年人工智能核心产业规模超过1.2万亿元。

此外,与模型密集发布同步升温的,还有资本对头部模型公司的争夺。头部模型公司估值正持续走高。

外媒报道,Anthropic在私募二级市场的估值已突破1万亿美元(约合人民币6.8万亿元),超过OpenAI今年3月最新一轮融资后约8520亿美元的估值水平。与此同时,亚马逊与谷歌相继宣布拟加大对Anthropic的投资力度,资本持续向头部模型公司集中。国内也传来腾讯和阿里正在洽谈DeepSeek的消息,若洽谈成功,这将是DeepSeek首次开始筹资。

有业内人士表示,当模型能力、成本与开源供给同时变化时,大模型竞争已不再是单一维度的技术竞赛,而是进入“模型能力、成本结构与生态体系”的综合竞争阶段。总的来看,无论是海外对Anthropic的持续加码,还是国内围绕DeepSeek的潜在合作与融资动向等,都显示出,在能力差距逐步收敛之后,优质模型资产正成为稀缺资源。

该业内人士表示,过去一周大模型的密集动态,表明大模型行业正进入一个新的阶段:能力仍在提升,但成本、效率与落地能力的重要性正在快速上升。当模型逐步接近可用门槛,竞争的关键,正在从“谁更强”,转向“谁更能被用起来”。

小讯
上一篇 2026-05-01 13:19
下一篇 2026-05-01 13:17

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/283069.html