
作者|参商 西梅汁
编辑|星奈
媒体|AI大模型工场

国内大模型发展趋势|3月份解读
Token消耗量暴涨!3月大模型“算力荒”与涨价潮背后
三月,国内AI大模型赛道上最直观的变化,就是Token消耗量开始一轮集体性的爆发式增长。字节跳动豆包大模型的日均调用量在不到两个月内上涨超过 60%,MiniMax 在 OpenClaw 带动下,两个月 Token 消耗增长达到 6 倍,MiniMax、月之暗面、智谱等厂商也陆续出现 API 配额趋紧、调用量持续冲高的情况。
这背后,已经不再是简单的用户规模扩张,而是随着AI从对话工具向智能体执行演进,带来的一些消耗激增,也让算力供需从原本的相对平衡,迅速转向紧张。
算力压力很快传导到上游。阿里云宣布算力、存储等产品最高涨价 34%,百度智能云同步上调价格,高端 GPU 租赁成本上升、交付周期拉长,行业开始告别“廉价算力”,算力成为决定稳定性与成本的关键变量。
在此背景下,头部厂商同步调整策略,算力资源明显向 MaaS(模型即服务)倾斜。阿里云优先保障百炼平台的 Token 业务,火山引擎则聚焦 Doubao-Seed 与 ArkClaw 等智能体服务。行业逻辑也随之从卖算力,转向卖模型能力与智能服务。
这轮变化同样重塑竞争格局。中小厂商面临成本挤压,头部厂商凭借模型、算力与调度能力形成优势。竞争焦点也从参数规模,转向 Token 效率、推理成本与能耗比等精细指标,长上下文、稀疏激活、任务裁剪等能力开始成为刚需。
整体来看,Token 暴涨、算力涨价与 MaaS 倾斜正在形成共振,行业也开始进入以规模化落地与商业化为核心的新阶段。随着 C 端与 B 端场景持续放量,算力紧张与成本上行将成为常态,真正能跑出来的厂商,取决于谁能把成本、效果和场景价值同时跑通。
OpenClaw“养虾”狂飙:多家厂商扎堆,本地部署 、多端打通成标配
OpenClaw“养虾”的爆发,更像是国内大模型从能力竞赛走向落地竞赛的一个标志性节点。
腾讯3月密集发布WorkBuddy、QClaw、ClawBot等8+款产品构建全场景生态,百度推出覆盖云端、手机、桌面的"龙虾全家桶",阿里以JVSClaw为核心延伸至JVS Book笔记本与JVS Box迷你主机,智谱则用AutoClaw实现"真·一键安装",8家主流厂商不约而同围绕OpenClaw做产品化封装。
明显可以感受到,过去或许还带着门槛的Agent,如今开始被重新包装成“小白也能用”的产品,安装门槛被压缩到几十秒,使用路径也被极度简化,“养虾”开始从圈层玩法变成大众工具。
与此同时,多端打通与生态协同能力正在成为新的竞争分水岭。腾讯QClaw打通微信、企微、、飞书、钉钉五大通道,让用户在任何通讯场景都能唤起"龙虾";阿里JVSClaw深度适配飞书插件,无需反复配置权限即可处理日程与文档;科大讯飞AstronClaw同样支持接入主流办公工具。这种"无处不在"的触达能力,本质还是在争夺用户的工作流入口。
更深层次的,是"龙虾"生态从单点工具向系统级能力的进阶。百度推出涵盖云端虾、手机虾、桌面虾的"龙虾全家桶",阿里计划延伸JVS Book笔记本与JVS Box迷你主机等硬件终端,小米则在探索"人车家全生态"中的系统级执行。预置Skills、模块化扩展、硬件载体,这些动作共同指向一个方向:智能体不再是孤立的应用,而是需要与操作系统、办公套件、终端设备深度耦合的基础设施。
从这轮的“养虾”狂飙,可以看到大模型的价值开始从一次性输出,转向持续执行与结果交付。当多家厂商同步押注"养虾"体验,本地部署、多端协同、生态整合这三大趋势,或许正是智能体从技术概念走向规模落地的关键路径。谁能把这套"框架+场景+终端"的链条跑通,谁就更有可能在"一人公司""超级个体"的新范式里,成为那个不可或缺的底层操作系统。
什么是Harness,在Agent时代为什么如此重要?
3月,中国日均词元(Token)调用量已突破140万亿,中国大模型的周调用量连续三周超越美国,成为Token经济时代的新锚点。在这一过程中,如何用好模型、让模型稳定执行复杂任务,成为了比模型本身性能更核心的工程挑战,而这正是Harness(驾驭工程)概念走红的背景。
Harness这个概念,本质上是一套包裹在AI大模型周围的、工程化的基础设施和控制系统。它的原意是驾驭马匹的马具(缰绳、马鞍这类的),在AI行业被用来比喻“驾驭”大模型这一强大但有时不可控的“野马”的系统。具体来说,Harness包含了从提示词模板、上下文管理与检索策略,到多步推理编排、工具调用的标准化接口与权限控制,再到任务失败后的重试、回滚,甚至是多智能体协同时的任务分配与验收评估等一系列复杂的工程化组件。
它的核心目标是解决大模型在长周期、复杂任务执行中容易出现的“失控”问题,通过外部控制机制来弥补模型内在的能力缺陷,从而将不可控的概率性输出,约束在一个确定性的、符合商业要求的执行框架内。
而Harness在Agent时代之所以如此重要,是因为它更决定了AI智能体是否能转变为企业级生产力工具。首先,它提供了企业应用所必需的可靠性与稳定性。当Agent处理一个长达数小时甚至数天的任务时,可能会遇到上下文窗口被挤爆、忘记早期指令、陷入逻辑死循环或产生幻觉式的自我评估等典型问题。
Harness通过预设上下文管理、状态持久化、独立的验证与纠错机制(比如让一个Agent做事,另一个Agent负责“挑毛病”),确保了Agent在执行长程任务时依然能够沿着预定路径稳定运行。其次,它构成了企业级应用的安全与合规护城河。在Agent时代,智能体被赋予了调用API、访问文件系统、甚至操作浏览器等高阶权限,安全风险呈指数级上升。Harness更像是一个“安全沙箱”和“运行容器”,通过统一的权限校验、敏感词过滤和行为审计日志,确保AI的所有操作都在可控的安全边界内,并且每一步都可追溯、可观测。
正如腾讯云负责人汤道生所强调的:“AI落地不只是一道算法题,更是一道工程题。”Harness的重要性,正在于它为这个充满不确定性的概率系统与要求确定性的商业世界之间,搭建了一座至关重要的桥梁。
国内大模型动态
阿里
4月1日,阿里发布Qwen3.6-Plus,定位国产最强编程模型。4月2日该模型接入OpenRouter免费层,4月3日日调用量激增711%,突破1.4万亿Token,登顶OpenRouter日榜榜首,打破该平台有史以来单日单模型调用量全球纪录。4月7日获得OpenRouter全球大模型调用周榜第一,7日平均调用量稳定在9000亿词元以上。
截至2月底,千问APP月活跃用户突破3亿,AI购物首体验用户近1.4亿。产品采用"联动外部平台"策略,用户说"订奶茶"直接拉起淘宝闪购进入下单付款页面,而非局限在应用内提供方法论,实现从"对话助手"向"生活Agent"的关键跃迁。
3月30日,近期,千问密集上线AI打车、AI充话费等一系列“AI办事”新能力。3月30日千问启动AI体验活动,邀请用户成为AI体验官,对新上线的“AI办事”做出反馈,共同推动AI能力的持续进化。以AI充话费为例,用户只需说一句“帮我手机充200”,即可完成充值。未来,千问还会提供更多记忆与主动服务,如记住全家手机号、在余额不足时自动充值,或每月定时充值。
3月26日,阿里AI助手千问被接入红旗汽车智能座舱,这是继AI眼镜之后,千问进一步拓展至更高复杂度的车载场景,迈向全场景AI助手。千问即将首发搭载于红旗HS6 PHEV。千问上车后,用户只需一句话即可完成多目标任务。系统可同时理解导航、用餐与时间约束等多重需求,并结合实时路况、天气、商户营业状态等信息,生成完整行程方案。
3月25日,阿里云宣布JVSClaw全面开放,所有用户无需邀请码,访问网址下载对应的客户端,即可获得一只云端“龙虾”。据介绍,新版JVS Claw也带来了多个核心功能升级:移动端语音输入、JVS文件空间、Skill调用优化、定时任务专用入口和Clawbot一键升级等。
3月24日,在2026玄铁RISC-V生态大会上,阿里巴巴达摩院发布新一代旗舰CPU产品玄铁C950。其采用开源RISC-V架构,单核通用性能在SPECint2006基准测试中突破70分,刷新全球RISC-V CPU性能纪录,适用于云计算、生成式AI、高端机器人、边缘计算等领域。此外,玄铁C950利用RISC-V开源开放特性,搭载自研AI加速引擎,首次原生支持Qwen3、DeepSeek V3等千亿参数大模型。
3月23日,千问上线打车能力,可一句话完成选车型、添加途经点、预约时间等操作,还支持“要空气清新的车,价格不超过30元”、“驾驶平稳”、“服务态度好”等个性化需求。此前,千问已上线点外卖、订机酒、出行导航等能力,打车上线后,用户即可通过连续指令完成多步骤安排,实现跨服务的串联执行。
3月18日,阿里云官网发布公告:因全球AI需求爆发、供应链涨价,阿里云AI算力、存储等产品最高涨价34%。其中,平头哥真武810E等算力卡产品上涨5%-34%,文件存储产品CPFS(智算版)上涨30%。据知情人士透露,此轮涨价另一个重要原因是“Token调用量暴涨”。阿里云的MaaS业务百炼在今年1-3月创下了历史最高增速。阿里云正在将紧缺的AI算力资源向Token业务倾斜。
3月17日,钉钉团队推出全球首个企业级AI原生工作平台"悟空"(WuKong),这是钉钉成立11年来首款独立APP。该平台采用CLI化架构,钉钉底层代码全面重写,从图形界面转向命令行界面,让AI原生调用上千项业务能力。平台具备企业级安全特性,AI Agent自动继承企业权限规则,所有操作在安全沙箱中运行。同时发布十大行业"一人团队"OPT解决方案,涵盖电商、跨境电商、知识博主、开发、门店、设计、制造、法律、财税、猎头等领域。阿里巴巴集团CEO吴泳铭亲临发布会现场站台。
3月16日,阿里巴巴集团宣布成立Alibaba Token Hub(ATH)事业群,由集团CEO吴泳铭直接负责,定位为与电商、云智能并列的第三个一级事业群,核心目标为"创造Token、输送Token、应用Token"。该事业群整合通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部五大核心部门,为解决此前AI业务分散导致的资源竞争与部门壁垒问题,建立Token工业化生态。
ATH事业群成立同日,阿里宣布通义千问技术负责人林俊旸等多位核心成员离职。林俊旸于3月3日正式提交辞呈,3月4日凌晨在社交媒体发文"me stepping down. bye my beloved qwen"确认离职,其团队包括Kaixin Li(Qwen3.5/VL/Coder核心贡献者)、惠彬原、郁博文等骨干成员相继离开。3月4日13点,通义实验室紧急召开All Hands全员会议,阿里高层将此次调整定性为"团队扩张"而非收缩。
3月13日,阿里上线JVS Claw,原名“无影JVS”,成为阿里版OpenClaw产品。从知情人士处获悉,“阿里将推出JVSBook(笔记本终端)与JVSBox(迷你主机)等硬件产品。其中,笔记本终端主打移动办公,基于类OpenClaw架构打造,深度集成JVS Claw平台;JVSBox则面向桌面办公,作为桌面级Al Agent工作站,同样采用类OpenClaw架构。”“上述硬件产品由阿里云无影团队主导,计划从软件平台延伸至硬件终端,构建完整的Al Agent体验。”前述知情人士补充说道。
3月10日,钉钉宣布,从即日起至2026年3月31日,企业和个人开发者在使用OpenClaw时,调用钉钉相关APl、Webhook或Stream服务,可获得不限量的免费调用额度。接入后,用户可通过OpenClaw直接调用钉钉Al表格、Teambition等产品技能,实现创建表格、数据整理及自动化任务处理、项目管理等操作。同时,钉钉将面向中小企业推出实战课程,帮助企业管理者和开发者从认知到实操掌握 OpenClaw 与钉钉的集成应用。
3月9日,在上周林俊旸突然离职后,阿里在今天(3 月 9 日)下午有了新的管理安排:Qwen模型一号位由阿里云CTO和通义实验室负责人周靖人代管,他会深入了解模型发展需要的资源,提升各环节协作效率,确保模型高效迭代。负责Qwen预训练的刘大一恒,则将同时代管后训练和Coding团队。刘大一恒和Qwen模型团队的其他leader向周靖人汇报。
3月2日,千问首款AI硬件“千问AI眼镜”正式上线,开启线上线下全渠道“0元预约”。该产品将于3月8日在中国市场现货发售,并于2026年内登陆全球市场。其中,具备顶级硬件配置的G1系列,在叠加国补后到手价为1997元,大幅降低了高端AI眼镜的使用门槛。据悉,千问AI眼镜还将全面接入千问APP,首批点外卖、订酒店等“办事”功能预计于3月底向用户开放。
3 月,阿里调整 AI 组织架构(成立 ATH 事业群、调整 Qwen 模型管理团队),推出 CPU、智能体平台、AI 硬件及相关产品,优化 AI 生态服务,同时上调阿里云 AI 算力及存储价格,推进 AI 技术落地与商业化。
腾讯
3 月密集发布 WorkBuddy、QClaw、ClawBot 等 8 + 款 AI Agent 产品,构建 “龙虾” 全场景生态,打通微信、、企业微信流量入口。
3月27日,在举行的腾讯云上海城市峰会上,腾讯云正式发布了AI Agent(智能体)产品全景图,并宣布对全栈AI能力进行系列升级。据了解,此次发布标志着腾讯云加速布局企业级Agent市场,意图从工具、平台、生态等多个层面,推动AI应用的规模化落地。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在会上表示,人工智能应用范式正从Chatbot向AI Agent跃迁,未来每家企业都可能借助标准化工具快速搭建专属智能体应用。在同样的模型能力下,不同的Harness,即包括工具调用、分层上下文工程、长记忆管理、工作流设计等在内的系统工程手段,都将影响AI落地实际效果。
3月25日,据腾讯云微信公众号,元宝派已正式上线电脑版,用户可以在桌面环境免费一键创建“龙虾”,或将已有“龙虾”接入派中,与派友和Bot一起聊天、协作、完成任务。在电脑端,用户可以边共享屏幕边实时交流,同时支持拖拽上传、截图、多端同步功能。
3月20日,腾讯 QClaw 正式开启全量公测,无需邀请码,用户通过官网下载最新版本,20秒即可完成安装,并向“龙虾”下达指令。新版本持续优化微信生态体验,同时打通企业微信、、飞书、钉钉等多平台远控通道,进一步拓展 AI 协作入口。「龙虾像素工作室」、定时任务等特色功能也在本次公测中正式和大家见面。
3月9日,据报道,腾讯最近在研发一款OpenClaw一键启动包的产品,QClaw,下载QClaw应用后,即可在本地电脑上一键轻松部署“小龙虾”。QClaw不是腾讯从零重写的一套Agent框架,而是围绕OpenClaw做的一次产品化封装。它解决的是“普通人怎么更容易把它跑起来、连起来、用起来”。按目前流出的内测介绍,QClaw最核心的产品形态,是一个本地一键启动包。下载安装之后,可以在本地电脑上轻松部署小龙虾。如果用户之前本机已经装过OpenClaw,还可以直接一键关联。模型方面,支持Kimi,MiniMax等国产模型,也支持自定义模型。
同日,腾讯面向个人用户开放了一项新功能,允许通过官方渠道快速创建能与AI智能体工具OpenClaw联动的机器人。根据腾讯开放平台发布的信息,用户只需通过手机扫码登陆即可完成开发者账号注册,只需点击一次鼠标即可完成机器人的创建,随后只需在OpenClaw运行环境中完成简单配置即可绑定,便能在上与该机器人进行对话。
据官方介绍,一个号码最多可以创建5个独立的机器人,绑定至OpenClaw环境后即可通过机器人给OpenClaw下达指令;支持Markdown、图片、语音、文件等多媒体消息收发,手机端、桌面端均可使用。
字节跳动
3月底,豆包App日活跃用户突破1000万,成为国内DAU最高的AI助手。截至3月底,字节跳动旗下火山引擎披露豆包大模型日均调用量突破120万亿Tokens,3个月内翻了一倍。自2024年5月首次对外发布以来,豆包大模型Tokens调用量在两年里已上涨1000倍。视频创作和智能体成为Tokens调用的新增长点,其中Seedance视频生成模型和"龙虾"智能体的迅速普及是主要驱动力。
3月20日,字节跳动旗下 AI 助手豆包正在灰度测试“购物下单”功能,用户可在豆包 App 内通过对话提出消费需求,由大模型识别购物意图后推荐商品并生成商品卡片,在 App 内完成选购与支付,无需跳转抖音。据了解,功能依托豆包大模型 2.0 的多模态理解与 Agent 能力,覆盖数码、家居、食品等多个品类,预计最快于 3 月正式上线。
3月19日,字节跳动旗下小云雀 AI 官宣上线短剧 Agent 功能。据悉,这是全球首个搭载 Seedance2.0 的行业智能体,支持 10 万字剧本一键成片,能深度理解剧本、统一角色形象,还提供 2D/3D/仿真人画风,支持自定义编辑,大幅降低短剧创作门槛。内测爆款《万兽独尊 》4 天播放破亿,5 人 8 天完成 60 集制作,效率远超传统工具。
3月18日,字节跳动安全团队最近在内部发布了《OpenClaw安全规范和使用指引》,同步面向字节员工推出ByteClaw。该服务基于火山引擎ArkClaw企业版构建,可以在公司账号体系下实现统一的身份认证、访问控制与权限管理,支持员工安全调用公司内部资源。
3月9日,火山引擎正式上线ArkClaw——开箱即用的云上SaaS版OpenClaw。当前,“火山方舟Coding Plan”用户可以抢先体验ArkClaw,“Coding Plan Pro”用户登陆即可同步使用ArkClaw,“Coding Plan Lite”用户可以免费体验7天。订阅后,ArkClaw“龙虾”可以畅享Doubao-Seed-2.0系列、Kimi2.5、MiniMax2.5和GLM等主流模型,ArkClaw协同 Doubao-Seed 2.0 Pro,复杂任务效果突出。
百度
百度AI动态集中在智能体生态布局(DuClaw、DuMate、RedClaw"龙虾全家桶")、企业级AI落地(博鳌十大案例)、自动驾驶商业化(萝卜快跑入选全球创新榜单)以及云算力调价等方面。
3月23日消息,百度DuMate正式上线,面向用户全量开放。这是中国首个国产企业级龙虾产品,支持本地部署,企业级用户也能安全合规使用。在功能上,DuMate原生支持 Word、Excel、PPT 等主流办公软件。内置百度搜索Skill,也让DuMate拥有更强的理解能力和更好的任务完成率。另外,DuMate也支持用户按需灵活扩展优质Skills。
目前百度龙虾全家桶,涵盖云端虾、手机虾、安全虾、桌面虾及全球首款家用小龙虾等产品,可以满足不同场景下的龙虾使用需求。
3月23日,百度网盘宣布全新升级GenFlow,并兼容OpenClaw能力,该功能已上线PC客户端及全新推出的「团队空间」,个人用户、团队可以在百度网盘一键部署OpenClaw、开箱即用。同时,百度网盘推出「bdpan-storage」Skill,让Agent拥有跨设备流转的「云端大脑」,文件上传下载、备份、分享、管理一句话搞定。未来,网盘文库将推出更多Skills并开放到ClawHub,方便团队及企业随时调用。
3月20日,百度千帆正式发布全新端到端文档智能模型 Qianfan-OCR。该模型基于统一的视觉语言架构,以4B参数规模实现了对文档解析、版面分析、文字识别与语义理解的全面融合,在多项权威评测中取得领先表现。目前,Qianfan-OCR已在千帆平台上线,并同步在HuggingFace开源了模型权重,面向开发者与企业用户开放使用。
3月18日,百度任命原大模型算法部何径舟自基础模型研发部(BMU)轮岗至移动生态事业群组(MEG),担任百度APP研发中心组织负责人,向罗戎汇报。原负责人赵世奇因个人原因离职。据知情人士透露,何径舟为百度自己培养的技术和管理型人才,在大模型算法领域有丰厚积累。此次轮岗将进一步推动大模型与搜推业务融合,强化大模型等前沿技术在搜索、推荐等核心场景的应用,推动产品迭代速度与质量双提升,帮助产品更好地面对技术代际变革,进一步提升用户体验。
同日,百度智能云发布AI算力、存储等产品调价公告,AI算力相关产品服务上调约5%-30%,并行文件存储等上调约30%,调价自2026年4月18日起执行。同日阿里云也发布类似调价公告,国内头部云厂商同步跟进全球算力涨价趋势。
3月11日,百度智能云发布零部署服务DuClaw,将过往的“一键部署”模式进一步精简为“零部署”,用户无需自行选择OpenClaw镜像部署云端服务器,无需自行配置大模型推理服务的API Key,做到零门槛“养虾”。目前,用户已可通过网页端直接使用该服务。后续还将陆续支持企业微信、钉钉、飞书等主流通讯应用,让AI助理随时随地触手可及。
3月10日,百度宣布,启动面向2027届在校生的暑期实习招聘项目,开放超过5000个实习offer。这是百度历年来设置业务实习专项最多的一次,包含管培实习生计划在内的7大业务实习专项同步对外公布。据介绍,此次百度暑期实习招聘超九成岗位与AI相关,涉及大模型算法、多模态、自动驾驶等多个前沿领域,是其史上最大规模的一次暑期实习招聘。
MiniMax
3月18日,MiniMax正式发布新一代Agent旗舰大模型M2.7,首次展示“模型自我进化”路径,通过构建Agent Harness智能体执行框架,让模型深度参与自身训练、优化与迭代流程,在部分研发场景可承担30%—50%工作量,内部评测集效果提升约30%;该模型在SWE-bench Pro测试中正确率达56.22%,VIBE-Pro、Terminal Bench 2测试中分别取得55.6%和57.0%的成绩,可将部分线上生产系统故障修复时间缩短至3分钟以内,同时强化多智能体协作能力,支撑互动娱乐产品OpenRoom,目前已在MiniMax Agent及开放平台全球上线。
3月12日—15日,MiniMax亮相上海2026AWE中国家电及消费电子博览会,这是其上市后首次向公众集中展示多模态大模型技术成果,携自主研发的全模态大模型矩阵及数十款AI智能硬件生态产品参展,覆盖具身智能、随身穿戴、教育陪伴、居家办公等多个场景。
3月9日,中国AI龙头MiniMax在港股市场大幅拉升,盘中最高冲至1000港元/股,刷新上市以来新高,截至收盘涨23.77%报997港元,总市值超3100亿港元。值得注意的是,MiniMax同日宣布推出全新Voice Maker语音模型和Music Maker音乐模型两大技能。基于MiniMax Speech2.8语音技术和Music 2.5+音乐模型的深度封装,用户通过OpenClaw平台或MiniMax旗下MaxClaw即可让AI助手拥有定制音色、多语种配音能力,甚至可以创作完整歌曲及人声哼唱demo。目前该技能已上线ClawHub,支持在飞书、企业微信、钉钉等IM平台使用。
3月2日,MiniMax创始人、首席执行官闫俊杰在2025年全年业绩交流会上披露新一年的增长态势:2026年2月公司ARR(年度经常性收入)超过1.5亿美元;面向企业客户和个人开发者的开放平台产品,2026年2月新注册用户数已经达到2025年12月的4倍以上。
在财报后的电话会上,MiniMax创始人闫俊杰谈及行业发展机会表示,接下来一年,AI行业的渗透率和增长速度将比大家预期的更快,增长来源也将更加多元化。闫俊杰认为,编程领域仍有很高的发展天花板,将迎来L4至L5级别的智能。目前AI在编程辅助工具层面已表现出色,但今年编程领域的AI应用将走向同事级协作,甚至达到创新性发现、复杂组织配合的智能水平。另外办公场景的发展速度会非常快,这是一个比编程市场空间更大的领域。闫俊杰认为,职场中需要编程的人数相对有限,而大部分白领都会涉及办公场景,这一更大的市场才刚刚起步。
月之暗面
3月31日,从知情人士处获悉,3月初,在Kimi K2.5模型发布一个月之后,月之暗面ARR(年度经常性收入)突破1亿美金。知情人士还表示,K2.5模型上线后,API供应的TPM(Tokens Per Minute,每分钟令牌数)配额迅速趋紧,有客户开出千万美元级别的消费承诺及预付担保,以期获得优先供应。据此向月之暗面方面求证,截至发稿未获置评。
3月25日,在2026中关村论坛开幕式上,月之暗面创始人兼CEO杨植麟就开源AI发表主题演讲,他表示以Kimi K2.5为代表的开源模型正在成为新的标准,硬件厂商往往需要通过开源模型评测集证明其性能提升。
此外,他认为当前AI领域的研究方式正在发生变化。行业此前更多依靠大量互联网数据及少量人工标注,由人来判断其是否符合人类价值观及偏好,从去年开始行业更加重视强化学习,但同样是由人来筛选高质量任务,编程、数学领域的效果提升正来自于此。接下来,AI将更大程度主导研究,每位研究员会配备大量token以合成新的任务及环境,AI会来定义该环境下最合适的奖励函数,乃至探索新的网络架构。在这一前提下,整个AI研发进程会逐渐加速。
3月18日,在2026年的英伟达GTC大会上,月之暗面Kimi创始人杨植麟发表公开演讲。他表示,要推动大模型智能上限的持续突破,必须对优化器、注意力机制及残差连接等底层基石进行重构。
继今年1月底正式发布Kimi K2.5以后,杨植麟在演讲中首次系统性地披露了该模型背后的技术路线图。他将Kimi的进化逻辑归纳为三个维度的共振:Token效率、长上下文以及智能体集群(Agent Swarms)。“当前的Scaling已经不再是单纯的资源堆砌,而是要在计算效率、长程记忆和自动化协作上同时寻找规模效应。如果能将这三个维度的技术增益相乘,模型将表现出远超现状的智能水平。”此外,他判断未来的智能形态将从单智能体向动态生成的集群进化。
智谱 AI
3月27日,智谱AI CEO张鹏出席第三届中关村论坛人工智能主题日AI开源前沿论坛,参与“OpenClaw与AI开源”圆桌讨论,围绕开源生态协同、智能体技术发展等话题分享观点;同时,智谱依托自身技术优势,助力论坛推动AI开源领域的理念碰撞与生态共建,参与构建开放共赢的AI创新共同体,论坛期间还揭牌了中关村人工智能开源联盟、北京市人工智能协会,启动京张遗址公园AI创新带等相关项目。
3月16日,智谱发布首个专为龙虾场景深度优化的通用大模型GLM-5-Turbo,并在发布时同步上调了GLM-5-Turbo的API价格,幅度为20%。根据端到端龙虾评测基准ZClawBench评测结果,GLM-5-Turbo在OpenClaw场景中的表现相比GLM-5提升显著,在多项关键任务上整体领先于多家主流模型。
值得一提的是,伴随这款“龙虾专供大脑”的模型发布,智谱还推出面向个人和企业级用户的龙虾套餐,其体验月卡39元就能获得3500万Tokens,进阶月卡99元获得1亿Tokens,让企业和个人都能轻松实现龙虾“Tokens自由”。
针对外界担忧的龙虾安全风险问题,智谱强调已经构建了一套面向企业场景的OpenClaw安全管理体系“Claw for Enterprise Security”,在安全保障层面系统性提供多层防护机制。
3月10日,智谱正式上线AutoClaw(澳龙),这是国内首个真·一键安装的本地版OpenClaw,预置50+热门Skills,支持一键接入飞书等即时通讯工具。一次下载,就能让你的电脑进化成7*24小时专属干活助理。目前,智谱提供一定免费额度给用户体验龙虾能力。
此外,AutoClaw 现已内置智谱专为 OpenClaw 场景深度优化的龙虾专属模型 ——Pony-Alpha-2(内测代号);其内测版本已面向 AutoClaw 及部分 GLM Coding Plan 用户开放试用,正式版本即将发布。
科大讯飞
3月12日,科大讯飞版“龙虾”AstronClaw正式上线。其核心采用沙箱隔离技术运行,全程守护用户数据安全。支持云端一键部署,可接入企业微信、钉钉、飞书等主流通讯工具,直接对话即可指派任务。据悉,平台可调用10000+skills,支持自由切换星火X2、MiniMax-M2.5、Kimi-K2.5、GLM-5等多款大模型,胜任行业分析、文档处理等工作。
3月3日,科大讯飞在巴塞罗那MWC大会发布主题“AI for Use, AI for Trust”,全球首发讯飞AI眼镜(40g轻量化,搭载唇动识别多模态降噪技术,获Digital Trends Top Tech大奖)、讯飞同传麦克风(首响延迟<2秒,支持多语种自动同传);同步升级智能办公本AINOTE 2、星火一体机、GuideX AI数字人方案,并推出星火医疗大模型X1,优化可视化思维链推理能力。
蚂蚁集团
3月19日,蚂蚁数科正式推出“蚁天鉴2.0 - 龙虾卫士”AI安全防护体系,并同步启动“龙虾AI安全守护计划”。
本次发布的“claw安全套件1.0”于今日上线,聚焦三大核心能力:一是“对抗思想变异”,通过精准识别输入输出内容,拦截违规信息与恶意诱导传播源头,防止模型被“黑化”;
二是“净化skills仓库”,基于蚂蚁数科CALIR五维模型框架,对Skills插件进行合规扫描与行为审计,有效识别并阻断权限越界、敏感泄露及异常调用等风险;
三是“风险舆情播报”,通过生成实时风险应急报告并主动推送,帮助企业第一时间掌握安全态势,实现风险的透明化与即时感知,变被动防御为主动应对。
另外,蚂蚁数科同步启动“龙虾AI安全守护计划”。该计划将面向首批100家合作企业,提供为期3个月、总计20万次的免费龙虾安全防护调用服务。
360集团
3月29日,周鸿祎在2026中关村论坛全球独角兽企业大会发表主旨演讲,提出"龙虾"(OpenClaw)破圈标志智能体时代全面到来,梳理出智能体工厂、行业智能体、一人公司、AI硬件、AI安全、国产算力六大机遇,其中提到国产推理芯片可实现弯道超车,并表示360将加大AI投资,深度布局人形机器人与AI服务领域。
3月20日,360以"安全即服务进阶 AI引领未来实战"为主题,正式发布360安全大模型3.0,提出数据制胜、攻防共生、智能协同、人机闭环四大战法,现场实战演示中成功检测并防御海莲花APT高级攻击,场景落地涵盖公有云安全云SaaS服务与私有化"安全大脑+安全大模型+探针"一体化方案。
3月14日,360集团在北京举办发布会,正式推出"360安全龙虾“智能体应用客户端及“360安全龙虾Box”硬件终端,同时发布专门应对OpenClaw安全问题的“360龙虾卫士”。
据360方面介绍,针对当前阻碍OpenClaw普及的“安装难、不好养、容易死、不安全”四大核心难题,360安全龙虾系列产品提供了一套"出厂满血、全能守护"的综合解决方案,旨在让普通受众切实享受到技术红利,实现“龙虾自由”。
阶跃星辰
3月23日,阶跃星辰正式推出Step Plan开发者月度订阅方案,针对OpenClaw及AI Coding场景深度定制,首发支持Step 3.5 Flash模型,设置Flash Mini、Flash Plus、Flash Pro、Flash Max四档差异化套餐,起步价49元/月,开发者社区限时半价低至25元/月;该方案采用Prompt-based计费模式,透明度高,所有档位均默认提供高速推理服务,用量较同档位竞品提升100%,不限制使用平台,同时预留多模态扩展接口,计划第四季度支持图像、语音等复合型开发场景。
3月17日,阶跃星辰与吉利汽车、千里科技携手,在英伟达GTC 2026大会上宣布联合打造超级Eva+G-ASD 4.0,将实现量产上车并由极氪8X首发搭载;其中,超级Eva由阶跃星辰与吉利联合研发,是基于WAM世界行为模型、与整车底层系统原生融合的整车智能体,负责“舱驾融合”中的逻辑决策,可实现对话式全链路出行服务,推动AI在智能出行领域的深度落地。
3月12日,阶跃星辰正式推出基于OpenClaw开发的云端AI助手StepClaw,开放5万个限时免费部署名额,有效期1个月,每个名额可享受5000万Tokens、云端服务器、存储在内的全套资源;StepClaw搭载Step 3.5 Flash模型,该模型当时已稳居OpenClaw调用量全球第一,成为开源社区最受欢迎的“龙虾大脑”,3月13日该功能同步扩展至阶跃AI网页端,用户无需复杂配置,可一键部署使用。
3月4日,阶跃星辰宣布将新一代Agent基座模型Step 3.5 Flash全链路开源,不仅开放模型本身,还公开预训练、中训练两大核心权重及官方同款Steptron训练框架,支持开发者深度二次开发;该模型采用稀疏MoE架构,总参数1960亿,推理时仅激活约110亿参数,单请求代码任务推理速度最高达350 TPS,专为智能体场景设计,开源后一日便登顶OpenClaw(俗称“小龙虾”)调用量榜首。
爱诗科技
4月8日,爱诗科技启动“开源周”收官活动,活动期间正式开放PixVerse R1轻量版模型与实时交互SDK,轻量版模型体积压缩至原有版本的40%,可适配中端手机、平板等轻量化设备,实时交互SDK支持开发者快速将实时世界模型集成至自有应用;同时面向高校科研团队与个人开发者,提供免费算力支持(每月最高1000小时GPU算力)、技术文档与一对一答疑服务,进一步推动实时世界模型在游戏开发、在线教育、虚拟场景搭建等领域的开源应用落地,助力开发者降低AI技术研发成本。
4月6日,爱诗科技发布PixVerse C1影视级视频生成模型,同步开源模型核心推理代码,该模型针对影视、广告等专业场景优化,支持文生视频、图生视频、多镜头分镜自动生成三大核心功能,可实现15秒1080P高清音画同步输出,支持自定义镜头运镜(推、拉、摇、移)、画面色调调整,适配广告片、短视频、影视预演、虚拟直播等多元场景,大幅降低专业内容制作门槛。
3月31日,爱诗科技正式开源PixVerse V6视频生成基础模型,该模型重点强化物理常识与时序一致性,解决了同类视频生成模型常见的画面抖动、角色形变、场景断层等问题,支持最长120秒长视频稳定生成,可实现角色外观高保真延续(同一角色在不同镜头中服饰、神态保持一致),兼容PyTorch、TensorFlow等主流AI框架,开放商用友好协议,开发者可免费用于非盈利项目,商业使用仅需完成简单备案。
3月12日,爱诗科技宣布完成 3 亿美元 C 轮融资,由鼎晖领投,中国儒意、三七互娱等跟投,刷新亚洲 AI 视频生成领域单次融资纪录,同步推出全球首个通用实时世界模型 PixVerse R1,支持 1080P 分辨率、毫秒级交互响应,可在视频生成中动态调整场景、角色与物理参数,API 开启公测并与网易游戏、芒果 TV 达成合作。
生数科技
4月初,生数科技正式发布新一代AI视频模型Vidu Q3,这也是全球首个支持16秒音视频直出的AI视频模型,重点聚焦内容生产的实用性与工业化落地,在声画同步、叙事能力、画质表现上实现重大突破。该模型支持1080P高清画质输出,可实现16秒声画端到端直出,画面节奏、对白、环境音与情绪同步生成,无需后期拼接,同时具备多镜头自由切换、多国文字渲染等核心功能,能够作为漫剧、短剧及影视剧中的独立叙事段落直接使用,大幅降低内容生产门槛。
在国际权威AI基准测试机构Artificial Analysis最新公布的榜单中,Vidu Q3排名中国第一、全球第二,超越Runway Gen-4.5、Google Veo3.1和OpenAI Sora 2等国际顶尖模型,进一步巩固了生数科技在AI视频生成赛道的全球领先地位,其相关技术将重点适配短剧、漫剧、广告营销等场景,推动AI视频真正融入内容生产全链条。
3月30日,生数科技完成股份制改造,公司主体由“北京生数科技有限公司”变更为“北京生数科技股份有限公司(未上市)”,完成了上市前最核心的主体架构调整,为后续冲刺港股IPO奠定基础。此次股份制改造也是公司AI业务规模化发展、资本化进程加速的重要举措,公司拟以港交所18C章(特专科技公司上市规则)申报,契合AI企业“高研发、高成长”的特性,若顺利推进,将成为全球首个专注于AI视频生成与世界模型的独立上市主体。
3月4日,生数科技相关融资消息正式披露,公司完成超6亿元A+轮融资,此次融资由星连资本、中关村科学城科技投资、启明创投等机构参与投资,这也是生数科技在两个月内完成的第一笔大额融资,所筹资金将全部用于AI视频生成模型、基座世界模型的技术研发,以及商业化落地和团队扩充,进一步巩固其在AI视频生成赛道的技术优势,该融资规模也成为当时国内AI视频生成领域的重要融资事件之一。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/267843.html