就在前两天,OpenClaw 的 Star 数以近乎垂直上升的速度,突破了 25w+,登顶 GitHub Star 历史第一。
作为 Cowork、Manus 等自主执行 AI Agent 平台的开源替代方案,自打其问世以来,一直爆火。
如今只用不到四个月时间,便超越了 Linux、React 等开源了十多年的超大型基建项目。
这背后很明显:AI Agent 时代已然到来。
越来越多的开发者,开始在本地搭建自己的 Agent,接入各种大模型来处理日常任务。
但 Agent 框架再强,底下跑的基座模型才是根。好模型难得,能深度定制的好模型,更难得。
无独有偶,就在 OpenClaw 登顶的第二天,阶跃星辰低调宣布:Step 3.5 Flash 全链路开源。
GPT plus 代充 只需 145
继 Step 3.5 Flash 模型开源后,阶跃团队这次再把预训练权重、中训练权重、以及训练框架,全部一并开放。
消息一出,社区评论区直接炸了。不少被这份毫无保留的诚意打动的开发者,自发地刷起了「源神」的称号。
要知道,目前大多数开源模型只会开放后训练的终版权重,像这样把全链路训练文件都透明公开的,在整个开源社区里实属罕见。
而且 Step 3.5 Flash 还是阶跃当前能力最强的开源 Agent 基础模型,具备了强大推理能力与 Agent 智能,专为 Agent 而生。
从上个月开源以来,Step 3.5 Flash 已在 Hugging Face 上累积超 300k+ 下载,近日更是跃升至全球 OpenClaw 用户调用日榜 Top1,稳居月榜 Top4!
如此受欢迎的超强 Agent 基座模型,阶跃团队选择将模型全链路开源,也难怪有人直呼「源神」。
大部分开源模型都是后训练终版成品模型,二次微调空间很小,至于怎么训出来的,更不会告诉我们。
而阶跃这次不一样,开放的三件东西加在一起,相当于把整个模型训练过程的关键阶段,以及用到的框架全部公布。
首先 Base 权重,作为最基础的预训练模型,适合想从头微调、全参数定制的开发者,拿到手就是一张白纸,完全按照自己的业务需求来。
然后 Midtrain 权重,在 Base 基础上经过了中间训练,推理能力更强,适合做 Agent 开发、工具调用等二次开发场景,不用从头来,站在更高的起点上继续往前走。
最后 Steptron 训练框架,阶跃官方自己在用的训练框架,涵盖持续预训练、有监督微调等完整环节,后续还会公开强化学习和评估模块。
总而言之,我们现在拿到的,是一套与阶跃内部团队几乎一致的模型训练工具链。
在这套工具下,阶跃训出了多强的模型?直接来看下 Step 3.5 Flash 的基准测试数据。
在推理和代码两个维度上,Step 3.5 Flash 的得分全面压过同级别开源模型,甚至媲美部分闭源模型。
Agent 能力上更是亮眼,在多步骤任务执行测试里,稳定性明显优于同等级模型。
另外本地部署的硬件门槛也相对亲民,11B 激活参数,支持在 Mac Studio M4 Max 等消费级硬件上流畅运行,无需数据中心级 GPU,数据也不出本地。
而且推理速度最高可达每秒 350 个 Token,代码类任务下响应尤为迅速。
更值得一提,目前 Step 3.5 Flash 模型在 OpenRouter 上限时免费调用,我们完全不需要本地部署。
只需要三步,就能把 Step 3.5 Flash 模型接入到OpenClaw 使用,我们一起来看下。
第一步,安装 OpenClaw:
curl-fsSL https://openclaw.ai/install.sh | bash
GPT plus 代充 只需 145
第二步,运行初始化向导:
讯享网openclaw onboard
按提示选择进行操作,最后打开 WebUI 进入控制台。
第三步,在 WebUI 里配置模型,进入 Config -> Models -> Providers,点击 Add Entry 添加一个新的 Provider,填入以下信息:
- API Type 选
openai-completions - Base URL 填
https://api.stepfun.ai/v1(国内用户可改用 https://api.stepfun.com/v1,或用 OpenRouter 的地址) - API Key 填入你在 StepFun 或 OpenRouter 申请的 Key
- Model ID 填
step-3.5-flash
保存并刷新后,将 Primary Model 设为 step-3.5-flash,就可以开始用了。
回过头来看,阶跃星辰 Step 3.5 Flash 这次全链路开源,既是一种扎实的技术自信,也诚意满满,实实在在地让普通开发者有机会真正可以上手,一步步训出前沿模型,而不只是拿到一个无法二次开发的黑盒结果。
以前想做垂直领域的模型定制,要么靠大厂资源,要么只能在别人训好的结果上小修小补。
现在有了这套工具链,可以用 Step 3.5 Flash 作为基座进行更深度的定制,打造真正属于自己的 Agent。
对开源社区来说,这套基础设施的价值更长远。
有了真实可上手的训练流程,大家可以在上面做实验、做改进、做创新,而不是永远只能围着闭源模型的 API 转。
这也呼应了阶跃团队之前邀请开发者共建 Step 4 的承诺。大家给阶跃冠上「源神」之名,现在看来实至名归。
另外,阶跃后续还会继续开放 RL 模块、评估模块,SFT 数据也将陆续公开。
感兴趣的朋友,可以持续关注一下。
- GitHub:https://github.com/stepfun-ai/Step-3.5-Flash
- Hugging Face:https://huggingface.co/stepfun-ai/Step-3.5-Flash
今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/212306.html