​Unsloth Studio 发布:首个本地可视化大模型微调平台,显存占用降低 70%

​Unsloth Studio 发布:首个本地可视化大模型微调平台,显存占用降低 70%知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio 这是一款开源 无代码的本地可视化界面 旨在大幅降低软件工程师微调大语言模型 LLM 的门槛 让开发者彻底告别复杂的 CUDA 环境配置与高昂的硬件成本 Unsloth Studio 的底层采用了由 Triton 语言编写的定制化反向传播内核 相比标准微调框架实现了质的飞跃 训练速度翻倍

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio。这是一款开源、无代码的本地可视化界面,旨在大幅降低软件工程师微调大语言模型(LLM)的门槛,让开发者彻底告别复杂的 CUDA 环境配置与高昂的硬件成本。

image.png

Unsloth Studio 的底层采用了由 Triton 语言编写的定制化反向传播内核,相比标准微调框架实现了质的飞跃:

  • 训练速度翻倍:训练效率提升了2倍。
  • 显存节省70%:在不损失模型精度的前提下,大幅减少了对 GPU 显存的依赖。
  • 消费级显卡友好:开发者现在可以在 RTX4090或5090等单块消费级显卡上,微调原本需要多卡集群才能运行的8B 或70B 参数模型(如 Llama3.3、DeepSeek-R1)。

该平台将数据准备、训练到部署的完整生命周期整合进了一个直观的 Web UI 中:

  • 可视化数据配方:引入节点式工作流,支持 PDF、JSONL 等多种格式的自动摄取,并能利用 NVIDIA DataDesigner 将杂乱文档转化为结构化的指令数据集。
  • 强化学习支持:内置对 GRPO(群组相对策略优化)的支持。这种技术源自 DeepSeek-R1,能够在无需额外“批判模型”的情况下,让本地硬件也能训练具备多步逻辑推理能力的 AI。
  • 一键导出部署:支持一键导出为 GGUF、vLLM 或 Ollama 格式,打通了从训练检查点到生产环境推理的“最后一公里”。

随着 Unsloth Studio 的发布,大模型微调正从依赖昂贵的云端 SaaS 转向更加私密、低成本的本地开发模式。它不仅为 Llama4和 Qwen 系列提供了即时兼容,更为企业所有权的定制化模型开发提供了强大工具。

技术详情:https://unsloth.ai/docs/new/studio

小讯
上一篇 2026-03-19 14:10
下一篇 2026-03-19 14:08

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/245664.html