【开源】Unsloth高效微调 LLM 模型
微调速度提升 2-5 倍,内存占用减少 70%
支持 Llama 3.3、Mistral、Phi-4、Qwen 2.5 和 Gemma 等多种大语言模型(LLMs)。
每日更新项目信息,欢迎关注
Unsloth是一个开源工具,专为加速大语言模型的微调而设计。通过其优化的内核和动态量化技术,Unsloth 不仅能显著提升训练速度,还能减少显存使用量,同时保持高精度输出。
核心亮点
• 速度提升: 微调速度提高 2-5 倍,无需更换硬件。
• 显存优化: 使用动态 4-bit 量化,显存占用减少多达 70%。
• 支持范围广:
• 最新模型: Llama 3.3 (70B)、Phi-4、Qwen 2.5 等。
• 视觉模型: Llama 3.2 Vision、Qwen 2.5 VL 等。
• 代码模型: Qwen 2.5 Codemodels。
• 硬件友好: 支持 2018 年以来的 NVIDIA GPU(如 V100、T4、A100、H100 等),最低要求 CUDA 7.0。
• 无精度损失: 使用 Triton 编写的手动反向传播引擎,保证计算精确性,无需近似方法。
主要功能
1. 快速启动:
• 通过简单操作即可微调模型:上传数据集,点击“运行全部”,快速生成优化模型。
• 输出模型支持 GGUF、Ollama、vLLM 或上传到 Hugging Face。
2. 动态量化:
• Unsloth 动态 4-bit 量化技术避免某些参数量化,提升精度,仅需少量额外显存。
3. 超长上下文支持:
• 在 Llama 3.3 (70B) 上实现 89K 上下文长度(相比原生支持提升 13 倍)。
• 在 Llama 3.1 (8B) 上支持 342K 上下文。
4. 全平台支持:
• 兼容 Linux 和 Windows(通过 WSL)。
• 提供免费笔记本资源和详细文档,适合初学者上手。
近期更新
• 新增支持模型:
• Llama 3.3 (70B)、Phi-4、Qwen 2.5 Codemodels、Llama 3.2 Vision。
• 修复关键问题: 修复梯度累积相关的 Bug,进一步优化性能。
• 增强功能: 与 Apple 合作,支持 Cut Cross Entropy,显著提升推理效率。
微调速度提升 2-5 倍,内存占用减少 70%
支持 Llama 3.3、Mistral、Phi-4、Qwen 2.5 和 Gemma 等多种大语言模型(LLMs)。
每日更新项目信息,欢迎关注
Unsloth是一个开源工具,专为加速大语言模型的微调而设计。通过其优化的内核和动态量化技术,Unsloth 不仅能显著提升训练速度,还能减少显存使用量,同时保持高精度输出。
核心亮点
• 速度提升: 微调速度提高 2-5 倍,无需更换硬件。
• 显存优化: 使用动态 4-bit 量化,显存占用减少多达 70%。
• 支持范围广:
• 最新模型: Llama 3.3 (70B)、Phi-4、Qwen 2.5 等。
• 视觉模型: Llama 3.2 Vision、Qwen 2.5 VL 等。
• 代码模型: Qwen 2.5 Codemodels。
• 硬件友好: 支持 2018 年以来的 NVIDIA GPU(如 V100、T4、A100、H100 等),最低要求 CUDA 7.0。
• 无精度损失: 使用 Triton 编写的手动反向传播引擎,保证计算精确性,无需近似方法。
主要功能
1. 快速启动:
• 通过简单操作即可微调模型:上传数据集,点击“运行全部”,快速生成优化模型。
• 输出模型支持 GGUF、Ollama、vLLM 或上传到 Hugging Face。
2. 动态量化:
• Unsloth 动态 4-bit 量化技术避免某些参数量化,提升精度,仅需少量额外显存。
3. 超长上下文支持:
• 在 Llama 3.3 (70B) 上实现 89K 上下文长度(相比原生支持提升 13 倍)。
• 在 Llama 3.1 (8B) 上支持 342K 上下文。
4. 全平台支持:
• 兼容 Linux 和 Windows(通过 WSL)。
• 提供免费笔记本资源和详细文档,适合初学者上手。
近期更新
• 新增支持模型:
• Llama 3.3 (70B)、Phi-4、Qwen 2.5 Codemodels、Llama 3.2 Vision。
• 修复关键问题: 修复梯度累积相关的 Bug,进一步优化性能。
• 增强功能: 与 Apple 合作,支持 Cut Cross Entropy,显著提升推理效率。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/211326.html