2026年从零开始构建领域大语言模型全流程实践项目_该项目详细阐述了如何从数据构造预训练微调DPO强化学习对齐到最终部署推理的完整大模型构...

科技前沿 • 2026-04-10 19:34 • 阅读 1

从零开始构建领域大语言模型全流程实践项目_该项目详细阐述了如何从数据构造预训练微调DPO强化学习对齐到最终部署推理的完整大模型构...Build LLM from scrartch 本项目的几点描述 1 从数据构造预训练微调 DPO RLHF 启动 gradio 服务推理一步步构建领域大模型 2 利用业务数据训练了一个基于领域数据的大模型 MT 该模型能进行简单的业务问答逻辑复杂 prompt 的效果不是很好还在不断优化中 3 主要代码参考了 https github

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

# Build-LLM-from-scrartch 本项目的几点描述：

1、从数据构造，预训练，微调，DPO(RLHF),启动gradio服务推理一步步构建领域大模型 2、利用业务数据训练了一个基于领域数据的大模型MT，该模型能进行简单的业务问答，逻辑复杂prompt的效果不是很好，还在不断优化中。 3、主要代码参考了 https://github.com/pengxiao-song/LaWGPT/tree/main

预训练模型、数据准备

下载预训练模型

代码参考： tools/download_base_model.py

准备数据

1、数据格式参考： train_data.json finetune_data.json infer_data.json

2、templates参考： alpaca.json law_template.json

3、扩展词表训练词表模型：参考https://zhuanlan.zhihu.com/p/?utm_id=0

spm_train --input=1.txt --model_prefix=/*/LLM/LaWGPT/models/tokenizer/MT-tokenizer --vocab_size=4000 --character_coverage=0.9995 --model_type=bpe

4、合并词表参考：tools/merge_vocab.py

预训练模型

scripts/train.sh

精调模型

scripts/finetune.sh

推理

参考 infer.py

启动服务预测

python webui.py --load_8bit False --base_model '/*/huggingface/hub/models--minlik--chinese-llama-plus-7b-merged/snapshots/ff2d5537b6500c6d9838effdbdb/' --lora_weights './outputs/v5/checkpoint-24000' --prompt_template "no_template" --server_name "0.0.0.0" --share_gradio True

小讯

premiere怎么使用亮度键抠图

上一篇 2026-04-10 19:35

Pixel Epic · Wisdom Terminal 集成VSCode Codex实战：智能代码补全与生成

下一篇 2026-04-10 19:33

premiere怎么使用亮度键抠图 1775823652
2026年LangChain4j vs Spring AI：Java开发者该如何选择？最新对比与实战建议 1775823619
用n8n+DeepSeek，5分钟搞定RSS订阅自动转博客文章（保姆级配置流程） 1775823578
2026年Claude Code有多少内置Skills？ 1775823541
2026年IDEA安装通义AI插件[代码] 1775823466
2026年Claude Code Skills 使用指南：安装、创建与管理 1775823429
2026年用 WorkBuddy 从零打造一本 AI 科普书——我的《ZZZ白话讲AI》创作实录 1775823391
字节跳动AI工具链深度解析：＊＊大模型＊＊赋能产业协作新范式_产品_模式_客户 1775823196
Hermes：比openclaw更好用的智能体？ 1775823160
Pixel Epic · Wisdom Terminal 集成VSCode Codex实战：智能代码补全与生成 1775823771
2026年YOLO12保姆级部署教程：从镜像启动到Gradio／WebUI／API全链路详解 1775823883
傅盛 1775823917
2026年Anthropic 重磅发布“顾问工具”！Sonnet／Haiku 干活，Opus 只当幕后军师 1775824068
Flutter for OpenHarmony：Flutter 三方库 dart_openai — 激发鸿蒙应用的 AIGC （AI 大模型／ChatGPT、Deepseek等）无限创意（适配鸿蒙 1775824150
警惕“工具滥用”：如何防止 Agent 在调用 API 时把你的账户刷爆？ 1775824187
2026年Claude Code + Obsidian，打造个人一站式内容创作管理引擎 1775824220
学生端精准学龙虾“小精龙” 来了 1775824262
2026年DeepSeekLinux驱动教程深度解析 1775824334

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/255211.html