预训练和微调过程中使用的优化算法（预训练和微调过程中使用的优化算法是什么）

科技前沿 • 2025-05-28 21:54 • 阅读 42

预训练和微调过程中使用的优化算法（预训练和微调过程中使用的优化算法是什么）预训练大模型与医疗从算法研究到应用闾海荣博士清华大学自动化系福州 CHIMA2023 CONTENTS 1 预训练大模型概述 2 理解大模型的内在机理 3 赋予模型精准性与可解释性 4 医疗领域应用 5 清华探索数基生命 TsinghuaConf lvhairong Page2 预训练从大数据到小数据关于预训练少量特定领域标注数据成本高剖析大模型

大家好，我是讯享网，很高兴认识大家。

预训练大模型与医疗：从算法研究到应用

闾海荣博士|清华大学自动化系福州，CHIMA2023

CONTENTS

1.预训练大模型概述

2.理解大模型的内在机理

3.赋予模型精准性与可解释性

4.医疗领域应用

5.清华探索：数基生命

TsinghuaConfidential|lvhairong@Page2

预训练：从大数据到小数据

①关于预训练少量特定领域标注数据

（成本高）

②剖析大模型

大数据（低成本无标注）

③精准可解释微调小模型

（学习特性）

④医疗应用

预训练大模型

（学习共性）

⑤数基生命

1.模型角度：模型参数不再是随机初始化，而是通过一些任务（如语言模型）进行预训练；

2.数据角度：将训练任务拆解成共性学习和特性学习两个步骤。

TsinghuaConfidential|lvhairong@Page3

以英文电子病历后结构化为示例

英文电子病历后结构化

A

①关于预训练

不懂英文

②剖析大模型

英文电子病历后结构化

B

③精准可解释懂英文

④医疗应用英文电子病历后结构化

C

懂英文的医生

⑤数基生命

TsinghuaConfidential|lvhairong@Page4

Transformer架构：预训练的基石

①关于预训练

②剖析大模型

③精准可解释

④医疗应用

从word2vec到Transformer

⑤数基生命从context-free到context-aware

TsinghuaConfidential|lvhairong@Page5

BERT和GPT

▪两类典型的大语言模型

▪BERT：BidirectionalEncoderRepresentationsfrom

Transformers

①

小讯

数据增删改操作（数据库的增删改差）

上一篇 2025-04-18 12:06

ifstream open函数（fopen和ifstream）

下一篇 2025-06-10 21:11

数据增删改操作（数据库的增删改差） 1744588800
yum 命令（linux yum命令） 1744588800
2025年dhc英文怎么读（dohc怎么读） 1744588800
2025年环回地址有哪些（环回地址怎么算） 1744588800
2025年.yml文件（yml文件应该用什么打开） 1744588800
2025年airplay是什么设备（airplay是什么意思啊连接上有什么显示） 1744588800
chrony服务端口信息（chronyd端口） 1744588800
批处理删除最后一行（删除每行最后一个字符） 1744588800
2025年cmip5数据处理（icpms数据处理） 1744588800
ifstream open函数（fopen和ifstream） 1744588800
onnx模型部署（onnx模型部署openvino 封装dll） 1744588800
2025年ssh免密码登录命令（ssh免密登录配置） 1744588800
aippt免费生成（aippt免费生成导出） 1744588800
enact翻译（enticed翻译） 1744588800
ip或者域名查询（ip域名查询是啥） 1744588800
2025年pcap文件怎么打开（pcapng文件怎么打开） 1744588800
2025年vue 怎么安装（vue怎么安装环境） 1744588800
2025年车辆颜色代码查询（车辆颜色代码哪里看） 1744588800

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/187931.html