预训练和微调过程中使用的优化算法(预训练和微调过程中使用的优化算法是什么)

预训练和微调过程中使用的优化算法(预训练和微调过程中使用的优化算法是什么)预训练大模型与医疗 从算法研究到应用 闾海荣博士 清华大学自动化系福州 CHIMA2023 CONTENTS 1 预训练大模型概述 2 理解大模型的内在机理 3 赋予模型精准性与可解释性 4 医疗领域应用 5 清华探索 数基生命 TsinghuaConf lvhairong Page2 预训练 从大数据到小数据 关于预训练少量特定领域标注数据 成本高 剖析大模型

大家好,我是讯享网,很高兴认识大家。



预训练大模型与医疗:从算法研究到应用

闾海荣博士|清华大学自动化系福州,CHIMA2023

CONTENTS

1.预训练大模型概述

2.理解大模型的内在机理

3.赋予模型精准性与可解释性

4.医疗领域应用

5.清华探索:数基生命

TsinghuaConfidential|lvhairong@Page2

预训练:从大数据到小数据

①关于预训练少量特定领域标注数据

(成本高)

②剖析大模型

大数据(低成本无标注)

③精准可解释微调小模型

(学习特性)

④医疗应用

预训练大模型

(学习共性)

⑤数基生命

1.模型角度:模型参数不再是随机初始化,而是通过一些任务(如语言模型)进行预训练;

2.数据角度:将训练任务拆解成共性学习和特性学习两个步骤。

TsinghuaConfidential|lvhairong@Page3

以英文电子病历后结构化为示例

英文电子病历后结构化

A


讯享网

①关于预训练

不懂英文

②剖析大模型

英文电子病历后结构化

B

③精准可解释懂英文

④医疗应用英文电子病历后结构化

C

懂英文的医生

⑤数基生命

TsinghuaConfidential|lvhairong@Page4

Transformer架构:预训练的基石

①关于预训练

②剖析大模型

③精准可解释

④医疗应用

从word2vec到Transformer

⑤数基生命从context-free到context-aware

TsinghuaConfidential|lvhairong@Page5

BERT和GPT

▪两类典型的大语言模型

▪BERT:BidirectionalEncoderRepresentationsfrom

Transformers

小讯
上一篇 2025-04-18 12:06
下一篇 2025-06-10 21:11

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/187931.html