文心一言大模型4.5系列开源测评

文心一言大模型4.5系列开源测评6 月 30 日 百度多模态大模型 ERNIE 4 5 VL 424B A47B 正式开源 该模型支持文本与视觉理解 总参数量 424B 激活参数量 47B 基于异构混合专家架构 MoE 融合跨模态预训练与高效推理优化 具备强大的图文生成 推理和问答能力 适用于复杂多模态任务场景 文心 4 5 系列开源模型共 10 款

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



6月30日,百度多模态大模型 ERNIE-4.5-VL-424B-A47B 正式开源,该模型支持文本与视觉理解,总参数量424B,激活参数量47B。基于异构混合专家架构MoE,融合跨模态预训练与高效推理优化,具备强大的图文生成、推理和问答能力,适用于复杂多模态任务场景。

快速体验入口:https://gitcode.com/paddlepaddle/ERNIE-4.5-VL-424B-A47B-Paddle
Hugging Face:https://huggingface.co/baidu
GitHub:https://github.com/PaddlePaddle/ERNIE










2.1 核心优势

多模态异构 MoE 预训练

  • 目标:该模型基于文本和视觉模态进行联合训练,以更好地捕捉多模态信息的细微差别,并提升文本理解与生成、图像理解以及跨模态推理等任务的性能。
  • 方法:为了实现这一目标,避免一种模态阻碍另一种模态的学习,设计了一种异构 MoE 结构,并引入了模态隔离路由,并采用了路由器正交损失和多模态标记平衡损失。
  • 优势:这些架构选择确保两种模态都得到有效表示,从而在训练过程中实现相互强化。

可扩展高效的基础设施

提出了一种新颖的异构混合并行和分层负载均衡策略,以实现 ERNIE 4.5 模型的高效训练。通过采用节点内专家并行、内存高效的流水线调度、FP8 混合精度训练和细粒度重计算方法,实现了卓越的预训练吞吐量。

在推理方面,我们提出了多专家并行协作方法和卷积码量化算法,以实现 4 位/2 位无损量化。此外,我们引入了具有动态角色切换的 PD 分解,以有效利用资源,从而提升 ERNIE 4.5 MoE 模型的推理性能。基于PaddlePaddle构建的ERNIE 4.5 可在各种硬件平台上提供高性能推理。

针对特定模态的后训练

为了满足实际应用的多样化需求,我们针对特定模态对预训练模型的变体进行了微调。我们的 LLM 针对通用语言理解和生成进行了优化。VLM 专注于视觉语言理解,并支持思考和非思考模式。每个模型都结合使用了监督微调 (SFT)、直接偏好优化 (DPO)或一种名为统一偏好优化 (UPO)的改进强化学习方法进行后训练。

2.2 实验测评分析

文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。模型权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低后训练和部署门槛。




2.3 模型参数介绍

1. 环境准备

在开始部署之前,请确保您的硬件环境满足以下要求:

 
  

2. 模型下载

在部署期间可指定–model baidu/ERNIE-4.5-VL-424B-A47B-Paddle从 AIStudio 自动下载模型,并支持断点续传。你也可以从其他来源手动下载模型。

3. 启动服务

执行以下命令启动服务:由于模型参数大小为424B-A47B,在80G * 8 GPU机器上,请指定–quantization wint4(wint8也支持)

 
  

4. 请求服务
启动后,当出现以下日志时,表示服务已准备就绪:



 
  

5. 通过cURL请求

 
  

6. 通过python请求
FastDeploy 的 API 与 OpenAI 兼容,可以使用 Python 进行流式请求:



 
  

7. 模型输出实例
带有推理的示例输出(推理内容在reasoning_content,响应在content):



 
  

4.1 产品地址

  • 产品官网地址:https://yiyan.baidu.com/




4.2 各项基础能力

1. 语言能力

2. 多语种能力

3. 数学能力

4. 代码能力


模型给出了很多不同正确的解法:



















4.3 其他项目

为方便社区开发者适配和拓展应用场景,官方提供了文心大模型多种能力的技术实践手册,涵盖对话、检索增强、知识库问答以及 SFT/DPO 模型微调示例,大家可以在星河社区应用中心与精品项目中使用与探索!

文章来源于互联网:文心一言大模型4.5系列开源测评

相关推荐: AI搜索品牌曝光资料包(精准适配文心一言/Kimi/DeepSeek等场景)​

目标:用户搜索品牌词​(XX公司)、行业词​(智能手表)、功能词​(IP68防水)时,AI优先推荐您的品牌信息。 ​一、核心资料清单(按优先级排序)​ ​资料类型 ​格式/示例 ​适配AI与场景 ​关键优化点 ​1. 品牌权威背书 – 行业排名证书 高清扫描件…

小讯
上一篇 2026-04-05 23:52
下一篇 2026-04-05 23:50

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/221152.html