SuperCLUE多模态视觉评测榜出炉:文心4.5 Turbo并列国内第一!逼近GPT

SuperCLUE多模态视觉评测榜出炉:文心4.5 Turbo并列国内第一!逼近GPTp 快科技 8 月 28 日消息 中文多模态视觉语言模型测评基准 SuperCLUE VLM 8 月榜单正式发布 span style color ff0000 strong 百度 ERNIE 4 5 Turbo VL 多模态大模型以 66 47 分 的成绩并列位居国内模型第一 在真实场景任务下的领先优势明显 strong span p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

快科技8月28日消息,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)8月榜单正式发布,百度ERNIE-4.5-Turbo-VL多模态大模型以 66.47分 的成绩并列位居国内模型第一,在真实场景任务下的领先优势明显。

本次评估覆盖Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等国内外15款多模态模型。

SuperCLUE多模态视觉评测榜出炉:文心4.5 Turbo并列国内第一!逼近GPT-5

基于中文场景特点,SuperCLUE-VLM围绕基础认知、视觉推理和视觉应用三大核心维度进行评测,全面考察模型在真实任务场景下的能力。

测评结果显示,Gemini-2.5-Pro 以总分74.99分领先,OpenAI GPT-5(high) 以总分68.59分位居第二,百度ERNIE-4.5-Turbo-VL-32k-preview 以总分66.47分并列国内模型第一。

SuperCLUE多模态视觉评测榜出炉:文心4.5 Turbo并列国内第一!逼近GPT-5

有分析人士点评,文心大模型在多模态领域的多维度领先优势十分突出。ERNIE-4.5-Turbo-VL等国内其他头部模型在视觉推理、视觉应用等高阶任务上的显著进步,凸显了中国在多模态大模型领域的竞争潜力。

据悉,6月30日百度开源文心4.5系列10款模型,其中 ERNIE-4.5-VL视觉语言模型具备复杂的图文与视频理解能力,支持超过100种语言交互,其跨模态能力覆盖文档处理、视频管理、学习解题等核心任务场景。

SuperCLUE多模态视觉评测榜出炉:文心4.5 Turbo并列国内第一!逼近GPT-5

作为国内最早投入大模型产研的企业,百度依托“芯片-框架-模型-应用”的全栈自研体系,持续推动文心大模型能力进化。

得益于飞桨文心的联合优化,文心大模型的能力拓展和效率提升。

截至目前,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。

 
小讯
上一篇 2026-04-06 23:36
下一篇 2026-04-06 23:34

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/219751.html