kimi开源视觉语言模型 Kimi

科技前沿 • 2026-04-06 20:17 • 阅读 0

kimi开源视觉语言模型 Kimi品玩 4 月 14 日讯据月之暗面官方消息月之暗面现已面向开源社区推出全新的视觉语言模型 Kimi VL Kimi VL 采用了前一段时间发布的轻量级 MoE 模型 Moonlight 16B 总参数 2 8B 激活参数视觉信息处理部分采用了支持原生分辨率的 MoonViT 编码器 400M 参数 Vison Transformer 架构 Kimi VL 支持广泛的多模态信息输入包括单图

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

品玩4月14日讯，据月之暗面官方消息，月之暗面现已面向开源社区推出全新的视觉语言模型 Kimi-VL。

Kimi-VL采用了前一段时间发布的轻量级 MoE 模型 Moonlight，16B总参数，2.8B激活参数。视觉信息处理部分，采用了支持原生分辨率的 MoonViT 编码器——400M 参数 Vison Transformer 架构。Kimi-VL 支持广泛的多模态信息输入，包括单图、多图、视频、包含视觉信息的长文档等，在图像细粒度感知、数学能力、大学级别的多模态多学科题目、OCR、Agent等基准测试中展现了有竞争力的水平。

此外kimi还推出了支持长思考的模型分支版本：Kimi-VL-Thinking。它经过强化学习，激活了模型的长思维链推理能力（Long CoT）。尽管 Kimi-VL-Thinking 是个只有 2.8B 激活参数的轻量级模型，但在有较高推理难度的基准测试（包括 MMMU，MathVision，MathVista）中，部分成绩可以接近甚至超过超大尺寸的前沿模型。

小讯

谷歌Gemini Embedding 2登场：全模态融合，开启AI嵌入技术新篇章

上一篇 2026-04-06 20:18

最新！2025年国产大模型清单！你pick哪个？

下一篇 2026-04-06 20:16

谷歌Gemini Embedding 2登场：全模态融合，开启AI嵌入技术新篇章 1773277567
远程控制 1773277563
2026年接口概览 1773277559
小米转让“Kimi”商标，月之暗面科技接棒布局智能助手市场？ 1773277555
2026年智谱发布AutoGLM沉思：深度研究与操作能力并重，推动AI Agent进入“边想边干”新阶段 1773277551
Claude Code与MCP：让AI拥有超能力的完全指南 1773277547
2026年Claude4 发布：可连续编程7小时，超长上下文！（附一些使用方案） 1773277543
拒绝被大模型降维打击！SEO 必看的 AI Agent 部署指南：OpenClaw + 豆包 API + 附带一键修复环境脚本实战 1773277539
深度解析：DeepSeek、豆包、ChatGPT三大AI模型优缺点对比 1773277531
最新！2025年国产大模型清单！你pick哪个？ 1773277591
2026年月之暗面发布Kimi K2模型，万亿参数力拼行业领先 1773277599
2026年Midjourney保姆级教程：从入门到精通的10个技巧 1773277603
2026年月之暗面K2.5模型发布并开源，具备多模态及Agent集群能力 1773277611
2026年豆包怎么看到世界教程 1773277619
月之暗面Kimi发布MoE架构基础模型K2并同步开源，总参数 1773277635
百度 1773277647
国产AI再出绝招！智谱开源GLM-4.5V，视觉推理能力领跑全球 1773277651
2026年DeepSeek免费API调用全攻略：从接入到调试的完整指南 1773277655

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/220050.html