- 一、海外代表公司及产品
- 二、中国代表公司及产品概览
- 三、各家模型版本详表(按公司)
- 四、技术路线与开源/闭源速览
- 五、信息更正与 2025–2026 动态速览
- 六、其他值得关注的生态
- 七、关键能力横向对比与跑分榜单
- 免责声明
本文按时间线与公司梳理大模型应用、主要公司与产品。
OpenAI(美国)
产品/模型时间说明
Codex2021 起专为编程设计,GitHub Copilot 技术基础。
ChatGPT2022.11基于 GPT-3.5 的对话式 AI,多轮对话、写作、编程;大模型「出圈」标志。
GPT-4 系列2023 起多模态、插件与 GPTs,演变为 AI 应用平台。
Anthropic(美国)
产品/模型时间说明
Claude 系列2023 起长文本与安全对齐,企业文档分析、代码审查等。
Claude Code2025.02 起终端 AI 编程助手,多语言、自动改代码与测试。
Claude Sonnet 4.52025.09复杂推理与自主编程,OSWorld 等测试表现突出。
Claude Agent SDK2025.10构建金融、个人助理等自主智能体。
Claude Cowork2026 起对话式创建定制插件,融入 HR、运营、设计等流程。
公司产品/品牌时间说明
百度文心一言 (ERNIE Bot)2023.03多语言、多模态,金融、政务、教育等。
阿里巴巴通义千问 / 千问2023.09超大规模语言模型,多轮对话、创作、推理;后开源 72B/32B 等;2026.03 品牌统一为「千问」。
字节跳动豆包2023 下半年轻量、响应快,结合抖音/头条生态;豆包 2.0 支持全模态与长链路 Agent。
科大讯飞星火认知大模型2023 起中文理解与教育场景,星火 App、教育机器人等。
商汤科技商量 SenseNova2023 起视觉+文本多模态,智慧城市、自动驾驶、医疗影像等。
MiniMaxabab / MiniMax 大模型2023 起对话与轻量部署,内容生成、智能客服;M2.5 等面向 Agent 与编程。
智谱 AIChatGLM / GLM 系列2023 起中文优化、开源多,科研、教育、企业服务。
昆仑万维天工 Skywork2023 起多语言、开放 API,内容创作、办公自动化。
百川智能百川大模型2023 起中文通用,搜索增强、知识问答。
深度求索DeepSeek 系列2024.12 起VL2/V3 等开源,政务、医疗、金融等;增长迅速。
OpenAI
时间模型/产品版本/代号说明2022-11ChatGPTGPT-3.5对话式 AI,引爆大模型热潮。2023-03GPT-4GPT-4多模态大模型。2023-03GPT-4 Turbogpt-4-1106-preview 等成本与上下文优化。2023-09DALL·E 3-文生图,深度集成 ChatGPT。2024-02Sora-文生视频。2024-05GPT-4ogpt-4o原生多模态,音视频实时交互。2024-07GPT-4o minigpt-4o-mini轻量、低成本。2024-09o1o1-preview / o1推理模型,「先思考再回答」。2024-12o3-面向 STEM 与复杂推理。
注:截至当前,OpenAI 官方旗舰仍以 GPT-4o / GPT-4o-mini 及 o 系列为主;GPT-5 等名称为媒体或社区说法,以官网发布为准。
Anthropic
时间模型/产品版本/代号说明2023-03ClaudeClaude 1.0安全与对话。2024-03Claude 3Opus / Sonnet / Haiku系列化,Opus 最强、Haiku 最快。2024-06Claude 3.5Claude 3.5 Sonnet推理与长文本增强。2025-02Claude 3.7Claude 3.7 Sonnet「扩展思维」模式。2025 起Claude 4.xClaude 4.0 / 4.1 等新一代系列。
阿里巴巴(通义千问 / 千问)
时间模型/产品版本/代号说明2023-04通义千问Qwen1开源 7B–72B。2024-06通义千问Qwen2代码能力提升,多编程语言。2024通义千问Qwen2.5性能与资源均衡。2025-04通义千问Qwen3旗舰,MoE,256K 上下文。2025-12通义千问Qwen3-VL / Qwen3-Omni视觉-语言;全模态(文本/图像/音频/视频)。2026-03千问品牌统一AI 核心品牌统一为「千问」。
字节跳动(豆包)
时间模型/产品版本/代号说明2024-05豆包豆包 1.0多模态,依托抖音生态。2025豆包豆包 1.5语音与内容生成优化。2026-02豆包豆包 2.0 (Seed 2.0)全模态感知与长链路 Agent。
百度(文心一言)
时间模型/产品版本/代号说明2023-03文心一言ERNIE Bot 1.0基于文心大模型对话。2024文心一言ERNIE Bot 4.0逻辑推理与代码增强。2025文心一言ERNIE Bot 4.5 / 5.0多模态与行业应用。
深度求索(DeepSeek)
时间模型/产品版本/代号说明2024DeepSeekDeepSeek-V2 / V2.5MoE,高性价比。2024-12DeepSeekDeepSeek-V3超大 MoE,671B 总参数。2025-01DeepSeekDeepSeek-R1推理专用,数学与代码。2026-02/03DeepSeekDeepSeek-V4长上下文、多模态等(以官方发布为准)。
注:V3.2、R1-0528 等多为社区或媒体称呼,正式版本以官网为准。
智谱 AI(GLM)
时间模型/产品版本/代号说明2023ChatGLMChatGLM2 / 3开源对话,长文本。2024-06智谱大模型GLM-4旗舰,128K 上下文。2024智谱大模型GLM-4.5 / 4.6推理与多模态。2025智谱大模型GLM-5、GLM-4 Plus、CogView4、CogVideoX 等对话、多模态、图文/视频生成。
其他中国厂商(选列)
公司模型/产品版本/说明
百川智能百川大模型Baichuan 1/2/3/4,Baichuan-M2(医疗),Baichuan4-Finance。
MiniMax海螺AI、MiniMax-01视频生成;线性注意力、长文本。
昆仑万维天工 SkyworkSkywork-MoE、Skywork-OR1-32B、Skywork-R1V3-38B。
零一万物Yi 系列Yi 1.
5⁄
1.6/Large,Yi-Vision,Yi-Coder。
上海 AI LabInternLMInternLM2.5,InternLM-Math,InternVL-Chat。
其他国际主流(选列)
公司模型/产品版本/说明
GoogleGeminiGemini 1.5 Pro(百万级上下文)、2.0、2.5。
MetaLlamaLlama 2/3、3.1(含 405B)、3.2、3.3。
IBMGraniteGranite 3.2、Granite Vision。
xAIGrokGrok-1.5/2/3 及 mini 等。
4.1 技术路线与特色(选列)
公司/产品架构/路线特点典型能力侧重
OpenAI密集 Transformer、o 系列推理模型多模态、实时交互、推理与代码
Anthropic宪法 AI、混合推理(快/扩展思维)长文本、安全对齐、编程与智能体
GoogleGemini、多模态与搜索整合百万级上下文、多模态、生态整合
MetaLLaMA 系列,开源可商用开源基座、多规模、多模态版本
阿里 千问Qwen 系列,MoE(Qwen3)长上下文、代码、开源与多模态
深度求索DeepSeek-V/R 系列,MoE高性价比、推理(R1)、数学与代码
智谱GLM 系列,CogView/CogVideo中文、多模态、图文/视频生成
字节 豆包多模态、Seed 系列全模态、抖音/飞书生态、Agent
百度 文心ERNIE,多模态搜索与文库整合、行业应用
月之暗面 Kimi长上下文、Agent超长文本、长文档阅读、推理
4.2 开源与闭源速查(概览)
类型代表产品/系列说明
闭源 / API 为主ChatGPT(GPT-4o)、Claude、Gemini、文心、豆包、Kimi能力强、迭代快;依赖厂商 API 与合规。
开源可商用LLaMA、Qwen、DeepSeek、GLM、Yi、InternLM、百川、混元图像可私有化部署、微调;社区与生态活跃。
开源 + 闭源双线千问(开源 Qwen + 闭源服务)、智谱(开源 GLM + 闭源)兼顾开放与商业产品。
4.3 应用场景速览
场景典型产品/方向
通用对话与写作ChatGPT、Claude、千问、文心、豆包、Kimi
编程与代码Claude Code、GitHub Copilot、DeepSeek-R1、Qwen、GLM
办公与效率Copilot、飞书/豆包、通义、WPS AI、钉钉
教育星火、文心、Kimi(长文档)、各类作业辅导与口语
政务与 ToG文心、通义、DeepSeek、华为盘古、360 智脑
金融与合规千问、文心、百川金融、Claude、企业版模型
多模态创作DALL·E、Sora、可灵、混元图像、CogView、海螺AI
终端与硬件小爱、蓝心、OPPO 等手机/车机;千问 AI 眼镜
信息更正
- GPT-5 系列:截至当前,OpenAI 未正式发布 GPT-5、5.1 等;旗舰仍为 GPT-4o / GPT-4o-mini 及 o 系列。
- DeepSeek:V3.2、R1-0528 等多为非官方版本号,官方里程碑以 DeepSeek-V3、DeepSeek-R1 等为准。
2025–2026 关键动态(选列)
时间公司/机构模型/产品关键信息2025-01深度求索DeepSeek R1推理专用,数学与代码,性价比高。2025-02智谱 AIGLM-5新一代旗舰,复杂任务与视频生成。2025-02字节跳动豆包 2.0多模态与长视频理解。2025-02快手可灵 3.0图/文生视频、智能编辑。2025-02腾讯混元图像 3.0开源图生图,图片编辑、风格变换、老照片修复等。2025-03阿里巴巴千问 AI 眼镜首款 AI 硬件,点外卖、订酒店等。2025-09–11蚂蚁集团百灵大模型Ring-1T、Ling-1T 等开源与多模态。2026-02蚂蚁集团百灵 Ming-Flash-Omni 2.0、Ring-2.5-1T、企业版全模态、万亿参数思考模型、企业场景。2026-02/03深度求索DeepSeek V4长上下文、多模态(以官方为准)。2026-03阿里巴巴千问品牌统一为「千问」。
公司/体系产品/定位说明
华为云盘古大模型NLP、CV、科学计算,分层解耦,工业、金融等。
科大讯飞星火认知大模型中文与教育,AI 学伴、口语陪练、智能客服等。
京东言犀大模型智能客服与导购,零售、物流。
360360 智脑通用问答与搜索增强,安全分析、内容审核、API。
月之暗面Kimi超长文本与多轮对话,长文档阅读,科研、法律等。
腾讯混元大模型通用与多模态,含混元图像等;应用于内部产品与开放能力。
小米 / vivo / OPPO小爱大模型、蓝心大模型等终端侧大模型,手机、家居等本地化体验。
关键能力横向对比(简要)
下表为公开评测与报道中的典型表现,供参考;具体以各榜单与官网为准。
模型(公司)代码生成数学推理多模态
Claude Opus 4.x (Anthropic)SWE-bench 等领先,多文件与复杂工程ARC-AGI 等推理突出长上下文、文档/代码库、多模态
GPT-4o / o 系列 (OpenAI)SWE-bench 第一梯队AIME 等稳健文本/图像/音频/视频,实时交互
DeepSeek V3/R1 (深度求索)性价比高,接近前沿AIME、高考数学等顶尖当前以文本为主
Qwen 3.x (阿里)SWE-bench 国产第一梯队AIME 顶尖长上下文、Qwen-VL 图文
GLM-5 (智谱)SWE-bench 国产顶尖AIME 优秀200K 上下文,多模态增强
Kimi K2.x (月之暗面)长文档代码理解强AIME 等竞赛领先超长文本与 Agent
豆包 2.0 (字节)工程能力快速追赶高考数学等优秀文/图/视频,抖音/飞书集成
文心 5 (百度)公开编程基准较少公开数学专项较少与搜索、文库等深度整合
主流跑分榜单与评测网站
类型名称网址/说明
综合/对战Chatbot Arena (LMSys)chat.lmsys.org;用户对战 Elo 排名。
综合/多维Artificial Analysisartificialanalysis.ai;速度、价格、准确率等。
开源Hugging Face Open LLM Leaderboardhuggingface.co/spaces/Hugg… 等。
API 热度OpenRouter Rankingsopenrouter.ai/rankings;按调…
中文/国内AI 工具集 - 大模型评测ai-bot.cn;国内外模型评测汇总。
中文/国内AIGC 大模型排行榜aigc.izzi.cn;多场景综合排行。
专项SWE-bench真实 GitHub 项目 Bug 修复能力。
专项AIME / MATH数学竞赛与数学基准。
专项OSWorld / AgentBench操作系统操作与智能体任务。
本文整理自公开报道与评测信息,时间与版本以各公司官网与正式发布为准。能力对比与榜单会随评测更新而变化,请以各站点最新数据为准。
参考资料:公开报道、各公司官网与评测站点整理。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/222599.html