2026年【OpenAI】如何选择GPT-5 Nano或Mini？五大维度对比与实用场景推荐获取OpenAI API KEY的两种方式，开发者必看全方面教程！

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

1. 为什么你需要一个“模型调度中心”？

如果你最近在折腾AI应用开发，尤其是想把手头的项目接入不同厂商的大模型，那你肯定遇到过和我一样的烦恼。今天想试试豆包的创意写作，明天项目需要通义千问的代码能力，后天又眼馋Kimi的长文本分析。结果就是，你得为每个厂商单独申请API Key、研究不同的调用接口、处理五花八门的参数格式，项目配置文件里塞满了各种if-else，维护起来头都大了。

这感觉就像家里电器，空调一个遥控器，电视一个遥控器，音响又是另一个，用起来非常割裂。我们真正需要的，是一个“万能遥控器”——一个统一的入口，能控制所有设备，按一下就能切换。在AI开发领域，FastGPT和New-api（或称One API）的组合，就是这样一个为你量身打造的“大模型万能遥控器”。

简单来说，FastGPT是一个功能强大的开源AI知识库与智能体应用框架，你可以用它快速搭建具备对话、知识库问答、工作流自动化等能力的AI应用。而New-api，则是一个标准的OpenAI API格式的转发与聚合服务。它的核心魔法在于，能将豆包、通义千问、文心一言、智谱GLM、月之暗面Kimi等众多国内主流模型的API，全部“翻译”成统一的OpenAI API格式。

这样一来，你的FastGPT应用就无需关心后端到底是哪家模型。你只需要像调用原版ChatGPT一样，调用New-api提供的同一个地址，然后通过一个简单的“模型名称”参数，就能在GPT-4、豆包、通义千问等模型之间自由切换。这不仅仅是方便，更是架构上的解耦，让你的应用具备了前所未有的灵活性和抗风险能力。下面，我就带你一步步把这个“万能遥控器”配置好，让你一站式玩转多厂商大模型。

2. 搭建与配置前的核心准备

在开始动手修改配置文件之前，我们需要确保战场已经布置妥当。这里假设你已经按照官方文档，成功在服务器上通过Docker部署了FastGPT和New-api这两个服务。如果还没部署，可以去它们的GitHub仓库找找部署脚本，通常一条Docker Compose命令就能拉起基础服务，这里就不赘述了。

配置的核心思想，是让FastGPT把所有的模型请求，都发给New-api，再由New-api这个“调度中心”去分发给具体的厂商。所以，我们的配置工作主要围绕两个关键点展开：一是告诉FastGPT New-api的地址在哪（通过环境变量），二是告诉FastGPT New-api那里都有哪些模型可用，以及这些模型各自有什么特性（通过修改config.json文件）。

首先，找到你部署FastGPT的docker-compose.yml文件或者容器启动时设置的环境变量。我们需要修改或添加两个至关重要的环境变量：

OPENAI_BASE_URL: 这个变量告诉FastGPT，你的“OpenAI”服务地址在哪里。这里我们就要填上New-api服务的访问地址。如果FastGPT和New-api部署在同一台服务器的Docker内网里，你可以用容器名加端口，比如 http://new-api:3000/v1。如果是通过外网访问，就填你的域名或IP，如 https://api.yourdomain.com/v1。关键是最后的 /v1 路径必须带上，这是OpenAI API的标准格式。
CHAT_API_KEY: 这是访问New-api的令牌。你需要在New-api的管理后台创建一个令牌。这里有个小坑需要注意：New-api的令牌有额度限制。记得在New-api后台，把这个令牌的额度设置得足够大，或者直接设为“无限”，不然可能在测试时突然提示额度用完，让你排查半天以为是配置错误。

设置好环境变量并重启FastGPT容器后，理论上FastGPT就已经把New-api当作它的默认AI供应商了。但这还不够，我们还需要把New-api里配置好的那些丰富多彩的模型，“注册”到FastGPT的模型列表中，让它知道具体可以调用谁。

3. 深度解析config.json：打造你的模型武器库

FastGPT的核心配置文件config.json，通常位于容器内的/app/data目录下，或者你通过Docker卷映射到宿主机的对应路径。这个文件定义了FastGPT所有可用的模型，是我们今天的配置重心。我们需要修改的主要是三个数组字段：llmModels（对话/语言模型）、vectorModels（向量嵌入模型）和reRankModels（重排序模型）。我会用最直白的方式，带你搞清楚每个关键字段是干嘛的。

3.1 配置语言模型 (llmModels)

这是最重要的一部分，决定了你的AI应用能用哪些模型来聊天、分析和思考。llmModels是一个数组，里面可以放多个模型对象。每个对象代表一个可选的模型。我们拿一个配置通义千问Qwen-Max的例子来拆解：

 // 模型特有的默认参数。比如对于GLM-4，可以在这里加 `"top_p": 0.7`。 }

实战技巧与踩坑点： - model字段是灵魂：这个值不是你想当然的模型名，必须去New-api后台，查看你添加的渠道里具体有哪些模型名。比如你在New-api里配置豆包渠道，模型名可能是doubao-pro，那这里就必须填doubao-pro。 - 至少一个“全能选手”：确保至少有一个模型的datasetProcess、usedInClassify、usedInExtractFields这几个关键能力都设为true。FastGPT内部的不同功能模块会调用不同的能力，通常用一个能力最强的模型（如GPT-4o或Qwen-Max）来充当这个角色。 - 视觉模型单独配：如果你需要识图功能，就单独添加一个模型对象，将vision设为true，同时datasetProcess等字段可以设为false，让它专攻视觉任务。 - 温度与上下文：maxTemperature和maxContext务必参考模型厂商的官方文档，乱填会导致请求失败。比如豆包某些模型最高温度只到1.0，你填1.2就会出错。

你可以按照这个格式，把你New-api里接入的模型（豆包、文心、Kimi、智谱等）一个个都配置进去，形成一个强大的模型列表。

3.2 配置向量模型 (vectorModels)

如果你的FastGPT用到了知识库功能，那么向量模型就是它的“记忆核心”。它负责把文本转换成数学向量（嵌入），用于语义搜索。配置格式如下：

{ "provider": "通义千问", "model": "qwen-multimodal-embedding-v1", // 对应New-api中的向量模型名 "name": "通义千问-多模态向量", "defaultToken": 700, // 默认文本分割的token长度 "maxToken": 3000, // 该向量模型单次处理的最大token数 "weight": 100, // 优先级权重，如果有多个向量模型，数值高的优先使用 "defaultConfig": {}, // 可传入特殊参数，例如指定向量维度 `"dimensions": 1024` "dbConfig": {}, // 向量存储时的额外参数（高级用法） "queryConfig": {} // 向量检索时的额外参数（高级用法） }

关键点： 国内常用的向量模型有通义千问的text-embedding-v2、百度的bge-large-zh等。你需要在New-api中为这些向量模型单独建立渠道。maxToken很重要，它决定了你知识库文本分割的长度，设置不当会影响检索精度。

3.3 配置重排模型 (reRankModels)

重排模型属于“进阶优化”选项。当知识库搜索返回多个结果片段时，重排模型可以对这些结果进行二次排序，把最相关的排在前面，从而提升回答质量。对于大多数普通应用，这不是必选项。配置相对简单：

{ "model": "qwen-gte-rerank", // New-api中的重排模型名 "name": "通义千问-重排模型", "requestUrl": "new-api/v1/rerank", // 重排请求路径，一般New-api会提供 "requestAuth": "Bearer your-new-api-token" // 认证信息，注意格式 }

4. 一站式实操：从修改到验证的完整流水线

光说不练假把式，下面我们走一遍完整的操作流程，确保你能一次成功。

第一步：备份原配置 在修改任何东西之前，先用cp config.json config.json.bak命令备份你的原始配置文件。这是血泪教训，能救你于水火。

第二步：编辑config.json 使用vim或nano等编辑器打开config.json文件。找到llmModels、vectorModels等字段。我建议你不要直接清空替换，而是采用“新增”的方式。在原有的数组里，按照上面的格式，添加新的模型对象。这样更安全，也保留了默认的备用模型。

第三步：重启FastGPT容器 配置保存后，必须重启FastGPT容器才能使更改生效。使用Docker Compose的话，命令通常是：

docker-compose down docker-compose up -d

或者直接重启FastGPT服务容器：

docker restart fastgpt

重启后，留意一下容器日志，看看有没有报错信息：docker logs -f fastgpt。常见的错误是model名称不对，或者maxContext超限，日志里会明确提示。

第四步：登录Web界面验证 打开你的FastGPT网页管理后台（通常是服务器IP:3000）。点击左侧菜单的“模型”或“系统设置”里的模型配置页面。如果配置成功，你应该能看到一个下拉列表，里面赫然列着你刚刚添加的“通义千问-Max”、“豆包-Pro”、“Kimi-Long”等模型选项。看到这个，就说明模型接入成功了！

第五步：创建应用进行实测 光看到还不够，得真正能用。我们去“应用”页面，创建一个新的对话应用。在应用配置里，选择“模型配置”，这时你就可以在“对话模型”下拉框中，任意切换你配置好的各个厂商模型了。创建完成后，打开对话窗口，问它几个问题，比如“你是哪个模型？”或者测试一些模型特有的能力（如让Kimi总结一篇长文）。观察回复内容和速度，确保一切正常。

5. 高阶技巧与常见问题排坑指南

配置成功后，我们可以玩点更花的，并提前避开一些坑。

技巧一：混合编排，各取所长 FastGPT的强大之处在于工作流。你可以在一个复杂的工作流里，让不同的模型干它们最擅长的事。比如： - 第一步：用通义千问（擅长代码）分析用户需求，并生成一个数据处理脚本框架。 - 第二步：用豆包（创意性强）为这个脚本起一个有趣的名字和写段使用说明。 - 第三步：用Kimi（长上下文）去检查整个工作流生成的文本是否连贯。通过New-api的统一接口，在工作流节点里切换模型就像换把工具一样简单。

技巧二：利用defaultConfig微调 每个模型都有自己的小脾气。比如智谱GLM系列默认的top_p参数可能不合适，你可以在defaultConfig里统一调整："defaultConfig": {"top_p": 0.8}。这样每次FastGPT调用这个模型时，都会自动带上这个参数，省去每次手动设置的麻烦。

常见问题排坑：

“模型不可用”或“额度不足”
- 检查点：立刻去New-api管理后台，确认两点：第一，你配置的模型渠道是“启用”状态；第二，你用在CHAT_API_KEY里的那个令牌，是否有足够的额度？99%的“模型不可用”问题都出在这里。
知识库训练失败
- 检查点：回头仔细核对llmModels里，是否至少有一个模型的datasetProcess字段被设为true。并且，这个模型本身在New-api里是能正常调用的。
视觉模型不识别图片
- 检查点：首先确认你上传的图片格式和大小符合模型要求。然后，确保你选择的对话模型，其配置中vision字段是true。最后，在New-api后台，确认对应的视觉模型渠道（如Qwen-VL）配置正确。
响应速度特别慢
- 检查点：可能是某个厂商的API节点不稳定。可以登录New-api后台，查看“日志”页面，看看请求延迟和失败情况。New-api支持负载均衡和故障转移，你可以在一个模型下设置多个渠道（比如两个不同区域的豆包API密钥），让它自动选择最快的。

5. 配置修改后不生效

* 检查点：第一，确认你修改的是正在运行的FastGPT容器所挂载的`config.json`文件路径。第二，修改后必须重启FastGPT容器。第三，清除浏览器缓存再刷新网页试试。

这套FastGPT+New-api的组合拳打下来，你真的会感觉手里握有了一个AI模型的“军火库”，并且指挥权完全在你。从繁琐的多平台对接中解放出来，把精力真正聚焦在应用逻辑和业务创新上，这种体验的提升是巨大的。我自己的几个内部工具和demo项目都切换到了这个架构，维护成本直线下降，再也不用担心某个厂商API临时调整带来的焦头烂额了。如果你在配置过程中遇到了上面没提到的新坑，不妨去项目的GitHub Issues里找找，或者多在开发者社区里交流，很多时候一个小提示就能省下好几个小时的调试时间。