OpenAI 致力于使人工智能广泛可及(),7月 18 日宣布推出其最具成本效益的小型模型—— GPT-4o mini[1]。在 ChatGPT 中,免费、Plus 和团队用户将从今天开始可以访问 GPT-4o mini,取代 GPT-3.5。企业用户也将从下周开始访问。
GPT-4o mini 在 MMLU 评估中得分为 82%,并在 LMSYS 排行榜[2] 上的聊天偏好中优于 GPT-4(截至 2024 年 7 月 18 日,早期版本的 GPT-4o mini 在性能上优于 GPT-4T 01-25)。其定价为每百万 token 输入 15 美分、每百万 token 输出 60 美分(大约相当于标准书籍中的 2500 页),比以往的前沿模型便宜一个数量级,且比 GPT-3.5 Turbo 便宜超过 60 %。这一价格使得开发者可以更经济实惠地构建和扩展其 AI 应用。
📌在 2022 年,世界上最好的模型是 text-davinci-003。它比 GPT-4o mini 差很多,其成本是 GPT-4o mini 的 100 倍。
![]()
GPT-4o mini 凭借其低成本和低延迟,使一系列广泛的任务成为可能,例如串联或并行多个模型调用(如调用多个 API),向模型传递大量上下文(如完整的代码库或对话历史),或通过快速、实时的文本响应与客户互动(如机器人客服)。
目前,GPT-4o mini API 支持文本和视觉,在未来将支持文本、图像、视频和音频的输入/输出。该模型的上下文窗口为 128K token,知识截止至 2023 年 10 月。得益于与 GPT-4o 共享的改进版分词器(tokenizer),在处理非英语文本时更加经济高效。
📌 tiktokentiktoken[3] 是 OpenAI 开源的一个快速分词器。当给定一个文本字符串(如 )和一种编码方式(如 ),分词器可以将文本字符串拆分为一系列 token(如 )。
将文本字符串拆分为 token 是有用的,因为 GPT 模型以 token 的形式查看文本。知道一个文本字符串中有多少 token 可以告诉你:
查看示例,了解更多 How to count tokens with tiktoken[4]
GPT-4o mini 在学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,在文本智能和多模态推理方面表现出色,并支持与 GPT-4o 相同范围的语言。它在函数调用(Function calling[5])方面表现出色,让开发者可以构建出从外部系统获取数据或执行操作的应用。与 GPT-3.5 Turbo 相比,在长上下文也具有更好的性能。
📌 函数调用是指将大型语言模型连接到外部工具。在 API 调用中,可以描述函数,让模型智能地选择输出包含调用函数所需参数的 JSON 对象。最新的模型(如 gpt-4o、gpt-4-turbo 和 gpt-4o-mini)已经被训练为能够检测何时需要调用函数,并生成符合函数签名的 JSON。由于这种能力带来的潜在风险,建议在执行影响用户的操作(如发送邮件、发布内容或进行购买)之前,建立用户确认流程。
GPT-4o mini 在几个关键基准测试中表现出色:

作为模型开发过程的一部分,OpenAI 与一些值得信赖的合作伙伴合作,以更好地了解 GPT-4o mini 的用例和限制。在与 Ramp[6] 和 Superhuman[7] 等公司合作时,他们发现 GPT-4o mini 在从收据文件中提取结构化数据或在提供线程历史时生成高质量电子邮件响应等任务中,比 GPT-3.5 Turbo 表现更好。
📌 名词解释
OpenAI 从一开始,就在模型中内置了安全措施,并在开发过程的每一步都进行了强化。在预训练阶段,过滤掉不希望模型学习或输出的信息,例如仇恨言论、成人内容、主要聚合个人信息的网站和垃圾邮件。在后训练阶段,使用人类反馈的强化学习(RLHF)等技术,使模型的行为与 OpenAI 的政策保持一致,以提高响应的准确性和可靠性。GPT-4o mini 具有与 GPT-4o 相同的内置安全措施,并经过自动化和人类评估,符合 OpenAI 的承诺(Moving AI governance forward[15])。超过 70 名外部专家测试了 GPT-4o,以识别潜在风险,OpenAI 已经解决了这些问题,并将在即将发布的 system card 和 Preparedness scorecard 中分享这些细节。还使用研究指导的新技术(The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions[16])改进了 GPT-4o mini 的安全性,使其更能抵御越狱、提示注入和系统提示提取。OpenAI 将继续监控 GPT-4o mini 的使用情况,并在识别到新风险时进行改进。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/210190.html