欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:
1 OpenAI介绍最具成本效益的小型模型 GPT-4o mini
OpenAI致力于使智能尽可能广泛地可访问。今天,OpenAI宣布推出 GPT-4o mini,这是OpenAI最具成本效益的小型型号。我们预计 GPT-4o mini 将通过使智能更加实惠来显着扩大使用 AI 构建的应用程序范围。GPT-4o mini 在 MMLU 上得分为 82%,目前在 LMSYS 排行榜(opens in a new window)的聊天偏好上优于 GPT-41。它的价格为每百万个输入Token 15 美分,每百万个输出Token 60 美分,比以前的前沿模型便宜一个数量级,比GPT-3.5 Turbo 便宜 60% 以上。
GPT-4o mini以其低成本和延迟实现了广泛的任务,例如链接或并行化多个模型调用(例如,调用多个API)、将大量上下文传递给模型(例如,完整的代码库或对话历史记录)的应用程序,或通过快速、实时的文本响应与客户交互(例如,客户支持聊天机器人)。
如今,GPT-4o mini 在 API 中支持文本和视觉,未来还将支持文本、图像、视频和音频输入和输出。该模型具有 128K 个令牌的上下文窗口,每个请求支持多达 16K 个输出令牌,并且具有截至 2023 年 10 月的知识。由于与 GPT-4o 共享的改进的标记器,处理非英语文本现在更具成本效益。
2具有卓越文本智能和多模态推理的小型模型
GPT-4o mini在文本智能和多模态推理方面的学术基准测试中都超过了 GPT-3.5 Turbo 和其他小型模型,并支持与 GPT-4o 相同的语言范围。它还在函数调用方面表现出强大的性能,这使开发人员能够构建获取数据或使用外部系统执行操作的应用程序,并且与 GPT-3.5 Turbo 相比,它提高了长上下文性能。
GPT-4o mini已在几个关键基准测试中进行了评估2。
推理任务: GPT-4o mini 在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准MMLU 上的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
数学和编码能力: GPT-4o mini 在数学推理和编码任务方面表现出色,优于市场上以前的小型模型。在MGSM 上,衡量数学推理,GPT-4o mini 得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为71.7%。GPT-4o mini 在衡量编码性能的 HumanEval 上得分为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
多模态推理: GPT-4o mini 在多模态推理评估 MMMU 上也表现出强劲的表现,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
模型评估分数
评估基准
作为我们模型开发过程的一部分,我们与少数几个值得信赖的合作伙伴合作,以更好地了解 GPT-4o mini 的用例和限制。我们与 Ramp(opens in a new window) 和 Superhuman(opens in a new window) 等公司合作,他们发现 GPT-4o mini 在执行任务时明显优于 GPT-3.5 Turbo,例如从收据文件中提取结构化数据或在提供线程历史记录时生成高质量的电子邮件回复。
3 内置安全措施
安全性从一开始就内置于我们的模型中,并在我们开发过程的每一步都得到加强。在预训练中,我们会过滤掉不希望模型学习或输出的信息,例如仇恨言论、成人内容、主要汇总个人信息的网站和垃圾邮件。在训练后,我们使用强化学习与人类反馈 (RLHF) 等技术将模型的行为与我们的策略保持一致,以提高模型响应的准确性和可靠性。
GPT-4o mini内置了与 GPT-4o 相同的安全缓解措施,我们根据我们的准备框架并符合我们的自愿承诺,使用自动化和人工评估进行了仔细评估。社会心理学和错误信息等领域的 70 多位外部专家对 GPT-4o 进行了测试,以识别潜在风险,我们已经解决了这些问题,并计划在即将发布的 GPT-4o 系统卡和准备记分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。
在这些学习的基础上,我们的团队还致力于使用我们研究提供的新技术来提高 GPT-4o mini 的安全性。API 中的 GPT-4o mini 是第一个应用我们的指令层次结构(opens in a new window)方法的模型,这有助于提高模型抵抗越狱、提示注入和系统提示提取的能力。这使得模型的响应更加可靠,并有助于更安全地在大规模应用程序中使用。
我们将继续监控 GPT-4o mini 的使用方式,并在发现新风险时提高模型的安全性。
4 可用性与定价
GPT-4o mini现在可在 Assistants API、Chat Completions API 和 Batch API 中用作文本和视觉模型。开发人员每 1M 输入令牌支付 15 美分,每 1M 输出令牌支付 60 美分(大约相当于一本标准书中的 2500 页)。我们计划在未来几天内推出 GPT-4o mini 的微调。
在 ChatGPT 中,Free、Plus 和 Team 用户将从今天开始访问 GPT-4o mini,而不是 GPT-3.5。从下周开始,企业用户也可以使用,这符合我们的使命,即让所有人都能享受人工智能的好处。
5 未来
在过去的几年里,我们目睹了人工智能的显著进步,同时成本的大幅降低。例如,自 2022 年推出的 text-davinci-003 以来,GPT-4o mini 的每个Token成本下降了 99%,这是一个功能较弱的模型。我们致力于继续保持这种降低成本的轨迹,同时增强模型功能。
我们憧憬着一个未来,模型可以无缝集成到每个应用程序和每个网站上。GPT-4o mini 为开发人员更高效、更经济地构建和扩展强大的 AI 应用程序铺平了道路。人工智能的未来正变得越来越容易获得、更可靠,并嵌入到我们的日常数字体验中,我们很高兴能够继续引领潮流。
作者
OpenAI
致谢
负责人: Jacob Menick, Kevin Lu, Shengjia Zhao, Eric Wallace, Hongyu Ren, Haitang Hu, Nick Stathas, Felipe Petroski Suchhttps://openai.com/gpt-4o-contributions/ 中注意到的贡献
脚注
项目负责人: Mianna 陈
https://openai.com/gpt-4o-contributions/中注意到的贡献 脚注
1截至 2024 年 7 月 18 日,早期版本的 GPT-4o mini 优于 GPT-4T 01-25。
2 GPT-4o mini的评估编号是使用我们的 simple-evals(opens in a new window) 仓库和 API 助手系统消息提示计算得出的。对于竞争对手的型号,我们将最大数量取在其报告数量(如果有)、HELM(opens in a new window)排行榜以及我们自己通过 simple-evals 复制的数量之上。
本文链接:https://gptwangzhi.top/chatgpt/501.html
必应chatgpt4.0 插件All in大模型Stable DiffusionChatGPT安装GPTschatgpt会员能续费吗chatgpt会员续费chatgpt4.0充值续费GPT商店GPTs商店
网友评论