OpenAI发布会:推出函数调用、实时 API 更新、偏好微调技术、发布 Go 和 Java SDK,费用降低 60%

chatGPT网址2024-12-18144

chatgpt 欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:

推出 OpenAI o1、实时 API 改进、新的微调方法以及更多面向开发者的功能。

今天,我们推出了更强大的模型、新的定制工具,以及一系列提升性能、灵活性和成本效益的升级,帮助开发者更高效地构建基于 AI 的应用。这些更新包括:

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

  • OpenAI o1 API

    支持函数调用、开发者消息、结构化输出和视觉能力。
  • 实时 API 更新

    包括简单的 WebRTC 集成、GPT-4o 音频费用降低 60%、以及支持 GPT-4o mini(音频费用仅为之前的十分之一)。
  • 偏好微调(Preference Fine-Tuning)

    一种全新的模型定制技术,让开发者更轻松地根据用户和开发者偏好调整模型。
  • 全新的 Go 和 Java SDK

    目前已进入 Beta 测试阶段。

OpenAI o1 API

OpenAI o1 是我们设计的推理模型,旨在以更高的准确性处理复杂的多步骤任务。该模型现已向 API 的第 5 层用户(usage tier 5)推出。o1 是 OpenAI o1-preview 的继任者,开发者已经使用 o1-preview 构建了智能应用程序,用于简化客户支持、优化供应链决策以及预测复杂的金融趋势。

o1 已进入生产就绪阶段,具备支持实际应用的关键功能,包括:

  • 函数调用

    无缝连接 o1 至外部数据和 API。
  • 结构化输出

    生成严格遵循自定义 JSON Schema 的可靠响应。
  • 开发者消息

    可为模型指定指令或上下文,例如定义语气、风格以及其他行为指导。
  • 视觉能力

    通过图像进行推理,为科学、制造或编码等需要视觉输入的领域解锁更多应用场景。
  • 更低的延迟

    o1 相比 o1-preview 每次请求平均使用的推理 token 数减少了 60%。
  • 新参数reasoning_effort

    允许开发者控制模型回答前的思考时间。

今天发布的 o1 快照版本o1-2024-12-17 是两周前在 ChatGPT 中推出模型的全新后训练版本。它基于用户反馈改进了模型行为,同时保留了在 o1 系统卡(System Card)中评估的前沿能力。我们也将 ChatGPT 中的 o1 更新为该版本(详情见模型发布说明)。以下评估数据反映了新版本的性能,确保开发者获取最新基准。

o1-2024-12-17 在多个基准测试中创造了新的性能纪录,提升了成本效益和性能。

不同指标下的模型评估准确性

此外,我们观察到 o1-2024-12-17 在函数调用和结构化输出测试中显著优于 gpt-4o。

我们正在逐步开放访问权限,同时努力扩展到更多使用层级,并逐步提高速率限制。欲了解更多信息,请查阅 [API 文档](opens in a new window)。

实时 API 的改进

实时 API (Realtime API) 使开发者能够创建低延迟的自然对话体验,非常适合语音助手、实时翻译工具、虚拟导师、交互式客户支持系统,甚至是你自己的虚拟圣诞老人。今天,我们针对开发者的常见需求推出了一系列改进,包括直接集成 WebRTC、降低价格以及提供对响应的更多控制。

WebRTC 支持

实时 API 引入了 WebRTC 支持。WebRTC 是一个开放标准,可以更轻松地跨平台构建和扩展实时语音产品,无论是面向浏览器应用、移动客户端、物联网设备还是服务器间的直接通信。

我们的 WebRTC 集成旨在确保在现实条件下(即使网络质量波动)也能实现流畅且响应迅速的交互。它处理音频编码、流式传输、噪声抑制和拥塞控制。

通过 WebRTC,现在仅需几行 JavaScript 代码即可为您的应用添加实时功能:

async function createRealtimeSession(localStream, remoteAudioEl, token) {    const pc = new RTCPeerConnection();    pc.ontrack = e => remoteAudioEl.srcObject = e.streams[0];    pc.addTrack(localStream.getTracks()[0]);    const offer = await pc.createOffer();    await pc.setLocalDescription(offer);    const headers = { Authorization: `Bearer ${token}`, 'Content-Type': 'application/sdp' };    const opts = { method: 'POST', body: offer.sdp, headers };    const resp = await fetch('https://api.openai.com/v1/realtime', opts);    await pc.setRemoteDescription({ type: 'answer', sdp: await resp.text() });    return pc;}

新的 GPT-4o 和 GPT-4o mini 实时快照,成本更低

推出 gpt-4o-realtime-preview-2024-12-17,作为实时 API 测试版的一部分,改进了语音质量、提高了输入可靠性(特别是在语音输入数字时),并降低了成本。通过效率改进,我们将音频 Token 的价格降低了 60%,降至每 100 万输入 Token $40、每 100 万输出 Token $80。缓存音频输入的成本降低了 87.5%,仅为每 100 万输入 Token $2.50。

同时,还将 GPT-4o mini 引入了实时 API 测试版,作为gpt-4o-mini-realtime-preview-2024-12-17。GPT-4o mini 是我们最具成本效益的小型模型,能在实时 API 中提供与 GPT-4o 相同的丰富语音体验。GPT-4o mini 的音频价格为每 100 万输入 Token $10、每 100 万输出 Token $20,文本 Token 的价格为每 100 万输入 Token $0.60、每 100 万输出 Token $2.40。缓存音频和文本的成本均为每 100 万 Token $0.30。

这些快照已在 [实时 API](opens in a new window) 中可用,同时也可通过 [Chat Completions API](opens in a new window) 访问,名称分别为gpt-4o-audio-preview-2024-12-17 和gpt-4o-mini-audio-preview-2024-12-17

更强的响应控制

为实时 API 提供了以下新功能,使其更易于创建卓越的语音驱动体验:

  • 并发的带外响应

    支持在后台运行内容审核或分类等任务,而不干扰用户的语音交互。
  • 自定义输入上下文

    可以指定哪些对话内容作为模型输入。例如,仅对用户的最后一句话进行审核,或者重新使用之前的回复,而无需永久更改会话状态。
  • 受控的响应时机

    支持服务器端语音活动检测 (VAD),但不会自动触发响应。例如,可以在收集必要数据(如账户信息)并将其添加到模型上下文后,再手动启动语音回复,从而提供更精确的控制。
  • 延长最大会话时长

    从 15 分钟增加到 30 分钟。

偏好微调 (Preference Fine-Tuning)

微调 API 现支持偏好微调,简化了根据用户和开发者偏好定制模型的过程。此方法使用直接偏好优化 (Direct Preference Optimization, DPO) 技术,通过比较模型输出的成对响应,教会模型区分偏好和非偏好输出。与固定目标训练不同,偏好微调通过成对比较学习,尤其适用于语气、风格和创意等主观性任务。

偏好微调与监督微调之间存在以下关键区别:

开始与可信赖的合作伙伴测试偏好微调,迄今已取得了令人鼓舞的结果。例如,Rogo AI 正在为金融分析师构建一款 AI 助手,用于将复杂查询分解为子查询。通过他们基于专家构建的基准测试Rogo-Golden,他们发现监督微调在处理分布外的查询扩展时存在挑战——例如,在“公司 X 增长速度如何”这样的查询中,可能会遗漏ARR 等指标。而偏好微调解决了这些问题,将模型性能从基础模型的 75% 准确率提升到了80% 以上

偏好微调 将于今天正式推出,适用于gpt-4o-2024-08-06,并很快支持gpt-4o-mini-2024-07-18。其定价与监督微调的训练 Token 价格相同,并将在明年初支持我们的最新模型。

Go 和 Java SDK 测试版发布

最后,推出了两个新的官方 SDK,分别适用于 Go 和 Java,现已进入测试版阶段,此外我们还提供了现有的官方 Python、Node.js 和 .NET 库。我们的目标是使 OpenAI API 无论您选择什么编程语言,都能轻松使用。

Go 是一种静态类型语言,非常适合处理并发任务和构建可扩展的 API 和后端系统。OpenAI Go SDK 使您能够轻松地在 Go 代码中与 OpenAI 模型进行交互。

client := openai.NewClient()ctx := context.Background()prompt := "Write me a haiku about Golang."completion, err := client.Chat.Completions.New(  ctx,   openai.ChatCompletionNewParams{    Messages: openai.F(      []openai.ChatCompletionMessageParamUnion{        openai.UserMessage(prompt),      },    ),    Model: openai.F(openai.ChatModelGPT4o),  },)

Java 一直是企业软件开发的主流语言,因其类型系统和庞大的开源库生态系统而广受欢迎。OpenAI Java SDK 提供了类型化的请求和响应对象,并提供了管理 API 请求的实用工具。

OpenAIClientclient= OpenAIOkHttpClient.fromEnv();ChatCompletionCreateParamsparams= ChatCompletionCreateParams    .builder()    .message(List.of(        ChatCompletionMessageParam.ofChatCompletionUserMessageParam(            ChatCompletionUserMessageParam            .builder()            .role(ChatCompletionUserMessageParam.Role.USER)            .content(                ChatCompletionUserMessageParam.Content.ofTextContent("What is the origin of Java's Duke mascot?"                )            )            .build()        )    ))    .model(ChatModel.O1_PREVIEW)    .build();ChatCompletionchatCompletion= client.chat().completions().create(params);

GPT4代充值

本文链接:https://gptwangzhi.top/chatgpt/1468.html

chatgpt plus会员怎么续费chatgpt4.0充值续费chatGPT商店GPT Builder创建ChatGPT插件GPT StoreGPT-4ogpt-4o检测人的情绪gpt-4o多模态大模型发布GPT-4o免费

相关文章

网友评论