Microsoft Azure 云平台的 Azure OpenAI 服务是一款功能强大的工具,它赋予开发者访问 OpenAI 最新的语言处理技术的能力。

打开网易新闻 查看精彩图片

通过一系列尖端模型,如 gpt-4o、gpt-4、gpt-3.5-turbo、DALL-E 和 ada,开发者能够开启在创意文本创作、信息摘要化、语义检索以及自然语言向代码的转换等多个领域的新视野。在本文中,我们将深入探讨 Azure OpenAI 服务的多项功能,并对其成本结构进行详尽的分析。

Azure费用解决方案可联系。同时,通过微软官方合作伙伴获取服务,企业用户可以合规、稳定地使用ChatGPT,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括最新版本GPT-4o、Dalle-3等,只要企业有需求,全云在线都能协助快速开通!

Azure OpenAI 服务成本咨询、免费试用:
https://azureopenai.cloudallonline.com/?zxwwy117

打开网易新闻 查看精彩图片

代币

来自OpenAI 帮助中心:

令牌可以被认为是单词的片段。在 API 处理提示之前,输入会被分解为标记。这些标记并未准确地在单词开始或结束的位置进行切割 - 标记可以包含尾随空格甚至子单词。以下是一些帮助理解令牌长度的有用经验规则:

  • 1 个标记 ~= 4 个英文字符
  • 1 个令牌 ~= 3/4 个单词
  • 100 个标记 ~= 75 个单词

或者

  • 1–2 句话 ~= 30 个标记
  • 1 段 ~= 100 个标记
  • 1,500 个单词 ~= 2048 个标记

要获得有关令牌如何堆叠的更多上下文,请考虑以下内容:

  • 韦恩·格雷茨基 (Wayne Gretzky) 的名言“如果你不投篮,你就会 100% 投失”包含 11 个标记。
  • OpenAI 的章程包含 476 个代币。
  • 美国《独立宣言》的抄本包含 1,695 个代币。

如何将单词拆分为标记也取决于语言。例如,“Cómo estás”(西班牙语“How are you”)包含 5 个标记(10 个字符)。较高的 token-char 比率可能会导致为英语以外的语言实现 API 的成本更高。

要进一步探索标记化,您可以使用我们的交互式Tokenizer 工具,它允许您计算标记数量并查看文本如何分解为标记。或者,如果您想以编程方式对文本进行标记,请使用Tiktoken作为专门用于 OpenAI 模型的快速 BPE 标记器。您还可以探索其他此类库,包括适用于 Python 的Transformers包或适用于 Node.js 的gpt-3-encoder包。

根据所使用的模型,请求最多可以使用提示和完成之间共享的 4,097 个令牌。如果您的提示是 4,000 个令牌,那么您最多可以完成 97 个令牌。

GPT-3.5型号

当前版本的gpt-3.5-turbo的限制为 4,096 个令牌,而最新版本的gpt-3.5-turbo-16k的限制为 16,384 个令牌。两者的价格均为每 1,000 个代币 0.002 美元(提示和完成的价格相同)。

GPT-4型号

GPT-4 模型有两种选项:限制为8,192 个代币的gpt-4模型和限制为 32,768 个代币的gpt-4-32k。

提示模式下gpt-4模型的定价为每 1,000 个代币 8K 上下文 0.03 美元,32K 上下文 0.06 美元。在完成模式下,每 1,000 个代币8K 上下文的定价为0.06 美元, 32K 上下文的定价为 0.12 美元。

微调模型

只有 GPT-3 模型(ada、curie、davinci、babbage)可用于微调(它们称为“基础”模型)。

来自微软学习:

Azure OpenAI 微调模型根据三个因素收费:

  • 培训时间
  • 接待时间
  • 每 1,000 个令牌的推理

托管时间成本非常重要,因为一旦部署了微调模型,无论您是否主动使用它,它都会继续产生每小时成本。应密切监控微调模型的成本。

目前,Azure OpenAI 服务中尚不提供微调模型。

达尔-E

Azure OpenAI 服务还包括图像模型,其定价基于处理的图像数量。标准图像模型 DALL-E 的售价为每 100 张图像 2 美元。

嵌入模型

除了语言和图像模型之外,Azure OpenAI 服务还提供嵌入模型。标准嵌入模型 Ada 的定价为每 1,000 个代币 0.0001 美元。

定价计算示例

想象一下,我们需要提出以下请求:

  • 使用gpt-3.5-turbo模型,提示 1,000 个令牌,完成 1,000 个令牌;
  • 使用gpt-4模型,提示时需要 1,000 个令牌,完成时需要 1,000 个令牌;
  • 使用gpt-4-32k模型,提示中包含 30,000 个令牌,完成中包含 10,000 个令牌。

计算逻辑:

对于gpt-3.5-turbo,成本为:
(1,000 +1,000) / 1,000 * $0.002 = 2 * $0.002 = $0.004。

对于gpt-4,成本为:
(1,000 / 1,000 * $0.03) + (1,000 / 1,000 * $0.06) = $0.03 + $0.06 = $0.09。

对于gpt-4–32k,成本为:
(30,000 / 1,000 * $0.06) + (10,000 / 1,000 * $0.12) = 30 * $0.06 + 10 * $0.12 = $1.8 + $1.2 = $3

总共价格为 3.094 美元。

从示例中可以看出,使用 gpt-4-32k 很昂贵,而gpt-3.5-turbo是最节省成本的选项。

你可以使用定价计算器来计算 Azure OpenAI 的工作负载,但其中目前缺少 GPT-4 和微调模型。

Azure OpenAI 服务在 Azure 基础架构上运行,在部署新资源时会产生成本。重要的是要了解可能会产生其他额外的基础设施成本。

打开网易新闻 查看精彩图片

请记住,启用将数据发送到 Azure Monitor 日志、警报等功能会导致这些服务产生额外费用。这些成本在其他服务和订阅级别下可见,但在范围仅限于 Azure OpenAI 资源时不可见。