Microsoft Azure 云平台的 Azure OpenAI 服务是一款功能强大的工具,它赋予开发者访问 OpenAI 最新的语言处理技术的能力。
通过一系列尖端模型,如 gpt-4o、gpt-4、gpt-3.5-turbo、DALL-E 和 ada,开发者能够开启在创意文本创作、信息摘要化、语义检索以及自然语言向代码的转换等多个领域的新视野。在本文中,我们将深入探讨 Azure OpenAI 服务的多项功能,并对其成本结构进行详尽的分析。
Azure费用解决方案可联系。同时,通过微软官方合作伙伴获取服务,企业用户可以合规、稳定地使用ChatGPT,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。
作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括最新版本GPT-4o、Dalle-3等,只要企业有需求,全云在线都能协助快速开通!
Azure OpenAI 服务成本咨询、免费试用:
https://azureopenai.cloudallonline.com/?zxwwy117
代币
来自OpenAI 帮助中心:
令牌可以被认为是单词的片段。在 API 处理提示之前,输入会被分解为标记。这些标记并未准确地在单词开始或结束的位置进行切割 - 标记可以包含尾随空格甚至子单词。以下是一些帮助理解令牌长度的有用经验规则:
- 1 个标记 ~= 4 个英文字符
- 1 个令牌 ~= 3/4 个单词
- 100 个标记 ~= 75 个单词
或者
- 1–2 句话 ~= 30 个标记
- 1 段 ~= 100 个标记
- 1,500 个单词 ~= 2048 个标记
要获得有关令牌如何堆叠的更多上下文,请考虑以下内容:
- 韦恩·格雷茨基 (Wayne Gretzky) 的名言“如果你不投篮,你就会 100% 投失”包含 11 个标记。
- OpenAI 的章程包含 476 个代币。
- 美国《独立宣言》的抄本包含 1,695 个代币。
如何将单词拆分为标记也取决于语言。例如,“Cómo estás”(西班牙语“How are you”)包含 5 个标记(10 个字符)。较高的 token-char 比率可能会导致为英语以外的语言实现 API 的成本更高。
要进一步探索标记化,您可以使用我们的交互式Tokenizer 工具,它允许您计算标记数量并查看文本如何分解为标记。或者,如果您想以编程方式对文本进行标记,请使用Tiktoken作为专门用于 OpenAI 模型的快速 BPE 标记器。您还可以探索其他此类库,包括适用于 Python 的Transformers包或适用于 Node.js 的gpt-3-encoder包。
根据所使用的模型,请求最多可以使用提示和完成之间共享的 4,097 个令牌。如果您的提示是 4,000 个令牌,那么您最多可以完成 97 个令牌。
GPT-3.5型号
当前版本的gpt-3.5-turbo的限制为 4,096 个令牌,而最新版本的gpt-3.5-turbo-16k的限制为 16,384 个令牌。两者的价格均为每 1,000 个代币 0.002 美元(提示和完成的价格相同)。
GPT-4型号
GPT-4 模型有两种选项:限制为8,192 个代币的gpt-4模型和限制为 32,768 个代币的gpt-4-32k。
提示模式下gpt-4模型的定价为每 1,000 个代币 8K 上下文 0.03 美元,32K 上下文 0.06 美元。在完成模式下,每 1,000 个代币8K 上下文的定价为0.06 美元, 32K 上下文的定价为 0.12 美元。
微调模型
只有 GPT-3 模型(ada、curie、davinci、babbage)可用于微调(它们称为“基础”模型)。
来自微软学习:
Azure OpenAI 微调模型根据三个因素收费:
- 培训时间
- 接待时间
- 每 1,000 个令牌的推理
托管时间成本非常重要,因为一旦部署了微调模型,无论您是否主动使用它,它都会继续产生每小时成本。应密切监控微调模型的成本。
目前,Azure OpenAI 服务中尚不提供微调模型。
达尔-E
Azure OpenAI 服务还包括图像模型,其定价基于处理的图像数量。标准图像模型 DALL-E 的售价为每 100 张图像 2 美元。
嵌入模型
除了语言和图像模型之外,Azure OpenAI 服务还提供嵌入模型。标准嵌入模型 Ada 的定价为每 1,000 个代币 0.0001 美元。
定价计算示例
想象一下,我们需要提出以下请求:
- 使用gpt-3.5-turbo模型,提示 1,000 个令牌,完成 1,000 个令牌;
- 使用gpt-4模型,提示时需要 1,000 个令牌,完成时需要 1,000 个令牌;
- 使用gpt-4-32k模型,提示中包含 30,000 个令牌,完成中包含 10,000 个令牌。
计算逻辑:
对于gpt-3.5-turbo,成本为:
(1,000 +1,000) / 1,000 * $0.002 = 2 * $0.002 = $0.004。
对于gpt-4,成本为:
(1,000 / 1,000 * $0.03) + (1,000 / 1,000 * $0.06) = $0.03 + $0.06 = $0.09。
对于gpt-4–32k,成本为:
(30,000 / 1,000 * $0.06) + (10,000 / 1,000 * $0.12) = 30 * $0.06 + 10 * $0.12 = $1.8 + $1.2 = $3
总共价格为 3.094 美元。
从示例中可以看出,使用 gpt-4-32k 很昂贵,而gpt-3.5-turbo是最节省成本的选项。
你可以使用定价计算器来计算 Azure OpenAI 的工作负载,但其中目前缺少 GPT-4 和微调模型。
Azure OpenAI 服务在 Azure 基础架构上运行,在部署新资源时会产生成本。重要的是要了解可能会产生其他额外的基础设施成本。
请记住,启用将数据发送到 Azure Monitor 日志、警报等功能会导致这些服务产生额外费用。这些成本在其他服务和订阅级别下可见,但在范围仅限于 Azure OpenAI 资源时不可见。
热门跟贴