字节回应被OpenAI“拉黑”：年中已停止使用GPT训练模型 | 最前线|azure|gpt训练模型|openai|人工智能|字节|微软|最前线

文 | 周鑫雨

编辑 | 邓咏仪

北京时间2023年12月16日上午，科技媒体Command Line作者Alex Health的一篇文章，将OpenAI对字节跳动的控诉摆到了台前。

这篇“檄文”中，字节被指控在大语言模型开发项目Project Seed中，几乎每个阶段都在秘密使用OpenAI的模型API来训练和评估模型。

“参与的员工们对此心知肚明。”Alex Health声称自己在字节的沟通平台飞书上亲眼所见，员工讨论如何通过数据脱敏来粉饰证据，“滥用非常普遍，以至于Project Seed的员工经常达到访问API次数的上限。”

这场控诉的结局是，OpenAI禁止了字节跳动的账户。OpenAI发言人Niko Felix通过Alex Health发表了声明：

所有 API 客户都必须遵守我们的使用政策，以确保我们的技术得到良好利用。虽然字节跳动对我们 API 的使用很少，但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不遵守这些政策，我们将要求他们进行必要的更改或终止其帐户。

OpenAI 发言人 Niko Felix的声明。

所谓的“Seed”，是字节在2022年末就启动的基础大语言模型开发项目。该项目下有两个主要产品，一个是已在国内推出的聊天机器人“豆包”，一个则是正在开发中的、计划通过火山引擎对外提供服务的机器人平台。

一名业内人士对36氪表示，国内厂商用国外主流模型的API先试水业务、训练模型的情况并不少见：“先用先进模型把业务跑起来，等自己的模型训练能力达到标准再进行替换。”

而多名知情人士则向36氪透露，目前字节跳动的模型业务比距，无论是产品项目Flow，还是大模型项目Seed，都有国内海外业务两手抓的打算。由于政策规定，国内业务将采用字节自主研发的模型，而海外业务，将先采用国外厂商的模型API服务。

在OpenAI的服务条例中，确实存在竞争保护相关的内容。为了防止客户使用OpenAI的服务开发竞品，OpenAI对客户的使用范围做了严格的规定：只允许开发非商用的用于数据治理的AI模型，或者用于微调OpenAI对外服务的模型。

OpenAI的服务条例。

“拉黑”风波后，字节跳动发言人Jodi Seth在当日也快速做出回应。她表示，GPT生成的数据在Project Seed早期被用于标注模型，并在今年年中左右从字节跳动的训练数据中删除：

字节跳动获得了微软使用GPT API的许可。我们使用GPT为非中国市场的产品和功能提供动力，但使用我们的自我发展模型为豆包提供动力，豆包仅在中国可用。

这则声明承认了字节存在用GPT生成的数据训练模型的行为，但这个行为发生在OpenAI设定服务条例之前。可见的是，OpenAI最早一版服务条例发布于2023年8月28日，而字节声称在年中前已经停止将GPT生成的数据应用于训练过程。

OpenAI的第一版服务条例更新于2023年8月。

字节回应的另一个重点，则是强调GPT的API服务是通过微软云服务Azure，而非从OpenAI直接获得。换言之，OpenAI的“拉黑”，显得越俎代庖。

不过，即便是微软Azure，也拥有与OpenAI类似的竞争保护条款：“客户不得使用且不允许第三方使用微软生成式人工智能服务创建、培训或改进（直接或间接）类似或具有竞争性的产品或服务。”

微软Azure生成式人工智能服务条款

如今，不少人都在等待微软Azure的回应。对海外AI业务依赖于国外厂商API的字节而言，微软的态度将至关重要。

欢迎交流

字节回应被OpenAI“拉黑”：年中已停止使用GPT训练模型 | 最前线

热搜

热门跟贴

热搜

热门跟贴

相关推荐

纯太阳能电车何时能实现，马斯克怎么看？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

机器人也有国家队？国产机器人大比拼 在上海世界人工智能大会的现场，我们发现今年有超多机器人参展，其中

硅谷AI精英人均“百万美元”薪酬，业界标配还是谣言？

不分割成token，直接从字节中高效学习，Mamba原来还能这样用

走进深水区，和36氪一起画出AI行业的未来蓝图

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。 通过视频直接提问，看看

全新TextGrad框架：用GPT-4o作引擎，自动优化端到端任务

GPT-4 更强的标志，原来藏在了 logo 里

全世界跑得最快的人形机器人，还能跳科目三 都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

国产机器人也会空翻了！打破限制，世界首款！

大疆前高管带6人创业，做出了类目Top1的割草机器人

AI时代，谁还没用AI智能硬件提升工作效率？

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

从零手搓MoE大模型，大神级教程来了

大模型不需要眼前的共识

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

被AI量产的短视频营销号气疯了，于是，我也做了一个

最新宣布：上海浦东先开始！无人驾驶出租车免费试乘启用，路线直通浦东机场，这样呼叫→

3分钟带你看遍IPF大会十年黑科技，迈向AI+新时代

机器人也有国家队？国产机器人大比拼在上海世界人工智能大会的现场，我们发现今年有超多机器人参展，其中

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。通过视频直接提问，看看

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有