美媒：一些中国大模型已经追平甚至超越美国产品

极客网

2024-12-18 10:13 ·上海

CNBC报道称，中国想在AI领域成为统治者，这种尝试可能已经获得回报。一些美国AI业内人士和科技分析人士认为，中国AI模型已经相当流行，从性能角度看，中国的一些模型与美国产品齐头并进，甚至超越。

由于无法采购美国先进AI芯片，中国只能寻找其它办法增强AI模型性能，比如依赖开源技术，开发自主软件和芯片。

OpenAIChatGPT是基于闭源模型开发的，但中国的许多企业选择了开源LLM。查看Hugging Face平台，下载最多的LLM有许多来自中国企业，其中阿里巴巴Qwen（通义千问）热度最高，深度求索的DeepSeek也备受推崇。

阿里Qwen、DeepSeek等中国大模型受追捧

Hugging Face机器学习工程师Tiezhen Wang告诉CNBC：“从评测基准看，Qwen的性能极为出色，这是它快速流行的主要原因。”还有，Qwen的授权模式比较友好，企业使用时法律评估没有那么复杂。

阿里巴巴给Qwen分了级，有的参数很多，更强大，但算力要求高，运行成本也高，如果是参数少的小模型，运行成本更低。

Tiezhen Wang说：“不管你选择什么规模的模型，Qwen都可能是现今性能最棒的模型之一。”

DeepSeek也成为耀眼明星，它不久前刚刚推出DeepSeek-R1模型。上个月DeepSeek发布消息称，R1模型可以与OpenAI o1模型竞争。

中国企业宣称，它们的模型可以与Meta Llama开源模型竞争，也与OpenAI等闭源模型一样好。

Lux Capital合伙人Grace Isford说：“2023年，我观察到中国对开源AI的贡献不断增加，中国模型的性能很强，成本低，吞吐量高。”

不只是中国企业支持开源LLM，Meta和欧洲创业公司Mistral也有开源版AI模型。随着中美科技竞争加剧，开源模型还有一个优势：中国企业可以将自己的模型推向全球。

全球咨询公司DGA Group的合伙人Paul Triolo说：“中国企业当然希望自己的模型能在中国之外使用，所以中国企业看重开源模型，希望借开源成为AI领域的全球性玩家。”

中国企业认为LLM会是未来科技生态系统的核心

虽然全球都在热炒AI模型，但是到底应该在模型之上开发什么应用？未来谁会主导全球互联网版图？现在还充满争论。

Grace Isford说：“如果你认为前沿基本AI模型是必需，那就应该思考这些模型的用途，比如用于前沿科学、工程技术。”

乐观者将AI模型比作操作系统，它和Windows、Android、iOS一样重要，有可能会主导市场，就像科技企业主导手机和PC一样。

英国伦敦大学国王学院学者Xin Sun认为：“中国企业认为LLM会是未来科技生态系统的核心。”

Xin Sun还说：“未来的商业模型有赖于开发者加入生态系统，要基于LLM开发新的应用，要通过各种手段吸引用户、数据并获得利润，远不只是引导用户使用云服务那么简单。”

中国构建独立于英伟达高性能AI芯片之外的基础设施

训练AI模型需要海量数据，运行时需要强大算力。英伟达已经成为AI芯片的垄断者，许多头部AI企业也用英伟达芯片训练模型，但中国是个例外。

虽然美国百般阻挠，禁止英伟达高端AI芯片流入中国，但中国企业仍然不断推出先进AI模型。

Paul Triolo说：“目前大多中国科技平台都拥有充足的算力，完全可以继续优化模型。首先，中国企业囤积了大量英伟达GPU；其次，中国有自己的GPU，它们来自华为等企业。”

实际上，中国科技企业正在开发英伟达芯片的替代品，华为是领导者，百度、阿里巴巴也在投资半导体设计。

Paul Triolo认为：“在未来的日子里，中国与美国先进硬件的差距还会拉大，特别是明年，因为明年英伟达将会推出Blackwell系统，美国会严格禁止Blackwell流向中国。”

Grace Isford认为，中国一直在向本国AI基础设施进行投资，它独立于英伟达高性能AI芯片之外。“不管美国有没有禁止英伟达AI芯片在中国销售，中国都会继续投资，继续打造自己的基础设施，继续开发、训练AI模型。”（小刀）

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴