大模型战争下半场：谁还愿意一直租用 AI？|ios|安卓|新系统|模型战争|调用

文 | wiwi

下一个 AI 项目该选什么模型？

以前这个问题很好回答：谁最强，就接谁。OpenAI 强就接 OpenAI，Claude 稳就接 Claude，Gemini 便宜就接 Gemini。对很多开发者来说，模型只是一个 API，先把产品做出来，比什么都重要。

但到了 2026 年，这道题没那么简单了。闭源 API 帮你把产品做出来，也可能在产品跑起来后吃掉你的利润。

一个 AI 应用只要真的跑起来，账单会先变得刺眼。调用量越大，Token 成本越像一根不断收紧的绳子；数据越敏感，法务和安全部门越会追问：这些内容到底去了哪里？产品越依赖某个 API，创业者越会担心：哪天价格变了、接口限了、模型规则改了，我这门生意还在不在？

这时，开放权重模型突然变得诱人起来。它未必总是最强，但它可以下载、部署、微调、量化，能放进自己的服务器，也能塞进云厂商和端侧设备。企业和开发者开始有了第二种选择：不是所有任务都必须交给闭源 API，也可以把一部分能力放到自己可控的部署环境里。

2026 年 6 月底，这场分裂被推到台前。据《华尔街日报》、CNBC、The Verge 等外媒报道，智谱最新的开放权重模型 GLM-5.2 在网络安全、漏洞发现等特定任务上，已经接近美国前沿模型的水位。这个消息真正值得看的地方，不是中国模型是否已经在通用能力上全面追平 OpenAI 和 Anthropic，而是另一件更具体的事：前沿能力正在通过开放权重更快扩散。

过去一年，AI 行业最重要的分裂，其实不在中美之间，也不在大厂和创业公司之间，而在两条路线之间。

一条路越走越封闭：最强的模型被放在 API 后面，被装进 ChatGPT、Claude、Gemini 这样的产品，由平台统一控制访问、计费、安全和迭代节奏。用户看到的是一个越来越好用的入口，开发者依赖的则是一个越来越关键、也越来越难替换的外部能力。

另一条路反方向生长：模型权重被公开释放，企业能部署在自己的机器上，开发者能自由改造，云厂商能托管，也能塞进手机等终端。在成本、可控性和扩散速度上，开放权重这条路正快速追近闭源。

China’s Zhipu is closing in on top U.S. AI models with Anthropic and OpenAI held back

一、为什么连 OpenAI 也开始补开放权重短板？

最近半年，闭源派不再只谈"我们最强"，做开放权重的公司也不再只谈"为了理想"，双方都把商业和成本的算盘摆到了台面上。

OpenAI 自己的松口，最能说明问题。这家长期坚持闭源路线的公司，在 DeepSeek 带来的冲击之后，态度也出现了少见的松动——萨姆·奥尔特曼公开承认，OpenAI 在开源这件事上可能"站在了历史错误的一边"，并对外发布了开放权重模型。但这不是 OpenAI 路线的根本反转，而是一次被竞争压力逼出来的补位：它仍然把最前沿能力握在手里，只是不得不承认，完全忽视开放生态会付出代价。

与此同时，闭源公司的安全叙事也在变硬，"我们最负责"正取代"我们最强"，成为它们维持封闭的新理由。

开放权重这一端则越来越热闹。Meta 仍在用 Llama 系列押注开放模型生态，商业逻辑并不难理解：在移动时代错失操作系统霸权之后，开放模型是它削弱苹果、谷歌生态优势、争夺下一代底层生态的方式。欧洲的 Mistral 在"主权 AI"的叙事下持续融资，给那些不愿把命脉交给美国模型的政府和企业一个替代选项。而 DeepSeek、Qwen、智谱这些中国名字，则证明了即便不掌握最强的消费级入口，也能靠高性价比的开放模型，在全球开发者中赢得一席之地。

这两条路的底色，是两种几乎相反的世界观。闭源派更像是在搭一套垂直系统：数据中心、模型、API、终端产品被串在一起，开发者在平台提供的接口上做生意，也必须接受平台的定价、限流和规则变化。做开放权重的公司则相反，把模型权重交给开发者和企业，让能力可以被重新部署、改造和组合。这背后既有理想，也有冷峻的地缘诉求——越来越多国家不愿把核心 AI 能力建立在别国的模型之上。这已经不只是"代码是否可见"的技术争吵，而是企业在部署、成本和数据边界上，能不能保留更多选择权的问题。

闭源谈安全，开放谈成本、部署和主权，争论也因此变得更难收场。

OpenAI 的开放模型

二、闭源卖能力，开放模型靠什么赚钱？

真正决定这两条路线能走多远的，不是模型有没有开放，而是谁能把钱收回来。

闭源公司卖的是"最终能力"。它投入巨额算力训练最强模型，再通过订阅、API、企业服务和生态分成收回成本，模型越强、越封闭，越能维持差异化和定价权。

它的下一步更值得注意——一批闭源模型公司，正从"卖模型调用"转向"卖数字员工"，把主打能替代部分初级工作的 AI Agent 以更高客单价卖给企业。在这种图景下，开放最前沿的权重无异于自断财路。所以闭源平台天然抗拒彻底开放：它们可以开放 API、开放工具、开放较小的模型，但最能带来溢价的核心能力，仍会牢牢攥在手里。

开放模型公司卖的是"铲子"。当模型本身像 Linux 一样免费且无处不在，利润就转移到了算力调度、数据治理、安全护栏和私有化运维上。Meta 持续押注开放模型，不是要靠模型 API 赚钱，而是要让全世界的开发者都在它的架构上优化，倒逼整个生态向它靠拢；云厂商乐见开源，是因为不管你用什么模型，最终都得在它的云上跑推理。

当然，大厂押注开放模型，也不是为了做公益。开放本身就是打法：先把开发者和云厂商拉进来，再在托管、工具链、企业服务和标准上赚钱。某种意义上，这也是一种"延迟的闭源"：先靠开放占住心智，等生态依赖形成、用户离不开了，再回头谈商业条款。分野就在这里：闭源公司想把用户留在自己的产品里，开放模型公司想把自己的模型铺进所有人的产品里。

简单说，闭源路线最怕失去定价权，开放权重路线最怕没人买单。两条路的差别，可以浓缩成一张表：

闭源 vs 开源

三、开放权重为什么像 AI 时代的 Android？

如果闭源更像 iOS，那么开放权重越来越像 Android。这个类比并不完美，却足够说明问题：移动互联网的结局不是一方消灭另一方，而是分成两套生态——高端体验和平台利润更多流向 iOS，全球规模和设备多样性更多流向 Android。决定 Android 胜负的，从来不是某一台旗舰机比 iPhone 强，而是它无处不在。

开放权重模型的扩散逻辑与此高度相似。它不需要在所有维度上击败最强闭源模型，只要在足够多的任务上"够用"，并且更便宜、更可控、更好部署，就会被源源不断地塞进各类场景：企业的私有化部署、行业定制模型、跑在手机和设备上的端侧模型，以及大量对成本敏感的后台任务。

真正进了企业场景，模型榜单只是参考。更多时候，大家算的是成本、延迟、权限和合规。只要这些账算得过来，一个 85 分但可控的模型，往往比一个 100 分但完全租来的模型更有吸引力。

四、模型一旦放出去，谁来负责？

问题不在于模型能不能开放，而在于模型开放之后，能力可以被复制，责任却很难被复制。模型越强，开放之后的风险越难收回——网络攻击、自动化钓鱼、深度伪造、生物化学风险、舆论操纵，都可能因强模型的扩散而降低门槛。这也正是 GLM-5.2 那类新闻真正让海外警觉的地方：当顶尖的网络安全能力以开放权重的形式扩散，攻防的天平可能被悄悄改写。

闭源至少还能靠账号、内容审核、调用限制和日志追踪保留一定控制权；而开放权重模型一旦被下载、改写、去掉安全过滤、重新部署，原始发布方就几乎管不到了。

这正是围绕开放模型的监管争论越来越激烈的原因，而且双方都不全错。支持者说，开放有利于透明、审计、竞争和创新，如果最强能力都攥在少数公司手里，社会反而更难监督它们；反对者说，软件开源释放的是代码，而模型开放释放的是一种可迁移、可复制、可规模化的能力，一旦跨过某些危险阈值，开放可能带来不可逆的扩散。

也正因如此，"开源还是闭源"这个问法本身正在变得不够精确。未来的开放会分成很多层级：有的只开放调用接口，有的连模型权重一起放出，有的甚至公开训练代码和数据配方；有的允许随便商用，有的只限研究。真正该问的不再是"要不要开源"，而是——开放到哪一层？ 哪些模型可以开放、开放到什么程度、由谁评估风险、如何追责，才是这场争论最困难、也最重要的部分。

五、中国 AI 为什么更需要开放权重？

对中国公司来说，这个问题尤其现实。沿闭源路线和 OpenAI、Anthropic、谷歌正面硬碰，要面对的不只是模型能力差距，还有算力、生态、品牌信任和市场准入等一连串落差。闭源当然必须做，中国也需要自己的强模型和强平台，但如果只是做一个中文版的超级入口，很容易陷入同质化。

开放权重反而可能是中国 AI 更有机会形成全球影响力的地方，原因很简单：它能绕过产品入口的壁垒。一个中国模型只要够便宜、够强、够好部署，就能被全球开发者直接拿去用，不必先说服用户下载一个 App、也不必建完整的海外销售体系。

DeepSeek 当初带来的冲击，本质上不是"又出了一个模型"，而是证明了一种可能——即便不掌握最强的消费级入口，也能靠高性价比模型改变全球开发者对中国 AI 的认知。美国国会下属的 USCC，在 2026 年《两个循环》报告里就点破了这套机制：开放模型在国内反哺产业链、在国外扩张影响力，两个循环彼此加强。

但这条路有代价。开放权重会削弱模型本身的直接收费能力，也让对手能更快学走你的成果。中国公司如果选开放路线，就不能停在"放出模型、刷榜、赢口碑"，必须回答下一步的硬问题：如何把开发者热度变成企业收入？如何把下载量变成生态控制力？如何把开放权重变成商业护城河？答不上来，开放就只会变成一场昂贵的流量战。

六、最后真正赚钱的，可能不是模型本身

把未来押注在开源或闭源任何一边，大概都是误判。更可能的结局是混合路线时代：最前沿、最高风险、最昂贵的模型，仍由少数公司闭源控制，负责冲击能力上限、承担更高的安全责任。

大量中高性能模型，则会以开放权重、可商用许可、行业版本、端侧版本的形式扩散，负责降低成本、扩大覆盖、进入垂直行业和本地场景。企业不会只选一种，开发者也不会只押一个模型。

这种"既要又要"，会把应用层推向一种新形态——从"选一个模型"变成"编排一组模型"：最难的问题交给闭源前沿模型，普通任务交给开源模型，碰隐私和内网数据则用本地模型。由此浮现出一个新的产业机会——模型调度层：谁能帮企业在闭源、开源、本地、行业模型之间自动分配任务（哪个合适就调哪个），谁就可能成为 AI 时代新的中间层，它不一定训练最强模型，却掌握模型如何进入业务流程。

最懂这门生意的，是那些同时押注两端的巨头。微软是其中最矛盾、也最精明的存在：它在闭源这边重押 OpenAI，又在开源社区拥抱 Hugging Face，还在 GitHub 上力推 Copilot——但无论你最终用闭源还是开源，很可能就有一部分要用到它的云、它的工具或它的代码托管。这种"中间地带"的繁荣恰恰说明，AI 的分裂并不是物理隔离，而是一场围绕云、工具链和企业服务展开的再分工：大模型竞争，正在从"模型公司之间的竞争"，扩展为"模型生态之间的竞争"。

结尾：从"谁最强"回到"谁还愿意一直租用 AI 能力"

"闭源还是开源"，表面是技术社区争了几十年的老问题，放进 AI 时代却变成了一个更大的产业命题：智能能力应该如何分配？

所以这从来不是非黑即白的选择。闭源解决能力上限，开放权重解决能力扩散。但扩散之后，新的封闭也会长出来——云、工具链、模型路由、企业服务，都可能成为下一轮入口。争论的核心，正在从模型能力转向部署权、成本结构和生态议价权。

过去两年，全球 AI 都在追问同一个问题：谁能做出最强的模型？接下来几年，问题会变成另一个——当模型足够强之后，它该属于谁？而这个问题，最终会落到一个个具体的日常选择上：下一个项目，你是接入那个昂贵而强大的封闭接口，还是下载一个低成本、可改、跑在自己机器上的开放模型。

它会先出现在一些不起眼的迁移里：一家创业公司把普通任务从闭源 API 切到开放权重模型；一家医院为了合规，把模型部署到本地；一家车企为了端侧响应速度，训练自己的小模型。

真正改变大模型格局的，未必是某一次榜单排名，而是越来越多人开始问：这套能力，我为什么一定要一直租？