文 | wiwi

下一个 AI 项目该选什么模型?

以前这个问题很好回答:谁最强,就接谁。OpenAI 强就接 OpenAI,Claude 稳就接 Claude,Gemini 便宜就接 Gemini。对很多开发者来说,模型只是一个 API,先把产品做出来,比什么都重要。

但到了 2026 年,这道题没那么简单了。闭源 API 帮你把产品做出来,也可能在产品跑起来后吃掉你的利润。

一个 AI 应用只要真的跑起来,账单会先变得刺眼。调用量越大,Token 成本越像一根不断收紧的绳子;数据越敏感,法务和安全部门越会追问:这些内容到底去了哪里?产品越依赖某个 API,创业者越会担心:哪天价格变了、接口限了、模型规则改了,我这门生意还在不在?

这时,开放权重模型突然变得诱人起来。它未必总是最强,但它可以下载、部署、微调、量化,能放进自己的服务器,也能塞进云厂商和端侧设备。企业和开发者开始有了第二种选择:不是所有任务都必须交给闭源 API,也可以把一部分能力放到自己可控的部署环境里。

2026 年 6 月底,这场分裂被推到台前。据《华尔街日报》、CNBC、The Verge 等外媒报道,智谱最新的开放权重模型 GLM-5.2 在网络安全、漏洞发现等特定任务上,已经接近美国前沿模型的水位。这个消息真正值得看的地方,不是中国模型是否已经在通用能力上全面追平 OpenAI 和 Anthropic,而是另一件更具体的事:前沿能力正在通过开放权重更快扩散。

过去一年,AI 行业最重要的分裂,其实不在中美之间,也不在大厂和创业公司之间,而在两条路线之间。

一条路越走越封闭:最强的模型被放在 API 后面,被装进 ChatGPT、Claude、Gemini 这样的产品,由平台统一控制访问、计费、安全和迭代节奏。用户看到的是一个越来越好用的入口,开发者依赖的则是一个越来越关键、也越来越难替换的外部能力。

另一条路反方向生长:模型权重被公开释放,企业能部署在自己的机器上,开发者能自由改造,云厂商能托管,也能塞进手机等终端。在成本、可控性和扩散速度上,开放权重这条路正快速追近闭源。

打开网易新闻 查看精彩图片

China’s Zhipu is closing in on top U.S. AI models with Anthropic and OpenAI held back

一、为什么连 OpenAI 也开始补开放权重短板?

最近半年,闭源派不再只谈"我们最强",做开放权重的公司也不再只谈"为了理想",双方都把商业和成本的算盘摆到了台面上。

OpenAI 自己的松口,最能说明问题。这家长期坚持闭源路线的公司,在 DeepSeek 带来的冲击之后,态度也出现了少见的松动——萨姆·奥尔特曼公开承认,OpenAI 在开源这件事上可能"站在了历史错误的一边",并对外发布了开放权重模型。但这不是 OpenAI 路线的根本反转,而是一次被竞争压力逼出来的补位:它仍然把最前沿能力握在手里,只是不得不承认,完全忽视开放生态会付出代价。

与此同时,闭源公司的安全叙事也在变硬,"我们最负责"正取代"我们最强",成为它们维持封闭的新理由。

开放权重这一端则越来越热闹。Meta 仍在用 Llama 系列押注开放模型生态,商业逻辑并不难理解:在移动时代错失操作系统霸权之后,开放模型是它削弱苹果、谷歌生态优势、争夺下一代底层生态的方式。欧洲的 Mistral 在"主权 AI"的叙事下持续融资,给那些不愿把命脉交给美国模型的政府和企业一个替代选项。而 DeepSeek、Qwen、智谱这些中国名字,则证明了即便不掌握最强的消费级入口,也能靠高性价比的开放模型,在全球开发者中赢得一席之地。

这两条路的底色,是两种几乎相反的世界观。闭源派更像是在搭一套垂直系统:数据中心、模型、API、终端产品被串在一起,开发者在平台提供的接口上做生意,也必须接受平台的定价、限流和规则变化。做开放权重的公司则相反,把模型权重交给开发者和企业,让能力可以被重新部署、改造和组合。这背后既有理想,也有冷峻的地缘诉求——越来越多国家不愿把核心 AI 能力建立在别国的模型之上。这已经不只是"代码是否可见"的技术争吵,而是企业在部署、成本和数据边界上,能不能保留更多选择权的问题。

闭源谈安全,开放谈成本、部署和主权,争论也因此变得更难收场。

打开网易新闻 查看精彩图片

OpenAI 的开放模型

二、闭源卖能力,开放模型靠什么赚钱?

真正决定这两条路线能走多远的,不是模型有没有开放,而是谁能把钱收回来。

闭源公司卖的是"最终能力"。它投入巨额算力训练最强模型,再通过订阅、API、企业服务和生态分成收回成本,模型越强、越封闭,越能维持差异化和定价权。

它的下一步更值得注意——一批闭源模型公司,正从"卖模型调用"转向"卖数字员工",把主打能替代部分初级工作的 AI Agent 以更高客单价卖给企业。在这种图景下,开放最前沿的权重无异于自断财路。所以闭源平台天然抗拒彻底开放:它们可以开放 API、开放工具、开放较小的模型,但最能带来溢价的核心能力,仍会牢牢攥在手里。

开放模型公司卖的是"铲子"。当模型本身像 Linux 一样免费且无处不在,利润就转移到了算力调度、数据治理、安全护栏和私有化运维上。Meta 持续押注开放模型,不是要靠模型 API 赚钱,而是要让全世界的开发者都在它的架构上优化,倒逼整个生态向它靠拢;云厂商乐见开源,是因为不管你用什么模型,最终都得在它的云上跑推理。

当然,大厂押注开放模型,也不是为了做公益。开放本身就是打法:先把开发者和云厂商拉进来,再在托管、工具链、企业服务和标准上赚钱。某种意义上,这也是一种"延迟的闭源":先靠开放占住心智,等生态依赖形成、用户离不开了,再回头谈商业条款。分野就在这里:闭源公司想把用户留在自己的产品里,开放模型公司想把自己的模型铺进所有人的产品里。

简单说,闭源路线最怕失去定价权,开放权重路线最怕没人买单。两条路的差别,可以浓缩成一张表:

打开网易新闻 查看精彩图片

闭源 vs 开源

三、开放权重为什么像 AI 时代的 Android?

如果闭源更像 iOS,那么开放权重越来越像 Android。这个类比并不完美,却足够说明问题:移动互联网的结局不是一方消灭另一方,而是分成两套生态——高端体验和平台利润更多流向 iOS,全球规模和设备多样性更多流向 Android。决定 Android 胜负的,从来不是某一台旗舰机比 iPhone 强,而是它无处不在。

开放权重模型的扩散逻辑与此高度相似。它不需要在所有维度上击败最强闭源模型,只要在足够多的任务上"够用",并且更便宜、更可控、更好部署,就会被源源不断地塞进各类场景:企业的私有化部署、行业定制模型、跑在手机和设备上的端侧模型,以及大量对成本敏感的后台任务。

真正进了企业场景,模型榜单只是参考。更多时候,大家算的是成本、延迟、权限和合规。只要这些账算得过来,一个 85 分但可控的模型,往往比一个 100 分但完全租来的模型更有吸引力。

四、模型一旦放出去,谁来负责?

问题不在于模型能不能开放,而在于模型开放之后,能力可以被复制,责任却很难被复制。模型越强,开放之后的风险越难收回——网络攻击、自动化钓鱼、深度伪造、生物化学风险、舆论操纵,都可能因强模型的扩散而降低门槛。这也正是 GLM-5.2 那类新闻真正让海外警觉的地方:当顶尖的网络安全能力以开放权重的形式扩散,攻防的天平可能被悄悄改写。

闭源至少还能靠账号、内容审核、调用限制和日志追踪保留一定控制权;而开放权重模型一旦被下载、改写、去掉安全过滤、重新部署,原始发布方就几乎管不到了。

这正是围绕开放模型的监管争论越来越激烈的原因,而且双方都不全错。支持者说,开放有利于透明、审计、竞争和创新,如果最强能力都攥在少数公司手里,社会反而更难监督它们;反对者说,软件开源释放的是代码,而模型开放释放的是一种可迁移、可复制、可规模化的能力,一旦跨过某些危险阈值,开放可能带来不可逆的扩散。

也正因如此,"开源还是闭源"这个问法本身正在变得不够精确。未来的开放会分成很多层级:有的只开放调用接口,有的连模型权重一起放出,有的甚至公开训练代码和数据配方;有的允许随便商用,有的只限研究。真正该问的不再是"要不要开源",而是——开放到哪一层? 哪些模型可以开放、开放到什么程度、由谁评估风险、如何追责,才是这场争论最困难、也最重要的部分。

五、中国 AI 为什么更需要开放权重?

对中国公司来说,这个问题尤其现实。沿闭源路线和 OpenAI、Anthropic、谷歌正面硬碰,要面对的不只是模型能力差距,还有算力、生态、品牌信任和市场准入等一连串落差。闭源当然必须做,中国也需要自己的强模型和强平台,但如果只是做一个中文版的超级入口,很容易陷入同质化。

开放权重反而可能是中国 AI 更有机会形成全球影响力的地方,原因很简单:它能绕过产品入口的壁垒。一个中国模型只要够便宜、够强、够好部署,就能被全球开发者直接拿去用,不必先说服用户下载一个 App、也不必建完整的海外销售体系。

DeepSeek 当初带来的冲击,本质上不是"又出了一个模型",而是证明了一种可能——即便不掌握最强的消费级入口,也能靠高性价比模型改变全球开发者对中国 AI 的认知。美国国会下属的 USCC,在 2026 年《两个循环》报告里就点破了这套机制:开放模型在国内反哺产业链、在国外扩张影响力,两个循环彼此加强。

但这条路有代价。开放权重会削弱模型本身的直接收费能力,也让对手能更快学走你的成果。中国公司如果选开放路线,就不能停在"放出模型、刷榜、赢口碑",必须回答下一步的硬问题:如何把开发者热度变成企业收入?如何把下载量变成生态控制力?如何把开放权重变成商业护城河?答不上来,开放就只会变成一场昂贵的流量战。

六、最后真正赚钱的,可能不是模型本身

把未来押注在开源或闭源任何一边,大概都是误判。更可能的结局是混合路线时代:最前沿、最高风险、最昂贵的模型,仍由少数公司闭源控制,负责冲击能力上限、承担更高的安全责任。

大量中高性能模型,则会以开放权重、可商用许可、行业版本、端侧版本的形式扩散,负责降低成本、扩大覆盖、进入垂直行业和本地场景。企业不会只选一种,开发者也不会只押一个模型。

这种"既要又要",会把应用层推向一种新形态——从"选一个模型"变成"编排一组模型":最难的问题交给闭源前沿模型,普通任务交给开源模型,碰隐私和内网数据则用本地模型。由此浮现出一个新的产业机会——模型调度层:谁能帮企业在闭源、开源、本地、行业模型之间自动分配任务(哪个合适就调哪个),谁就可能成为 AI 时代新的中间层,它不一定训练最强模型,却掌握模型如何进入业务流程。

最懂这门生意的,是那些同时押注两端的巨头。微软是其中最矛盾、也最精明的存在:它在闭源这边重押 OpenAI,又在开源社区拥抱 Hugging Face,还在 GitHub 上力推 Copilot——但无论你最终用闭源还是开源,很可能就有一部分要用到它的云、它的工具或它的代码托管。这种"中间地带"的繁荣恰恰说明,AI 的分裂并不是物理隔离,而是一场围绕云、工具链和企业服务展开的再分工:大模型竞争,正在从"模型公司之间的竞争",扩展为"模型生态之间的竞争"。

结尾:从"谁最强"回到"谁还愿意一直租用 AI 能力"

"闭源还是开源",表面是技术社区争了几十年的老问题,放进 AI 时代却变成了一个更大的产业命题:智能能力应该如何分配?

所以这从来不是非黑即白的选择。闭源解决能力上限,开放权重解决能力扩散。但扩散之后,新的封闭也会长出来——云、工具链、模型路由、企业服务,都可能成为下一轮入口。争论的核心,正在从模型能力转向部署权、成本结构和生态议价权。

过去两年,全球 AI 都在追问同一个问题:谁能做出最强的模型?接下来几年,问题会变成另一个——当模型足够强之后,它该属于谁?而这个问题,最终会落到一个个具体的日常选择上:下一个项目,你是接入那个昂贵而强大的封闭接口,还是下载一个低成本、可改、跑在自己机器上的开放模型。

它会先出现在一些不起眼的迁移里:一家创业公司把普通任务从闭源 API 切到开放权重模型;一家医院为了合规,把模型部署到本地;一家车企为了端侧响应速度,训练自己的小模型。

真正改变大模型格局的,未必是某一次榜单排名,而是越来越多人开始问:这套能力,我为什么一定要一直租?