深度解读硅谷AI格局(2)：Anthropic的王牌和隐忧|anthropic|知名企业|硅谷ai格局|编程|谢尔盖·布林|谷歌|高吞吐量内核

上期我们拆解过，这轮AI浪潮里商业数据最炸裂的当数 Anthropic——人类历史上收入增长最快、人类历史上人均产值最高、人类历史上估值最高的私有公司。

但那些都是"结果"，是"过去"。

今天这篇文章，我们回到当下：真正让硅谷震动甚至害怕的那张底牌，到底是什么？以及，这家公司手里攥着史诗级好牌的时候，有没有可能翻车？

王牌Mythos强在哪

2026年上半年， Anthropic的新一代模型Mythos是整个硅谷AI圈的焦点。

Mythos这个词，希腊语里就是"神话传说"。名字霸气侧漏，但如果你仔细看它的评测数据，会发现这名字甚至有点谦虚。

先说编程，SWE-bench Pro，业界公认最苛刻的编程评测。它扔一个真实代码仓库过去，要求跨文件修bug、改架构，模拟工程师实际干活的样子。Opus 4.6拿到53.4%，已是上代的天花板。Mythos直接干到77.8%，从"能干活的中级工程师"跳到"能独立负责复杂项目的高级工程师"。

数学方面测试成绩也是碾压的，美国数学奥林匹克真题USAMO 2026，Opus 4.6得分42.3%，刚摸到及格线。Mythos干到97.6%，距离满分一步之遥，翻倍级的领先。

人类最后的测试，Opus拿53分，Mythos拿了64.7分。这个考试是几百位专家联合出的题，专门为了让AI做不出而设计的，Mythos硬是突破了60分大关。

比编程和数学更让硅谷坐不住的，是安全。

《纽约时报》把Mythos称为"可怕的警钟"，卫报管它叫"零日漏洞机器"——下面这组数字，做过网络安全的人看完都会后背发凉。

实战型黑客攻防赛题CTF安全挑战，考的是能不能真正攻进一个系统，在Mythos之前，市面所有大模型在这类任务上的成功率趋近于零。Mythos一上来：73%。

英国AI安全研究所AISI做了一个测试：让Mythos模拟攻击企业内网。一共32步，从侦察、渗透到完全掌控内网，全链路打通。人类安全专家干完同样的事要20多个小时，Mythos在10小时内完成了3次。

另外，OpenBSD操作系统藏了27年的一个安全漏洞，全球顶尖安全研究者都没发现，Mythos找到了。

Firefox浏览器安全测试中，Opus 4.6成功写出2次攻击，Mythos写出181次——两个数量级的差距。

把编程、数学、安全三组数据并排摊在桌上，结论已经很清楚：Mythos对所有上一代模型实现了全面碾压。

8小时不停手的模型

Mythos为什么这么强？这就不得不提它独有的能力了。

现在的模型干不了长活。任务稍微复杂一点，做着做着就断了，回头问你要不要继续。Opus 4.6算能扛的，最长连续干一两个小时不中断，已经到头了。

Mythos打破了这条天花板。给它一句话，它能连续8小时自主执行一个任务——自己拆解、写代码、跑测试、看结果、复盘、再改。你早上交代一个工程任务，下午回来它还在推进。

8小时自主工作的能力，直接引发了硅谷对AGI的重新讨论。

谷歌联合创始人谢尔盖·布林在一次内部会议上说的话已经传遍了硅谷："如果你用过Mythos，你就会感觉到这就是一个纯粹的AGI。如果你觉得这都不是AGI，那我就不知道什么是AGI了。"

硅谷当前正在形成一种共识：能自我改进的系统就是AGI。有朝一日它能自己写代码、进化自己、看一眼效果再写代码——那就是AGI。布林因此做了一个决定：要求谷歌大模型团队从多模态全力转向Coding模型。

一个模型强到这个程度，但普通用户接触不到。Anthropic选择了一条完全不同的路径。这背后的原因，不光关乎安全，更关乎商业。

不公开的生意经

Mythos不向公众开放，由一个叫Project Glasswing的框架管控，仅限12家科技巨头加40个安全组织做防御性研究。所有可能被模型攻击的巨头，同时也是最早拿到模型做防御的一方。

与此同时，Anthropic挑了全美100家大企业，开始输送服务。

价格不低：每百万Token输出125美元，Opus 4.7的5倍。

Anthropic的账本是这样算的：不需要所有人用，100家大企业就够了。当前企业API占其收入70%-75%，Claude Code年化收入超过25亿美元，B端生意模型已被市场实打实验证过了。

但真正让投资圈兴奋的，是硅谷流传的另一条消息：Anthropic在实验revenue share模式——用我的模型让你的营收增长10%，我从中拿1%-2%。

这个模式一旦跑通，AI公司就不只是卖工具了。它是给你提供一套能把你收入拉上去的服务。这种事以前要靠麦肯锡、靠高薪工程师团队，周期长、成本高。现在一个模型就干了，而且干得更好。

回头再看OpenAI，两条路线的差距一目了然。OpenAI走C端订阅，每月20美元，用户量做到天也有天花板。谷歌一年广告收入四五千亿美金，加上整盘Meta，全拿过来也就七八千亿美金。到了这个体量，估值自然撞墙。

Anthropic切的是企业成本支出端——全球企业每年花在人力、咨询、研发上的钱是几十万亿美金级别。帮你增长，拿一两个点，天花板根本不在一个量级。

当然，这也不是说Anthropic就无敌了。

三根软肋

第一根：算力的周期赌局。

一个月前Anthropic还在被用户骂降智降限额，原因就是算力跟不上。

CEODario Amodei凡尔赛说："我本来以为今年增长三四倍就够了，没想到涨了10倍。"增长10倍当然爽，但你的算力储备是按三四倍建的，缺口大到需要立刻下重注。

2026年5月7日，Anthropic租下SpaceX的Colossus 1超算集群，但底层的问题没有解决。GPU是大宗商品，采购逻辑是刚性的，一次买足未来三到五年的量，建机房、通电、上规模，每一步都有无法压缩的固定周期。买卡本质就是赌未来收入曲线。赌对了皆大欢喜，一旦增长放缓，那批卡瞬间变成沉没成本。

Amodei自己公开说过，公司可能因此破产。

这是高增长公司的经典悖论：增长越快，被迫下的注就越大；注下得越大，容错空间就越小。

第二根：人才密度。

Anthropic目前约3000人。DeepMind接近2万人，谷歌旗下还有多个AI团队，加上Meta、微软、OpenAI——整个硅谷已经把Anthropic当作第一假想敌。各路团队的研究方向正在从"怎么做出好AI"转向"怎么打Anthropic"。