上期我们拆解过,这轮AI浪潮里商业数据最炸裂的当数 Anthropic——人类历史上收入增长最快、人类历史上人均产值最高、人类历史上估值最高的私有公司。
但那些都是"结果",是"过去"。
今天这篇文章,我们回到当下:真正让硅谷震动甚至害怕的那张底牌,到底是什么?以及,这家公司手里攥着史诗级好牌的时候,有没有可能翻车?
王牌Mythos强在哪
2026年上半年, Anthropic的新一代模型Mythos是 整个硅谷AI圈的焦点。
Mythos这个词,希腊语里就是"神话传说"。名字霸气侧漏,但如果你仔细看它的评测数据,会发现这名字甚至有点谦虚。
先说编程,SWE-bench Pro,业界公认最苛刻的编程评测。它扔一个真实代码仓库过去,要求跨文件修bug、改架构,模拟工程师实际干活的样子。Opus 4.6拿到53.4%,已是上代的天花板。Mythos直接干到77.8%,从"能干活的中级工程师"跳到"能独立负责复杂项目的高级工程师"。
数学方面测试成绩也是碾压的,美国数学奥林匹克真题USAMO 2026,Opus 4.6得分42.3%,刚摸到及格线。Mythos干到97.6%,距离满分一步之遥,翻倍级的领先。
人类最后的测试,Opus拿53分,Mythos拿了64.7分。这个考试是几百位专家联合出的题,专门为了让AI做不出而设计的,Mythos硬是突破了60分大关。
比编程和数学更让硅谷坐不住的,是安全。
《纽约时报》把Mythos称为"可怕的警钟",卫报管它叫"零日漏洞机器"——下面这组数字,做过网络安全的人看完都会后背发凉。
实战型黑客攻防赛题CTF安全挑战,考的是能不能真正攻进一个系统,在Mythos之前,市面所有大模型在这类任务上的成功率趋近于零。Mythos一上来:73%。
英国AI安全研究所AISI做了一个测试:让Mythos模拟攻击企业内网。一共32步,从侦察、渗透到完全掌控内网,全链路打通。人类安全专家干完同样的事要20多个小时,Mythos在10小时内完成了3次。
另外,OpenBSD操作系统藏了27年的一个安全漏洞,全球顶尖安全研究者都没发现,Mythos找到了。
Firefox浏览器安全测试中,Opus 4.6成功写出2次攻击,Mythos写出181次——两个数量级的差距。
把编程、数学、安全三组数据并排摊在桌上,结论已经很清楚:Mythos对所有上一代模型实现了全面碾压。
8小时不停手的模型
Mythos为什么这么强?这就不得不提它独有的能力了。
现在的模型干不了长活。任务稍微复杂一点,做着做着就断了,回头问你要不要继续。Opus 4.6算能扛的,最长连续干一两个小时不中断,已经到头了。
Mythos打破了这条天花板。给它一句话,它能连续8小时自主执行一个任务——自己拆解、写代码、跑测试、看结果、复盘、再改。你早上交代一个工程任务,下午回来它还在推进。
8小时自主工作的能力,直接引发了硅谷对AGI的重新讨论。
谷歌联合创始人谢尔盖·布林在一次内部会议上说的话已经传遍了硅谷:"如果你用过Mythos,你就会感觉到这就是一个纯粹的AGI。如果你觉得这都不是AGI,那我就不知道什么是AGI了。"
硅谷当前正在形成一种共识:能自我改进的系统就是AGI。有朝一日它能自己写代码、进化自己、看一眼效果再写代码——那就是AGI。布林因此做了一个决定:要求谷歌大模型团队从多模态全力转向Coding模型。
一个模型强到这个程度,但普通用户接触不到。Anthropic选择了一条完全不同的路径。这背后的原因,不光关乎安全,更关乎商业。
不公开的生意经
Mythos不向公众开放,由一个叫Project Glasswing的框架管控,仅限12家科技巨头加40个安全组织做防御性研究。所有可能被模型攻击的巨头,同时也是最早拿到模型做防御的一方。
与此同时,Anthropic挑了全美100家大企业,开始输送服务。
价格不低:每百万Token输出125美元,Opus 4.7的5倍。
Anthropic的账本是这样算的:不需要所有人用,100家大企业就够了。当前企业API占其收入70%-75%,Claude Code年化收入超过25亿美元,B端生意模型已被市场实打实验证过了。
但真正让投资圈兴奋的,是硅谷流传的另一条消息:Anthropic在实验revenue share模式——用我的模型让你的营收增长10%,我从中拿1%-2%。
这个模式一旦跑通,AI公司就不只是卖工具了。它是给你提供一套能把你收入拉上去的服务。这种事以前要靠麦肯锡、靠高薪工程师团队,周期长、成本高。现在一个模型就干了,而且干得更好。
回头再看OpenAI,两条路线的差距一目了然。OpenAI走C端订阅,每月20美元,用户量做到天也有天花板。谷歌一年广告收入四五千亿美金,加上整盘Meta,全拿过来也就七八千亿美金。到了这个体量,估值自然撞墙。
Anthropic切的是企业成本支出端——全球企业每年花在人力、咨询、研发上的钱是几十万亿美金级别。帮你增长,拿一两个点,天花板根本不在一个量级。
当然,这也不是说Anthropic就无敌了。
三根软肋
第一根:算力的周期赌局。
一个月前Anthropic还在被用户骂降智降限额,原因就是算力跟不上。
CEODario Amodei凡尔赛说:"我本来以为今年增长三四倍就够了,没想到涨了10倍。"增长10倍当然爽,但你的算力储备是按三四倍建的,缺口大到需要立刻下重注。
2026年5月7日,Anthropic租下SpaceX的Colossus 1超算集群,但底层的问题没有解决。GPU是大宗商品,采购逻辑是刚性的,一次买足未来三到五年的量,建机房、通电、上规模,每一步都有无法压缩的固定周期。买卡本质就是赌未来收入曲线。赌对了皆大欢喜,一旦增长放缓,那批卡瞬间变成沉没成本。
Amodei自己公开说过,公司可能因此破产。
这是高增长公司的经典悖论:增长越快,被迫下的注就越大;注下得越大,容错空间就越小。
第二根:人才密度。
Anthropic目前约3000人。DeepMind接近2万人,谷歌旗下还有多个AI团队,加上Meta、微软、OpenAI——整个硅谷已经把Anthropic当作第一假想敌。各路团队的研究方向正在从"怎么做出好AI"转向"怎么打Anthropic"。
好消息是势头在这边:已有创业公司CTO辞职来做普通研究员,这种人才吸力的上一次峰值是2008年的Google。但3000人对整个硅谷生态,这场仗不好打,就看Anthropic未来人才队伍建设了。
第三根:销售基因。
现在的情况是企业API占收入大头,纯自然增长,企业抢着用。
但做企业级应用,销售团队永远是必修课。Anthropic是极客型组织,模型好,技术强,但"怎么卖"这件事几乎没建过体系。
现在企业抢着用,是因为市场上没得选。等竞争对手也拿出差不多的模型,企业为什么还选你?到时候拼的就是谁能靠销售团队扎进行业、把客户绑定住。
最后
三根软肋,哪一根都不是小事。但最致命的还不是这些。
处在超高速爆发期的公司,外部竞争和资源瓶颈打不倒它。真正危险的是内部判断力——在增长飞轮转得最快时能否保持克制。
钱多了,诱惑跟着就来了:消费者产品要不要做?基础设施要不要横向扩张?每条路看起来都对,每条路都可能把人从"专注"拖到"平庸"。
当然,硅谷的魅力正在于此:永远会有一个think different的团队,从你完全没想到的角度杀出来。1998年的Google,2004年的Facebook,2015年的OpenAI,2022年的Anthropic,都在重复同一个叙事——这里没有永恒的赢家。
下一个Anthropic,可能已经在某个车库里敲下了第一行代码。
今天就到这,如果本文对你有帮助,欢迎收藏转发。如果对硅谷AI感兴趣,点个关注下期咱们接着聊。
如果你想体验龙虾为工作提效,现在就可以试试:
国内版:easyclaw.cn
国际版:easyclaw.com
企业版:easyclaw.work
热门跟贴