OpenAI 2年前押注的1个判断，现在全行业都在抄作业|openai|抄作业|押注|知名企业|谷歌

2023年初，OpenAI内部有个小范围讨论：要不要把ChatGPT的上下文窗口从4K tokens扩到32K。工程团队算了一笔账，成本涨8倍，延迟肉眼可见。产品团队投了反对票。但Sam Altman拍板：做。8个月后，长文本能力成了所有大模型厂商的军备竞赛焦点，Anthropic直接干到100K，Google跟到1M。

这个决策的底层逻辑，和大多数创始人的工作流完全相反。

常规路径是教科书式的：找痛点→验证需求→做最小可行产品（MVP, Minimum Viable Product）→优化转化→找低成本获客渠道→数据驱动迭代→规模化。这套流程能帮你活到B轮，但很难解释为什么有人能在同一赛道快你三个身位。

Altman自己在Y Combinator时期就提过这个悖论。2015年他写过一篇博客，说大多数创始人像"在雾天开车"——车灯只能照亮前方50米，但真正的机会往往出现在200米外。当时没人当回事，毕竟YC的投资组合里，靠"预测未来"赢的案例远少于靠"快速执行"赢的。

从"响应需求"到"制造需求"的断层

2022年夏天的Stable Diffusion是个分水岭。Midjourney已经验证了文生图有市场，但Emad Mostaque（Stability AI创始人）选择开源模型，把算力成本压到消费级显卡能跑。这个决策的争议在于：当时没有证据表明"个人本地部署"是真实需求，所有用户调研都会告诉你，云端API更方便。

Mostaque的判断依据很私人。他在对冲基金做过量化交易，见过2012年深度学习论文爆发前夜的学术圈状态——某个技术曲线即将陡峭化时，先发者的窗口期只有6-12个月。他赌的不是"用户现在想要什么"，而是"6个月后，当算力成本再降一个数量级，市场结构会变成什么样"。

结果所有人都看到了。Stable Diffusion的开源生态在4个月内长出3万个衍生模型，直接倒逼Midjourney调整定价策略。Mostaque后来承认，这个决策有"赌博成分"，但赌博的前提是"你对技术收敛方向有比市场更短的反馈回路"。

预测能力的三个输入源

这种反馈回路从哪来？我观察了十几个有类似特质的创始人，他们的信息 diet 高度重合。

第一，学术会议的poster session。不是keynote，是poster——那些没被选中做口头报告、但审稿人觉得"有点意思"的研究。2023年NeurIPS的poster区里，已经有3篇关于"推理时计算扩展"（inference-time compute scaling）的雏形工作，比o1模型的发布早了一年。跟进这些paper的创始人，对"慢思考"路线的信心比市场早9个月。

第二，供应链的异常波动。2019年，某自动驾驶公司的创始人发现，激光雷达的BOM成本在Q2突然跌了15%，但终端售价没变。他跑去问供应商，得知某头部厂商在清库存——因为固态方案即将量产。这个信号让他推迟了多传感器融合的方案，all in纯视觉，省了18个月的研发冗余。

第三，边缘用户的"错误用法"。Notion早期的增长团队有个内部梗：每次用户把产品用成"完全不是设计初衷"的样子，就值得开瓶香槟。最早有人拿Notion做wiki，团队觉得是edge case；当wiki用法占到DAU的30%时，他们才意识到"知识管理"的市场比"笔记工具"大一个数量级。

为什么结构会反噬

回到开头那个教科书流程。它的危险在于，每一步都在强化"可验证性"——你要有数据、要有用户反馈、要有A/B测试的显著性。这套系统优化的是"决策的正确率"，但牺牲的是"决策的时效性"。

2024年有个残酷的对照组。两家做AI编程助手的公司，A公司严格执行"验证需求"流程，每功能上线前做200人访谈；B公司创始人是前OpenAI研究员，凭"代码生成模型的上下文利用率会在6个月内成为瓶颈"这个判断，提前押注了超长上下文架构。12个月后，B公司的产品日活是A公司的7倍——不是因为执行更好，而是因为架构选择对了，后期所有优化都在正确的地基上。

A公司的CEO后来复盘："我们的用户调研问的是'你现在需要什么'，但用户只能基于现有工具想象答案。当新范式出现时，旧需求的优先级会瞬间重排。"