2023年初,OpenAI内部有个小范围讨论:要不要把ChatGPT的上下文窗口从4K tokens扩到32K。工程团队算了一笔账,成本涨8倍,延迟肉眼可见。产品团队投了反对票。但Sam Altman拍板:做。8个月后,长文本能力成了所有大模型厂商的军备竞赛焦点,Anthropic直接干到100K,Google跟到1M。

这个决策的底层逻辑,和大多数创始人的工作流完全相反。

常规路径是教科书式的:找痛点→验证需求→做最小可行产品(MVP, Minimum Viable Product)→优化转化→找低成本获客渠道→数据驱动迭代→规模化。这套流程能帮你活到B轮,但很难解释为什么有人能在同一赛道快你三个身位。

Altman自己在Y Combinator时期就提过这个悖论。2015年他写过一篇博客,说大多数创始人像"在雾天开车"——车灯只能照亮前方50米,但真正的机会往往出现在200米外。当时没人当回事,毕竟YC的投资组合里,靠"预测未来"赢的案例远少于靠"快速执行"赢的。

从"响应需求"到"制造需求"的断层

从"响应需求"到"制造需求"的断层

2022年夏天的Stable Diffusion是个分水岭。Midjourney已经验证了文生图有市场,但Emad Mostaque(Stability AI创始人)选择开源模型,把算力成本压到消费级显卡能跑。这个决策的争议在于:当时没有证据表明"个人本地部署"是真实需求,所有用户调研都会告诉你,云端API更方便。

Mostaque的判断依据很私人。他在对冲基金做过量化交易,见过2012年深度学习论文爆发前夜的学术圈状态——某个技术曲线即将陡峭化时,先发者的窗口期只有6-12个月。他赌的不是"用户现在想要什么",而是"6个月后,当算力成本再降一个数量级,市场结构会变成什么样"。

结果所有人都看到了。Stable Diffusion的开源生态在4个月内长出3万个衍生模型,直接倒逼Midjourney调整定价策略。Mostaque后来承认,这个决策有"赌博成分",但赌博的前提是"你对技术收敛方向有比市场更短的反馈回路"。

预测能力的三个输入源

预测能力的三个输入源

这种反馈回路从哪来?我观察了十几个有类似特质的创始人,他们的信息 diet 高度重合。

第一,学术会议的poster session。不是keynote,是poster——那些没被选中做口头报告、但审稿人觉得"有点意思"的研究。2023年NeurIPS的poster区里,已经有3篇关于"推理时计算扩展"(inference-time compute scaling)的雏形工作,比o1模型的发布早了一年。跟进这些paper的创始人,对"慢思考"路线的信心比市场早9个月。

第二,供应链的异常波动。2019年,某自动驾驶公司的创始人发现,激光雷达的BOM成本在Q2突然跌了15%,但终端售价没变。他跑去问供应商,得知某头部厂商在清库存——因为固态方案即将量产。这个信号让他推迟了多传感器融合的方案,all in纯视觉,省了18个月的研发冗余。

第三,边缘用户的"错误用法"。Notion早期的增长团队有个内部梗:每次用户把产品用成"完全不是设计初衷"的样子,就值得开瓶香槟。最早有人拿Notion做wiki,团队觉得是edge case;当wiki用法占到DAU的30%时,他们才意识到"知识管理"的市场比"笔记工具"大一个数量级。

为什么结构会反噬

为什么结构会反噬

回到开头那个教科书流程。它的危险在于,每一步都在强化"可验证性"——你要有数据、要有用户反馈、要有A/B测试的显著性。这套系统优化的是"决策的正确率",但牺牲的是"决策的时效性"。

2024年有个残酷的对照组。两家做AI编程助手的公司,A公司严格执行"验证需求"流程,每功能上线前做200人访谈;B公司创始人是前OpenAI研究员,凭"代码生成模型的上下文利用率会在6个月内成为瓶颈"这个判断,提前押注了超长上下文架构。12个月后,B公司的产品日活是A公司的7倍——不是因为执行更好,而是因为架构选择对了,后期所有优化都在正确的地基上。

A公司的CEO后来复盘:"我们的用户调研问的是'你现在需要什么',但用户只能基于现有工具想象答案。当新范式出现时,旧需求的优先级会瞬间重排。"

预测不是天赋,是基础设施

预测不是天赋,是基础设施

有个误解需要澄清。我说的"预测未来"不是指算命,而是指"压缩信息获取-处理-行动的周期"。这依赖于一组具体的基础设施:

你的人际网络里,要有3-5个"信号源"——不是那种泛泛之交的行业大佬,而是能在技术细节层面对话的工程师、在供应链一线的销售、在学术边缘游荡的PhD。他们的价值不是给你答案,而是让你知道"什么问题值得问"。

你的时间分配里,要有20%留给"无目的阅读"——不是行业报告,是跨领域的原始材料。2022年关注扩散模型数学原理的创始人,比只看AI新闻的同行早6个月理解"生成式"和"判别式"的本质差异。

你的决策机制里,要容忍"无法验证的押注"。不是盲目赌博,而是建立"如果X发生,我会在Y时刻看到Z信号"的检验清单。Mostaque在Stable Diffusion发布前就定了指标:如果3个月内GitHub衍生项目不到5000个,就转向闭源。这个退出条件让他在错误时止损,在正确时加码。

Altman在2023年的某个闭门会上说过一句话,后来被广泛引用:"创业公司的死亡率不是因为做错了什么,而是因为做对了太晚。"这句话的刻薄之处在于,它暗示了"做对"本身有时间戳——2022年做对长文本和2024年做对长文本,是两种完全不同的商业价值。

现在的问题是:你现在的"正确决策",时间戳落在哪一年?