一个旧金山团队刚把"解剖"大模型的手术刀变成了商品。他们声称能把你从炼丹师变成工程师——但同行说,这不过是更精确的炼丹。
谁在做这件事
Goodfire的CEO Eric Ho坐在MIT Technology Review的采访间里,抛出了一个挑衅性的判断:今天所有前沿实验室的主流心态是堆规模、堆算力、堆数据,然后等着AGI降临,其他都不重要。"我们要说,有更好的办法。"
这家公司专注的技术方向叫"机械可解释性"(mechanistic interpretability)——试图通过映射神经元和它们之间的连接路径,理解模型执行任务时内部发生了什么。《MIT Technology Review》把这项技术列为2026年十大突破性技术之一。
Goodfire的特殊之处在于,他们不只想用这套方法审计已经训练好的模型,而是想介入设计环节。Ho的原话是:"我们要消除试错,把训练模型变成精密工程。"
产品长什么样
新发布的工具叫Silico。按Goodfire的说法,这是首个能帮开发者在全流程调试的现成工具——从构建数据集到训练模型。
核心功能是让你"透视"模型内部,并在训练过程中调整参数。这些参数是决定模型行为的设置。过去这种级别的干预被认为是不可能的,或者至少是不切实际的。
Silico用智能体(agents)自动化了大量复杂工作。Ho解释:"智能体现在足够强了,能完成我们以前用人工做的很多可解释性工作。这是让这个平台真正能被客户自己使用之前,必须跨越的鸿沟。"
Goodfire已经用内部技术调整过大模型行为,比如减少幻觉。Silico是把这套能力打包成产品。
两派观点交锋
阿姆斯特丹大学研究员Leonard Bereska的态度更冷静。他认为Silico看起来有用,但质疑Goodfire的宏大叙事:"实际上,他们是在给炼丹增加精度。叫它工程,听起来比实际更有原则性。"
这个分歧触及行业的核心张力。一派相信规模即一切,另一派相信理解即力量。Goodfire站后者,但Bereska的提醒是:理解程度的提升,未必能跨越从"知其然"到"精密控制"的鸿沟。
Ho的回应隐含在产品的设计逻辑里:如果智能体真的能替代人工完成可解释性工作,那么规模化部署这套方法就成为可能。这是Silico的商业赌注。
为什么现在
大模型的黑箱问题正在从学术议题变成生产瓶颈。当模型被部署到医疗、金融、法律场景,"不知道它为什么这样回答"从可容忍变成不可接受。
Goodfire的时机选择很精准:模型能力已经溢出实验室,但工程化工具严重滞后。Silico试图填补的正是这个缺口——不是让模型更聪明,而是让构建过程更可控。
这个市场的竞争者很少。Anthropic、OpenAI、Google DeepMind也在研究机械可解释性,但都是内部项目。Goodfire是第一个把它产品化的外部玩家。
我的判断
Silico的真正价值不在于它实现了"精密工程"的愿景,而在于它把争议本身变成了产品。开发者现在可以亲自验证:这套方法到底是更精确的炼丹,还是真正的工程化转折点。
对于每天和模型幻觉、不可预期行为搏斗的工程师来说,多一个调试维度就是多一条生路。Bereska的批评是诚实的,但不妨碍Silico成为现阶段最有实用价值的可解释性工具之一。
如果智能体确实能降低使用门槛,这项技术可能从少数实验室的特权变成行业标准配置。那将改变的不是模型有多强,而是人类对模型的信任能走多远。
热门跟贴