一个7×6的棋盘,42个格子,4531985219092种合法局面。这是四子棋(Connect 4)的复杂度——比国际象棋开局多几个数量级。但有人证明:你不需要记住万亿种变化,只要8张决策图就能保证先手必胜。
这不是强解,是"弱解"。区别很微妙,却改变了我们对"完美游戏"的理解。
强解意味着你知道每一个局面的理论结果。四子棋早在1988年就被Victor Allis强解,后来John Tromp在2012年压缩到8GB数据库。但8GB是什么概念?你背不下来,比赛时也没法查。
弱解则走另一条路:它只保证你赢,不告诉你其他路怎么走。用作者的话说,"Red(先手)只学对自己有利的分支,冗余信息一概丢弃"。
类比一下:强解像背下整本《牛津英语词典》,弱解像只背雅思高频词表——目标明确,效率极高。作者把强解比作"策略A":现场算所有变化;弱解是"策略B":赛前背完,上场零搜索。
两种策略的"数据产品"相同(都完美),但生产逻辑截然相反。一个依赖算力,一个依赖知识。
WeakC4的核心设计:给必胜路径造一门"语言"
这套方案叫WeakC4,关键创新是"语言"——不是自然语言,是一套能描述必胜节点的符号系统。作者发现:四子棋的必胜路径有结构性重复,可以用少量模式覆盖。
具体怎么做?先锁定一小部分节点(必胜关键位置),给它们设计描述语法;再构建一个极小的开局树,确保所有叶子节点都落在那套语法能描述的范围内。
结果是:先手第一步必须走中间列(第4列)。这是唯一被证明的必胜起点。走其他列?弱解不回答,因为"那些分支对Red不是好选择"。
这种"选择性失明"是刻意的设计,不是缺陷。
为什么弱解可能比强解更有价值
作者提出一个反直觉观点:强解是"通用的、朴素的方法",不需要理解游戏结构;弱解反而留出"创造性选择的空间",能表达人对游戏的洞察。
想想实际场景。你去参加四子棋比赛,带8GB数据库不现实,但带8张打印好的决策图完全可行。WeakC4的目标就是可执行性——让完美策略从"理论存在"变成"人类可用"。
这触及一个深层问题:我们对"解决游戏"的定义是否太偏理论?如果一种解法无法被人类在实战中调用,它的"完美"有多少意义?
作者用图论语言区分两者:强解是整个游戏树,弱解是一个子图,且满足"闭包"约束——从任意包含节点出发,按弱解走法不会走到子图外面。这个数学保证让弱解虽不完整,却绝对可靠。
从四子棋到更复杂的游戏
四子棋已被强解,WeakC4的价值在于方法论。对于围棋、象棋等尚未强解或强解数据量爆炸的游戏,弱解可能是更务实的目标。
作者暗示的方向是:不必追求"全知",而是识别"足够赢"的知识边界。这类似于机器学习里的"蒸馏"——把大模型的能力压缩到小模型,损失一些泛化性,换取部署可行性。
WeakC4的代码和决策图已开源。8张图的具体内容?原文没展开,但逻辑很清楚:中间列开局,然后按图索骥。没有搜索,没有估值函数,纯记忆驱动。
这种极端方案能工作,恰恰因为四子棋的必胜结构比想象中"窄"——先手优势足够大,大到可以用有限模式覆盖所有关键变化。
最后一个细节:作者在描述两种策略时,数据产品"identical"的句子被截断了。但意图很明显——无论A还是B,最终都输出完美着法。路径不同,终点相同。你会选哪条路?
热门跟贴