四子棋被"弱解"了：人类用8张图记住必胜套路

硅屿手记

2026-04-12 08:08 ·北京

一个7×6的棋盘，42个格子，4531985219092种合法局面。这是四子棋（Connect 4）的复杂度——比国际象棋开局多几个数量级。但有人证明：你不需要记住万亿种变化，只要8张决策图就能保证先手必胜。

这不是强解，是"弱解"。区别很微妙，却改变了我们对"完美游戏"的理解。

强解 vs 弱解：两种"完美"的代价

强解意味着你知道每一个局面的理论结果。四子棋早在1988年就被Victor Allis强解，后来John Tromp在2012年压缩到8GB数据库。但8GB是什么概念？你背不下来，比赛时也没法查。

弱解则走另一条路：它只保证你赢，不告诉你其他路怎么走。用作者的话说，"Red（先手）只学对自己有利的分支，冗余信息一概丢弃"。

类比一下：强解像背下整本《牛津英语词典》，弱解像只背雅思高频词表——目标明确，效率极高。作者把强解比作"策略A"：现场算所有变化；弱解是"策略B"：赛前背完，上场零搜索。

两种策略的"数据产品"相同（都完美），但生产逻辑截然相反。一个依赖算力，一个依赖知识。

WeakC4的核心设计：给必胜路径造一门"语言"

WeakC4的核心设计：给必胜路径造一门"语言"

这套方案叫WeakC4，关键创新是"语言"——不是自然语言，是一套能描述必胜节点的符号系统。作者发现：四子棋的必胜路径有结构性重复，可以用少量模式覆盖。

具体怎么做？先锁定一小部分节点（必胜关键位置），给它们设计描述语法；再构建一个极小的开局树，确保所有叶子节点都落在那套语法能描述的范围内。

结果是：先手第一步必须走中间列（第4列）。这是唯一被证明的必胜起点。走其他列？弱解不回答，因为"那些分支对Red不是好选择"。

这种"选择性失明"是刻意的设计，不是缺陷。

为什么弱解可能比强解更有价值

为什么弱解可能比强解更有价值

作者提出一个反直觉观点：强解是"通用的、朴素的方法"，不需要理解游戏结构；弱解反而留出"创造性选择的空间"，能表达人对游戏的洞察。

想想实际场景。你去参加四子棋比赛，带8GB数据库不现实，但带8张打印好的决策图完全可行。WeakC4的目标就是可执行性——让完美策略从"理论存在"变成"人类可用"。

这触及一个深层问题：我们对"解决游戏"的定义是否太偏理论？如果一种解法无法被人类在实战中调用，它的"完美"有多少意义？

作者用图论语言区分两者：强解是整个游戏树，弱解是一个子图，且满足"闭包"约束——从任意包含节点出发，按弱解走法不会走到子图外面。这个数学保证让弱解虽不完整，却绝对可靠。

从四子棋到更复杂的游戏

从四子棋到更复杂的游戏

四子棋已被强解，WeakC4的价值在于方法论。对于围棋、象棋等尚未强解或强解数据量爆炸的游戏，弱解可能是更务实的目标。

作者暗示的方向是：不必追求"全知"，而是识别"足够赢"的知识边界。这类似于机器学习里的"蒸馏"——把大模型的能力压缩到小模型，损失一些泛化性，换取部署可行性。

WeakC4的代码和决策图已开源。8张图的具体内容？原文没展开，但逻辑很清楚：中间列开局，然后按图索骥。没有搜索，没有估值函数，纯记忆驱动。

这种极端方案能工作，恰恰因为四子棋的必胜结构比想象中"窄"——先手优势足够大，大到可以用有限模式覆盖所有关键变化。

最后一个细节：作者在描述两种策略时，数据产品"identical"的句子被截断了。但意图很明显——无论A还是B，最终都输出完美着法。路径不同，终点相同。你会选哪条路？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴