你打开Wordle,信心满满输入一个词,屏幕跳出一片灰色,你开始慌了;第五次猜测还是没对,眼看着只剩最后一次机会,手心冒汗,狂敲键盘又赶紧删掉——这种体验是不是过于熟悉?你身边应该也有那种“每猜必中”的朋友,你怀疑他们在作弊,但今天要聊的研究可能会让你更崩溃:确实有人作弊了,只不过他们用的不是词典,而是信息论。

最近,宾汉姆顿大学的研究者把一项70年前诞生的数学理论搬进了这个风靡全球的猜词游戏,结果让成功率飙升到了99%。他们做的不复杂——就是不再老老实实猜“最可能是答案的词”,而是反过来,先猜“能给你最多信息的词”。听上去有点反直觉?咱们今天就用几条清单拆开,把这件事讲明白,顺便吐吐槽:我们之前被Wordle虐,可能真的是自己没想明白游戏在玩什么。

打开网易新闻 查看精彩图片

先记住一个结论,免得你后面又绕晕:Wordle本质上不是猜词游戏,而是信息收集游戏。你每一次敲下五个字母,真正的目的不是“这次就撞对答案”,而是“让剩下来的可能性被砍掉一大半”。这个视角一转,所有你以前纠结的“这个词好像不太常见啊,该不该猜”就全有了新解释。

下面我们就一条一条来,看看这群研究者到底是怎么用数学碾压直觉的。

1. 你每一次猜词,都是在给“不确定性”刮痧

宾汉姆顿大学的高级作者Congyu ‘Peter’ Wu和同事把Wordle定义成一个“动态反馈系统”。说人话就是:你每做一个动作,系统就吐给你一点新信息,然后这些信息立刻改变你下一步的动作。绿色告诉你某个字母位置全对,黄色告诉你某个字母存在但位置不对,灰色直接把一批字母扔进垃圾桶。然后你拿着这些线索,再决定下一个词是什么。

这个过程,在信息论里有个特别贴切的度量工具——熵。这个地方不用慌,熵说白了就是“一摊子事有多混乱、多不确定”。游戏刚开始时,所有可能的单词都还在候选人名单里,你面对的是一片巨大的混乱,熵很高。每猜一个词,反馈就会刮掉一大批不可能的选项,混乱下降,熵也下降。就像你在一个全黑的房间里找一枚硬币,每照一次手电筒,就知道哪些角落不用再去翻了,整个局面从“乱七八糟不知道在哪”到“哦原来就可能在沙发缝里”,越来越有序。

Wu本人的原话就是:“通过这种连续的反馈,游戏的状态随着玩家从线索中学习、排除可能性而发展,每一轮都会降低不确定性。”而降低不确定性的那把尺子,就是香农熵——70年前克劳德·香农捣鼓出来的概念,现在被拿来分析你的每日猜词。

所以,一旦你接受了这个设定,就不会再因为“我猜了四个字母全对,但第五个就是不对”而暴躁。因为你的每次猜测,本来就不是为了当答案王,而是为了当信息王。

2. 香农熵:一个70岁的“不确定性计算器”

既然整个游戏的本质是把不确定性降到零,那么衡量不确定性的工具就变得至关重要。研究团队用的就是香农熵,这个东西专门用来给“不确定”打分。一个事件的结果越不确定,熵值越高;一旦结果确定了,熵就归零。Wordle里,当你把剩余可能的单词池压到只剩下一个,熵就没了,你也赢了。

我们可以用一个生活例子感受一下。假设你朋友在心里想了一个1到100之间的数字,让你猜。你问“是42吗?”,如果不对,你只排除了一个数,剩余还有99个,不确定性几乎没减少,这次的“信息量”就极低。但你如果问“大于50吗?”,无论回答是还是否,你都一口气砍掉50个数字,熵掉得飞快。这就是香农熵在决策里的价值:一次好问题带来的信息增加,能让你后续的猜测效率原地起飞。

Wordle的每一个猜测,就相当于你在问系统一个“五个字母长的问题”。问题的好坏,直接决定你能不能在六次之内把不确定性清零。研究者没有把宝押在“问一个最可能是答案的问题”上,而是拼了命地找“能砍掉最多可能性的问题”。这就是整篇论文的核心智慧,也是让99%成功率落地的真正推手。

3. 那个让你翻白眼的首词,可能是最“值钱”的选择

读到这里你可能开始不服了:“我凭语感选常用词,不也是信息吗?”没错,但区别在于——你很可能被“看起来像答案”给骗了。论文的另一位作者,博士生Donald Stephens直接把话说得很透:“一个猜测不一定非要是最有可能的答案,它只需要是信息量大的。”

这话听上去很冷静,甚至有点冷漠,但仔细一想,它直接戳破了多数人玩Wordle的直觉误区。你倾向于去试那些你觉得“真实存在”的词,或者元音字母多的词,因为你下意识觉得这种词更可能是答案。但从信息论的角度看,一个词哪怕自己几乎不可能是最终答案,只要它能高效地测试出大量字母是否存在、把剩余单词池一劈为二,它就是一次优质猜测。

这里有必要停一下澄清一句:原文并没有给出某一个具体的最优首词,所以咱们也不编造某个“神词”。重点在于思路的转向——从“找答案”变成“提问”,你的猜测就不再是赌运气,而是主动设计一场信息收割。

Stephens进一步解释,通过使用香农熵,目标就变成了“最大化不确定性的期望减少量,而不是最大化猜中的概率”。换句话说,如果你今天考虑选A词(你觉得它很可能是答案)和B词(你觉得它大概率不是答案,但它能告诉你更多字母的存在与否),信息论会劝你选B,因为B带来的信息增益能让你后面几步走得更快。实践中,这种策略常常让玩家在更少的步数内解决谜题。

4. 你的游戏是手工,他们的游戏是算法实时计算

说句有点打击人的实话:你要想真的手操这套信息论玩法,不太现实。研究者自己也在论文里说了,如果要实时使用这个方法,玩家需要在旁边运行一个脚本或程序。具体操作就是,你每输入一个词以后,把Wordle给你的彩色反馈输进程序里,剩下的事情交给香农熵去算,程序会吐出应当使用的下一个词。

所以,那个99%的成功率背后,并不是某个天才大脑在裸算,而是数学和计算力在替你做最优决策。你那只凭肌肉记忆敲词的双手,和人家那套根据当前剩余单词池精确计算每一个候选词信息增益的脚本,根本不在一个赛道上。但这也正好解释了为什么我们平时虽然有时能赢,却没法稳定地把胜率拉满——人类在工作记忆容量和即时概率估计上,天生就不如一个目标明确的算法

这并不意味着你的直觉毫无价值。事实上,Wordle的开发者Josh Wordle设计游戏时,本就希望它成为一个直觉和逻辑混合的有趣挑战。只是当研究者用信息论的透镜去看它时,发现这个游戏的底层逻辑早就写好了最优解的数学路径,只是大多数人一直绕着走。

5. 99%怎么得来的,以及这个数字到底意味着什么

研究团队宣称他们用这套基于香农熵的方法,在Wordle中达到了99%的成功率。这背后当然不是手动打了几万局,而是通过大量基于算法的游戏模拟得出的统计结论。虽然原文没有交代具体模拟了多少局,但99%这个数字已经足够说明一个问题:把猜词彻底当成信息收集任务去求解,几乎可以把失败率压到小概率事件的范畴。

这个数字也顺带吐槽了另一种常见玩法——很多人喜欢用前两次猜测去试出尽可能多的元音和频率高的辅音,以为这就是“科学”。但实际上,这种策略依旧是在凭感觉去分配信息测试,而不是精确计算每一次猜测带来的熵减期望值。两者的差距就像用温度计测体温和用红外热像仪看全身热分布,虽然都在测温,但精度完全不在一个量级。

还有一点值得注意:99%并不是100%。那1%的失败机会,或许就来自那些无论你怎么猜都信息量受限的极端单词分布,也可能是题目本身的设计让某些开局无论如何都无法在六步内彻底消除不确定性。研究者没有拍胸脯说“彻底消灭失败”,而是呈现了一个大幅提高胜率的方法,这种克制的语气反倒让结论更加可信。

现在回过头来看Wordle的每一次灰黄绿闪烁,你可能会多一层理解:那不是在“告诉你答案是什么”,而是在一遍遍刷新你对剩余选项的“不确定性地图”。你以为自己是在猜单词,实际上你一直在做的,是用有限的机会去换回越来越精确的信息。游戏没有变,信息论也没有变,只是我们终于看懂了两者之间那个巧妙的等式。

最后留一个开放的问题吧:如果以后Wordle发布了一个困难模式,或者题目池变了,这套基于熵的策略还能不能继续99%?这可能需要新的计算,但思路大概不会过时——在任何需要逐步获取信息的场景里,也许你都该先问问自己:我接下来这个动作,是为了撞大运,还是为了最大程度地搞清楚局面?而不只是在猜单词这件事上。