中华民国史上有一个著名事件,叫做“蒋介石重注押杜威”。

1948年美国大选前夕,蒋介石的智囊团在美国报纸上看到民调数据,共和党候选人杜威远远胜过民主党候选人杜鲁门,便决定全力支持杜威。

打开网易新闻 查看精彩图片

坊间传闻,时任中国立法院副院长陈立夫访美时偷偷送给了杜威巨额政治献金(外国人资助美国大选是违法的),但从未得到官方证实,权作谈资。

打开网易新闻 查看精彩图片

蒋介石组织的支持杜威的游行队伍,正路过故宫博物院。游行队伍的标语以中英文书写,上面一行是“GOOD LUCK DEWEY”,下面一行是汉字“杜威好运”。还弄了4个人抬着一头不知道什么材料做的大象,代表共和党,大象的身上挂着杜威的头像。

打开网易新闻 查看精彩图片

上表中党派后面一列的数字为选举人票数。大选结果出来,杜鲁门大胜杜威,其选举人票之比为303:189。当时美国的选举人票总数是531张,现在是538张,这是因为阿拉斯加和夏威夷两个小州于1959年成为美国的最后两个州,加了几张选票。

从上表还可以看出,以前第三方候选人参赛的时候还是不少的,克林顿和小布什时期还有,近20年都没有第三方候选人杀入决赛了。我的推测是,竞选花钱越来越多,第三方没那么多钱,大金主也不会在他们身上投资。那么这些独立候选人的出路就是做一点成绩出来被两大党之一收购,就像今年的小罗伯特·肯尼迪一样,跟小公司被巨头收购类似。

杜鲁门上台以后当然报复了老蒋,但“押错宝”未必是主要原因,反而应该是结果。也就是说,杜鲁门“美国优先”的路线让蒋公选择了杜威,而不是老蒋误信了民调机构,押了杜威才让杜鲁门报复他。

回到今年的美国大选,赛前几乎所有的民调机构都错得离谱。哈里斯刚刚换掉拜登之后,挟风雷之势,曾在民调中明显优于特朗普,直到大选前夕,在7个摇摆州还是“胶着”。结果出来,特朗普在7个摇摆州全胜,相当于日本队碾压国足的比分,怎么看也不像“胶着”,甚至在铁盘州的得票也比上届多。

民调是一门统计科学,比较复杂,我先列举一些“术语”,给观众看看大概是什么样的,方便理解。

打开网易新闻 查看精彩图片

先拿特朗普举个例子,解释一下上表这四种误差。“未覆盖误差”,即有些人群是支持特朗普的,但民调没覆盖进来。这个听起来简单,实际上很复杂且昂贵。比方说,民调可以把不同性别、种族、年龄、教育阶层的群体都覆盖进来,但如果胖子都支持特朗普,而按照前面几个维度的抽样恰好都是瘦子,那么胖子这个群体就叫“未覆盖”。

人群的分类维度理论上可以有无穷多个,抽不抽烟、好不好色、吃不吃香菜,都可以算个维度,这是覆盖不过来的。所以办法只能是这样,先覆盖性别、种族这些最基本的可能对不同候选人有偏好的维度,再适当考虑其他影响比较小的维度。万一这次民调蒙错了,没关系,可以事后总结,发现胖瘦对喜欢哪个候选人也有倾向,那么下届大选的民调把胖瘦这个维度也加进来。教育程度就是这样,前几届大选的民调较少考虑选民的教育程度,后来发现这玩意有影响,近两届大选也加进来了。另外,以前民调主要是全国性的,近几届大选摇摆州越来越重要,所以现在更注重以州细分做民调,民调机构跟候选人一样,也在摇摆州多投钱。

其他几条也差不多。“无应答误差”,民调公司打电话没接,或者邮寄了问卷没发回来。为什么呢?有可能是特朗普支持者蓝领多,忙着送外卖没空;也有可能是特朗普支持者上网少,不看帖子(电子问卷);还有可能是特朗普支持者在他的忽悠下不相信主流媒体、民调公司,故意不回复。

“测量误差”,既可能是问题有误导性,也可能是特朗普支持者教育水平低,理解问题有误的人多。

“抽样误差”,这个就更难。媒体每次报道的民调,我注意过样本数量,一般全国只抽样几千或者一万多人,还有更少的(1千多人),考虑到美国有3亿多人,各州的地域差异也很大,很难反映总体情况。

为了给不熟悉统计学的观众更直观的印象,再举一个例子。民调机构“538”创始人内特·西尔弗称,他在选前运行8万个模型,显示两人的票数“比抛硬币还要接近”,哈里斯胜率略高。

本文原计划要分析几个统计模型,看看民调的缺陷在哪,为什么不准。既然8万个模型都预测成这样,不费这劲也罢。

打开网易新闻 查看精彩图片

从科学角度,民调统计的误差在3%以内就算合理范围,正负加一块有6%的浮动。但是这无法解释为什么2016、2020、2024三届大选,民调都严重低估特朗普,一边倒的误差不像是随机的。所以学界又提出了一个理论,叫做“害羞的特朗普支持者”,说白了就是支持特朗普政治不正确,所以他们不说实话,有人问就说支持哈里斯,或者还没想好选谁。这个理论在学界也有争议,我看过一些反对的观点,觉得也有道理,因为这问题影响因素太多,怎么解释都行。

由于AI的出现,科学家又发明了一个新办法,就是用计算机来模拟选民。原理跟电脑游戏差不多,用计算机设定一个虚拟选民,然后给他赋值,年龄、性别、种族这些基本参数,以及他所在的州(比如宾州),该州的经济发展水平、人口结构什么的也都输进去,这样就可以设计几万甚至几十、上百万虚拟选民,然后使用特定的算法计算该州的投票结果。上文中的内特·西尔弗可能也使用了AI模型。AI猜的准不准我还没看到相关结论,既然真人调查都不准,AI有什么理由更准呢?

再回到1948年大胜的杜鲁门,又发现杜鲁门跟特朗普有很多共通之处,只是党派反过来了,杜鲁门是民主党,特朗普是共和党。下面列举一些他俩相似的地方,或许能解释一部分为什么民调总是低估特朗普的问题。

1.1948年大选之前,绝大多数媒体、多次民调,都显示杜威胜。

2.以选举人票计,杜鲁门:杜威是303:189,特朗普:哈里斯是312:226,胜负比例差不多。

3.不但媒体、民调支持杜威,当时共和党的竞选经费也比民主党多(具体数字未找到)。杜鲁门的优势是在任总统身份,但民主党当时已经从罗斯福连任多届,想换人的选民也很多。

4.当时电话并未普及,装电话的都是比较富裕的家庭或者中产,以电话方式进行的民调覆盖不到穷人。

5.杜威出身中上阶层,当州长之前是地区检察官,哈里斯当参议员之前是加州总检察长。杜鲁门出身农民,到处打零工,没上过大学,举止粗俗经常被人笑话。

6.在竞选中,杜威经常说空话废话套话,回避实质性问题,精英派头十足,不屑于跟杜鲁门对怼。而杜鲁门深入基层,在没有高铁的情况下,在全美巡游3万英里,挨个居民点走访,坐老乡家炕头上聊天,而且为了跟中西部白人拉近距离,专挑粗俗的词语说话(也算是本色出演)。

7.杜鲁门还喜欢一惊一乍地制造噱头,博取关注度,扮演明星,有时信口开河,因为群众爱听。

8.对蒋政府军援:杜威愿意加大军援,杜鲁门倾向于保持半死不活的现状,甚至“24小时内结束战斗”。

民选的规则,不是比谁“客观正确”,而是比谁更能得到多数人的“主观认可”。民调的复杂性,也需要民调机构尽可能摒弃自己的思维定式,不但问卷要尽可能触达更多阶层,也需要获得更广泛群体的信任。精英更不是关起门来当精英,须得躬身入世,才能了解群众所思所求。