历史与分析：美国大选民调为什么不准|共和党|杜鲁门|民调|特朗普|美国大选结果|选民

中华民国史上有一个著名事件，叫做“蒋介石重注押杜威”。

1948年美国大选前夕，蒋介石的智囊团在美国报纸上看到民调数据，共和党候选人杜威远远胜过民主党候选人杜鲁门，便决定全力支持杜威。

坊间传闻，时任中国立法院副院长陈立夫访美时偷偷送给了杜威巨额政治献金（外国人资助美国大选是违法的），但从未得到官方证实，权作谈资。

蒋介石组织的支持杜威的游行队伍，正路过故宫博物院。游行队伍的标语以中英文书写，上面一行是“GOOD LUCK DEWEY”，下面一行是汉字“杜威好运”。还弄了4个人抬着一头不知道什么材料做的大象，代表共和党，大象的身上挂着杜威的头像。

上表中党派后面一列的数字为选举人票数。大选结果出来，杜鲁门大胜杜威，其选举人票之比为303：189。当时美国的选举人票总数是531张，现在是538张，这是因为阿拉斯加和夏威夷两个小州于1959年成为美国的最后两个州，加了几张选票。

从上表还可以看出，以前第三方候选人参赛的时候还是不少的，克林顿和小布什时期还有，近20年都没有第三方候选人杀入决赛了。我的推测是，竞选花钱越来越多，第三方没那么多钱，大金主也不会在他们身上投资。那么这些独立候选人的出路就是做一点成绩出来被两大党之一收购，就像今年的小罗伯特·肯尼迪一样，跟小公司被巨头收购类似。

杜鲁门上台以后当然报复了老蒋，但“押错宝”未必是主要原因，反而应该是结果。也就是说，杜鲁门“美国优先”的路线让蒋公选择了杜威，而不是老蒋误信了民调机构，押了杜威才让杜鲁门报复他。

回到今年的美国大选，赛前几乎所有的民调机构都错得离谱。哈里斯刚刚换掉拜登之后，挟风雷之势，曾在民调中明显优于特朗普，直到大选前夕，在7个摇摆州还是“胶着”。结果出来，特朗普在7个摇摆州全胜，相当于日本队碾压国足的比分，怎么看也不像“胶着”，甚至在铁盘州的得票也比上届多。

民调是一门统计科学，比较复杂，我先列举一些“术语”，给观众看看大概是什么样的，方便理解。

先拿特朗普举个例子，解释一下上表这四种误差。“未覆盖误差”，即有些人群是支持特朗普的，但民调没覆盖进来。这个听起来简单，实际上很复杂且昂贵。比方说，民调可以把不同性别、种族、年龄、教育阶层的群体都覆盖进来，但如果胖子都支持特朗普，而按照前面几个维度的抽样恰好都是瘦子，那么胖子这个群体就叫“未覆盖”。

人群的分类维度理论上可以有无穷多个，抽不抽烟、好不好色、吃不吃香菜，都可以算个维度，这是覆盖不过来的。所以办法只能是这样，先覆盖性别、种族这些最基本的可能对不同候选人有偏好的维度，再适当考虑其他影响比较小的维度。万一这次民调蒙错了，没关系，可以事后总结，发现胖瘦对喜欢哪个候选人也有倾向，那么下届大选的民调把胖瘦这个维度也加进来。教育程度就是这样，前几届大选的民调较少考虑选民的教育程度，后来发现这玩意有影响，近两届大选也加进来了。另外，以前民调主要是全国性的，近几届大选摇摆州越来越重要，所以现在更注重以州细分做民调，民调机构跟候选人一样，也在摇摆州多投钱。

其他几条也差不多。“无应答误差”，民调公司打电话没接，或者邮寄了问卷没发回来。为什么呢？有可能是特朗普支持者蓝领多，忙着送外卖没空；也有可能是特朗普支持者上网少，不看帖子（电子问卷）；还有可能是特朗普支持者在他的忽悠下不相信主流媒体、民调公司，故意不回复。

“测量误差”，既可能是问题有误导性，也可能是特朗普支持者教育水平低，理解问题有误的人多。

“抽样误差”，这个就更难。媒体每次报道的民调，我注意过样本数量，一般全国只抽样几千或者一万多人，还有更少的（1千多人），考虑到美国有3亿多人，各州的地域差异也很大，很难反映总体情况。

为了给不熟悉统计学的观众更直观的印象，再举一个例子。民调机构“538”创始人内特·西尔弗称，他在选前运行8万个模型，显示两人的票数“比抛硬币还要接近”，哈里斯胜率略高。

本文原计划要分析几个统计模型，看看民调的缺陷在哪，为什么不准。既然8万个模型都预测成这样，不费这劲也罢。

从科学角度，民调统计的误差在3%以内就算合理范围，正负加一块有6%的浮动。但是这无法解释为什么2016、2020、2024三届大选，民调都严重低估特朗普，一边倒的误差不像是随机的。所以学界又提出了一个理论，叫做“害羞的特朗普支持者”，说白了就是支持特朗普政治不正确，所以他们不说实话，有人问就说支持哈里斯，或者还没想好选谁。这个理论在学界也有争议，我看过一些反对的观点，觉得也有道理，因为这问题影响因素太多，怎么解释都行。

由于AI的出现，科学家又发明了一个新办法，就是用计算机来模拟选民。原理跟电脑游戏差不多，用计算机设定一个虚拟选民，然后给他赋值，年龄、性别、种族这些基本参数，以及他所在的州（比如宾州），该州的经济发展水平、人口结构什么的也都输进去，这样就可以设计几万甚至几十、上百万虚拟选民，然后使用特定的算法计算该州的投票结果。上文中的内特·西尔弗可能也使用了AI模型。AI猜的准不准我还没看到相关结论，既然真人调查都不准，AI有什么理由更准呢？

再回到1948年大胜的杜鲁门，又发现杜鲁门跟特朗普有很多共通之处，只是党派反过来了，杜鲁门是民主党，特朗普是共和党。下面列举一些他俩相似的地方，或许能解释一部分为什么民调总是低估特朗普的问题。

1.1948年大选之前，绝大多数媒体、多次民调，都显示杜威胜。

2.以选举人票计，杜鲁门：杜威是303：189，特朗普：哈里斯是312：226，胜负比例差不多。

3.不但媒体、民调支持杜威，当时共和党的竞选经费也比民主党多（具体数字未找到）。杜鲁门的优势是在任总统身份，但民主党当时已经从罗斯福连任多届，想换人的选民也很多。

4.当时电话并未普及，装电话的都是比较富裕的家庭或者中产，以电话方式进行的民调覆盖不到穷人。

5.杜威出身中上阶层，当州长之前是地区检察官，哈里斯当参议员之前是加州总检察长。杜鲁门出身农民，到处打零工，没上过大学，举止粗俗经常被人笑话。

6.在竞选中，杜威经常说空话废话套话，回避实质性问题，精英派头十足，不屑于跟杜鲁门对怼。而杜鲁门深入基层，在没有高铁的情况下，在全美巡游3万英里，挨个居民点走访，坐老乡家炕头上聊天，而且为了跟中西部白人拉近距离，专挑粗俗的词语说话（也算是本色出演）。

7.杜鲁门还喜欢一惊一乍地制造噱头，博取关注度，扮演明星，有时信口开河，因为群众爱听。

8.对蒋政府军援：杜威愿意加大军援，杜鲁门倾向于保持半死不活的现状，甚至“24小时内结束战斗”。

民选的规则，不是比谁“客观正确”，而是比谁更能得到多数人的“主观认可”。民调的复杂性，也需要民调机构尽可能摒弃自己的思维定式，不但问卷要尽可能触达更多阶层，也需要获得更广泛群体的信任。精英更不是关起门来当精英，须得躬身入世，才能了解群众所思所求。