转载声明:除调整格式外,不得对原文做改写、改编。原创不易,谢谢合作!
转载请注明来源,并在文章开头添加以下文字/或公众号名片:来源:公众号☞不知名风险投资人 ♥作者:黄先生斜杠青年
♥声明:本文为原创文本,非生成式,转载请注明出处!
Timothy Guinnane的一篇新论文揭示了估计历史人口的缺陷和不确定性
我们对过去的了解本质上是不完美的。随着时间的流逝,关于现在的信息逐渐消失,消失在广阔的记忆中,永远无法回忆起来。这并不意味着试图了解我们的历史,扩大我们从遗忘的熵力中回收的知识语料库是没有意义的——但这确实意味着当我们试图从过去获得理解时,我们必须意识到自己的局限性。
我是斜杠青年,一个PE背景的杂食性学者!♥
最能明显感受到历史记录差距的一个领域是历史人口估计的挑战。很难知道1000年前甚至500年前任何一个国家的人口是多少,但利用我们拥有的数据——人口普查、出生和死亡记录以及早期官僚机构的其他碎片的零散组合——我们可以开始了解这些人口。
在对历史人口估计的广泛、跨学科的追求中,引用最多的著作之一是科林·麦克维迪和理查德·琼斯的《世界人口史地图集》。McEvedy 和 Jones 的参考书于 1978 年首次出版,旨在展示从公元前 400 年到现在世界上几乎每个国家的人口历史。他们的估计被用作各种学术研究的基础来源,从关于“人类社会中的长期人口周期”的论文到对“文学史中爱情的文化演变”的研究,再到全球环境历史数据库,被广泛用作长期全球气候变化研究的工具。
不过,麦克维迪和琼斯的工作可能最有用的地方是在发展经济学领域。Daron Acemoğlu 和 Oded Galor 等著名学者的著作在很大程度上依赖于他们的估计,将它们用作基础数据,为进一步分析几个世纪甚至几千年来不同州和地区的经济发展提供信息。
唯一的问题是:麦克维迪和琼斯的数据是错误的。
这是耶鲁大学经济史学家蒂莫西·吉纳内(Timothy Guinnane)的论点,他于去年8月在《经济史杂志》(Journal of Economic History)上发表了一篇题为《我们不知道过去两千年来世界上每个国家的人口》的文章。Guinnane教授的文章对McEvedy和Jones数据中的缺陷以及许多使用它的论文中发现的复合错误进行了充分的分析。但你不必相信他的话。取而代之的是,请接受麦克维迪和琼斯自己的话——他们在结束《地图集》的介绍时提出了一个罪魁祸首:……
不存在这样的数据
例如,1850之前的大多数社会都没有保留现代人口普查提供的那种高质量的人口记录。在 1086 年威廉一世国王的王室政府完成了非常全面的末日之书后,英格兰在接下来的 700 年内都不会被全面调查和人口普查。在这些清晰时刻之间的间隙中,人口和经济史研究人员必须进行推断和近似,要么使用从已知点向后追溯的出生、死亡和移民记录,以找到更早的人口,要么使用来自记录更好的国家的模式来寻找更模糊的邻居的数据, 或者根据 GDP 等值的代理对人口进行粗略估计。
根据McEvedy和Jones的估计,世界人口份额随时间变化的图表。通过Wikimedia Commons。
Guinnane在一次采访中告诉表示:所有这些都是McEvedy和Jones在他们自己的工作中记录下来的。他们在地图集中做出的假设并不是特别令人震惊——尤其是相对于 1970 年代,也就是他们编纂作品的时代。然而,问题出在随后几十年里引用了麦克维迪和琼斯的无数作者。
Guinnane在看到一个又一个学者“引用这种类型的数据”后受到启发,写下了他的文章,这让他感到“困惑”——他自己作为经济历史学家的经验表明“不存在这样的数据”。当他更深入地研究麦克维迪和琼斯的使用和误用时,他发现有理由认为,这两位作者也会“困惑”地看到现代发展经济学家以他们的方式使用他们的数据集,部分原因是,正如他的论文所指出的那样,“研究人员在过去40年中提供了更好的数据”。
误判的衔尾蛇
然而,Guinnane在他的论文中列出的错误不仅仅是使用过时的数字。在他引用的许多论文中,Guinnane发现了方法论上的缺陷,这些缺陷加剧了McEvedy和Jones估计的现有问题。一个特别普遍的缺陷与统计学中的假设有关,称为“经典测量误差”。在不深入研究统计分析的情况下,当测量误差与被测量的真实值或模型中的任何其他值及其各自的误差无关时,它被认为是“经典”的。经济学家经常假设他们的测量误差是经典的,并据此假设这些误差以某些可预测的方式影响他们的估计。
然而,McEvedy 和 Jones 使用的估计值的测量误差显然不是经典的。他们对每个国家在每个特定时间的人口的估计都以不同的精确度进行四舍五入:100万以下的估计数四舍五入到最接近的十万,而超过10亿的估计数则四舍五入到最接近的2500万。这意味着任何给定估计值的误差大小都与估计值本身的大小直接相关。
另一个麻烦的来源来自使用McEvedy和Jones的数据的理论问题。该地图集的人口估计经常基于特定国家或地区的经济数据,例如,1350 的波兰拥有能够养活 X 人的 Y 规模的经济。然而,许多后来的研究人员使用麦克维迪和琼斯的经济衍生人口估计来推导出新的经济规模估计,这相当于一个错误估计的衔尾蛇——或者,用计量经济学建模的艺术来说,这是一个“循环性”问题。对 1350 年波兰经济的一些估计用于估计其人口,然后,几十年后,用于进一步猜测其经济特征。最后,正如Guinnane说的的那样,“你从计量经济学模型中得到的只是(McEvedy和Jones)最初做出的假设。”
但是,除了观察这些特殊的失误之外,Guinnane还在他的论文中指出了一个更广泛的哲学问题,即我们如何应对历史的不确定性。虽然他引用了个别论文,在他看来,这些论文或多或少地以深思熟虑的方式使用了麦克维迪和琼斯的数据,但他并没有试图将责任归咎于个别学者。相反,他说,问题在于“只要有影响力和声望的经济学期刊接受基于[地图集]之类的研究,我们就不会得到过去更好的人口估计。”
在他看来,“除非我们足够关心好的数据,停止天真地使用旧的数据,否则估计不会改善。如果有些时间和地点我们真的只有猜测,我们必须接受对猜测的计量经济学分析不会导致真相。
更多时间深度剖析,尽在公众号《不知名风险投资人》
关注我,带你先看到未来!♥
转载声明:除调整格式外,不得对原文做改写、改编。原创不易,谢谢合作!
转载请注明来源,并在文章开头添加以下文字/或公众号名片:来源:公众号☞不知名风险投资人 ♥作者:黄先生斜杠青年
♥声明:本文为原创文本,非生成式,转载请注明出处!
热门跟贴