想到一个数据问题:如果把所有叫同一个名字的人看作一个整体,哪个名字群体的平均年龄最大?Erin Davis为了找到答案,动手算了笔账。

她调取了两份美国政府的公开数据。一份是生命表,统计某年出生的人到某年还活着的比例。另一份是新生儿姓名统计,记录每年有多少婴儿取了这个名字。两份数据一结合,就能估算出:比如1940年出生的叫“Myrtle”的婴儿,到2025年还有多少人健在。

打开网易新闻 查看精彩图片

然后按出生年份逐年拉清单,把所有叫这个名字的现存人数汇总,再求出加权平均年龄。Davis坦承这个方法有个明显瑕疵——没把移民因素算进去。新入籍的居民可能已经五六十岁叫“John”,这会让计算结果偏低。她暂时没找到修正的办法。

不管怎样,冠军出炉了:Myrtle。这名字听起来就像一位坐在摇椅上的老奶奶。Davis还做了个可交互的查询页面,你可以输入自己的名字,看看它的平均年龄排在第几位。