同样记录美国人名字,人口普查局的姓氏榜单和社会保障局的婴儿姓名排行,时常得出不一样的流行趋势。这次普查局把跨度三十年的数据一次性放出来,给了外界一个重新比对的机会。
美国人口普查局近日放出了一个关于名字的数据集,涵盖名和姓两类。按照官方说法,他们经常收到查询姓名出现频率的请求,为了回应这些需求才启动了这次整理工作。数据源自人口与住房普查的姓名统计结果。
打开网易新闻 查看精彩图片
数据集里的信息限定得很死:只有某个名字出现的频次,不含任何具体到个人的信息。目前可以下载的范围包括在1990年、2000年、2010年以及2020年四次普查中出现次数达到100次及以上的名字。
这件事有意思的地方在于交叉验证。数据集发布后,已经有人提出疑问:这批数据到底能跟社会保障署每年放出的婴儿姓名数据对上多少?两套权威统计口径的差异,恰好能反映不同历史时期命名习惯的沉积效果。
热门跟贴