今天的流行歌曲比 10 年前更快乐还是更悲伤?

近年来大数据可以精确的计算,衡量文本情感内容存在多少情感词。使用了多少次负面情绪词,“痛苦”、“仇恨”或“悲伤”?与积极情绪相关的词语,“爱”、“快乐”或“幸福”使用了多少次?这是一种可以精确计算的技术,用于所谓的“情绪分析”。情绪分析通常应用于社交媒体帖子或当代的正确信息,但也可以应用于到更长的时间尺度,例如几十年的报纸文章或几个世纪的文学作品。

流行歌曲变得更加消极。与负面情绪相关的词语的使用增加了三分之一以上。让我们以数据集为例。如果假设每首歌平均有 300 个词,那么每年前 100 首热门歌曲的歌词中就有 30,000 个词。在20年前,这些词中约有 450 个与负面情绪相关,而在10年前,它们的数量超过 700 个。同时,与积极情绪相关的词在同一时期有所减少。20 年前的歌曲中有超过 1,750 个积极情绪的词,而10年前只有大约 1,150 个。在绝对数量上,与积极情绪相关的词总是比与消极情绪相关的词多。这是一个通用功能人类语言的概念,凛冬将至是趋势的方向

即使只看一个词,也可以看到这种效果:例如,“爱”的使用在 10 年内几乎减少了一半,从大约 400 到 200 个实例。相反,直到 20年前,前 100 首歌曲中都没有提到“仇恨”这个词,现在每年使用 20 到 30 次。

结果与其他对歌曲情绪的独立分析一致,其中一些使用完全不同的方法,并专注于歌曲的其他特征。歌曲的数据集发现定义的“幸福”和“光明”也出现了类似的下降,而“悲伤”则略有增加。这些标签来自分析低级声学特征的算法,例如节奏或音调。还检查了前 100 名歌曲的节奏和音调,变得更慢小调变得更加频繁。小调被认为比大调更暗淡。

发生了什么?大数据需要大理论。一个这样的大理论是文化进化。顾名思义,该理论规定,文化随着时间的推移而演变,部分遵循达尔文自然选择的相同原则,即如果存在变异、选择和繁殖,那么我们可以期待更成功的文化特征会固定在人群中,以及其他灭绝。

所说的文化是指社会传播的任何特征,而不是遗传传播的特征。例子包括我们根据出生地使用的方言、地域特色以及实际上喜欢的音乐。这些特征是传播的,因为一个人通过观察和模仿其他人来学习它们。许多行为是通过社会习得的,为了使社会学习具有适应性,为了增加个体生存繁殖的可能性,学习必须是选择性的。向一个会做饭的成年人学习,比向自己还在学习烹饪的兄弟姐妹学习要好。优先复制成功个人的行为,在文化进化术语中被称为“偏向成功的传播”。同样,还有许多其他的学习偏见可能会发挥作用,例如从众偏见、声望偏见或内容偏见。多年来,学习偏见已被用于理解人类和非人类动物种群的多种文化特征,并为理解复杂的文化模式提供了一条富有成效的途径。

如果前几年的前 10 首歌曲有负面歌词,通过测试歌曲是否有更多负面歌词来检查成功偏差,词曲作者是否主要受以前成功歌曲的内容影响?同样,通过检查前几年著名艺术家的歌曲是否也有更多负面歌词来测试声望偏见。著名艺术家被定义为那些出现在公告牌排行榜上次数不成比例的人。通过查看带有更多负面歌词的歌曲,是否也恰好在排行榜中表现更好来检查内容偏差。如果是这样的话,这表明负面歌词的内容使歌曲更具吸引力,从而更受欢迎。

尽管数据集中发现了关于成功和声望偏见的少量证据,但内容偏见是这三者中最可靠的解释负面歌词兴起的影响。这与文化进化中的其他发现一致,其中负面信息似乎比中性或正面信息更容易被记住和传播。在我们的分析模型中包含无偏传播极大地减少了成功和声望效应的出现,并且似乎在解释这些模式时占据了最大的比重。这里的“无偏传播”可以被认为与遗传漂移类似,其中性状似乎会漂移通过随机波动进行固定,并且明显没有任何选择压力。