人类语言千差万别,目前全世界共有超过7000种语言。不同语言的使用者是否只是用不同的词汇形式表达相同的概念?如果是这样,翻译中又会丢失什么?这个问题触及语言普遍性与相对性的经典争论。尽管人类语言存在显著的多样性,但学界发现,语义系统背后可能共享某种普遍的结构。然而,这种共性与差异背后的原则尚未明确——部分原因在于现有语义理论往往缺少与神经认知机制的连接。

近日,《自然·通讯》杂志发表了北京师范大学毕彦超教授、王晓莎助理研究员团队合作完成的一项研究“Semantic similarity across languages reflects neurocognitive dimensions shaped by climate”。该研究团队整合计算语言学、行为实验与脑成像数据,揭示语义系统沿着神经认知维度组织的普遍性,并发现气候这一环境因素能独立于文化、地理、语言历史等因素,显著预测语义差异。

打开网易新闻 查看精彩图片

研究首先基于53种语言的预训练词向量数据,构建了13个神经认知维度(包括颜色、形状、味觉、嗅觉、声音、触觉、躯体运动,以及时间、空间、数字、心理认知、情绪和社会)的语义表征。结果显示,基于神经认知维度的语义模型在跨语言相似性上显著优于分布语义模型、心理语言学特征模型以及随机控制模型。其跨语言平均相关系数达到0.63,而其他模型均低于0.42。进一步,该模型能推广至2681种语言的共词化网络数据,无论是在全部语言样本还是非欧亚语言子样本中,其预测性能均处于随机模型分布的上界,证明神经认知维度结构具备跨语言普遍性。

在揭示普遍性之后,研究进一步检验了跨语言语义变异与环境因素的关系。作者采用表征相似性分析方法,将语义距离矩阵与地理、气候、语言历史、文化等环境距离矩阵进行回归。结果发现,在词嵌入数据中,气候对语义变异的独特贡献最强(β=0.28),语言历史也有显著贡献(β=0.22),而文化与地理贡献不显著。这一气候效应在12个语义维度上均显著,仅在“形状”维度上未达校正阈值。类似模式在8种语言、253名母语者的行为评分数据中得到了复现:气候的独特贡献达到β=0.53,而文化、地理、语言历史的效应均不显著。

打开网易新闻 查看精彩图片

为探索气候效应在神经层面的反映,研究分析了包含45种语言母语者、86名参与者的功能磁共振成像数据。结果显示,在12个语言加工脑区中,只有右侧前颞叶的神经活动模式与神经认知维度语义空间显著相关(β=0.44)。进一步分析发现,气候距离能够显著预测该区域的神经活动差异(β=0.12),即使在控制激活位置差异后仍保持显著。共通性分析表明,气候与语义因素共同解释了右侧前颞叶神经活动的38.20%方差,提示气候可能通过塑造语义表征间接影响脑活动。

最后,研究通过主成分分析将19个气候变量降维为两个主成分:冷/温带与热带气候、海洋性与大陆性气候。语义空间投射分析显示,冷/温带气候区的语言在情绪和感觉运动维度上更强,而热带气候区的语言则在社会认知与嗅觉维度上更强。海洋性气候区的语言在嗅觉、认知和时间维度上更强,大陆性气候区的语言则在社交和声音维度上更强。这些维度差异在不同语义域的概念中呈现出高度一致性。

READING

BioPeers

欢迎关注本公众号,所有内容欢迎点赞,推荐❤️,评论,转发~

如有错误、遗漏、侵权或商务合作请私信小编~~

欢迎大家投稿课题组 研究进展 、招聘及招生宣传~

所有文章只为科普、科研服务,无商业目的~