语言学家一直在寻找理解词汇关系的更好方法。最近一项研究提出了"词汇吸引"(Lexical Attraction)的概念,试图为这一领域提供新工具。

所谓词汇吸引,指的是特定词汇在语料库中共同出现的统计倾向。研究者认为,这种共现模式能够揭示传统语法分析难以捕捉的隐性语言结构。

打开网易新闻 查看精彩图片

该方法的核心在于量化词与词之间的"引力"强度。高频共现的词对形成强连接,低频或零共现的词对则关系疏远。通过构建这样的网络,研究者可以识别出超越句法范畴的语义聚类。

打开网易新闻 查看精彩图片

这项技术的潜在应用包括:发现濒危语言中的隐藏语法规则、辅助构建低资源语言的计算模型,以及验证语言学中的长期理论假设。

打开网易新闻 查看精彩图片

不过,研究者也坦承该方法存在局限。纯统计方法可能混淆共现与因果,且对稀疏数据的处理仍需改进。下一步工作将聚焦于与神经网络语言模型的对比验证。