原标题:计算机分析揭示莎士比亚的历史剧《亨利六世》或为合著作品

摘要:400年来,虽然莎翁不在,但他的作品《哈姆雷特》《李尔王》等多部作品仍然广为流传。不过现在研究人员却利用机器学习算法来分析莎士比亚和他同时代诗人的写作风格,以此来确定莎士比亚的戏剧是否为合著作品。 基于这项技术及此前的研究成果,研究人员认为莎士比亚的《亨利六世》系列作品是他和剧作家克里斯托弗·马洛的合著作品。

此前莎士比亚的另一部作品《两个高贵的亲戚》也被认为是他和年轻剧作家约翰·弗莱彻的合著作品。

宾夕法尼亚大学的信息学家Alejandro Ribeiro、 Santiago Segarra及Mark Eisen在莎士比亚学者Gabriel Egan的帮助下完成了这项研究。 研究小组使用一种算法来研究《亨利六世》某些选段的写作风格。这种研究思路已不算新颖,不过此前的计算方法通过对文章中的实义词和用词频率进行分析来确定作者的写作风格,而现在研究人员却通过"with"等功能词("functional" words)来进行分析。

Segarra解释说:“一个更可靠的方法是使用功能词,而不是实义词 。每个人都会使用这些词,所以通过分析作者不同的使用习惯可以更接近 风格 的客观衡量标准。”

研究人员从文章中选取了莎士比亚全集中50-100个功能词来训练机器算法,兼建立一个“词语邻接网络”。研究人员表示,这些“网络”能够“计算出”每对目标词语的数量,并会打出相应分数。 当计算机算法为所有的词语组合打出分数后,会生成作家写作风格的“指纹”,并与其它选文进行对比,来确定原创作者。

通过这种方法,研究人员发现,莎士比亚《亨利六世》系列作品最有可能是合著作品,研究人员利用相同的方法为莎士比亚同时期的剧作家 John Fletcher、 Christopher Marlowe、Thomas Middleton、 Ben Jonson及 George Peele等建立类似的“网络” ,并发现克里斯托弗·马洛( Christopher Marlowe)最有可能是这系列作品的合著者。

这项研究成果将发表在《莎士比亚季刊(Shakespeare Quarterly)》上。