“伏尼契手稿”因何走红?
伏尼契手稿是一份内容不明的神秘书籍,距今有600多年的历史,内有很多奇异文字和图片,甚至有折叠页面。有些页面已经丢失,目前剩余约240页。伏尼契手稿是迄今为止发现的最神秘的古代手稿之一。
多年来,人们对于伏尼契手稿的探索,从来没有停止过。大量密码学家和语言学家都试图揭开伏尼契手稿的秘密,但都以失败告终。伏尼契手稿已经成为密码学和语言学上的一个世界性难题。关于伏尼契手稿的前世今生大家可以参看我置顶的一篇文章。
伏尼契手稿真正进入大众视野,是因为一篇名为“解码用未知语言和文字写的回文构词法文本(Decoding Anagrammed Texts Written in an UnknownLanguage and Script)”的论文。该论文于2016年出版,研究成果发表于2017年ACL大会。
在论文中,计算机科学教授Greg Kondrak和研究生Bradley Hauer使用人工智能(AI)技术来解码伏尼契手稿的各个部分,并且使用一种算法解密的技术来揭示隐藏在背后的潜在加密语言。
人工智能(AI)技术确定“伏尼契手稿”语言
多年来,研究人员对于伏尼契手稿的书写语言,做过很多研究和论断,例如:阿拉伯语、阿兹特克语、罗马语、拉丁语、意大利语等等,但最终都被推翻。
研究人员认为,就像之前的许多密码学家一样,通过计算文本的某些特性,比如,每封信的频率和字母组合的出现频率,他们可以创造出一种统计指纹,可以与其他语言进行比较。每一种语言都可以基于这样的统计数字“指纹”。
因此,他们通过人工智能(AI)算法来挑选这些指标,并将《世界人权宣言》(使用了多达380种语言)作为他们的样本。得出的结论是伏尼契手稿是用希伯来语的形式编写,并且都是以固定模式排列组合。
希伯来语是犹太人的民族语言,是世界上最古老的语言之一。它属于闪含语系闪米特语族的一个分支,没有元音字母,只有22个辅音字母,其文字从右往左书写。许多文学作品和文献是用希伯来语写出来的。
公元70年,罗马人毁掉了犹太人的都城耶路撒冷。犹太人被逐出家园流落世界各地。他们使用寄居国的语言,致使希伯来语作为口语逐渐消失。后来经过很多年,犹太人想要复活语种,但影响甚微,仅有一小部分人恢复使用,这也使希伯来语的延续得到了保证。
今天的希伯来语使用人数大概750万人。假设伏尼契手稿确为希伯来语,让现在的以色列人去翻译,会是什么结果呢?谜底是否真的会被解开呢?
人工智能翻译的“伏尼契手稿”,却无人能解读
后来,研究人员利用了先前的伏尼契手稿研究结果,假设是通过字母表顺序加密,即先写好文本,然后将每个字母都按字母表顺序重新排序书写。例如,you are pretty,转换为密码格式就是ouy aer eprtty。根据这个假设,研究人员设计了一个编译算法,希望把伏尼契手稿按照他们的假设翻译成真正的希伯来文字。
研究人员找来了希伯来语演讲者莫斯赫·科佩尔,但科佩尔并不能将人工智能对伏尼契手稿翻译出来的文字,变成一个连贯的句子读出来。于是,他们开始进一步拼写修正。并力求能找到希伯来语历史学家。
人工智能解读“伏尼契手稿”的结果受到质疑
很多人认为,在判断伏尼契手稿语言的过程中,并不涉及神经网络或深度学习,仅仅是老式的统计分析,即大量的计数和百分比。
伊利诺斯理工学院的计算语言学家Shlomo Argamon教授表示,初步的测试结果“也许有点值得怀疑,但比在科学文献中经常发表的许多其他结果更好一些。”尽管Kondrak和Hauer的算法可以为伏尼契手稿文本的源语言提出建议,但它不能评估这些匹配的可能性。
美国中世纪研究院执行董事Lisa Fagin Davis表示,他们的算法接受了现代语言的训练,但依据伏尼契手稿的碳含量,应该是用15世纪的希伯来语写成的。语法、拼写和词汇会有很大的不同。
在研究过程中,Kondrak和Hauer认为,伏尼契手稿存在字母颠倒的写法,所以每个单词的字母都是乱写的,基于此得出的结论,往往站不稳脚跟。因为字母颠倒的写法远非一个既定事实。
Nick Pelling,一个在这个问题上写过大量文章的伏尼契专家表示,该论文结论的正确可能性基本上接近于0%。
人工智能解读“伏尼契手稿”结论
事实上,是媒体夸大了该项研究成果,Kondrak和Hauer也承认他们的研究只是一个起点,并非最终结论。虽然谜底没能解开,但是通过人工智能(AI)尝试破解未解之谜是第一个好的思路。试想如果人工智能(AI)真的破解了伏尼契手稿,那么对古今中外的这些专家们将是多大的打击。文/超脑智能(转载请注明出处)
热门跟贴