你听过伏尼契手稿(Voynich manu)吗?它是约在 15 世纪出版的一本神秘书籍,由于书中语言和字母无人能辨识,自 19 世纪被发现以来一直都困扰着历史学家和密码学家,而加拿大团队最近则运用人工智能展开了新一轮的破译尝试,并从中获得些微的收获。
Phys.org 报导,这个团队是由加拿大阿尔伯塔大学(University of Alberta)电脑科学教授 Greg Kondrak 和研究生 Bradley Hauer 所组成。身为狂热的语言爱好者,Kondrak 的主要工作内容便是自然语言处理(NLP),试图帮助电脑理解人类的语言。
Kondrak 解释,自然语言处理不仅是为了让人们和电脑沟通的能够更加简易、方便,也是为了那些以书面形式存在的许多资讯,“我们使用人类语言与其他人交流,但电脑并不理解这种语言,因为它是专为人打造的,我们甚至没有意识到里面有着多少模糊的含意。”
伏尼契手稿共有 240 页,全书都是用精美的牛皮纸所制成,除了无人能辨识的字母、语言,手稿中也有着许多素描插图,自 19 世纪被发现以来,许多顶尖解码专家都曾积极研究,但最终仍无人能解析出内容,一些人甚至因此认为手稿只是恶作剧。
但 Kondrak 和 Hauer 显然并不这么想。为了帮助电脑理解人类的语言,他们正在研究该如何运用 AI 来协助解析人类语言中常出现的歧义内容(ambiguities),而他们的目标正好就是伏尼契手稿。
▲ 手稿中除了文字还有许多草药、天文及生物的插图,部分人甚至认为内容与中世纪炼金术相关。(Source:See page for author [Public domain], via Wikimedia Commons)
在进行内容解析之前,Kondrak 和 Hauer 必须先确定手稿中使用的语言种类,为此他们运用世界人权宣言中 400 种不同语言的样本进行了辨识。起初他们假设手稿是用阿拉伯文写成的,但是实际运行算法之后,却发现最有可能的反而是希伯来语(Hebrew)。
在解析出语言类别后,团队的目标自然转为朝向破译内容的方向进行,但这应该如何去做到呢?Kondrak 和 Hauer 先是假设手稿内容是以“alphagrams”方式撰写──以一个词语定义另一个,就像人类语言中那些含糊的内容,接着他们便运用算法来试图破译手稿。
在深入研究中团队发现,伏尼契手稿中有约 80% 以上的单字都能在希伯来语字典中找到,但他们并不确定当这些字连结在一起时,句子是否具有意义。在向希伯来学者求助破译内容的过程失败后,他们转而向 Google 翻译寻求协助。
尽管不是全部内容,但 Google 翻译还是提供了一个首次能见到在语法上通顺、且具有意义的句子:“她向牧师,房子里的人,我和人们提出了建议。”
Kondrak 认为,虽然手稿以这样的句子开始有些奇怪,但句子内容确实具有意义。在没有古希伯来历史学家的情况下,伏尼契手稿的全部内容仍旧是个谜团,但至少这个句子能被看作是一个开始,团队期待未来能将开发的算法应用到其他类似的古代手稿中。
(首图来源:See page for author [Public domain], via Wikimedia Commons)
黄金关键变局,金价、日元、美债三角连动崩解?
科学家目瞪口呆!这个超大质量黑洞冬眠 10 万年后二度“打嗝”
LG Innotek 产能问题,苹果 Face ID 恐无法在 2018 年全面普及
国产滑盖机开挂变身全面屏手机,苹果小米要跪or要醉?
YouTube 也被“挖矿”了?
日本社交网站 Gree 指 Supercell 侵犯专利,《部落冲突:皇室战争》等游戏部分功能已停用
张忠谋:5 纳米动工建厂,象征台积电 3 大承诺
Google 照片全景图,让你同时看 AI 的智能和智障
输入法行业报告:语音识别成智能设备标配 讯飞输入法占先机
恩施绿葱坡滑雪场邀您来一场速度与激情
“双迪富氢杯”第三届中国·脑力锦标赛新闻发布会圆满落幕
保民生,稳物价,有赞河北商家多举措为石家庄“线上保供”
宁波城市形象推广“云”评审来袭!谁的作品更能“波”动评委们的心弦?
IEXS证券筑牢用户资金安全壁垒,打造高品质服务
永盛人力集团再次获得客户认可 荣获“新锐伙伴奖”
中国飞鹤铭牌永留月面,母乳研究再获突破,引专家力赞
朱志祥诗三首
国宾礼书画网副主席 徐忠迪
祝贺周兆平老师被中国书画院入选院士
输入法行业报告:语音识别成智能设备标配 讯飞输入法占先机
想要投资窗帘行业,曼诗菲窗帘值得考虑的。
当当2021出版人盛会启幕 “小”数据“大”事件讲述国民阅读故事
新生代汽车朋克MINI EV成功下线 焦作市孟州市四大班子领导共同出席
光明新零售牵手中华慈善总会,为爱的传播助力