人工智能|研究人员使用人工智能破解“死海古卷”

参考消息网6月9日报道“科学2.0”网站近日发表题为《人工智能笔迹分析提供了有关死海古卷手稿作者的线索》的报道 , 全文摘编如下:
1946年 , 随着二战结束 , 考古学家重返工作岗位 , 用了10年时间在死海附近约旦河西岸艾因费什哈的12个洞穴里 , 发现了被丢弃的希伯来语《圣经》手稿 。 这些“死海古卷”的残片中包含原本不会随着时间推移而保留下来的《次经》 , 除了缺少《以斯帖记》 。
抄录基督教《圣经》的是匿名僧侣 , 而死海古卷也没有任何署名 , 但人们一直在猜测是谁抄录了它们 。 有人希望至少能通过笔迹找到抄写员之间的一些联系 。
在对古姆兰1号洞出土的“大以赛亚书卷”的一次最新分析中 , 研究人员利用计算机来辨识笔迹 , 包括握笔方式等生物力学特征对笔迹的影响 。
这幅古卷中的笔迹看上去几乎一模一样 , 但有人认为它是由两位书写风格非常相似的抄写员抄录的 。 研究人员发现 , 字母“a”在这幅古卷中出现了5000多次 , 它们非常相似 , 单凭肉眼几乎无法比对 。
但计算机不知道累也不会分心 , 因此更适合分析大型数据集 , 比如5000个手写的字母“a” 。 数字成像技术使得在字符微观层面进行各种计算机运算成为可能 , 例如比对笔画(被称为结构)以及整个字符(被称为字体) 。
研究人员遇到的第一个障碍是要训练出一种算法 , 将文本(墨迹)与背景(皮革或纸莎草)分离开来 。 为了实现这种分离(即“二值化”) , 研究团队开发出一种先进的人工神经网络 , 能够利用深度学习对它加以训练 。 这个神经网络将2000多年前抄写员留下的原始墨迹 , 完好无损地保存到数字图像上 。
荷兰格罗宁根大学博士研究生马鲁夫·达利完成了这项研究中的首次分析测试 。 他对结构和字体特征的分析显示 , “大以赛亚书卷”中的54栏文本可以分成不同的两组 , 它们不是随机散布而是集中分布在古卷中的 , 而变化出现在大概一半的位置 。
达利由此推测抄写员可能不止一位 , 于是将这些数据交给了兰伯特·朔马克教授 , 后者利用字母碎片模式重新计算了各栏之间的相似性 。 这次的第二步分析证实了存在两位不同的抄写员 。 第二位抄写员在书写中较第一位抄写员表现出更多变化 , 不过他们的笔迹非常相似 。
在第三步中 , 研究团队生成视觉分析 。 他们创建了包含书卷中一个字母所有变体的“热图” 。 然后 , 他们生成了这个字母在前27栏和后27栏文本中的平均版本 。 用肉眼比较这个字母的两种平均版本 , 就会发现有所不同 。 这就将计算机分析和统计分析与人类对数据的粗略理解联系在了一起 , 因为热图既不依赖也非产生于第一次或第二次分析 。
这幅古卷的某些方面和文本出现笔迹变化的位置导致一些学者提出 , 从第27栏开始更换了一位新的抄写员 , 但这个观点并没有得到普遍接受 。 研究报告的作者则认为 , 他们的量化分析和统计分析证实了这个观点 。
【人工智能|研究人员使用人工智能破解“死海古卷”】除了改变死海古卷——可能还有其他古代手稿文献——的古文字学之外 , 这项对“大以赛亚书卷”的研究还为基于物理特性分析古姆兰古卷文本开辟了一条全新的道路 。 现在 , 研究人员能够触及抄写员个人的微观层面 , 仔细探究他们是如何完成这些手稿的 。

    推荐阅读