AI 多所名校联合Adobe 用开源算法“透视”了一封300多年前的信

史料,是历史研究所需的重要材料,它帮助后人认识、解释、重构了历史过程的痕迹 。在众多史料中,书信是重要的一类 。在现代信封开始使用之前,人们习惯于用一种被称为是“锁信”(letterlocking)的复杂方式对信纸进行折叠,再用蜡密封,并安装上防篡改装置 。
这种方式在当时被视为是全球通信安全的基础 。
MIT 图书馆管理员 Jana Dambrogio 曾对这种方式进行过介绍:

“锁信”持续了几个世纪,不论是名人还是普通民众都在使用 。“锁信”最早于一批梵蒂冈秘密档案中发现,其历史可追溯至 1494 年 。
Jana Dambrogio 与伦敦国王学院早期现代英国文学讲师 Daniel Starza Smith 以及“解锁历史”(Unlocking History)研究小组一起将“锁信”发展为一个研究领域 。
AI 多所名校联合Adobe 用开源算法“透视”了一封300多年前的信
文章图片

一般情况下,对于“锁信”方式保存的信件,人们只有将其剪开才能读到信件内容——不过对于历史学家来说,这样简单粗暴的方式无疑是对史料的一种破坏 。
就在最近,一项技术帮助历史学家们解决了这一难题——科学家们首次在不打开、不破坏信件的前提下“阅读”了封印的古老信件 。
没错,科学家们拥有了透视功能!
“透视”书信首次实现
2021 年 3 月 2 日,相关研究成果发表于《自然》子刊《自然?通讯》(Nature Communications),题为 Unlocking history through automated virtual unfolding of sealed documents imaged by X-ray microtomography(解锁历史:基于 X 射线微断层扫描成像的密封文档自动虚拟展开) 。
AI 多所名校联合Adobe 用开源算法“透视”了一封300多年前的信
文章图片

论文作者来自 MIT(图书馆、计算机科学和人工智能实验室)、Adobe 研发中心、英国伦敦国王学院、伦敦玛丽女王大学、荷兰乌得勒支大学、莱顿大学、内梅亨大学 。
据 MIT 官网介绍,这项突破性的研究是史料保护者、历史学家、工程师、成像专家和其他学者跨国界、跨学科合作的结果 。
研究团队通过在文艺复兴时期的欧洲信件上进行演示,终于实现在不打开、不破坏的前提下“阅读”了封印的信件 。
研究人员对一封标号为 DB-1627 的信件进行了还原:这封信写于 1697 年 7 月 31 日,出自一位法国商人 Jacques Sennacques 之手 。在信中,他向堂兄 Pierre Le Pers 请求提供一份 Daniel Le Pers 的死亡通知副本 。
值得一提的是,在进行计算分析之前,研究人员只知道写在邮包表面的收件人姓名 。
AI 多所名校联合Adobe 用开源算法“透视”了一封300多年前的信
文章图片

“虚拟展开”算法已开源
研究团队所运用到的是一种自动计算扁平化算法 。
论文介绍,计算扁平化算法目前已成功地应用于对损坏的历史文献进行 X 射线微断层扫描,但还仅限于卷轴、书籍、仅仅被折叠过一两次的文档 。
相比于上述情况,研究团队要解决的难题是:对通过“锁信”方式保存的信件错综复杂的褶皱和缝隙进行重建 。
研究团队的思路是对信件进行逆向工程,也就是说,信件本身就是研究历史通信安全方法的关键数据集 。
他们观察到了信件内置的防篡改锁定机制,这种机制主要是通过不可逆的破坏来阻止潜在拦截者,接收者能够借助这种机制检测到所谓的“中间人”攻击——正是借助这一机制,研究人员可以给信件分配一个安全分数 。
不过基于一种特殊的设计,信件只有在预定目的地才能打开 。因此研究人员要设计系统,还得通过已打开的信件进行推断 。
具体来讲,团队的研究对象是“布里耶纳收藏”(Brienne Collection),这是一个欧洲邮政局长的箱子,里面装有 1680-1706 年未递送的信件 。箱子里有 3148 件已编目的物品,包括 2571 封已打开的信件、碎片和其他文件,以及 577 个未打开过的邮包 。
下图展示的是团队主要研究的 4 个邮包 。
AI 多所名校联合Adobe 用开源算法“透视”了一封300多年前的信
文章图片

他们利用高对比度延时积分 X 射线微断层扫描(X-ray microtomography,XMT)产生的高分辨率体积扫描,开发了一种“虚拟展开”(virtual unfolding)方法,即一种完全自动的、重建和虚拟展开信件成像的体积扫描方法 。
如下图所示,在没有任何关于信包折叠形状的先验信息的情况下,这一方法会生成:

推荐阅读