电话咨询

电话咨询:010-62607600

微信咨询

微信扫码

分享 | 自动拼接甲骨碎片,计算机视觉准确率高达84%

行业资讯 发布时间:2021-09-10 17:37:53 作者:wangyx

1912年,德国的魏格纳通过观察地图上各大洲的海岸线,提出了地球上所有大陆曾经是统一的「泛大陆」的大陆漂移说;1917年,中国的王国维发现两片残缺的甲骨可以缀合,拼出较为完整的卜辞,开创了甲骨缀合的先河。

image.png

研究人员告诉我们:「甲骨学者普遍认为,缀合出一块较为完整的、可用于甲骨文研究的甲骨,其价值不亚于发现一块新的甲骨。」要利用甲骨文来研究古代的历史,必须首先对甲骨进行缀合,尽可能地恢复其本来面貌。

甲骨碎片自动拼缀,计算机视觉识别率达84%以上

最近,西南大学计算机与信息科学学院陈善雄副教授和首都师范大学甲骨文研究中心莫伯峰副教授,通过使用一种新的依据边缘轮廓匹配的计算机视觉算法,实现了甲骨碎片的自动拼缀,准确率达到84%以上,为将来在全球甲骨拓片的数据集上实现自动化甲骨缀合打下了坚实的基础。

论文题目为《The Research on Rejoining of the Oracle Bone Rubbings Based on Curve Matching》,已被期刊 ACM Transactions on Asian and Low-Resource Language Information Processing 接收。

image.png

甲骨文作为我国最早的成熟文字、世界四大古文字之一,因刻写在龟甲和兽骨上而得名,记载了三千年前商朝的珍贵史料,更是入选联合国教科文组织「世界记忆名录」。目前,已出土的甲骨碎片多达16万余件。

可惜的是,这些甲骨碎片被埋在地下多年,经历了地下活动的冲击和挖掘造成的磨损,多数甲骨残缺严重;又由于随着人类历史的迁徙遍布于世界各个角落,很难有完整的信息。因此,将分散的甲骨碎片组合成一个完整的卜辞,成为了甲骨文研究重要的基础课题。

过去,甲骨缀合是由数名甲骨文学者通过视觉评估和经验评估进行的。虽然为我们提供了很多很好的范本,但是效率缓慢,更何况有大量甲骨碎片散落世界各地。近期,随着人工智能的引入,这一挑战有了些许进展,但仍然是依照传统的字体、分类、同文、残字等线索进行缀合。甲骨碎片的轮廓曲线这一更为直观的线索,因为难以被人类视觉轻易捕捉而被忽视。

image.png

基于不同线索的甲骨缀合示例。(a)字体;(b)残字;©同文;(d)轮廓曲线。(来源:论文)

该团队基于缘轮廓匹配的思路,提出了皮尔逊相关性分析算法 (CAP) 和拟合度分析算法 (CFDA)相结合的计算机视觉方案 ,通过采用 CFDA 算法进行拟合度评分,再用 CAP 对初步筛选的候选项进行皮尔逊系数计算的方式,在一定程度上提高了曲线匹配准确率,同时增强了曲线匹配在小样本上的准确度。

image.png

自动甲骨拓片缀合模型。(来源:论文)

通过与传统的单独 CAP 、切比雪夫距离等多个算法进行实验对比,结果显示 CFDA & CAP 的准确率较为稳定,对于不同的候选图像库的容量大小,其平均性能可达到84%;而在小样本任务上, CFDA & CAP 的准确率至少比其他方法高出了 25% 。

image.png

不同曲线匹配算法的准确度。(来源:论文)

相关的预处理工作

即使在资源匮乏的情况下,该团队所提出的模型也能保证甲骨碎片自动缀合的准确性。这在一定程度上离不开高质量的数据,为此,研究人员在数据的标注和处理上下了很大的功夫,创新性提出了高效的曲线特征提取流程。

曲线特征用于建立两个碎片之间的关系,合理选择特征空间可以提高配准算法的适应性,缩小搜索空间,减少噪声等不确定因素对匹配算法的影响。该团队提出的曲线特征提取流程包括三个阶段:曲线标注、位置矫正和特征提取。

为了与目标曲线进行匹配,在曲线标注阶段,存在标注曲线的起点和终点颠倒的情况,因此,部分曲线需要在位置矫正阶段经过 180° 旋转,以得到正确的位置;在特征提取阶段,使用直角坐标系为甲骨文拓片的轮廓曲线进行建模,得到曲线的水平距离(𝐾𝑖)和垂直距离(𝐷𝑖)。

image.png

提取局部特征。(来源:论文)

进行局部特征提取时,研究人员只提取每条曲线的 𝐾𝑖和 𝐷𝑖,而忽略曲线上两个相邻点之间的关系。为了获得全局特征,通过进一步提取全局离散点收集坐标点,再用高斯平滑对其进行去噪,使得曲线在同一坐标系中可以进行精确匹配和比较。尽管标记的轮廓曲线在每个垂直方向上可能有一个以上的像素点,但没有必要覆盖尽可能多的坐标点,因此算法按顺时针搜索下一个提取点。

image.png

基于目标曲线的坐标点搜索策略。(来源:论文)

破解甲骨研究难题

甲骨文是汉字的源头和中华优秀传统文化的根脉,值得倍加珍视、更好传承发展。国务院副总理孙春兰就曾指出,要综合运用人工智能识别等技术手段,推动研究实现新突破。

作为提供新材料使研究永葆生机的一种重要方式,甲骨缀合是甲骨研究永恒的主题。随着利用人工智能进行甲骨缀合的研究出现,甲骨专家可以将更多的精力放在甲骨文义本身,早日为我们破解出商朝历史。

image.png

图示:甲骨缀合。(来源:论文)

从大量碎片中找到有着相似边缘的两块甲骨拼接起来,有人曾说甲骨缀合就是拼图,但实际上,甲骨缀合的核心是要对甲骨材料非常熟悉。陈善雄副教授和莫伯峰副教授领导的研究小组是率先开展利用人工智能技术进行甲骨研究的团队,在此项研究之前,就已经提出过一种用多区域划分的卷积神经网络对甲骨拓片进行材质分类的人工智能方法。

拼图都是既定的,而甲骨缀合却是有变数的。所以,甲骨缀合貌似是拼图,却需要大量的积累和准确的识别。利用人工智能进行甲骨文文字研究也并非一蹴而就。目前,新算法还只是在现有的较少量的甲骨拓片数据集上,进行一对一的缀合测试。未来,该团队计划将两片甲骨碎片的缀合拓展成多片的缀合,并将利用深度学习技术进一步提高效率。

深延科技自主研发的古籍文字识别软件,基于先进的深度学习技术,针对多种古籍文献类型,能够实现快速识别并转化,具有高准确率、高并发、高版面还原等特色,可以极大地提升古籍文献数字化效率,减少成本支出。

image.png

立即使用深延AI平台