网站首页 | 网站地图

追光青年
首页 > 文史 > 正文

搭建起敦煌千年数字图书馆

——“数字藏经洞”数据库平台上线发布

1900年,道士王圆箓在敦煌莫高窟清理流沙时,偶然发现藏经洞,意外打开了一座艺术宝库。但遗憾的是,此后,藏经洞出土的7.3万件文物中,有约4.7万件漂洋过海散落世界各地,被收藏于不同国家的近百家公私机构中。百余年来,以藏经洞出土文物为重要研究资料的敦煌学,受到不少人的关注。

5月31日,“数字藏经洞”数据库平台正式上线发布,首次实现利用数字化技术对藏经洞文物全面呈现、解读和共享,搭建起贯通古今的敦煌千年数字图书馆,引发了国内外敦煌学研究者的高度关注。

敦煌研究院院长苏伯民在发布会上说,近些年,随着敦煌学研究愈深入、交流愈密切,海内外各机构意识到,应加强学术合作,共同建设一个统一完整、开放共享、便捷智能的学术平台,实现敦煌文化艺术资源的全球共享。

在中国各级政府及相关部门的鼎力支持,英国、法国、美国、匈牙利等多国公私收藏机构的密切配合下,敦煌研究院借助数字化、信息化和人工智能技术,开展了“流失海外敦煌文物数字化复原项目”,并在国际敦煌项目(IDP)的基础上,推进建设“数字藏经洞”数据库平台。

当天上线发布的“数字藏经洞”数据库平台,已经录入敦煌藏经洞出土文物目录74651条,发布敦煌文书经卷9900多卷、图像60700多幅,经卷内容识别840多万字,首次实现利用数字化技术对藏经洞文物全面呈现、解读和共享。

“该平台运用人工智能技术对经卷文字进行自动识别并基于人机协同审核校正标注结果,不仅整合了流失海外敦煌文物目录、珍贵图像,还纳入海量国内外敦煌学研究成果,同时具备图像拼接、图像缀合、知识图谱构建、全文检索等多项功能。”苏伯民说。

敦煌研究院副院长俞天秀介绍,藏经洞经卷上文字多为古文手写,本身难读,再加上部分经卷里没有标点符号,更加难读。“数字藏经洞”在展示时,设有“字对照阅读、字读音与纠错、行对照阅读、全文对照阅读”等功能,帮助各个领域、不同诉求的人群都能读通、读懂。

“目前,通过人工智能赋能,平台的经卷原文已支持中文、英文、法文、日文等多语种呈现。”俞天秀说,“同时,平台还可以帮助大众快速释译经卷原文、凝练经卷主旨,并提供一些背景资料,以供参考。”

美国加州大学伯克利分校东亚图书馆馆长周欣平表示:“平台将敦煌文献的图像本全面识读并转换为文字本,再利用文字本来做信息检索和知识发现等,更加有利于敦煌学的广泛深入研究。”

当天还举行了“数字藏经洞”管理咨询座谈会,并形成了以下共识:“数字藏经洞”为一个国际性的共建共享数据库平台,综合运用人工智能等关键技术实现全球敦煌藏经洞文物数字资源的统一管理和共享,数据库平台合作伙伴之间可无偿交换共享藏经洞文物数字资源,面向大众共享敦煌文物数字资源。

  (本报记者 尚杰 王冰雅 本报通讯员 苏家英)

[责任编辑:李金芳]