- 0
- 0
- 1
分享
- 甲骨文在云端蹦迪、AI一键“美颜”……古籍迎来赛博复兴时刻!
-
原创 03-13


去年国家图书馆联手央视频推出的国内首部聚焦古籍保护的微短剧《重回永乐大典》,以富有想象力的表达方式讲述《永乐大典》的修复故事,让古籍修复走进大众视野。
我国古代典籍卷帙浩繁,见证着中华民族悠久的历史,是中华文化的重要载体,其保护与活化的重要性不言而喻。
2023年10月,习近平总书记对宣传思想文化工作作出重要指示,明确提出要“着力赓续中华文脉、推动中华优秀传统文化创造性转化和创新性发展”。
2022年4月,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,明确提出“推进古籍数字化”。同年10月,全国古籍整理出版规划领导小组印发《2021—2035年国家古籍工作规划》,将“国家古籍数字化工程”列为四项重大工程之一,对相关工作进行详细规划。
如今以技术为杠杆,古籍已然从“藏于馆阁”发展为“活于云端”,迎来了自己的赛博复兴时刻!
古籍资源库书写文明共享新范式
古籍作为中华文明的基因库,承载着跨越千年的文化记忆。除传统线装典籍外,甲骨、简帛、碑帖拓本、古地图等特殊载体文献共同构成了博大精深的古籍体系。
2024年9月,在第九次古籍数字资源联合发布会现场,国家图书馆、山东大学图书馆、云南省少数民族古籍整理出版规划办公室、南京图书馆、云南省图书馆、海南省图书馆、成都市图书馆、德州市图书馆、重庆市北碚图书馆、济宁市图书馆、泸州市图书馆、温州市图书馆等12家单位新增发布古籍资源7085部(件)。本次资源发布之后,全国累计发布古籍及特藏文献影像资源将达到13.9万部(件)。
通过缩微胶片数字化、AI标点等技术手段,不仅实现古籍高清影像的全球共享,更构建起跨时空的知识图谱。
国家图书馆古籍馆有300余万件古籍特藏,是全球中文古籍最大的存藏单位。

据第十四届全国政协委员、中国国家图书馆古籍馆馆长陈红彦介绍,由国家图书馆(国家古籍保护中心)建设的“中华古籍资源库”,今年春节前夕,第十次发布古籍数字资源18705部(件),至此全国累计发布古籍及特藏文献影像资源超过15.8万部(件)。国家图书馆的资源库让很多学者查询古籍足不出户,也避免了大量原件的使用,保护了古籍。但目前数字化影像的存储与纸本、缩微胶卷相比还不够稳定,存在风险,载体的保存技术需要进一步成熟,也需要异地异质灾备手段。
同时,“中华古籍资源库”还积极开展国际古籍数字化合作,推动大批存藏海外的中华古籍以数字化形式回归。2009年,中国国家图书馆与美国哈佛大学哈佛燕京图书馆达成协议,对该馆所藏中文善本进行数字化,目前这些数字化古籍发布在“中华古籍资源库”的“哈佛大学善本特藏”专题库中;同年日本东京东洋文化研究所将所藏4000余种汉籍,以数字化方式无偿提供给中国国家图书馆;2018年日本永青文库向中国国家图书馆捐赠36部4175册珍贵汉籍,并在“中华古籍资源库”上线“日本永青文库捐赠汉籍”专题库。
“殷契文渊”甲骨文AI协同平台是腾讯携手合作伙伴为甲骨文研究专家和爱好者打造的在线研究平台和数据库。

通过“微痕增强技术”“甲骨文全信息数据模型”和“字形匹配”系列算法,实现了甲骨文实物的高保真数字还原,以及甲骨文字的高效率数字查找。显著提升了甲骨文研究考释过程中的文字查找效率和准确性。
平台还整合了现有字形数据资源,建立了全球最大的甲骨文单字数据库,覆盖143万甲骨文单字,为专家学者和爱好者提供了强大的文字智能搜索工具。同时,打造高清数字展览,线下数字海报和数字展陈装置已在殷墟博物馆使用;推出的“了不起的甲骨文”小程序,让甲骨文走进大众生活。
字节跳动与北京大学联合推出的古籍数字化平台“识典古籍”,依托人工智能技术开展古籍数字化整理。

“识典古籍”网址:www.shidianguji.com/
由于数字化整理需要把纸本内容转化成数字文档,古籍特有的假体字、异体字和书写方式等,对转化准确率形成挑战。在文本提取基础上,自动断句、自动标点以及识别文本中的人名、地名、官职名等,更体现着智能科技对古籍整理工作的颠覆式迭代。
经过两年多的发展,“识典古籍”阅读端已经上线超过1万部古籍,并提供图文对照、分词检索、实体百科等功能。平台也已具有版式识别、自动标点、结构整理、校勘等涉及古籍整理的全流程整理功能。
浙江大学徐永明教授搭建的将中国古典文献及其成果融为一体的“智慧古籍平台”。以扫除阅读障碍、推动古籍阅读普及化为目的,该平台借助光学字符识别技术,实现古籍图像“一键转文本”;再辅以计算机学习技术,古籍文本可被自动标注现代中文标点符号。

“智慧古籍平台”界面:http://csab.zju.edu.cn
此外,人名、地名、职官、时间、典故和名物都用不同颜色显示,用户点击即可查看字词释义、地点定位、著者详情等相关信息。
地方机构亦因地制宜,如南京图书馆的江苏省古籍数字资源集成平台、浙江图书馆的“浙江省历史文献数字资源总库”、无锡市图书馆的“金匮琳琅”、连云港的“西游名著数据库”、南通市图书馆的“静海藏书·古籍数字化平台”等等,通过古籍数字平台展示地方特色数字资源。
降低门槛“人人皆可参与”
古籍活化不再局限于学术机构,而是通过“技术+众包”形成全民参与生态。
实现古籍的数字化主要分三步:
一是成像,即采用非接触数字化方式对古籍进行拍照、扫描,以获得古籍全息数字图像;
二是文本化,即利用人工智能对古籍图像进行文字的识别、校对、标点等;
三是人工复查核对,尽管经过人工智能处理的古籍文本准确率已经很高,但依然需要人工核校,特别是一些异体字、冷僻字,以及特殊格式的古籍,更是离不开人工核校。
在校对方面,借助数字平台,古籍整理的“众包”模式悄然兴起。
2024年7月,依托字节跳动与北京大学联合推出的古籍数字化平台“识典古籍”,全国高等院校古籍整理研究工作委员会举办了“‘我是校书官’——古籍大众智能整理计划”。一期活动将古籍OCR图文校作为大众整理任务,即参照底本逐行确认AI识别的文字是否正确。

无独有偶,中华书局下属的古联公司在2018年推出古籍整理众包平台,后又上线能在移动端分发任务的“文献整理与编校”小程序。据悉,该平台上编校过的任务5万+个,处理的古籍超14亿字。
突破圈层,覆盖生活场景
古籍作为中华文明的重要载体,正通过游戏、网络文学、文创等领域的创新融合,以更生动的方式走近大众。
游戏领域:沉浸式互动与知识传播结合
国家典籍博物馆的沉浸式实景解谜游戏《故纸修复师·碎丹青》,参观者以“古籍修复工作者”的身份,通过使用沉浸式互动道具进入互动体验,根据互动终端给予的逻辑剧情,通过推理、“修复古籍”,在遍布谜题线索的展厅内寻找线索,获得知识传递。

红楼桌游《大观园之谜》
北京联合公司出版的基于名著《红楼梦》设计的互动桌游《大观园之谜》,该桌游主要采用“大富翁”游戏形式,将大观园内的居所、庭院、田园等设计为72个行走点。玩家首先要抽取书中角色身份,然后通过掷骰子进行移动,并在经停点购置“房产”、向经停的角色征收“茶水费”、完成红楼梦知识答题等,以这些方式积累“财富”。在游玩过程中,参与者不知不觉间就在脑中积累了《红楼梦》中的背景、角色、地名等知识。
网络文学:古籍IP的二次创作
国家图书馆(国家古籍保护中心)、抖音集团曾举办的“古籍活化 传承书香”征文活动,以古籍为线索进行二次创作或为古籍中的故事“补足”,以不同视角更全面、更细致地呈现当时的社会风貌。
本次征文中获得一等奖的作品《鄱阳湖君传》脱胎于《子不语》中黑鱼精的故事,作者将原作中的立场反转,把主角设定为“一条只做好事却突然遭劫被斩的鱼妖”。该作品没有局限于套路式的复仇故事,而是讲述了主角以真诚之心带领百姓奔赴好生活、追求与自然和谐发展共存的故事。
文创领域:古籍元素的实体化与生活化
南通市图书馆挖掘馆藏古籍里的文字和版画素材,邀请读者共同参与制作,已推出创意剪纸、碑帖拓印、线装笔记本等一系列文创产品。

高鹗殿试卷文创鼠标垫
南京图书馆立足馆藏书籍,开发出水浒画像、高鹗殿试卷、金陵图咏等7个系列40多个产品,其中“水浒传”系列文创产品以清代张琳绘制的《水浒传人物图像》为参考设计而成,各首领人物单独展现,再现一百零八将的身姿与风采。
从修复保护到开放共享,古籍数字化正以多元路径激活文明基因。据统计,我国现存古籍约20万种5000多万册(件),但实现数字化的不超过8万种,大多数只是完成了初步的影像扫描,真正实现文本数字化的不足4万种。持续推进数字化,中华文化典籍才能以另一种形态得到长期保存和传承。相信随着《国家古籍工作规划》的深入推进,沉睡的古籍将化作流动的数据,在数字时代续写中华文脉的辉煌篇章。
本文根据浙江大学、古联公司、国家图书馆(国家古籍保护中心)、国家典籍博物馆等官方发布信息整理而成。封面图来源于即梦。
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文由 文化科技融合汇 授权 数艺网 发表,并经数艺网编辑。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 本站部分文字及图片来源于网络,如侵犯到您的权益,请及时告知,我们将及时处理或删除。