古籍的数字化“旅程”(主题)
人民日报记者 姚雪青
浏览“江苏省珍贵古籍数字资源集成平台”,如同漫步在历史长卷中。《投笔集一卷》《憺园文集三十六卷》等文集有序排列在电子书架上,点开一看,古朴厚重的线装书一页一页、图文并茂地呈现在眼前。
(资料图片仅供参考)
近日,南京图书馆“清人文集数据库”上线。作为“江苏省珍贵古籍全文影像数据库”项目第一期成果,该平台目前共收录清人文集400部,以全本彩色扫描的方式制作成13万余幅高像素数字图像,并带有检索功能,在全网发布。
“南京图书馆馆藏的清刻本有7万多册,其中不少是清人文集。”南京图书馆历史文献部主任、江苏省古籍保护中心副主任陈立说,本次南京图书馆发布的数据库,便是结合馆藏优势,以图像数据库形式,集中公布了一批具有相同主题的珍贵文献。值得一提的是,这其中有许多“罕见”文献,甚至有些还是仅存“孤本”。陈立介绍,例如嘉庆时期刻本吴俊《荣性堂诗集》、潘奕隽《三松堂集》等,都是存世较少的清人文集。
这些古籍是怎样从图书馆库房被“搬”到网络平台的呢?
陈立介绍,古籍数字化过程分为两步。首先,要将古籍进行扫描。古籍扫描使用专用非接触式扫描仪,通过高像素照相机,尽量不按压古籍页面进行拍照;采用的光源是防紫外线的LED灯冷光源,图片颜色不能失真,要用色卡比对。
扫描完成后,就要对这些原汁原味的图像做数据化处理,做至少深入到第二层级的标引,方便使用者按子目检阅相关内容。记者看到,每种文献的序和跋都进行了单独标引,通过检索可以单独搜索出来。“古籍的序和跋中不乏名家作品,具有较强的文学和研究价值,如《莫愁湖风雅集》中就有姚鼐作的序。”陈立介绍。
平台的开发建设也至关重要。一方面,要完整、全面地给古籍“搬家”,还要方便、快捷地帮助使用者找到相应内容;另一方面,还要给后续发布的方志、家谱等多种类型的古籍文献“搬家”预留接口。
古籍数字化的最大挑战,一是专业知识,二是技术。“从事这项工作,需要懂历史学、文献学、目录学等的复合型人才,还要有甘坐冷板凳的精神。”陈立坦言,南京图书馆对古籍文献进行扫描的工作从15年前就开始了,数字标引小组也在4年前启动。正因为有这些基础准备,“清人文集数据库”才能在近期与读者见面。
不过,古籍数字化到这一步还没有结束。陈立介绍,古籍数字化的2.0版,将为古籍爱好者梳理浩如烟海的文字背后的知识逻辑顺序,制作专题知识图谱型数据库,甚至可将部分书中内容制作成“数字文创”,让曾经束之高阁的古籍更好走进千家万户。