古籍资源数字化开发与利用是新时代古籍整理出版的新趋势和新方向。目前古籍资源数字化的主要类型有原典的数字化和古籍整理成果的數字化两种,面临缺乏整体规划、古籍整理成果资源有限、缺乏统一的数字化标准、尚未形成明晰的盈利模式等主要问题。未来应当加强对古籍资源数字化的行业监管和引导,进行项目资助,建立古籍资源数字化版权保护规章制度,加强古籍资源数字化人才培养,加强多种途径的尝试,探索古籍资源数字化的更多可能性。
古籍资源数字化是指利用现代信息技术对古籍文献进行加工处理,使其转化为电子数据形式,通过光盘、网络等介质保存和传播。古籍资源的数字化开发和利用,已经成为古籍整理出版的新趋势和新方向。
古籍资源数字化开发与利用的现状
一是对古籍善本的原物扫描和原样复制。海内外各图书馆和其他收藏机构进行了大量的古籍原典数字化的工作,很多古籍善本通过扫描制作成图片的方式,实现了网络存储、查询、下载和共享,对我们接触和研究古籍文献提供了极大的便利。如国家图书馆出版社近年来开发的“中华再造善本数据库”,便将“中华再造善本工程”中影印出版的珍贵古籍善本进行图像数字化,并通过对珍贵古籍善本的数字化加工和多元应用,实现珍贵古籍善本的再开发和再利用,是一个具有重要学术研究价值的古籍数字资源平台。
二是用数字化的形式展现古籍整理的已有成果,发布专业文本供读者浏览,还可实现多功能检索。经过多年的努力,出版机构尤其是专业古籍出版社积累了大量的古籍整理出版成果,将这些古籍整理出版资源数字化,提供网络阅读和检索服务,将使古籍整理出版成果得到更广泛的利用。由中华书局下属古联(北京)数字传媒科技有限公司开发的“中华经典古籍库”,便在这一方向进行了很好的实践,取得了一定的成绩。“中华经典古籍库”收录了中华书局及其他古籍出版社出版的整理本古籍图书,涵盖经史子集各部,包含了“二十四史”、“史料笔记丛刊”、“古典文学基本丛书”、“佛教典籍选刊”、《资治通鉴》、《新编诸子集成》、《清人十三经注疏》等经典系列。“中华经典古籍库”提供了丰富的古籍数字化阅读、检索服务以及必备的辅助工具,特别提供了文本数据与原书图像的对照,并能自动生成引用格式,便于了解版式信息,省去了核对纸书的麻烦,为用户带来了便利。
古籍资源数字化开发与利用面临的问题
1. 重复建设的情况严重
除了“中华再造善本数据库”“中华经典古籍库”这些较为知名的古籍数据库之外,还有大量的机构在进行古籍资源数字化的工作,如“中国哲学书电子化计划”“书同文古籍数据库”“中国基本古籍库”“国学宝典”等等。由于缺少统一的规划,这些数据库出现了重复建设的问题。一些热门古籍不断重复地被不同的数据库进行数字加工,如多个数据库都收录了《四库全书》和《二十五史》;数字化成果质量良莠不齐,既有可以代表古籍整理较高水平的数字化资源,也有粗制滥造的简单图片扫描。总体来说,结合校勘、辑佚等深度整理的精良本的数据库较少。
2. 古籍资源数字化缺乏“源头活水”
古籍原典数字化面临较为严重的资源限制。以各大图书馆为代表的收藏机构保存了大量的古籍善本,其中不乏稀见文献资料。但大部分收藏机构将这些古籍资源视为自己的独有资源,不愿轻易示人,更不要说进行数字化传播了。因此,受资源垄断的限制,一些珍稀古籍文献和善本得不到进行数字化的机会。古籍整理成果资源有限。数字化的古籍应该是经过认真整理的古籍,需要运用目录学、版本学、校勘学、文字学、音韵学、历史文献学等各方面专业知识进行点校,成为现有最好或较好的版本。否则,将会造成谬误流传,劣本取代善本。但目前流传的古籍数字化资源,有很多是未经专业整理的粗制滥造的版本。目前“中华经典古籍库”收书2300余种,12.6亿字,预计再经过数年的努力,可以达到5000种、20亿字的规模。这一数据相较我国现存的古籍图书规模,属于九牛一毛、冰山一角。制约“中华经典古籍库”规模的最大因素,在于优质古籍整理成果的匮乏。
3. 缺乏统一的数字化标准
各机构开发的数据库都有自己的数字化标准,没有形成统一的跨平台接口。古籍资源数字化的技术标准必须符合中文古籍的特点。古籍数字化流程中,数据采集标准规范、图像采集处理规范、文字采集规范、资源内容表示规范、古籍用字标准、专有名词标准、整理本古籍元数据标准、整理本古籍文献数据标注标准等等,都必须符合中文古籍的特点。目前国内对古籍数字化缺少统一的行业标准,各数据库自行制定的标准存在较大差异,导致各数据库的质量良莠不齐,也不利于不同数据库之间的合作开发与利用。
4. 尚未形成很明晰的盈利模式
进行古籍资源的数字化,需要投入大量的人力、物力和财力,并且周期长,投资回报率不高。从目前来看,古籍资源的数字化尚处于探索期,并未形成明晰的盈利模式。由出版单位开发的各类数据库,主要依靠图书馆、高校等专业组织的购买,难以形成广泛的零售需求,很难扩大销售规模,难以带来巨大收益。以“国学大师”“书格”等为代表的共享数据库,主要通过收取网站广告费、网友捐赠、移动硬盘拷贝资料销售等方式来维持运营,未能找到更好的盈利模式。
对古籍资源数字化开发与利用的建议
1. 政府部门设立相关机构,加强对古籍资源数字化的行业监管和引导
制定古籍资源数字化发展规划,协调各出版机构的古籍资源数字化工作,整合各出版机构的优势资源,可以避免同质化重复建设。主管部门制定统一的古籍资源数字化标准,建立跨平台、跨数据库的统一接口,使各数据库能够实现跨平台资源检索和使用,充分实现各平台优质资源的共享。
2. 在古籍资源数字化盈利模式尚不明晰的情况下通过项目资助的方式,对古籍资源数字化进行引导
为古籍资源数字化提供必要的资金支持。以项目资助的方式,引导图书馆等收藏单位将已有古籍善本进行数字化开发和利用,鼓励图书馆进行稀有古籍善本的数字化开发和网络共享,使更多研究者和读者能够通过数字化平台接触古籍善本影像资料,实现对古籍善本的有效保护和利用。通过资金扶持,引导出版机构进行古籍整理出版资源的数字化。鼓励出版机构加大古籍整理工作力度,整理出版更多古籍善本,为古籍资源数字化不断提供新的古籍整理优质内容。此外,还可以通过税费减免等方式,降低古籍资源数字化机构的运营成本,鼓励更多的企业参与到古籍资源数字化工作中来。
3. 对古籍资源数字化版权进行有效保护建立古籍资源数字化版权保护规章制度
古籍资源数字化存在难制作、易被侵权的问题。应当做好古籍资源数字化版权登记,加强对古籍资源数字化版权的保护力度,严厉打击侵犯古籍资源数字化版权的行为。
4. 加强多种途径的尝试探索古籍资源数字化的更多可能性
除了古籍原典的数字化、古籍整理成果的数字化这两大最主要的古籍资源数字化途径之外,我们还应积极尝试更多可行的途径。
(1)古籍的数字化整理。古籍的数字化整古理可以通过数字化平台实现古籍的自动校勘、自动标点、自动编纂、自动注释、自动索引、自动排版等功能,可以极大提高古籍整理出版工作效率,并降低人力成本。笔者相信,在技术不断成熟和完善的基础上,古籍的数字化整理必将成为古籍整理出版工作的新动力。
(2)古籍资源的数据库开发与利用。目前大多数的古籍数据库还处于“资料库”的阶段,只能提供较为简单的检索和阅读服务。而古籍资源的数据库采用社会科学的方法论和电脑运算工具,如超文本、资料视觉化、统计学、文本探勘、数位制图等,实现运算、分析、统计等功能,可以将古籍资源进行更深入的开发和利用,产生新的价值。
(3)古籍资源的融合出版。古籍出版单位可以在纸质图书中加入AR、VR等新技术,使阅读体验更加丰富,更加富有层次。如对文博考古类图书中出现的图片进行AR处理,使图片中器物的细节更加丰富立体;对图书中展示的考古发掘现场进行VR展示,使读者能进行全方位、多角度的观看,如身临其境。