• 05-242017
  • 爱瞰影像:数字化古籍应注意之问题 <<返回

      我国古籍流传下来的约十几万种,每种书又往往包罗万象,古代的各种文化知识散布其中,给某一学科,某一知识点的研究带来很多不便,面对书山文海,形如大海捞针,惶惶然不知所措。同时,由于历史的,现实的原因,对于古人所要熟背“四书五经”及当时流传的语言、典故和风俗,现在却生疏多了,再去拾起古籍一一背诵是很不切实际的,使我们对古代的社会生活有很大的陌生感,此也正是文史工作者遇到的一大难题,幸而我们的古籍也走进了数字化阶段。为我们的整理、研究工作带来了一把锐器。

      利用数字化古籍,缩短了查找、收集资料的大量时间,避免了繁重的机械式劳作,节约了经济成本,简单易行,方便快捷,大大提高了整理、研究古籍的效率,是我们学习的捷径。但是,数字化古籍的运用也存在着很大的问题,必须引起我们的注意,以免误入歧途,劳而无功。

      数字化古籍既有客观上的问题,又有主观方面的问题,而主观上的问题更应当引起注意。在客观上,主要是古籍数字化发展过程中所出现的各种技术、资源利用等问题,表现为文本格式的多样化,目前的数字化古籍除常见的txt、doc、html格式外,还有exe、pdf、wdl、pdg、ebk等多种,有些不能兼容,给学习带来不便:扫描、录入、检索技术的水平有待提高,一部好的数字化古籍,不仅要尽量逼真,符合古籍的版式特点,并能快又准确的多方面检索,但是现在的各种数据库大都不能做到:文字方面的繁简转换、通假、避讳、异体、生僻字依旧是需要克服的难题;人力资源的相对浪费,大家多关注大部头的丛书,像《四库全书》、《二十四史》、《十三经注疏》等,以致这些书籍拥有众多的电子版,而大量单行本无人问津;此外在版本的选择、统一的规划、管理等方面也有不足之处。

      就主观而言,将数字化古籍奉之为圭某,不费任何筛选功夫,盲目的照抄照搬。数字化古籍的功能不仅在于信息的查询和保存,更重要是能在保护现有古籍的基础上,使之能在数字化环境中留下“真迹”,增强古籍保护、开发、研究的意识,在古籍文献中发现问题、分析问题进而解决问题,使其具有学术价值。

      而现在的数字化古籍尚不能达到这一要求,多为简体横排形式,不能保持古文献的版式原貌,虽有照片形式的,是很好的“留真谱”,但是却不能进行检索,达不到为我们服务的目的。全文版的《文渊阁四库全书电子版》虽然繁体竖排,文字清晰,在保存古籍,检索服务等方面做得都非常好,但是却不能作为标准,以之是非为是非,原因在版本方面。

      众所周知,《四库全书》经十年编成,是中国古代的一部官修书之一,也是我国古代一部丛书之一,分经、史、子、集四部,故名四库。其修撰时,三审而呈御览,抄写人员也是经过严格审定的,可谓每一道工序都都做到,具有无与伦比的文献价值、史料价值与版本价值。可是,整部书的编修都在“文字狱”的阴影下,清政府大肆销毁了对满清不利的书籍总数,据统计为一万三干六百卷,焚书总数15万册,销毁版片总数170余种、8万余块。除了焚毁书籍,满清还系统的对明代档案进行了销毁,甚至连前人涉及契丹、女真、蒙古、辽金元的文字都要进行篡改。查缴禁书竟达三干多种,十五万多部,总共焚毁的图书超过七十万部,禁毁书籍与四库所收书籍一样多,难免会说“清人纂修《四库全书》而古书亡矣!”。收进去的书籍,也有许多进行了删削、挖改,已不是古籍之本来面貌,所以对收进《四库全书》中的书,不能一味的盲目崇拜,对一部书来说,有单行本行世的,一定要拿来与四库本等相较,从中选出的底本为我所用,以免事倍功半,贻笑大方。

      除版本方面外,在具体的文字、内容方面,我们也不能掉以轻心,不加校勘的照搬。技术方面的问题,使一些生僻字显示不出来,或者用形近字代替,或者繁简转换的出现问题,这些都需要我们在引用是校勘相关书籍改正过来。尤其是在查找一些词语时,一定要仔细阅读上下文,确定其在文中的意思,以免断章取义,与学术研究的目的大相径庭。同时,现在古籍数字化的工作是带有商业性质的一些专业技术公司做得比较好,也容易获得,但是,他们的工作人员并非都具有专业水平,文字上的讹误衍脱是难于避免的,这都需要我们在具体运用时,必须与原版古籍相校对,做到准确无误。

      数字化古籍只是为我们提供了学习、研究的捷径,是我们进行研究性学习的一把锐器,给我们带来了学习的新思路、新方法,但绝不是什么万能至尊的法宝,我们必须以脚踏实地,谦虚谨慎的学习态度,认真务实、一丝不苟的学习方法,坚持循序渐进的学习道路,正确的运用数字化古籍这把好工具,做到事半功倍的效果。