《光盘版大藏经时不我待》
作者:新江 吴军
近年来,电子计算机技术的发展与普及非常迅速,宗教也大受其惠。宗教界当仁不让,将这最新的科技成果引人自己的领域,用于神圣事业。诸如“宗教电脑迸出璀璨火花”、“忏悔电脑化”、“科技宗教新结合,大小罪过均保密——自助告解机全面电脑化”、“不上教堂也可悔罪,只需装设告解程序”、“伊朗设计祈祷软件”、“电脑福音,快乐聚会——教会诗歌点播电脑系统问世”、“网络天堂·电子教堂——在虚拟空间祈祷、告解、听圣歌”、“教宗演说上网,互联网友可观直播”、“首部中文电子佛典诞生”、“佛经光盘将问世”、“死海经卷电脑编纂”
等有关报道不断见诸报端。真是物换星移几度秋,宗教与科技水火不相容的时代恍如隔世。 今非昔比!时值佛教传人中国2000年之际,我们更关心佛教与计算机的缘分。
不过,我们说佛教与计算机更有缘分,主要是因为佛教经典之浩瀚,使用计算机管理更有必要。有人称某经典浩如烟海,须皓首才能穷经。然而,比起佛经来,《道教》的《道藏》、基督教的《圣经》、伊斯兰教的《古兰经》以及儒教的《十三经》等要少得多。佛经到底多少呢?经过十余年的艰苦努力,《中华大藏经(汉文部分)》上编终于于去年(1997)出齐,共106册,每册100万字左右,全书计约1.06亿字,但这只是历代大藏经所收集的编有千字文帙号的典籍即历代的正藏,还未包括尚待整理出版的下编——历代汉文大藏经中所收的没有千字文帙号及新编入藏部分。此外,还有藏传佛教的甘珠尔、丹珠尔以及南传佛教的巴利语三藏等。佛经称之浩如烟海,当不过分。
如此浩瀚之佛教经典,能不教人望洋兴叹吗!即使大睿大智之人,一目十行,过眼成诵,但是否都能记得住,在需要的时候非常及时方便地找到呢?众所周知,科学研究也好,宗教研究也好,都要以资料的搜集为基本前提。皓首不能穷经,令人望而却步。而你所研究的问题,如果在资料上有遗漏,又有多大的可靠性呢? 由于技术手段的落后,迄今为止,宗教学的研究尤其是佛教研究,因其需要驾驭的资料过于庞大而无序,一直停留在定性水平一一个体手工业,至多工场手工业水平。如此状况,长使英雄泪满巾!前些年,在审读一篇稿件时,由于该稿件所引的两段《坛经》未注明出处页码,使笔者这样的凡夫俗子大伤脑筋,《坛经》(敦煌本)虽然只有1.4万字左右,但对于不熟悉其内容的人来说,也只好一页一页地翻了。后来,与研究佛教的内行谈及此事,得到的回答是“很难办”!像《坛经》这样比较熟悉的短文还好说,如果遇见不熟悉的经卷,就如翻天书一般,几乎无法查找核对。
为了摆脱这种困境,前人曾进行过许多艰苦卓绝的努力。如魏晋南北朝时期的《综理众经目录》、《魏世众经目录》,唐代的《开元释教录》,宋代的《开宝藏》、《毗卢藏》、《圆觉藏》、《资福藏》,辽代的《契丹藏》,金代的《赵城藏》,元代的《普宁藏》、《官刻本大藏经》,明代的《万历藏》,清代的《龙藏》,以及历经隋唐辽金明各代完成的《房山石经》等等,其中《开元释教录》首创千字文编次方法以便检索,此法多为历代汉文大藏经所沿用。近代以来,日本人兴起刻藏热潮,刊刻了《卐正藏经》、《卐续藏经》和《大正藏》等,并编纂了多部索引,如《大正藏索引》、《妙法莲花经索引》、《法华三部经章句索引》、《唯识学术语索引》、《肇论思想语汇索引》、《理惑论索引》、《中国高僧传索引》、《祖堂集口语语汇索引》等(国内也有类似的工作,如《佛藏子目引得》、《新编汉文大藏经目录》等),其中除了目录索引外,不乏语汇类索引。以上目录和索引虽然对于佛教研究起到了极大的推动作用,但佛经数目浩繁,索引尤其是字词语汇索引,简直编不胜编;同时,在佛经的分类上也有不准确和难以操作的问题,这一方面是因学者的观点与角度不一致所致,而更深层次的原因则是一部经典往往具有若干种属性,可以分属于不同的派别,可以分属于政治、经济、文化等不同研究领域。所以,那些目录和索引即使编出来,也会因数目过多过于繁杂而使用不便,且体积巨大,藏不胜藏。不仅如此,印刷品浪费木材,消耗能源,造纸产生污染,破坏生态环境。这也有悖于佛教仁慈为本、普渡众生的宗旨。
计算机技术的飞速发展和个人电脑的普及,为社会科学包括佛学研究水平的提高开创了广阔前景。从定性到定量,将是一次前无古人的革命,将是一场使社会科学成为真正科学的革命,整个社会科学包括佛学研究的面貌将彻底改观。一旦人们将那些常常使人望而生畏的成百上千的古籍资料输入计算机,并按照一定的方式编排好,计算机就能够方便快捷而又准确全面地帮助读者找到所需要的任何资料。这将彻底突破社会科学自古以来个体手工业或工场手工业(俗称“爬格子”)的局限,而使古籍考证成为轻松乐事,大量的时间将用于更深层次的思考。这就是计算机对于社会科学包括佛学研究的意义。
据有关人士介绍,海外从80年代即已经开始了这方面的工作,进入90年代,形成了日本、韩国、台湾、香港和美国五个区域中心,而每个中心又往往有若干个团体组织在进行该项工作,可谓百花齐放。经过不懈的努力,现已出了不少成就,如金刚经光盘、禅文献数据库、妙法莲花经光盘、高丽大藏经光盘、中文电子佛典等。
比起海外来,我国内地这方面的工作起步较晚。虽然早在1986年,中国社会科学院的有关人士曾做过一些有益的尝试,但由于各方面尤其是资金以及电脑硬件和软件条件的限制,该项事业没有进行下去。1995年4月8日至9日,在海外编藏热潮的推动和压力之下,国务院宗教事务局主持召开了“大藏经编纂及其电脑化学术研讨会”,参加研讨会的除了宗教局领导外,还有佛教界、学术界和出版界人士。会上大家议论纷纷,见仁见智,提出许多有益的建议。有的学者针对“光盘版大藏经的时代已经到来!”这一紧迫形势,呼吁“大陆的佛教界、学术界、出版界和电子工程界联合起来,在政府的支持下,对付继之而来的新的挑战,迅速抢占‘制高点’,参与世界新潮流,走入世界大藏经编纂电子化的前列”。但另一方面,一些与会人士尤其佛教界人士,从佛典供养以及目前电脑普及率不高的角度出发,似乎更重视印刷版、书册本。
除了认识问题之外,佛经光盘的出版还有一个汉字输入的问题。 现通行的GB(国标)码只有6763个汉字,GBK(国标扩展)码虽然有20902个汉字,可以解决一般古籍中的汉字问题(笔者曾用GBK码为一些古籍补字,《尚书》《论语》《孟子》补齐,《谷梁传》差一字,《全唐诗》则差六七十字甚至更多,说明中古时期随着文化的发展,汉字越来越多且越发复杂),但佛经的数量多(约几亿字),用字繁杂、不规范(古今字、异体字、正俗字、变体字等等)是人所共知的。这个问题不解决,佛经的电脑化只能是一种美好的理想而已。
正当笔者为此问题困惑不已的时候,得到了一个令人惊异的消息,韩国高丽大藏经光盘的汉字技术问题是由北京一家公司解决的(真是一个意外的惊喜)。他们是怎么解决的?早在1994年秋,笔者就获悉韩国要出版电脑版高丽大藏经的信息。1992年9月,海印寺高丽大藏经研究所成立,其任务之一就是出版电脑版大藏经,该研究所所长仲林大师说:“今后五年内若能全部完成大藏经的电脑化作业,这将给佛学研究带来一次革命性转折。”由于汉字字库及输入是该项任务中技术问题的关键的关键。在对各种程序反复试验后,最后选中台湾的“依天”,它使用的汉字达73000个之多。 还准备请中国社会科学院进行经文的输录工作。前不久,笔者才得到确切消息,高丽大藏经光盘所用的汉字字模及输人法“郑码”是由北京中易公司提供的。
说到中易公司,业外人士也许不大熟悉,但一提起大名鼎鼎的“郑码”(全称“字根通用码”),几乎无人不晓。郑码的发明人是整整哺育了我国两至三代英语学习者的《英华大词典》的主编郑易里教授和他的女儿郑珑。早在本世纪二三十年代,郑老就致力于提高汉字检索速度的研究,发明了“六笔查字法”,1964年提出“汉字四拼方案”,为汉字从笔画编码走向字根编码奠定了基础。1982年郑老发表《26键位汉字拆根输入码方案》,这是我国第一个用计算机键盘26个英文字母键的汉字输入法,在中文信息界产生了深远的影响。1988年,郑老的女儿郑珑也加入进来,终于于1989年底获得成功并荣获1992年北京国际发明金奖和最优秀发明大奖、1993年北京首届科技博览会金奖。1995年,郑码以其简便、快捷宜学并支持GBK大字符集而与智能ABC、表形码被一起正式选人Windows95中文版作为中文输入法。
为了进一步了解有关高丽大藏经的汉字输人情况,笔者辗转找到中易公司,并拜访了该公司总工程师郑码输入法发明人之一的郑珑老师。据郑珑老师介绍,1994年11月,韩国三星集团为录入高丽大藏经并以此为契机推出三星公司韩文视窗版的训民汉字系统,请求中国中文信息学会推荐最优秀的中文形码输入法。当月下旬,三星公司的专家即来北京选“码”,经过多方考察比较,从十几种参选的输入法中选定了郑码。郑码的录入速度达到了每分钟240个汉字,且其排版的佛经比原稿还精美,使韩国客人叹服(笔者所见中易公司排版的《康熙字典》的样品,的确精美无比)。 1995年3月,郑珑老师赴韩国进行技术指导,面对几乎对汉字一窍不通,对偏旁部首概念一无所知的韩国小姐,郑珑老师实际上只用了四天时间就完成了教学任务。一开始,她们每分钟只能录入五个汉字,一个月后就可以录入六七十个,两个月时即达到一百个。三十位韩国小姐仅用了半年时间就把5000多万字的高丽大藏经录入进计算机。三星公司已将其制成光盘(由于中易公司未安装韩文Windows95的软件,非常遗憾,笔者没有看到光盘的演示,据中易公司技术人员介绍,高丽大藏经光盘目前只是全文录入了,可以阅读,还不能全文检索)。
录入速度绝对没有问题,佛经中的数不胜数的不规范字是如何处理的呢?郑珑老师告诉笔者,凡是韩国方面解决不了的问题全部由中易公司解决了。她举例说,韩国的大藏经研究所一开始先统计了两卷佛经,就找出2000个左右异体字,比如“觉悟”的“觉”,就有11种写法,郑珑老师都一一补入(后来韩国方面因不便统计,许多异体字也就没有进一步予以区分)。
笔者还了解到,为了彻底解决中文古籍计算机化的瓶颈问题,中易公司经过多年艰苦不懈的努力,终于于最近推出了“全汉桥2000”超级汉字处理系统,其主要包括:86000字的全汉字中文曲线字库、全汉字中文输入法以及全汉字支持环境与应用系统。“全汉桥2000”不但字库庞大,囊括了所有比较规范的、字出有据(包括韩国、日本等国)的汉字,而且由于它是一个开放的系统,还可以随时加入新发现的任何汉字。由于目前计算机的运行速度和中文检索系统早已不是问题,只有汉字字库仍是中文古籍电子化的难点。所以,可以断言,“全汉桥2000”的推出,为中华大藏经的电脑化准备了必要的前提条件。毫无疑问,以大藏经之难度,加能解决,则中文古籍电子化的难题则会迎刃而解。
时至今日,世界范围的文献数据电脑化浪潮滚滚而来,其势如火如荼,日新月异。如果我们依旧步履蹒跚,甚至原地踏步,我们的社会科学包括佛学研究必将不进则退,大大落后于世界水平。光阴加梭,时不我待。 历史上,在佛教传入中国1000年之际,我们的祖先利用当时的最新科技成果开始了印刷本的大藏经工程,创造了辉煌——佛经印经和编排在印刷术和目录学方面都堪称技术和文化上的典范。今天,在佛教传入中国2000年之际的电子时代、信息时代,我们当然应投入必要的力量,制作出能够代表中国当代佛学研究水平的全文检索的中华大藏经,树立一个新的古籍整理的典范,再创辉煌!
摘自:《世界宗教文化》1998年第4期 |