方正数据转换
由于历史的原因,20多年来,方正排版系统中,大部分汉字的系统内码,除GB2312标准的6763个汉字以外,都是自定义内码(就是方正集团自主设定的内码,而不是符合国际和国内标准内码)。这在方正系统内,印刷是没有问题的。但是如做成电子版,方正汉字内码由于和计算机或其他电子设备中的汉字标准内码不一致,就会出现乱码,所以无法进行中文信息交换。
随着信息社会的发展,电子版、网络版、多媒体版迅速发展,它们都要求中文信息的内码标准化,这样就有一个原方正系统下做的文字数据的内码,都要向标准内码转换的问题。而现在,更要求转换成国际标准内码。在常用字范围,方正内码向标准内码(标准码)转换,使用转换工具可以完成。但是,用方正系统做的比较复杂的,自造生僻字多的,自定义内码多的资料的数据转换,就会出现很多问题,就要复杂的多。
近20年来,我国印刷出版业几乎都用的是方正系统,积累了大量的方正数据资源。本公司从1991年研发中文系统,从开始就瞄准国内和国际标准,所以所研发的《超大型中文信息处理系统平台》项目在2003年列为《国家973信息技术与高性能软件规划项目》。并按期完成投入产业化。这些年,承担了许多大型国家全文数字化工程项目。其中就有大量原方正系统下印刷出版了的产品,如国家《中华大典》项目等,进行了大量文字数据标准化的转换成 GB18030-2005 或国际 ISO-10646:2003(Unicode 3.0;4.0;5.0)的工作。对其中原方正系统的自造字,自定义内码的文字信息,重新筛选出来,进行补充造字和标准化处理,重新回填到原位等的数据标准化转换工作,使之能适应各种电子版产品应用的需求。
本公司这种专业化的转换和处理,已进行了几十亿字。不但可以满足客户一切需求,而且在业界也有很高的声誉。欢迎垂询!欢迎试样! |