《中易汉神e--超大字符集中文网络国际应用平台》简介
一、目前网络平台存在的问题:
1、支持(可用)的汉字太少,一般都是6000多个字。所以只能是普通的小说、新闻、股票、网上聊天等
等。所以受汉字字数的限制。中华民族历史大量灿烂文化、近现代科技资料、天文、地理、医书、户
籍、大型出版物等等,都无法上网。至使国际互联网上西文资料占98% ,中文资料只占0.1% 的可悲
局面;
2、无法建成中文大型网络数据库;
3、目前网络中的汉字使用的是2字节国标内码,与国际标准内码不统一。所以只能在装有标准中文版系
统的年脑中浏览。没有中文版系统的电脑无法浏览中文网站,受到大陆地域限制;
4、不能和其他文种处于统一平台,不能互相交流。无法实现网络国际化、全球化。
二、《中易汉神e--超大字符集中文网络国际应用平台》的内涵
超大型中文:指的是含有全部国际标准代码的70195个汉字。近期可达91000个汉字;
网络:它是一个大型网络平台;
国际:它还兼容150个以上国家的文字在西文Windows操作系统上的运行;
应用平台:是建立在Windows操作系统上的应用网络平台。
功 能 |
当前网络平台 |
本项目网络平台 |
运行环境 |
|
Window 2000/XP 操作系统 |
支持汉字个数 |
6763个汉字 |
70195 个汉字以上(扩大10倍以上) |
支持编码汉字的字节数 |
2字节 |
4字节 |
采用编码标准 |
中国GB标准 |
ISO 和 Unicode 国际标准 |
浏览检索范围 |
中国大陆 |
全球 |
搜索引擎 |
搜索引擎支持2字节汉字 |
搜索引擎支持4字节汉字 |
目前适应的系统环境 |
只支持Windows中文版 |
Windows中文和英文版通用 |
支持多文种状况 |
不支持 |
可支持34种包含150个国家以上的文种 |
平台性能 |
单独中文 |
多文种统一平台 |
中文输入管理模块和输入法的支持 |
中文输入法的管理模块只支持2字节汉字的输入;采用的输入法最多只能输入2万7千多字。 |
中文输入法的管理模块支持4字节的输入;采用专家认可的《郑码》输入法能输入7万汉字至10万汉字。 |
全文检索数据库 |
只支持2字节编码汉字 |
支持4字节编码汉字 |
检索速度 |
优 |
优 |
网络的应用 |
网络处理的内容和应用受到上述的种种限制 |
网络处理的内容和应用大为扩宽,为中华古籍、宗教经典、科研和历史文献的全文检索创造了基础条件。 |
《中易汉神e--超大型中文网络国际应用平台》的上述特点,都是当前中文和多国文字信息处理国际级的最新最高成就。在2001年已列入“国家973信息技术与高性能软件规划项目”,由国家科技部IT领域首席科学家顾钧教授任课题组长。目前,《中易汉神e》已经完成产品化,达到使用阶段。
四、本产品拥有自主知识产权。
五、本产品测试合格:
本项目的基本平台,在2003年3月经美国微软亚洲测试中心测试合格。
六、本产品的领先地位:
在世界上率先实现了4字节国际内码的超大型中文网络国际平台。为一切大型中文资料走上国际互联
网,为中华几千年灿烂文化走向世界,走进千家万户奠定了基础。
七、本产品目前的应用范例:
1、可以对有47000个字头字的《康熙字典》进行全文检索。证实了《中易汉神e》的上述性能,已经准备
公开销售。
2、国家图书馆的古籍《地方志》的全文数据化工程已经确立采用《中易汉神e--超大型中文网络国际应
用平台》;《地方志》共有16亿汉字。
3、2008-北京数字奥运,将以此应用平台为基础应用系统。目前经过北京科委专家论证,给予了很高评
价。现需进一步工作,争取立项。
八、本产品尚待完善的方面:
(1) 建立在此超大型应用平台系统之上的各种电子政务、图书馆管理、公安和银行以及科研管理系统
的应用开发;
(2) 多文种的输入法;
(3) 加强跨系统、跨平台性能。促进其他系统平台支持4字节国际标准内码。
参考资料:中文信息处理中的中国和国际标准字库以及中易系统平台发展介绍 |