Scanning
Full Text Digitization
Digitization of Jiapu
CMS of Ancient Books
在2003年国际标准ISO/IEC10646:2003(Unicode)7万超大字库标准刚刚推出之际,中易即依托于强大的超大字符集相关核心技术,成立了大型集约化古籍数字化生产线,提供专业的从扫描、全文版式还原、网络发布的全系列数字化服务。承担了众多大型古籍数字化项目,是行业内最早具备应用超大字符集进行古籍数字化技术处理能力的单位,目前已升级到ISO/IEC10646:2017(Unicode 11.0)8万字超大字符集。 ◆ 中易曾承担多个大型国家级古籍数字化项目,采用自主知识产权研发的软件,实现集中式管理,全程无纸化作业,实现对各工序任务的合理调配、数据管理、及质量控制。拥有一支经验丰富的古籍数字化专业团队,积累了20多亿字数字化成果,尤其擅长于处理数字化难度最大的古籍善本、拓片、家谱、历史档案等丰富。 ◆ 基于中易在行业内丰富的古籍数字化经验,国家图书馆《中文文献全文版式还原与全文输入XML规范》和《计算机中文信息处理规范》,由中易承担编制任务。 ◆ 中易在古籍数字化工程质量和数据安全方面,都拥有良好的口碑。
Scanning Services of Ancient Books/Genealogies/Archives
古籍扫描与普通文档扫描差异性很大,古籍分为很多种不同的装帧方式,常见的有线装、蝴蝶装、包背装等,为了避免损坏和达到最佳的数字图像获取效果,不同的装帧方式在扫描时的处理方法和关注要点都不相同。很多古籍还存在纸质脆弱、纸薄透字、水浸虫蚀的情况,在扫描的时候都需要进行特殊的处理,保护原件的同时,尽可能清晰完整的获取数字图像。 古籍扫描从操作技术、流程设置、管理方法上,都需要专业的、有大量经过验证的实际操作经验的专业团队操作,才能保证对珍贵的古籍在完成高品质的数字扫描的同时,也能做到良好的保护。 中易是从事古籍、家谱、历史档案扫描、全文版式还原数字化的专业公司,曾承担过国家图书馆古籍地方志80万筒子叶的扫描工程,以及上百万页的家谱、历史档案的数字图像扫描加工,采用专业设备,无损扫描,配备经验丰富的专业人员,提供整理、扫描、图像处理、目录加工等专业服务。
Full Text Digitization of Ancient Books/Historical Archives
中易专业古籍数字化加工生产线,采用大规模工业化生产管理,自主研发的C/S结构集中式管理系统,由服务器端集中进行各工序任务的合理调配、数据管理、质量控制追踪、人员的分配管理,多道工序间相互关联,有序衔接,全程无纸操作。 经验丰富的专业团队,曾承担多个大型国家项目,早在2004年,即率先采用行业内先进国际标准ISO/IEC10646: 2003 (Unicode 4.0) 的7万超大字库,对国家图书馆古籍地方志全文版式还原数字化,完成6亿字;并曾承担多个大型中央直属单位、省/市级图书馆、档案馆的古籍、家谱、历史档案项目的全文数字化,累积超过20亿字工程经验。 中易公司在2017年6月,通过中共中央党史研究室的考察和招标,签订了关于党史善本资料数字化工程合同。在严格的保密和细致的工程技术要求和监管下,如期圆满完成。 中共中央党史中涉及许多党内机密,而且许多善本是独一的原件,所以对施工方有许多保密的严格要求。在原件不出室,多重监管下,中易以严格遵守规定,认真细致地完成了这一重要工程,获得研究室好评。 中易积于30年来在超大字符集方面雄厚的技术积累,采用独有核心技术,提供高品质的古籍全文化服务: ◆ 超大字符集:《中易超大型国际网络中文平台》(简称“中易汉神”),是《国家973信息技术与高性能软件规划项目》最先实现产业化的项目之一,自2004年起,全面支持ISO/IEC10646: 2003 (Unicode 4.0) 的7万余汉字的显示、全文检索、输入/输出,经中国国家中文信息处理产品质量监督检验中心检测合格,并已在多个类似项目中成熟应用。经不断升级,目前已支持ISO/IEC10646: 2017(Unicode 11.0)八万余汉字,为古籍、家谱数字化过程中大量的生僻字处理,提供了良好的基础平台。 ◆ 版式还原:古籍版式复杂,中易在全文数字化过程中,可提供原版式还原。基于中易强大宋、楷、仿宋、黑四大8万字超大字库,可采用与原书风格最相近字体进行版式还原,刻本采用宋体,抄本采用楷体,还原原书风貌。 ◆ 专业补造字:提供与Windows中宋、楷体字库风格一致、无缝衔接的补造字。 ◆ OCR及其它数字加工工具:适用于古籍字体识别的专业OCR及其它自主研发的工具软件,提供低成本、识效率的全文加工服务。
Digitization of Genealogies
家谱,或称族谱,是记述某一同宗共祖的血缘世系人物或兼及其他方面情况的历史图籍。寻根问源是中华民族的传统,人们自古以来就很重祖世系源流,而数字家谱的出现,可以使得人们更为方便地查找研究自己的祖先和家族传承。 与其它古籍不同,家谱具有批量小、种类多的特点,同时又具有自身的文献特色: ◆ 内容具有逻辑关系:家谱中人物关系多用五世图、五世表等来表现,对研究传承关系具有重要意义; ◆ 涉及大量生僻字:古籍数字化中生僻字在人名、地名中出现机率最高。而由家谱中90%以上的信息都涉及到人名、地名用字,用字的字种量大。 ◆ 家谱跨越的时间年代长,并由各个家族自行撰写,版式通常复杂,并存在大量非连续性文本。 ◆ 家族情况复杂多样,家谱为民间编写,内容中常含有错误,需要勘正。 中易具有大型家谱数字化加工经验,曾数字化数十万页家谱,自主研发的家谱数字化专用工具,采用人工智能的算法,自动关联家族人物关系,纠正原谱中出现的错误,形成完整的世系树,直观地展现人物关系,便于使用和研究。 采用中易超大字符集核心技术,支持ISO/IEC10646: 2017(Unicode 11.0)八万余汉字,解决家谱数字化过程中的生僻字问题。配备中易全汉字家谱发布系统,是家谱展示、研究的得力工具。
Content Managemant System for Ancient Books
中易全汉字发布系统采用B/S结构,支持对国际标准ISO/IEC10646: 2017(Unicode 11.0)及国家标准GB18030-2005中全部8万余汉字的显示、检索、输入/输出,对采用超大字符集制作的古籍、家谱、历史档案的全文数据进行完美呈现,方便用户研究和利用数字资源。全部系统都可根据需要定制开发。 全汉字古籍发布系统: ◆ 采用专利技术,用户计算机里缺少的汉字都可以在通用浏览器里正常显示,无需额外下载安装其它内容,透明友好; ◆ 全文检索引擎,超大字符集和所有补造字都可检索,简/繁/异体字实现关联检索,检索速度快,检索结果有序排列,并可实现模糊/精确检索、二次检索、高级限定范围检索、布林检索; ◆ 在线超大字符集输入法,无需读音,无需学习,拿来即用; ◆ 扫描图像和全文版式还原内容同屏显示,或单独显示; ◆ 在线联机《康熙字典》,随时查释义; ◆ 数据统计、纪年转换等众多在线工具; ◆ 用户注册、登录及阅读权限管理; ◆ 后台数据管理、用户管理、安全管理模块。 全汉字家谱发布系统: ◆ 除了具备上述古籍系统的一切功能外,针对家谱资源特点,可对人物传承关系进行树状图显示; ◆ 人物节点对应相应元数据及图像内容; ◆ 可以在线自建新家谱,或在老谱后续修家谱; ◆ 家族成员互动、联系等功能。
中易《超大型中文网络国际应用平台》,是国家973产业化项目之一,全面支持对ISO/IEC10646: 2017的8万余汉字的应用。
独有的核心技术,采用在线、或离线的方式,全部计算机中缺少的汉字都可正常显示,无需人工干预,友好透明,具有实时性。
多种中文输入法,无需知道读音、无需学习、拿来即用。或可通过简单的学习实现快速盲打,符合语言文字规范,适宜中小学辅助教学。
Copyright © 2023.北京中易中标电子信息技术有限公司版权所有