从中医古籍数据库建设看中医古籍数字化论文

从中医古籍数据库建设看中医古籍数字化论文

ID:25741391

大小:53.00 KB

页数:5页

时间:2018-11-22

从中医古籍数据库建设看中医古籍数字化论文_第1页
从中医古籍数据库建设看中医古籍数字化论文_第2页
从中医古籍数据库建设看中医古籍数字化论文_第3页
从中医古籍数据库建设看中医古籍数字化论文_第4页
从中医古籍数据库建设看中医古籍数字化论文_第5页
资源描述:

《从中医古籍数据库建设看中医古籍数字化论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、从中医古籍数据库建设看中医古籍数字化论文.freell格式标引,如病证方药的名称、索引信息、各级标题等,力求实现图像的全文检索,避免标引过繁或过简,影响检索效果。对标引后数据进行审核。1.2.6数据发布将图像数据、元数据、标引数据、文本数据合成、入库,形成中医古籍电子书,发布到阅览系统后进行数据库测试,实现中医古籍的数字化保护与利用。1.3采用技术数据库采用Oracle9i,数据搜索采用OracleText技术。整个系统采用基于Java的VC设计模式,构建了高内聚、弱藕合、可维护和可扩展的中医古

2、籍数字化系统1。2中医古籍数字化存在的障碍2.1中医古籍中生僻汉字的处理汉字从产生至今经历了漫长的演变过程,由此也产生了大量的繁简字、异体字、古今字、通假字等。中医古籍数字化过程中遇到的字体障碍有两个方面,一个是对字体的认知障碍,生僻汉字的准确录入需要很深的中医文献学功底,而对于一般的操作人员很难办到;一个是技术障碍,Unicode字符集虽然可以解决字库问题,但是很多软件不支持,常用的输入法和搜索引擎不支持大字符集,很多生僻字仍不能正确显示和检索。用造字的方法费时费力,而且很难共享和检索,生僻汉

3、字的处理仍是中医古籍数字化过程中的一大障碍。2.2全国古籍数字化标准尚待建立目前,虽然参与中医古籍数字化工作的单位较多,但几乎都处于各自为战的状态,所采取的途径多样,因此产生的数字化成果形式多样,不利于中医古籍数字化发展,也不利于中医古籍数字化资源共享。究其原因,除了缺乏统一的协调规划外,没有可参照的行业标准也是其中重要的原因。2.3中医古籍数字化软件有待改进软件功能是否强大对中医古籍数字化过程和成果具有直接影响,选择合适的软件可以起到事半功倍的效果。目前,可供选择的数字化加工系统很多,扫描和图

4、像处理技术已较为成熟。而OCR软件对古籍中部分繁体字和不规则用字的识别效果很差,辅以人工校对则需要大量的时间和人力,如何提高OCR在古籍字符识别上的准确率是古籍数字化面临的一大难题;数据加工软件在批处理、大字符集、内容管理等方面存在缺陷;检索系统如何根据中医古籍的特点提高检索速度和精准度也是值得进一步研究的问题。2.4古籍信息的精准检索快速、准确地检索到所需要的内容是古籍数字化应有的基本功能,也是评价其优劣的重要指标。全文本的数字化古籍可以实现任意字符的检索,但是数据准确度小、检索噪音大的问题尚

5、待进一步解决;图像版可以保证信息的准确无误,但在全文检索上存在一定缺陷,通过对有效检索点的标引可以在一定程度上弥补上述不足,但仍不可避免地要遗漏某些信息。由于中医古籍中病、证、方、药的同名异义、异名同义现象普遍存在,使内容的精确检索更加困难。如何建立后控词表,实现关联检索也是中医古籍数字化面临的一个难题。2.5研究支持功能尚不完善研究支持功能是指能够提供有关古籍内容本身科学、准确的统计与计量信息,提供与古籍内容相关的参考数据、辅助工具,这些信息、数据或工具都是古籍内容的增值或补充2。中医古籍具有

6、极高的研究价值,其研究支持功能应更强大。除常用的中医古籍研究辅助工具外,还应具有不同版本和相关数据的链接。对病、证、方、药的参考数据进行汇聚,对生僻字进行注解,建立学术论坛等,都是研究支持功能的重要组成部分,而目前的中医古籍数字化成果在此方面尚显薄弱。2.6深度开发不够中医古籍数字化不应仅仅满足于对古籍的阅览和查询。古代中医药文献是一个知识宝库,在数字化的基础上挖掘古籍中的宝贵知识财富,实现知识发现和知识拓展,更好地为中医药事业的发展和人类健康服务是中医古籍数字化的最高目标。3中医古籍数字化建设

7、的建议3.1图文关联是实现中医古籍数字化的较好方式图文关联是将古籍文献分别存储为图像、文本两种形式。图文关联是将文本对应放在与之相匹配的图像之下,并建立索引关系,实现图文对照。此种方式可以弥补“图像”在检索和内容编辑上的不足,又可以校对“文本”的准确性,使读者既能看到原书原貌的古籍文献,又可以快速准确地查到所需要的内容。尤其对于研究者,对原始版本信息和文本的准确性要求更高,而通过图文对照便可很好地解决这一问题。3.2中医文献与计算机专业人员的通力协作中医古籍数字化是古典文化与现代技术的结合,需要

8、有精通中医古籍整理、目录学和版本学知识的人才与掌握计算机网络知识和多媒体技术的专业人员通力协作。中医古籍数字化虽属新的古籍整理方式,但仍归于中医文献整理范畴,离不开文献整理的知识。在整个过程中,中医知识不可或缺;同时,在数据处理、数据库设计、应用平台构建等方面都需要计算机专业人员参与。中医文献专家的需求和建议能指导计算机技术人员对整个系统的设计,进而改善中医古籍数字化系统的功能。上述两方面人员的深入合作是创建理想中医古籍数字化模式的前提。3.3重视统一标准的研究和制定建立完整的中医古籍资源库需要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。