基于xml电子病历的索引策略应用与研究论文

基于xml电子病历的索引策略应用与研究论文

ID:34139609

大小:2.31 MB

页数:64页

时间:2019-03-03

基于xml电子病历的索引策略应用与研究论文_第1页
基于xml电子病历的索引策略应用与研究论文_第2页
基于xml电子病历的索引策略应用与研究论文_第3页
基于xml电子病历的索引策略应用与研究论文_第4页
基于xml电子病历的索引策略应用与研究论文_第5页
资源描述:

《基于xml电子病历的索引策略应用与研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、福建师范大学硕士学位论文基于XML电子病历的索引策略应用与研究姓名:陈圣群申请学位级别:硕士专业:光学工程指导教师:滕忠坚;洪亲20090401中文摘要电子病历的标准化、集成化、网络化一直是我国医院信息系统改革的三大问题。j下在发展的XML技术有强大的可扩充性、灵活性和有与生俱来的网络特性,可以成功地解决了电子病历表示和存储问题。但是如何快速处理已固有的电子病历(静态的电子病历)和日趋更新的电子病历(动态的电子病历),还有待于我们进一步研究。本文首先介绍了基于XML电子病历的相关技术,然后着重对基于XML的电子病历的索引技术进行研究,讨论和分析了半结构化数据索引

2、技术的原理和特点。接着,改进了传统混合索引策略的同时,引入了的更新策略,使其适应基于XML电子病历快速地实时更新。最后,通过实验证实了它的可行性和优越性。关键词XML电子病历索引策略中文文摘XML具有便于长期保存病历、信息交换和查询,强大的可扩充、灵活性和与生俱来的网络背景。因此,完全以XML来描述电子病历可以达到不依赖于任何一种开发语言、任何一种数据库,是目前存储电子病历的最佳选择。同时,我们必需考虑到,日趋网络化的电子病历具有时时更新的特性,应该构造一个好的索引策略,来减少电子病历查询和处理的时间。所以,基于XML的电子病历的索引策略是值得我们研究的。本文首

3、先对课题的研究背景和国内外研究背景作了简单介绍,并概述了研究意义和内容,然后对基于XML电子病历的概念和相关技术进行一一介绍。从目前电子病历的索引技术出发,对当前几种索引技术方法进行了较为详细的概述。针对当前索引技术的缺点,结合结构索引和倒排索引的优点,使用一种混合索引。同时,为了减少空间和时间开销,对传统的混合索引策略进行改进;同时,针对网络化电子病历,引进了更新策略。以适应基于XML电子病历的实时更新。主要研究工作如下:绪论介绍了课题的背景,阐述了国内外研究情况,并概述了论文的意义和主要工作。传统的混合索引策略可同时支持对包含路径和关键词的查询表达式检索,但

4、它仅支持静态数据集合,而网络上的信息却是动态的,所谓动态的数据集合就是指对集合本身而言支持记录的插入、删除和更新操作。对于每天发展变化的网络来说,为使用户及时得到网络化电子病历的更新信息,如何建立索引策略是论文的主要工作。第一章电子病历是记录有关病人健康和医护状况的终身电子信息载体,具有“全、准、快、易”优点。本章介绍了电子病历概念及其体系结构的同时,还概述了良构型(Well.fo衄ed)和有效型(Valid)的XML,是SGML的一个子集,又是对HTML的补充。具有XML具有平台无关性、存储格式不受显示格式的制约等优点。介绍了电子病历的四种存储技术和分析它们的

5、优缺点,得出NativeXML数据库法以自然方式存储和处理XML数据,没有因数据模型的转化带来的信息丢失和性能下降,故用该方法存储电子病历是最佳的。同时,概述了基于XML电子病历处理相关技术,比如XPath,XQquery,DTD等;最后,论述了电子病历的搜索引擎,指出了它主要指标有响应时间、查全率、查准率和相关度等,说明了创建索引的过程。第2章详细介绍了当前基于XML电子病历的索引技术,包括值索引、节点索福建师范大学工学硕士论文引、路径索引、结构索引、倒排索引。其中,结构索引是利用XML文档树的层次性,通过分析、解读文档的层次,进行文档划分、关键词的索引和用户

6、的查询,达到更准确地掌握文本所表达思想和信息。倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址,是由属性值来确定记录的位置,而不是由记录来确定属性值。同时,也介绍了若干种著名的倒排索引方法。第3章首先介绍了结构摘要、双拟关系、Dewey编码的概念,引出了混合索引策略,即结构索引和倒排索引相结合,来提高查全率、查准率和相关度。针对电子病历传统混合索引中的结构索引策略,是对基于XML电子病历的文档树的结点进行Dewey编码,保持了结构关系上的信息,保存了整个文档的位置关系;同时,引入双似关系,保留了唯

7、一路径,使具有相同路径的文本数据都集中在该路径的节点之中,避免了相同标签路径的重复访问缺陷,大幅度地提高了性能。在混合索引中的倒排索引策略,用开散列表(OpenHashTable)来存储词典,且使其总是驻留内存,实现快速地查询关键字。针对动念的电子病历,混合索引策略是在改进的基础上,再引进了更新策略,适应了实时更新的电子病历的混合索引策略。在讲解的过程中,在附录中还给出了索引系统实现的主要算法,如Dewey编码算法,倒排索引结构的创建算法,倒排索引缓存区的LRU替换算法和动态电子病历的混合索引算法。第4章首先,介绍了建立索引系统过程。(1)电子病历预处理,包括信

8、息的格式支持与转换以及信

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。