基于数据仓库的病历管理决策支持系统的研究与开发

基于数据仓库的病历管理决策支持系统的研究与开发

ID:77697813

大小:3.13 MB

页数:73页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于数据仓库的病历管理决策支持系统的研究与开发_第1页
基于数据仓库的病历管理决策支持系统的研究与开发_第2页
基于数据仓库的病历管理决策支持系统的研究与开发_第3页
基于数据仓库的病历管理决策支持系统的研究与开发_第4页
基于数据仓库的病历管理决策支持系统的研究与开发_第5页
基于数据仓库的病历管理决策支持系统的研究与开发_第6页
基于数据仓库的病历管理决策支持系统的研究与开发_第7页
基于数据仓库的病历管理决策支持系统的研究与开发_第8页
基于数据仓库的病历管理决策支持系统的研究与开发_第9页
基于数据仓库的病历管理决策支持系统的研究与开发_第10页
资源描述:

《基于数据仓库的病历管理决策支持系统的研究与开发》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

遣掌鄉波*營UniversitofSrienceandTechnoloLiaoninygyg预±等恆巧交mLTHE^SFORMASTEIVSDEGREEjjI‘V纖繼V基于数据含库的病历管理决策支持系统巧研究与开发作者姓名;王军伟指导教师;张学东教授专业领域:计算机技术答辩日期;2016年6月4日 TP31公开分类号密级UDC单位代码10146学号133085211083硕士学位论文基于数据仓库的病历管理决策支持系统的研究与开发研究生姓名:王军伟指导教师:张学东教授工作单位:辽宁科技大学指导教师:孙国利主任医师工作单位:鞍山市医学科学信息所论文提交日期:2016年6月1日答辩日期:2016年6月4日学位授予日期:授予单位:辽宁科技大学论文评阅人:张学东教授工作单位:辽宁科技大学论文评阅人:外审工作单位:答辩委员会主席:李良俊教授工作单位:鞍山师范学院1 "TheFormantCriteriaofDegreePaperatUSTL"TheresearchanddevelopmentofmedicalrecordmanagementdecisionsupportsystembasedondataminingbyWangjunwei(computertechnologyin)Supervisor:Prof.ZhangxuedongMay3,20162 3 中文摘要中文摘要随着卫生体制改革的深入,医疗市场竞争的加剧,建设数字化医院已经成为现代化医院生存发展的必然选择。病历的信息化管理作为医院信息化的重要组成部分之一,必然要求引进先进的计算机技术,使我国医院病历管理工作能够满足建设数字化医院过程中更新、更多、更实用的信息需求。数据仓库技术(DW)为这样问题提供了一个有效的解决方案,它以传统的数据库技术作为存储数据和管理资源的基本手段,面向决策支持系统(DSS)构建统一的数据管理平台。尽管联机分析处理和数据挖掘是现代优秀的DSS中的核心技术,但是在医疗卫生领域,与医院病历管理系统结合确是一种新的尝试。基于数据仓库的病历决策支持系统(本系统)能够收集分散的各种详细数据源,建立以各种主题为导向的数据仓库,来制定出科学的病历分析策略。本文基于数据仓库理论、数据挖掘理论,决策支持系统理论、运用MSSQL数据仓库开发工具,以病历管理信息系统为基础,建立了一个面向病历分析的决策支持系统。最终目标是不断对其进行扩展,建立起区域化的数据仓库及其分析系统。本文首先分析了决策支持系统、数据仓库技术和OLAP技术的研究发展现状,以及医疗市场的发展对病历信息系统的要求,提出本文的课题背景和研究内容。然后分别阐述了决策支持系统、数据仓库、联机分析处理和数据挖掘的相关理论与技术。详细论述了如何基于数据仓库技术构建一个病历辅助决策系统,以及如何利用决策支持数据仓库进行数据分析和实例展示。在文章最后,对本文所做的工作进行总结,对本系统今后的发展提出了展望。本文的主要贡献在于结合项目的实际需要对本系统进行了研究,运用数据仓库和决策支持系统理论,采用先进的数据仓库开发工具,依据卫生部最新的信息系统功能规范,构建了病历决策支持系统,实现了从不同角度、不同侧面对病历的数据进行分析,最后还介绍了文档索引图算法在病历分类中的应用。关键词:数据挖掘;数据仓库;决策支持系统;病历管理4 ABSTRACTABSTRACTWiththehealthsystemreformdeepeningandthehealthcaremarketcompetitionintensifying,thebuildingofdigitalhospitalhasbecometheinevitablechoiceofthemodemhospitalsurvivalanddevelopment.Themedicalrecordsinformationmanagementisanimportantpartofthehospitalinformationsystem.Itisboundtorequiretheintroductionofadvancedcomputertechnology,whichmakesthemanagementofhospitalmedicalrecordstomeettheconstructionprocessofthedigitalhospitalnewer,moreandmoreactualinformationneeds.Thedatawarehouse(DW)issuchatechnicalsolutiontosolvetheproblem.Itisatraditionaldatabasetechnologytostoredata,manageresources,andbuildaunifieddatamanagementplatformfordecisionsupportsystem(DSS).Despitetheon-lineanalyticalprocessinganddataminingaretheexcellentcoretechnologiesinmodemDSS,butintheareaofhealth,theintegrationofhospitalmedicalrecordsmanagementsystemisindeedanewattempt.ThesystembasedondatawarehousecancollectthosedetaileddataonavarietyofscatteredSources,establishthedatawarehousesystemwillavarietyoftheme-oriented,anddevelopthemedicalrecordsanalysisanddecision-making.Thispaperisbasedonthetheoryofdecisionsupportsystem,datawarehouseanddatamining.ByusingMSSQLdatawarehousedevelopmenttools,wecreateddecisionsupportsystemformedicalrecordsanalysisbasedonthemedicalrecordsmanagementinformationsystem.Thegoalistocontinuetoextendthemtoestablishregionaldatawarehouseandanalysissystem.Thefirstchapteranalyzestheresearchanddevelopmentstatusofthedecisionsupportsystems,datawarehousingtechnologyandon-lineanalyticalprocessing(OLAP)technology,thebackgroundandresearchcontentoftherequestofthemedicalrecordsinformationsystemformedicalmarketchanging.Then,thepaperintroducesdecisionsupportsystem,datawarehousing,onlineanalyticalprocessing,dataminingandtherelevanttheoryandtechnology.wediscusshowtobuildthemedicalrecordsdecision-makingsystembasedondatawarehouse,andhowtousedecisionsupportdatawarehousefordataanalyzingandpresenting.Theexamplesaregiventomeetthedecisionsupportneeds.Finally,thispapersummarizestheresearchandthefuturedevelopmentofthesystem.Themaincontributionofthispaperistoconductastudyonthesystem.Withtheactualneedsoftheproject,weconstructofthedecisionsupportsystemfortheinpatientmedicalrecordsbyusingdatawarehouseanddecisionsupportsystemstheoryandadvanceddatawarehousedevelopmenttools,accordingtotheMinistryofHealth5 ABSTRACTbasedonthelatestinformationsystemsfunctionalspecification.Itcananalyzethemedicalrecordsdatafromdifferentanglesanddifferentaspects.Finally,itintroducestheapplicationofdocumentindexgraphinmedicalrecordclassification.KEYWORDS:Datamiming;Datawarehouse;Decisionsupportsystem;medicalrecordmanagement6 目录目录独创性声明....................................................................................................................3关于论文使用授权的说明............................................................................................3中文摘要..................................................................................................................4ABSTRACT...............................................................................................................51.绪论..........................................................................................................................91.1研究背景及意义................................................................................................91.2研究现状及发展趋势......................................................................................101.2.1研究现状................................................................................................101.2.2发展趋势................................................................................................111.3论文组织..........................................................................................................122.相关理论概述........................................................................................................132.1决策支持系统...................................................................................................132.1.1决策支持系统的结构............................................................................132.1.2DSS的决策步骤.....................................................................................152.2数据仓库技术...................................................................................................152.2.1数据仓库与传统数据库的区别............................................................152.2.2数据仓库的组成....................................................................................162.2.3数据仓库的体系结构............................................................................172.2.4数据仓库的设计方法............................................................................182.3数据挖掘技术...................................................................................................192.3.1数据挖掘的概念....................................................................................192.3.2数据挖掘的任务....................................................................................192.3.3数据挖掘的过程....................................................................................212.3.4数据挖掘系统的体系结构....................................................................232.3.5数据挖掘的决策树算法........................................................................242.4基于数据仓库和数据挖掘的决策支持系统体系结构...................................273.病历管理决策支持系统的需求分析....................................................................293.1系统业务分析..................................................................................................303.1.1系统业务流程介绍................................................................................303.1.2系统业务流程分析................................................................................313.2系统功能分析..................................................................................................323.2.1医院信息系统(HIS)子系统..................................................................323.2.2查询统计报表子系统............................................................................333.2.3综合分析决策子系统............................................................................333.3数据流程分析..................................................................................................333.3.1系统顶层DFD图....................................................................................343.3.2系统第一层DFD图...............................................................................343.3.3系统第二层DFD图................................................................................354.病历决策系统的设计与实现................................................................................364.1系统设计目标..................................................................................................364.2系统性能体系规划..........................................................................................367 目录4.3数据管理规划..................................................................................................374.3.1数据仓库主题规划................................................................................394.3.2概念模型设计........................................................................................404.3.3逻辑模型设计........................................................................................404.3.4物理模型设计........................................................................................444.4体系性能规划..................................................................................................444.4.1医院信息子系统....................................................................................444.4.2检索统计报表子系统............................................................................454.4.3综合分析决策子系统............................................................................464.5病历管理决策支持系统的实现......................................................................464.5.1病历管理决策支持系统的实现流程....................................................464.5.2病历管理决策支持系统的结构与建议结构........................................474.5.3对数据仓库的病人病因治理建议保障体系的构造............................484.6病历DSS的性能运用......................................................................................504.6.1医院综合信息子系统............................................................................524.6.2数据转换聚合子系统............................................................................524.6.3查询统计报表子系统............................................................................534.6.4综合分析决策子系统............................................................................555.改进的DIG算法在病历分类中的应用................................................................575.1病历的采集和预处理......................................................................................575.2向量量化..........................................................................................................575.3改进的DIG算法即文本分类算法的步骤和结果......................................595.3.1改进的DIG算法................................................................................595.3.2实验结果................................................................................................625.4结论与讨论......................................................................................................656.总结与展望............................................................................................................666.1总结...................................................................................................................666.2展望...................................................................................................................66参考文献......................................................................................................................68致谢......................................................................................................................70作者简介......................................................................................................................718 辽宁科技大学硕士学位论文1.绪论1.1研究背景及意义随着中国对医疗体制的不断改革、国家卫生部门以及疾病预防控制中心的网络化、数字化的发展和不断完善,医院已经存在的海量病历资料对于医疗水平和企业效益的各方面都具有很高的研究价值。每个住院的病人都享有知情权,他们有权查阅和打印相关病历资料;患者们也能选择多家医院进行就诊,这就需要在各个医院之间传递患者的病历信息;目前中国的医院也开始集团化,因此就需要各个下属的合作医院之间能共享患者病历;随着商业化医疗保险的出现,使病历资料与保险公司业务结缘;现在医院的效益化,需要患者按照病种付费、对医院各科室绩效进行考核等,这也是促进了病历资料研究在各方面的应用价值;教学、科研、医疗等各个领域都对病历资料的管理有了新的需求;并且在法律方面进行研究,最高人民法院在《关于民事诉讼证据的若干规定》中对医疗举证责任进行了严格规定,这就使病历资料成了医患纠纷的重要证据,因此病历信息的管理相当重要。患者病历作为医院的宝贵财富,传统的病历管理还停留在原始的纸质管理保存方式上,堆积如山的病历放在柜子里、架子上,病历资料容易损坏和丢失,占用医院很大的黄金位置,无形当中给医院造成了潜在的损失,并且管理这些纸质病历的工作人员工作量也非常巨大;需要查看患者病历的人员需要等待很长的时间,使其工作效率并没有得到提升,反而降低了,浪费了时间也浪费了人力;在资源共享方面,每份病历都要等到一个医生使用完以后另一个医生才能使用,资源没有得到有效地共享;国务院颁布的有关《医疗事故处理条例》的相关文件也给病历管理提出了更高的要求,患者的病历资料没有妥善保管可能会给医院带来巨大的经济损失;这些宝贵的资料还能用于医疗研究,发现各病种之前的潜在规则,对提高医疗水平具有重大意义,因此病历资料的数字化和发现其中的潜在规则已成为当今医院发展和医疗水平发展的一项重要内容。本文开发的基于数据仓库的病历管理决策支持系统,根据医疗改革新要求、卫生部规范以及医院工作人员执行的实际性,将当前先进的数据仓储功能和数据挖掘功能相融合,使系统的可操作性性更加人性化、输出结果能够满足各类型医院的管理要求和医疗水平研究、能够全面快捷的上报汇总数据报表,挖掘患者病历当中隐含的有价值的信息,为提高医院医疗水平做出贡献,本系统就是为了解决以上诸多新问题而研究开发的。9 1.绪论1.2研究现状及发展趋势1.2.1研究现状联机事务处理系统(业务系统)刚上线时,由于数据量少人们往往查找不到数据,然而很多年后当数据量越来越多时也难以查找。面对这个难题,人们尝试组建一个专门用于统计和分析专业数据的数据系统,其中的数据来源多样,可以是联网处理事务的系统、也可以是外部其他的数据、也可以是脱机处理过去事项的数据,这样就产生了一个数据仓库。数据库可以通过联机的功能,向相关信息使用者提供分析统计和决策的依据,在数据库的帮助下可以获取决策和统计分析使用所需要的相关数据。随着Internet被人们熟知和电子商务的蓬勃发展,数据仓库技术也逐渐变成了社会信息中重要的一部分。在一些技术比较先进的国家,以数据仓库和数据挖掘为基础在线分析处理技术,最开始在一些数据相对密集型的行业中取得了很好的效果。获得效果的案例有澳大利亚,他们尝试将数据仓库技术在政府税务部门试用,以获取税收业务方面的决策数据信息,系统运行了三年后,投入与回报的比率达到了1:15。对于我国,由于信息化建设的发展比较晚,所以在数据仓库应用方面成功的案例并不许多。在计算机科学技术蓬勃发展的今天,决策领域也引入了计算机相关技术,由此产生了一门新的决策系统学科,人们称之为“决策支持系统”(DSS)。上世[1-4]纪九十年代,在国外已开始使用传统决策支持系统,进入21世纪以来,此项技术在我国也取得长足的发展。虽然在我国发展的还不是很成熟,但在不断努力的推动“管理科学与工程”等一系列学科的发展。另外在我国自主研发各项新技术(数据库连接、数值运算功能、综合集成能力)的不断提高下,使得决策支持系统不在是外国专家的研究专利,更多的被我国专业人才所掌握。随着数据库日渐完善,能够成功运用于模型库系统时,才可以将传统的决策支持系统和管理信息系统相互融合运用于社会的各部门。在90年代初,提出了新决策支持系统的数据仓库、数据挖掘、联机分析处理等概念,并且在90年代中期,此技术在国外[1-7]形成了高潮,在1996年我国正式引进了这些概念。因为新决策支持系统工作的根本是数据库,相关的研究技术大致包括数据仓库以及数据挖掘、联机分析处理等,所以许多方面的学者对此引起了关注,便迅速地在我国兴起了研究的高潮。新型决策支持系统的作用在于:决策分析信息来源于数据仓库的支持;同过联机使数据处理的方式多样化;联机分析在数据仓库中的工作和组织方式多样化;对数据挖掘没有显现的知识。自从在70年代这一时期决策支持系统出现之后,就在相关理论和实际应用方面都获得了比较大的进展,许多企业都开始研究和分析决策支持系统,同时建立管理信息系统和决策支持系统,使得两者可以相互协助。例如,中国人民大学医疗与财税电子化研究所与山东省浪潮齐鲁软件产业股份有10 辽宁科技大学硕士学位论文限公司联合推出了“浪潮税务决策支持系统”,此决策支持系统就是以统计分析、数据仓库以及数据挖掘等技术为基础,在系统设计上,使业务模型和技术框架的祸合度达到最小的限度,并且在分析业务的特殊性和共同性基础上,构建面向适用不同级别企业机关的业务模型。如今,我国医疗信息化推进建设过程中,经过较长时间发展的联机事务处理(OLTP)技术已经基本成型,决策支持技术经过多年的改进已经在医疗领域有所运用,但在病历中还是涉及不多,然而在实际工作中已出现了很多新的要求,这就使旧式的病历管理方式已经不能达到标准。因此,如何合理化、高效率地管理这些数量越来越多的病历资料并能达到快速查询的标准和分析,建立一套比较完整通用的、自动化的、网络化的、扩展性强的病历数字化管理系统已经势在必行。1.2.2发展趋势20世纪后十年所提出的决策支持系统依靠数据仓库、联机分析处理、数据挖掘等技术,为管理决策提供了更加及时、准确、有用的决策信息,逐渐在我国医疗、通信、保险、等相关领域得到了越来越多的关注和应用。起初,由于激烈的竞争环境、政府减少管制、重构内部流程的需要、急需为用户指定的市场销售策略等主要因素促使大量的公司使用数据仓库。目前DW存在于能想象得到的全部行业,而电信和医院业继续在DW投入上保持领先的地位,这两个行业的15%预算都用在了DW的建设上,而在未来各行各业也把获取、清洁、保养和使用商业而造成的海量数据,构建自己的数据仓库,挖掘对自己有用的信息,用来提供比较科学的决策支持。伴随着社会经济的发展,各大企业更加重视系统数据中所带来潜在表象,想要更好的运用这些表象来分析出数据的潜在价值,从尔转化为收益,这就需要通过计算机技术上的数字化、智能化手段来帮助实现。国内的数据发掘行业发展仍然不成熟,无法做出有效的市场分析,但是很多行业已经加强了对这一行业的研究。根据国外专家的分析预测,在未来的几年里,随着计算机的普遍应用和企业数据量的日益增加,数据仓库和数据挖掘技术在中国把形成一个产业。通过IDC(InternationalDataCorporation)的分析预测,BI行业市场于2004年将会有接近140亿美元的市场价值。随着数据库逐步进入高速发展的轨道,一些现代化的企业、集团、组织只要对数据价值有清晰的认知,数据库就成为了不可缺少的选择。由于世界经济增长速度的减缓、WTO的激烈竞争,越来越多的中国企业感受到行业竞争压力,产品经营所围绕的中心由实物转向了客户,信息的价值也受到了空前的重视,数据库俨然已经成为了信息技术领域的焦点之一。美国的PaloAlto管理集团公司曾经在1999年对欧洲、北美、日本等国家商务智能技术的应用现状展开调查,结果显示,在被调查的375家企业中,营销业界对于此技术的11 1.绪论使用已经有半数的覆盖比例,医疗卫生行业则达到或者接近了70%,并且在未来的几年中,各行各业对该技术的应用水平都把提高大约50%。在IDC对欧洲、北美的62家企业的调查研究后,发现采用了商务智能技术的企业在投资的三年里,回报的收益比例高达4倍,其中25%的企业甚至有着超过6倍的“恐怖”的投资回报比率。调查的结果同时表明,企业希望在混乱复杂的环境中有所成就,如果没有大量的事实和数据支持,高层决策者在非常复杂的商业结构中采取准确的决策是非常困难的。所以,伴随着数据库和数据采集挖掘技术的成熟度的提高,必把成为更多的企业管理者进行商务智能决策的工具。随着中国医疗体制的不断改革、卫生统计体系以及疾病预防控制体系的网络化、数字化、区域化的不断完善和发展,医疗体系中聚集了海量的病历数据,这些珍贵的信息因为没有数据挖掘进行开发,很容易造成“知识缺乏且数据爆炸”的现实,如果不改变这样的局面,医疗系统不是在海量数据的“海洋”中被“淹死”,就会在医院业务层面和决策相关规律的“沙漠”中“渴死”。人们迫切需要开发出更加符合具有中国特色的数据仓库建设体系、数据挖掘分析体系及可以完美融合在一起的决策支持系统,这些需求既是现代医院管理发展到一定阶段对医院信息管理水平提出的现实要求,又是现代医院业务发展与信息技术发展高度融合的必然趋势。1.3论文组织本文的内容组织如下:第一章主要对课题的研究整体背景以及意义做出了阐述,并且介绍了国内外目前的研究进程和发展态势以及课题进行研究的内容。第二章重点对数据仓库和数据挖掘的创建、相应的联机分析系统和决策支持体系进行了概述。第三章给出了病历管理决策支持系统的需求分析,主要包括系统业务分析、系统功能分析、数据流程分析。第四章给出病历管理决策支持系统的设计与实现。主要包括功能设计、数据仓库设计、实现流程、核心数据仓库的构建、系统的功能、分析展示、决策支持。第五章给出改进的DIG算法在病历分类中的应用。主要包括对病历的预处理、量化、以及文本分类算法在病历管理中的应用,并且对此进行了实验。第六章对整个课题做出了全面的总结,针对课题中存在的缺陷做出改进以及对未来发展的规划。12 辽宁科技大学硕士学位论文2.相关理论概述数据仓库(DW)、数据挖掘(DM)和联机分析技术(OLAP)是最近这几年在数据库这个领域中比较热门并且发展较快地三项崭新技术。数据仓库可以对数量较多的处理数据进行集中后再重新组织,使得“数据孤岛”、“信息贫乏”这些问题都迎刃而解。数据挖掘指的是使用很多分析技术,在整个数据仓库进行管理和组织的众多数据之间挖掘和寻找隐藏的潜在关系。联机分析技术是把数据分析活动从面向方法变为面向数据,从而实现分析工具的有效互操作。而决策支持系统(DSS)是从大量的历史数据中观察得出的目前存在的客观规律,为每个企业的高级管理者提供一定的科学决策根据。2.1决策支持系统[8]决策支持系统(DecisionSupportSystem,缩写为DSS)是决策者运用数据模型给出的相关表象,以及对应理论中的专业知识,以计算机技术、仿真技术和信息技术为手段,应用独特的人机交互方式来完成非结构化、半结构化的系统。它在组织管理工作、安排事物运用等方面为决策者提供更多优质的选择。开发这种智能系统的意义在于为决策管理者提供了分析表象问题、建造数据模型、模拟解决方案等,通过分析功能工具和信息处理,使得企业管理者和决策者能够显著的完善企业内部结构,提高工作效率以及企业效益。2.1.1决策支持系统的结构决策支持系统的主要由四个方面组成,分别为数据库系统、推理部分、模型库系统、用户接口系统,即如图2.1所示:数据库系统数据仓库模型库系统用户接口系统用户图2.1决策支持系统的基本结构框架Fig.2.1thebasicstructureframeworkofdecisionsupportsystem13 2.相关理论概述1.决策支持系统的数据库系统就是数据部分。2.决策支持系统所包含的的模型库系统是由两部分组成的,分别为管理系统(MBMS)和模型库(MB)。3.决策支持系统的推理部分包括推理机、知识库(KB)以及知识库管理系统(KBMS)。4.决策支持系统所利用的用户接口这个功能就是为了检查和及时接收使用者的相关请求,使用系统的功能作为决策服务,把数据调用、数据模型创建、知识推理进行有机地统一起来,最终为决策者提供有利的决策支持。决策支持系统的应用一般情况下分为三层结构,即多维分析模型服务器、数据库服务器以及客户端应用程序,如图2.2所示。多维分析数据库关系型模型服务器服务器数据库数据文件客客客户户户端端端应应应其它用用用程程程序序序图2.2DSS的应用结构Fig.2.2theapplicationstructureofDSS1.客户端应用程序一般包括信息检索、格式查询、客户联机、编制报表。2.多维分析模型服务器的主要作用就是提供合理化规则化的服务、客户端工作、聚集并将数据库服务器化繁为简,为系统数据的传输减少工作量,尽可能的提高工作效率。3.数据库管理器的主要任务是实现查询、进行繁复计算等功能。它由三部分组成:数据库、数据字典、数据库管理系统。数据字典中包含数据库中全部关系和对象的集合就是数据字典,其中数据在理论层面的功能就是对数据项的意义14 辽宁科技大学硕士学位论文和源头进行描述,在最终的问题决策过程中帮助指向的问题域和搜索数据。规模比较的决策支持系统大部分都会包含很多互相独立的数据库,不仅能够是这些单个的数据库存放于结构各异的环境下,也能够在同一台数据服务器上使用。DSS可以使用OLEDB技术,也可以使用ODBC技术进行访问,从而对其进行控制。2.1.2DSS的决策步骤一般把决策支持系统的步骤分为一下四个步骤:1.发现问题并制定决策目标,其中包括设计方案、确定效果度量和建立数据模型。2.使用概率等知识描述每种方案产生的结果的可能性。3.决策工作人员对每种结局进行评价,一般用“效用值”来定量表示。它是决策工作人员根据所在的环境条件和经验等因素,对不同结果的价值作出定量估计;4.对各个方面的信息进行全面分析,敲定最终方案,有时需要对最终方案给出灵敏度研究分析,给出在原始数据变化同时对此方案有影响的参数范围。决策一般都不能够一次完成,它是一个循环迭代的过程。可用计算机来辅助确定目标、设计方案、评价分析和数据模型验证来完成决策支持系统来。在此过程中,由企业的决策者提供多种方案的参数,使用人机交互方式,最后选择最为合适的方案。2.2数据仓库技术上世纪六十年代以来,全世界对于“数据仓库”权威性较高的概念归纳是美国信息工程学家W.H.Inmon在《建立数据仓库》这一著作中提出的,即“一个反映主题的、随时间而进行变化的、稳定的、集成的数据集合,使其来为企业整[9]个管理层给出相关决策的全过程”。在这个概念中,我们可以分析出数据仓库有四个比较基本的特征,分别为:面向主题、稳定性、时变性以及集成性。然尔,如何建立一个适用于联机分析应用系统数据源以及符合相关决策支持的具有结构化的数据环境成为我们面前的一道难题,DW的出现解决了这一难题,但是,如何从数据库系统中获取重要的信息是现阶段DW需要研究调查与急需解决的特别重大问题。2.2.1数据仓库与传统数据库的区别数据仓库和比较传统的数据库之间有着相当大的差别。,它并不是简单的“大型数据库”,DW是根据数据库已经存在的基础下,为管理者的决策需求挖掘出15 2.相关理论概述潜在的、有用的数据信息。它们的不同之处还在于DW是面向主题、不易丢、时变的、集中的的所有数据的集合。1.面向主题(Subject-Oriented):DW根据像销售组织、供应商和客户等主题,重视模型建立与分析,去除对决策系统没用的数据,提供有针对性的主题;而传统的数据库却是为程序处理数据,不是按同一主题进行数据存储。2.集成性(Integrated):把很多中具有相异结构的数据源进行集成。通过数据清理、数据集成技术,保证相关因素的相同性。3.时变性(Time-Variant):数据仓库存有的重要结构会显式或隐式地把时间元素囊括在内,而数据库保存数据信息时却不要求一定要有时间的信息。4.非易失性(Nonvolatile):数据仓库中所存在的数据是有一定的历史保存意义的,DW的数据大部分都是来源于其他的数据源,这些来源的数据可以不进行更新,但是可添加新数据,确保了数据的稳定性。但是数据仓库却不能代替数据库,因为许多数据仓库仍然要用到数据库管理系统进行管理。因此,数据仓库和数据库是互补的、他们各自都有自己的优点和[10]缺点。2.2.2数据仓库的组成目标数据库的选择、数据抽取与转换数据的工具、前端数据访问分析工具,是数据仓库三个重要的组成部分。简单地说,数据仓库其实是一种信息集成技术,通过不同的信息源获得数据最初样本,经过反复推演之后,存储在内部数据仓库中,企业决策人员可以从中获得各种决策样本,以有效的数据做为决策援助,对于深入分析企业所遇到的难题,全面的、系统的为决策人提出解决方案提供了数据参考。数据仓库通常是由以下七个部分组成的:1.数据源:可来自各程序的操作性数据库、业务数据库、外部数据源等等。2.数据的ETL:是用来进行数据抽取、清洁、转变、装载与索引等一些进行调和工作的部分,以使结构有所差异的不同数据源实现数据集成。3.模型创建工具:分割出实际业务的逻辑性,为数据库构建模型。4.数据存储:数据仓库所包含的中心性存储指的是元数据的存储,站在数据分析师的角度而言,它的作用可以比作数据库的地图,站在数据库管理员的立场而言,元数据是一个涵盖了全部内容、过程的文件档案。5.目标数据库:为决策支持系统提供一个权威的、单一的数据源。6.前端工具:它是查看目标数据源不可或缺的道具,能够进行深层次的进行分析。7.数据仓库管理工具:可以被称之为一种管理方法,能够让数据仓库良好的运作。16 辽宁科技大学硕士学位论文2.2.3数据仓库的体系结构对于企业而言,提取数据中遇到最大的难题就是如何运用最有效率的方法整理出不同模块中,不同环境中存储下来的大批量历史数据,并通过有效地方式为工作人员提供统一的视图信息,最后对企业的信息进行共享是非常关键的。数据[11]仓库的主要区域是:采集数据、存储数据和传递信息。如图2.3所示。数据仓库构建数据仓库使用数据仓库/分析主题设计与构建终信端数据仓库管理息用导户数据源数据转换/数据仓库/航工清洗/加载数据集市具数据数据复制信息OLAP模式转换发布元数据库(持久性共享元数据)数据仓库管理数据流元数据流图2.3数据仓库体系结构Fig.2.3thearchitectureofdatawarehouse为了提高数据仓库中海量数据的读取效率,主要手段是生成的数据仓库利用[12-17]维度对组织数据进行建模,生成雪花架构、星型架构,以方便进行决策分析。星形模式是有冗余数据、不存在渐变维度、非正规化、维护简单、查询效率高的关系模型。在星形模式中,使用者最关注的实体查询核心处于模式的中心,它被称之为实体指标,其为数据库的查询提供量化的有度数据;而处在星形图角上位置的被称为维度实体,其作用对用户所进行查询得出的结果进行规范和限制,对数据进行滤筛选,使得从实体的查询返回的行数量减少,缩小互相访问的范围。在这中间,每一个维表都具备独自的属性,维表与事实表是通过关键字进17 2.相关理论概述行互相关联的。选择星形模式主要原因是能便于用户理解和提高查询效率。雪花模式是对星形模式的进一步层次化,它是数据冗余少、效率低、维护复杂、正规化的模型。它把某些维度表扩展成为事实表,这样以来既能应对不同级别的用户查询,又能凭借不同层次的联系关系将数据自下向上的进行综合,最大可能的将数据存储量降低,达到提高查询效率的效果。在真正建立数据仓库的整个过程中,普遍情况下只扩至三层:类目细节实体、指标实体和维度实体,应避免高于这三层的雪花图模型,因为它们不是DW和OLAP应用,而是更大程度[18]的支持OLTP应用程序的结构规格化。它是对分析服务多维数据集进行组建的最有效的架构,若对多维数据集的构建是维度关系型架构的单一角色,就可以[19]直接选择星状模式。而雪花模式的长处则是规范化的结构更方便维护和减少存储空间。综上所述,对于企业中部门数据集市,数据量大部分都是处于小范围内且有较为固定的报表时,能够使用星型模式;对于企业级数据仓库,最佳的模式是雪花性模式,这样才方便系统管理、发挥可扩展能力、降低投资成本。2.2.4数据仓库的设计方法体系结构的不同,导致数据仓库设计所涉及的范围和内容系统也会出现差异,最终致使设计方法出现差异,数据仓库的设计过程需要处理好两方面的工作。一方面是整体规划数据资源,另一方面是对历史数据进行最为彻底的数据清理,提升数据质量。创建数据仓库每次的情况都不同,它的过程很复杂,也有可能失败,其在一个不停循环、完善、反馈的复杂过程中逐渐完善。它的建立步骤也不是绝对的,[20]而多数的创建流程是采用螺旋式的方法,数据仓库建立通常包括7个步骤:1.需求分析:主要完成对功能的需求确认和数据探索。2.概念模型设计:主要是制定系统的边界、所包含的内容和主题域,构建一个比较不易变化的概念模型。3.逻辑模型设计:主要是确定数据分割策略、分析主题域、记录系统定义和定义关系模式。4.物理模型设计:物理模型是用来索引策略,确定数据存放地点、存储分配以及数据仓库存储结构。5.生成数据仓库:对数据进行加载,并且对接口进行编程。6.数据仓库维护与运行7.集成与测试18 辽宁科技大学硕士学位论文2.3数据挖掘技术2.3.1数据挖掘的概念我们常说的数据挖掘,其主要针对的是企业在日常工作中产生的大量数据,在整理分析的同时做出整合推断,以此发掘有价值的潜在规律、趋向和模式,对客户的行为进行预测和模拟,它主要是运用统计学原理,以机器学习、人工智能[21-27]技术为手段给企业管理者提出正确的决策援助与解决支持的过程。2.3.2数据挖掘的任务数据挖掘一共包含6项任务,分别是关联分析、聚类分析、时序模式、分类、预测和偏差检测。1.关联分析关联分析是假如两个及其以上的事务之间存在着某种关联,并且这些事务出现的概率非常高,那么他们之间就能建立关联规则,其中的某个事务就能通过其他食物进行预测,从而挖掘出有用的信息。关联规则一般使用“可信度”和“支持度”两个阙值来进行筛选,去掉那些没有用的关联规则。“可信度”是指该相互具有关系的规则所表示的事例与满足前提的事例之间的比率;“支持度”是指该关联规则代表的事例与全部事例的比率。2.聚类分析聚类分析,是对分类问题进行剖析的一种多元统计办法,它根据不同种类的度量生产一组相似对象群体。它能把数据库的数据归纳分为多个类,不同种类的个体相隔的距离很大,相同类别的个体之间的距离很小。聚类分析的计算方法有基于模型法、基于密度法、基于网格法和层次分析法等。3.时间序列模式时间序列模式是在不同时间点根据客体的某一个相关物理量的采样值,并按时间排序而成的序列,它是一种重要的高维数据类型。在这个模式中,找出某一最小比率(阈值)持续低于最小时间内出现百分比的规则,而且此规则会因为形式发生变化进而做出良性的调整。“相似时序”做为时间序列模式中最重要的方法,它按发生时间的顺序检查了生事件的数据库,并找到一个或者多个相似的时间序列。4.分类数据挖掘中的一项至关重要的任务就是分类,它能针对某个单独类别的数据的整体信息进行概念性描述,大致可以分为特征描述和辨别性描述,通常用决策树或者关联规则来表示。该分类模式可以把数据库中的元组映射到一个给定的类19 2.相关理论概述别。分类算法的不同表现出不同的特征,在识别出不同的特征同时就会去完成不同的任务。现在许多分类算法都在统计学、神经生物学、机器学习、专家系统等领域被学者从不同角度进行研究应用,判定分类算法的优劣衡量可由速度、准确28]率、可解释性、可伸缩性、健壮性等五个标准来进行。5.预测预测是指发掘历史数据背后隐藏的特定规律,根据其规律构建出相应的数据模型,基于模型对未来数据的种类和特征进行观察和预判。线性回归分析是最具代表性的方法,是以时间做为变量,对海量历史属于进行分析,建立出线性方程,输入任意时间值来预测未来的状态。对分类也可以进行预测,但大多数分类都是离散型的值,但是回归预测却是连续性的值,而神经网络预测既能是离散型的值,也能是连续性的值。6.偏差检测偏差检测是发现数据库中的数据信息出现的异常情况,它是在整个过程中最终结果和参照之间的不同,而观察一般是某个或者是由多个域的值汇总,参照是另一种观察,是预测外界赋予和给定模型的标准。就医院中的数据挖掘任务而言,能分为数据分析、知识发现、决策支持、医疗智能这四个层次。如图2.4所示:图2.4医院中的数据挖掘任务Fig.2.4thedataminingtaskstothehospital知识发现(KDD)是企业有各种需求的动力下新兴出来的一类新技术。怎样很好的利用这些海量的历史数据,找出合适医院对病历管理工作的知识和信息,以20 辽宁科技大学硕士学位论文便为医院决策者提供管理和科研上的决策支持,已成为现代医院信息化的需求。决策支持系统(DSS)是帮助企业决策者通过知识、数据和模型,用人机交互的方式进行的非结构化决策的计算机系统。在这里需要说明的是决策支持并不能替代企业决策者的决策行为,医院的决策过程包括了数据识别问题、模型的创建和使用、总体评价等过程。数据挖掘技术在医院应用中的最高阶段是实现决策支持系统的“智能化”,就是达到医疗商业智能(MI)。MI是对医院采集上来的数据进行搜集、管理与分析,来促进企业决策者做出对相应有效的决策。MI的管理模式有基于事实、基于例外和基于目标三种。不同的医院和部门可能会选用不同的管理模式,如重视投资服务的医院通常会采取基于例外的管理模式,而重视管理的医院通常会采取基于事实的管理,而重视个人医疗服务的医院则会采取基于目标的管理。在医院开始建立数据仓库的时候,关注的都是知识发现和数据分析,在出现数据挖掘技术以后,医院才把数据仓库的应用提到了决策支持和医疗智能的层面,更加重视辅助业务分析、管理以及提供决策支持信息。目前国内医院对业务的需求大多集中在界于决策支持和知识发现之间,以管理为主的决策需求,将在以后成为卫生体系中数据挖掘的重点。2.3.3数据挖掘的过程在科技飞速发展的今天,各大企业已经把数字化应用到了运营的每一个步骤当中,在商务流程中产生的海量数据,给我们建立数据模型提供了必要的基础,如何完整,有效的利用这些数据,使之成为有价值性的关联数据,为我们企业决策者提供解决问题的答案的过程,这就是理论上所说的数据挖掘。数据挖掘整体过程呈现线性结构,而且复杂多变,特别是其中的sh数量颇多的反馈回路,这其中的每一步都需要反复操作,还有失败的可能。数据挖掘过[28]程如图2.5所示。21 2.相关理论概述图2.5数据挖掘流程图Fig.2.5theflowdiagramofdatamining我们把数据挖掘过程一般分为以下4个步骤:1.确定目标确定目标就是要清晰的分析出业务上的主要问题,想要解决这个问题就需要有预见性,只有明白数据挖掘的最终目地,才能有的放矢,虽然数据挖掘的最后结果不可预测,但是也要有大体产生结果的范围,只有把决策者的经验和知识结合到一起,明确挖掘目标,最后成果才能更有成效,而没有目标的挖掘是没有意义的。2.数据准备(1)数据的选择找到与业务对象相匹配的全部数据信息,并从中选择符合条件的数据进行挖掘数据。(2)数据净化与预处理。数据净化与预处理是研究数据的质量,解决时序信息和正确标准化,正确出掉奇异值和噪声等,是为接下来的分析做好前提准备,并确定数据挖掘的类型。(3)数据转换。数据挖掘能够成功的关键是根据任务的需要,利用特定的算法把数据转换成分析模型,建立起真正适合数据挖掘算法的分析模型。3.数据挖掘22 辽宁科技大学硕士学位论文为了达到最终目标,对转换完的实效数据进行数据挖掘,选择合理的统计分析,模式识别,支持向量机(SVM),机器学习,数据挖掘算法等数据挖掘方法。4.表达、评价和巩同挖掘结果为了有利于用户对挖掘结果的理解,尽量使用图表、比例模型等方式来表达数据挖掘结果。其中最重要的是筛选结果以及评价结果中有价值的部分,帮助用户对基本对表面现象做出挖掘结论,最后还一定要把结论与理论知识结合起来,核对结果的真实有效性。数据挖掘结果要经得起时间以及常识的验证,最后得出的矛盾也要以此理论基础来解决,并且由用户再次分析。在整个数据挖掘过程中会发现项目目标制定以及全部数据准备工作占了一大部分的工作量,而实际采用数据挖掘算法进行分析的工作量却并不是很大。各[29]步骤的相对工作量如图2.6所示。图2.6数据挖掘各步骤工作量Fig.2.6theworkloadofdataminingeachstep2.3.4数据挖掘系统的体系结构[30]数据挖掘的系统大概可划分数据准备、数据分析、结果表达三级结构,如图2.7所示。23 2.相关理论概述用户界面用户界面OpenAPI关因分聚联果类类数据挖掘核心分关分分析系析析知识库OpenAPIODBC或其他专用数据库接口数据仓库数据仓库文件系统其他数据源图2.7数据挖掘的三级结构图Fig.2.7TertiarystructureofDataminingsystem第一级:数据准备。数据准备由采集数据和预处理组成。数据采集是从实践的环境中提取并集成数据,避免语言的歧义性,除掉脏数据,创建统一视图。预处理就是减小数据的范围,并且提高数据挖掘的质量。第二级:数据分析。数据分析是把客户需求转换为数据挖掘的各步操作,并且为每步操作选择相应的技术。第三级:结果表述。结果表述是把数据挖掘结果以可视化工具等客户易理解的方式反映给用户。2.3.5数据挖掘的决策树算法决策树(DecisionTree)是自上而下生成的,每个决策或者时间都可能有两个或多个事务,这会导致不一样的结果,决策树是把决策的分支画成像树一样的枝干。决策树能够自动对数据进行分类,其中每个非叶子节点都标识一个分裂属性。[31]决策树也可以解释成一种特殊的规则集,它的特征是规则的层次关系。决策24 辽宁科技大学硕士学位论文树的算法有许多,如C4.5算法、SLIQ算法、ID3算法、CARPT算法、SPRLNT[32]算法、PUBLIC算法以及CHAID算法。目前数据挖掘中最流行的算法其中的一个是决策树算法,这是因为很容易理解决策树算法是怎样进行预测的。生成决策树的规则不但能解释怎样进行预测、为什么要预测,而且有助于划分群体,即显示的时哪几组的实例会得出相应的结果。决策树是用图解的方式来表示逻辑处理的一种工具,它广泛应用于分类,并且能够清楚地、直观地表示加工的逻辑要求。它特别适用于逻辑组合不复杂、判定因素较少的情况。决策树的质量是由树的大小和分类的精度决定的。当决策涉及到多个方案进行选择时,可以利用由分支构成和若干节点的树状图形,能够形象地把各个可能出现的概率、可供选择的方案、状态以及各个方案在不同状态下的结果值简明的画在一张图标上,以方便研究。构造决策树的过程一般由创建树和调整树组成,创建树阶段是按照广度优先的原则选择部分的数据对决策树进行创建,是用余下的数据对决策树进行检验是决策树的调整阶段,我们可以适当的调整那些不能正确回答问题的决策树,直到创建一棵正确的决策树。它的优点是系统地、连贯地考虑各个方案之间的关联,整个决策分析过程直观且易懂。例如:某医院的数据库保存肺结核病人的某个阶段的住院记录,根据其年龄段,把患者分为五类:5岁以下、5-14岁、15-44岁、45-59岁、60岁以上。各个年龄段住院人数记录如表2.1所示表2.1各年龄段住院人数记录Tab.2.1recordsofpatientinhospitalofdifferentage患者年龄段住院人数5岁以下05-14岁115-44岁25045-59岁16460岁及以上264对应决策树如图2.8所示,由决策树获得分类规则如下:老年人是肺结核的高发人群。25 2.相关理论概述5岁以下是否住院人数=05-14岁是否住院人数=115-44岁是否住院人数=25045-59岁是否住院人数=164住院人数=264图2.8决策树Fig.2.8Decisiontree1.决策树构造算法原理ID3算法是决策树一个典型的方法,它的基本思想是找出最有判断力的属性,再把样例分为多个子集,每一个子集上再划分最具有判断力的属性,直到自己只包括同类型的数据为止,最终得到一颗决策树。其基本原理如下:设EFFF是n维有限向量空间,Fj是有限离散符号集,把E中12n的元素eV,V,,V称做实例,其中V∈F,j,2,1,n。设正例集PE和12njj反例集NE是E的两个实例集。设向量空间E中的PE和NE的值分别为p和n,ID3算法基于二种假设:(1)向量空间E中的一棵正确的决策树对任何一个实例分类的概率和E中正反实例的概率一样。(2)决策树对某个实例作出正确的判断所需要的信息量是:pp+nnp+nE(p,n)=log+logp+npp+nn如果以某个属性A作为决策树的根,那么A具有n个值{V,V,V,,V},它123n们把E分成n个子集{E,E,,E},如果E中含有P个正例和N个反例,则子12niii集E需要的期望信息为E(P,N),和属性A为根所需要的期望熵为:iiivp+niiE(A)=∑E(pi,ni)p+ni=126 辽宁科技大学硕士学位论文pp+nnp+niiiiiiE(p,n)=log+logiip+npp+nn其中,iiiiii因此,以A为根的信息增益为:Gain(A)=E(p,n)E(A)**ID3算法选择了使Gain(A)成为最大属性A做根节点,对A的每个取值对应的E的V个子集E递归调用以上生成过程,最终生成子节点。此算法的优点是i采用“自顶向下”的查找策略,查找全部的属性空间,创建决策树的深度小、分类速度快、算法简单;其ID3算法的缺点是它只适合离散的属性集,倾向选择取值较多的属性,并且在决策树层次比较多时,决策质量低。2.C4.5算法原理C4.5算法是在ID3算法的基础上改进的决策树算法,凭借它突出的优势在各个行业的数据挖掘当中得到了成功的应用。IBM公司的IntelligentMiner工具采用的算法是gini算法,其公式如下:n2gini(T)-1∑pj(2.1)j1如果集合T分成NandN两部分,那么这个分割的gini就是:12NN12gini(T)gini(T)gini(T)(2.2)split12NN选择最小的gini作为分割标准(对每一属性都要遍历全部的分割方法)。split2.4基于数据仓库和数据挖掘的决策支持系统体系结构在分析传统的决策支持系统存在许多不足的情况下,提出了基于数据仓库与[33]数据挖掘的决策支持系统,它的体系结构如图2.9所示。27 2.相关理论概述OLAP查询分析报表查询数据挖掘决策支持(DSS)工具单病种患者单病种医疗疾病分布住院业务结构分析质量分析分析绩效分析元数据数据仓库(DW)模型库ETL(数据抽取、转换、加载)工具RCMNOVA其他数据源外部数据图2.9基于数据仓库与数据挖掘的决策支持系统总体结构图Fig.2.9Decisionsupportsystemoverallstructurechartbasedondatawarehouseanddatamining28 辽宁科技大学硕士学位论文3.病历管理决策支持系统的需求分析需求分析(RequirementAnalysis)是用户提出对于有关信息系统在某些方面的需求,在大量数据的调查和了解用户使用规律的基础上.,把系统内某些潜在规律和特定因素综合进行对比分析,提出符合用户需求的数据模型,并且以所需求方案的的形式进行讲解的过程。需求分析所得结果以及模拟出的行为要根据要现有的数据和调查建模为准,根据用户所需的系统类型,分析出潜在的逻辑联系。需求分析是在信息系统开发中最为关键的一个环节。要想建立准确、全面的逻辑模型,就要通过对用户提供的数据以及系统的功能不断做出改进。逻辑模型的建立由许多因素所组成的,包括数据流图和应用字典等,做出一份完整的系统分析需要大量的工作,涉及的步骤有多个方面,不只在设计,还需要数据管理与业务分析。做出完整的需求分析,开发人员在随时掌握用户在整个进行过中的需求意见,详细的对当前业务的管理与职责分工进行分析,做出数据流程图、业务流程图,继而对于系统的最终目标展开分析,重新组织业务流程,使其规范化和合理化,并且根据相关要求改进数据库模型和对数据进行重新定义。医院信息化建设已经是现代社会中的医院至关重要的组件,在社会中越来越举足轻重的作用,尤其是随着我国医疗改革的进一步发展,公有制医院走企业经营的道路是一种趋势,这代表着各医院与国内外医疗市场之间存在着激烈的竞争。为了创造效益,确立优势、各医院就必须在“信息化建院、科学化管理、高科技兴医”方面上发展。在卫生系统内部,医院管理者中间已经达成共识,这也正本课题研究的大环境。病历管理作为医院信息系统(HospitalInformationSystem,简称HIS)的组成部分之一,就需要打破传统观念来管理工作,首先要引进先进的自动化管理科学技术,放弃落后的管理方法和机制,为医院改革发展做好助理和谋划,满足医院改革过程中更新更实用的信息要求,最终使我国医院信息化管理工作走上科学化、规范化的轨道。医院信息系统积累了海量的患者就诊信息、医疗费用收支信息、业务流程信息和诊疗过程信息,这些信息以数据的形式进行存储。本课题需要做的就是怎样把适时数据和历史数据有效地组织起来,创建数据仓库,以效益为基点、以患者为中心去指导医院在各项业务上做出合理的决策,而数据仓库在其他许多行业的成功范例将对本系统的应用具有良好的借鉴作用。本系统需求从业务流程分析、系统功能分析、数据流程分析三个方面来进行分析。29 3.病历管理决策支持系统的需求分析3.1系统业务分析3.1.1系统业务流程介绍医院是信息较为密集的单位,其覆盖的业务范围大致有病人信息、费用信息、诊疗方案信息和治疗过程信息这四大类,这些信息几乎在病历中都涵盖了。患者信息中含有患者的个人信息、诊治信息、住院和手术信息、仪器检测结果、病史和治疗过程信息、医生叮嘱等,这都是基本信息;医疗费用信息指的是在各诊疗过程的不同阶段产生的检查、手术、药物等各类费用,这是另外的一个基本信息;业务过程信息的概念是相关医疗机构在医疗业务的处理过程中衍生的控制过程性信息,比方说住院出院信息的办理、患者提前预约、医药产品的输入输出等非全面整体的信息;管理信息则是基本信息与业务过程信息累计加工获得的,如住院天数、病人流动情况等,这是衍生出来的信息。医疗基本信息流向如图3.1所示。图3.1医疗基本信息流向示意图。管理信息患者信息费用信息患者信息费用信息诊疗活动过程信息过程信息诊疗活动图3.1医疗基本信息流向示意图Fig.3.1themedicalbasicinformationflowdiagram病历管理决策支持系统的数据采集来源于医院信息系统(HIS)的数据库或者外部文件,因此应归纳分析出病历决策分析的信息处理流程图,以便为数据采集和数据挖掘提供依据,如图3.2所示。图3.2数据集成处理流程Fig.3.2Dataintegrationprocessingflow30 辽宁科技大学硕士学位论文数据抽取和数据转换是把数据从联机事务处理系统、外部环境中的数据源导入数据仓库(需要遵循相关的固定的规则事项)。数据仓库是用来支持病历管理中的决策制作过程,物理上是数据的载体。联机分析技术模型是针对数据主题的多维分析模型,例如对医院绩效分析和患者结构分析等,它根据相关性较高的分析主题内容来反馈多方面多角度的视图。数据显示则是将集合概括下的相关数据以图表、图形、曲线等多种方式直观的展示给决策者,为管理者提供相关的设定方案和凭证,并且通过精心细致的判断推理将方案的合理性最大化,有助于医院的管理层进行科学决策。3.1.2系统业务流程分析业务流程分析是细分业务功能的概念,使用一个较为整体的图案文件来形容不同的步骤和阶段点医务人员查询病例基础库统计ETL(数据抽取、转换、加载)工具查询报表统计报表数据仓库数据挖掘技术决策支持输出图3.3系统业务流程图Fig.3.3Systembusinessflowdiagram根据国际疾病和手术分类标准、国家有关标准和法规,梳理分析了患者完整的病历管理进度,其详细流程如图3.4所示。31 3.病历管理决策支持系统的需求分析病例基本诊断信息医疗费用手术信息病例借阅基础数据信息管理管理信息管理管理管理字典维护借还借阅标识病例特殊病例数据基病例借标准处理础库阅库代码库电子病例HIS输出读取接口信息接口库病例数据上报文件知识、模ETL型、方法库病例数据分析展现分析数据库图表图3.4系统的详细业务流程Fig.3.4Detailedbusinessprocessofthesystem3.2系统功能分析对医疗管理过程中涉及的工作内容和业务流程的取样分析可知,确定该系统首要功能有查询统计报表子系统、患者病历信息综合业务子系统、综合分析决策子系统。其中查询统计报表子系统应该呈现给用户直观的统计调查结果;患者病历信息综合业务子系统应实现对患者信息、查询统计报表子系统应实现给用户直观的查询统计结果;诊疗和费用信息、系统设置的现代化管理,是用系统采集并且获取患者的病历信息以及相关的数据,并且准备好后期的有关数据的分析,以方便有关决策的实行;综合分析决策子系统应是查询统计报表子系统应实现并且给用户呈现直观的统计调查结果;完成了数据仓库的创建,使得数据挖掘的算法发现隐藏在数据背后的既有规则,让医务人员在决策上获得相应的支持,为医院效率和医疗质量的提升提供了科学的依据。3.2.1医院信息系统(HIS)子系统医院信息系统主要作用是使得医院的日常管理工作更加现代化、合理化,其主要价值体现在患者个人信息、治疗花销、治疗流程等多方面,系统还中以通过32 辽宁科技大学硕士学位论文相关设置使得患者简化就诊流程,更快,更好的对自己的病情进行治疗。另外在医务人员使用方面,系统可以对各项条目进行添加、删除、改动、查看、引进等基本操作。完成主要针对患者的病历信息的数据管理和采集的工作。3.2.2查询统计报表子系统查询统计报表子系统的主要功能是对患者个人信息管理、就医费用信息管理,诊疗流程信息管理的综合统计和查询等方面的操作。患者信个人息查询可以选择对患者按年龄、性别、地区、职业、住院时间、科室等信息进行查询、导入、导出、打印;费用信息能选择按科室、年龄段、职业、地区等条件进行查询、导入、导出、打印诊疗信息查询能选择科室、患者信息、医生信息进行查询、导入、导出、打印;。信息统计报表可选择按照性别、地区、年龄段、归转、科室、住院时间等具体条件进行一些组合统计。3.2.3综合分析决策子系统决策支持功能模块主要作用是对已经采集整理好的患者信息,利用数据仓库及挖掘技术,借助其中相关的计算公式来得出患者信息中所呈现的潜在规律。根据这些规律,决策者可以制定科学的,合理的,有针对性的解决某一事物的方案。病历管理决策支持系统需求结构如图3.5所示。图3.5综合分析决策支持子系统需求结构Fig.3.5Demandstructureofcomprehensiveanalysisanddecisionsupportsubsystem3.3数据流程分析数据流程分析指的是按门类分别存储在不同数据仓库中的一系列数据有规则的流动排列,每有符合既定规则的数据则抽取出来进行循环的筛选、每有数据经过分析处理就会有特定的流程与算法保留下来,等所有数据都经过筛选完,整[34]个数据流程分析结束。它通常用数据流程图(DataFlowDiagram,DFD)来实现。33 3.病历管理决策支持系统的需求分析3.3.1系统顶层DFD图第一,整个系统做为一个整体起到单一功能的作用。医生先把患者的信息录入系统当中进行保存和检索,然后提交给数据仓库,医院管理的人员有权限对信息进行查询、统计、打印等一系列操作。待到数据汇聚到一定数量以后,可根据对库中数据进行抽取、转换、加载,使之建立成为数据仓库,然后通过数据挖掘算法获取到想要的决策支持信息给医疗决策者。病历管理决策支持系统顶层DFD图如图3.6所示。数据抽取、转换、加载数据库数据仓库数据挖掘技术得患者诊疗信息到决策支持信息病例决策医生医疗支持系统管理者患者诊疗信息图3.6顶层DFD图Fig.3.6thetoplayerDFDdiagram3.3.2系统第一层DFD图医生在进行仔细的审核之后,在第一时间将患者治疗信息存储在系统中,相关信息就会自觉化的存储至数据库;这样患者的相关信息就能够被系统综合的进行管理,医生也能够更好的记忆和查找患者信息,提高工作效率。管理者可以修改和输入患者信息,在进行一系列抽取、转换以及加载处理之后建立数据库。根据数据挖掘算法获取有关决策支持的信息,最终将信息反馈给相关的医务人员。本系统的第一层DFD图如图3.7所示。34 辽宁科技大学硕士学位论文1医生患者诊疗信数医疗决患者病数据策人员例信息患者诊疗信据数据仓数据挖库抽取、库查询统计条2掘医疗转换、患者病技术得管理者加载患者诊疗信例到决策信息查支持信图3.7第一层DFD图Fig.3.7thefirstlayerDFDdiagram3.3.3系统第二层DFD图医生对患者信息进行录入,确定信息无错误无误差后,将信息记录上交至系统数据库。医院工作人员可以通过查询数据库中存在的患者信息,做出不同的处理方案,对患者信息进行相应审核,并且对错误不当的患者信息进行修改,达到采集患者信息的工作目的,建立数据仓库。按“患者信息管理”处理过程展开的第二层DFD图如图3.8所示。医生患者诊疗信息1.1信息数患者诊疗信息录入数据有误患者诊疗信息医疗决据仓1.2策人员库库医疗审核数据挖掘管理员诊疗活动1.3信息技术得到信息决策支持修改信息图3.8第二层DFD图Fig.3.8thesecondfloorDFDdiagram35 4.病历决策系统的设计与实现4.病历决策系统的设计与实现基于数据仓库的病历管理决策支持系统的建立将大大提升原有病历数据的信息利用价值,它把以其显著的优点而成为我国病历管理必然发展的选择和未来的发展模式,同时也是未来医院各项自动化管理工作的基础和核心。本章把对病历管理决策支持系统的总体结构、主题划分和关键技术等进行分析。4.1系统设计目标本系统目标是综合电脑设备策略、虚拟网设备策略和多种信息连接设备,通过全部案例汇总库、措施库和智慧库的铺垫,实施数据探究和信息展现体系策略,设定的病人履历的数据综合。对整个医院的病历基础数据及其信息进行数据采集、数据传输、数据存储、数据处理、数据分析及程序启动整个过程的自动化、网络化和信息化,实现处理信息工作与病历管理的现代化、数字化、规范化、信息化。(1)创建医院病历数据库,创建各类方法数据库、知识数据库等各种专题数据库。(2)创建基于数据窗口技术和网络技术的病历信息共享平台,实现病历数据库数据的录入、删除、修改、查询、统计等功能,实现属性信息的集成、数据查询统计功能,为各级医疗机构创建区域的病历基础数据库提供支持。(3)创建接口数据库和接口数据标准,实现不同结构环境间的数据交换。(4)通过信息化、网络化的病历管理,使得医院信息系统管理流程更接近于合理,管理内容更加丰富。(5)通过病历数据库系统管理平台软件,强化了医院内部绩效考核流程和病历质量控制流程,做到及时对问题进行反馈并有针对性的避免病历信息录入过程发生的问题。(6)通过病历数据库系统管理平台软件,实现了对病历数据的信息共享,为医院内部的决策和科研提供了依据,也为政府决策和各级主管部门的宏观管理提供准确的、及时的、全面的信息。同时,也应该为社会团体提供病历信息,逐步完善管理程序、并且提高医患纠纷处理的能力。4.2系统性能体系规划病人履历治理策划保障体系的用途关键在于实现对医院对患者、诊疗、费用等信息的非人工治理与能够给环境保护体人员自主的高明建议,大大增加了医院的治理能力和利润。通过要求探究,下面更深层且细腻的规划了此体系的用途的36 辽宁科技大学硕士学位论文组成,包含看病者总履历的事宜、搜寻记录账目、统一汇总探究三方面下级体系,进一层有医师信息治理层、看病者信息治理层、病情治理层、消费情况统理层、体系改变层、医师信息治理层、看病者信息治理层、病情治理层、消费情况统理层、体系改变层、信息统计图表模块、病种患者结构关联分析、病种医疗质量分析、疾病分布探究、留院观察探究等大约14层共同组成此体系;病人履历治理决定保障体系的体系构造图如图4.1所示。图4.1系统结构图Fig.4.1systemstructurediagram4.3数据管理规划数据储藏室的发觉规划总要求应按照事情本身制度合适的章程,通常有功效、数据的实时度、治理的进程、发出器的弹性度、时间的整体度、与时俱进的跟随性、顾客的感受程度与更多事宜。数据储藏室是对现有的数据库体系进一步的发掘,开始是对已有数据库中信息的搜索、转变和探究,对环境体系治理员决定探究的保障。病人履历治理履历保障体系的数据储藏室规划和探究通过SSAS设备实现的,根据SQLServer2008数据库设定的数据储藏室;里面的对应关系是一对多,而且也规划了表的数据名,关键字、属性、长短与表和表的联系,病人资料治理数据储藏室的外在轮廓就有了雏形,还是无数据状态,需要医院根据病人的病情情况来数据搜索,再进行搜集到的数据的选择、转变和传送到数据储藏室。有关病人履历治理判定体系数据储藏室规划开始是医院管辖者通过此体系搜寻病人的病历及诊治策略,再通过搜集的病人相关病历资料观看、转化和传送,转化为合适探究的信息,有时还会加大另一种字段和在SQLServer2008里完成37 4.病历决策系统的设计与实现病人履历资料数据储藏室,再以多台电脑实施探究,运用此体系显示探究结论,再给环境保护体系操作者合理的建议改善治理设备与增加医院利润。此体系的数据储藏室规划结构如图4.2所示。图4.2病历管理决策支持系统的数据仓库设计流程图Fig.4.2datawarehousedesignflowdiagramofmedicalrecordsdecisionsupportsystem数据储藏室与一般的数据库不同的主要在于数据储藏室要让数据自己规划自己体系构造,也可以表明数据储藏室展现中心思想。所以应该知道此体系的中心点,然后构造数据储藏室。其中心思想比较笼统,依据实际的治理结果,数据的进一步探究得到的。从数据形式看它是数据储藏室规划的关键内容,成为数据储藏室规划的中心地带。数据储藏室构造根本上分析是以关系模式到多元化模式变化的形式。主题思想形式是数据储藏室构造的开始点,显示规划人眼里的当今时代,顾客心中此系统的综合分析;另一种思维逻辑形式对于思维形式或关键情况讨论叙述体系,来说明体系有的主要功效;末尾的理论形式规划是展现“怎么做”,“怎样完成”此体系的实际步骤。依据病人治理决定保障的数据储藏室规划里,此体系运用主体思想形式规划、思维性形式、理论形式规划的数据构造策略。主体思想形式规划主要第数据储藏室综合分析和运行;思维型形式规划在于存在的数据的布置,[35]如数据的非实质性、概况和理论,此体系的三方面数据构造方式如图4.3所示。38 辽宁科技大学硕士学位论文概逻物念辑理模模模型型型设设设计计计图4.3三层数据建模方式Fig.4.3Threelayerdatamodelingmethod4.3.1数据仓库主题规划本系统的数据仓库设计主题如表4.1所示。表4.1数据仓库主题划分表Tab.4.1systemsubjectfieldclassificationtable主题域维度病种患者结构分析时间、年龄段、职业、性别、地区病种医疗质量分析时间、转归疾病分布分析时间、地区、职业住院业务绩效分析时间、医院、科室本系统各主题说明如下:1)病种患者结构分析。根据各个角度,包括年龄阶段、工作、性别、所处地区,对住院病人进行病种结构分析,得到某个时间段内某个病种在不同年龄、不同职业、不同性别、不同地区的高风险容易患病的人群,使得医院能够及时地提供相应的服务,来提升医院总体的服务质量。2)病种医疗质量分析。从转归情况等角度,对于病种在某一固定时间段内治愈出院人数、平均住院费用、住院总费用等进行一定的质量分析。这对其中的病种限价、对医疗质量的考核提供科学的依据,无形中提升了医疗质量,并且在提升了医院对于医疗的质量管理,并且也减轻病人所难以承受的一些负担。3)疾病分布分析。根据地区和职业分布情况等这些角度,详尽的对医院内的病人的病情进行分析,从而得到某个时间段内疾病在不同职业、不同地区的分布情况。这对医院进行流行病学跟踪、职业病高发人群调查,随访、预测等提供决策依据。4)住院业务绩效分析。从医院、科室绩效等角度,对某一时间内医院或者科39 4.病历决策系统的设计与实现室期的住院的日均住院费用、人均住院费、业务收入用进行效益分析,以方便找出医院或科室的收入增加或减少的原因。4.3.2概念模型设计开始应该从体系的主要思想与思想联系着手。探究原先存在的数据,再搜寻有关数据文献比对,得出数据构造的原因,原先存在的数据资料有自己独特的理解,再规划病人履历治理建议保障体系的主体思想形式。。数据储藏室的主体思想形式对各个数据库中数据的汇总,拥有完整的主体思想流程图,全部的面向公司利益构造的。数据储藏室针对建议中心思想探究的,所以不会出现在数据储藏室的第一步有合理的结论,应该明了应有的建议标准,医院的医师喜欢哪些中心思想,从中找到包含的数据根基,要用的有关数据。医院决定人员期望治理设备与病人数据之间展开探究,此体系建立了事宜时代的体系章程。从中得知,数据储藏室的要求探究很关键。对病情不同病人构造探究作为主要思想的形式图形如下图4.4。患者信息表诊疗信息表医生消息表患者编号患者编号医生编号患者名称11医生编号11医生名称性别科室编号性别民族民族血型血型住址出生日期出生日期身份证号1身份证号籍贯联系方式1政治面貌职业工作时间科室表婚否联系方式既往病史科室编号科室编号过敏史毕业学校科室名称职称科室类别编号图4.4病种患者结构分析概念模型Fig.4.4theconceptmodelofdiseasestructuralanalysis4.3.3逻辑模型设计逻辑模型设计是数据仓库实施过程中的重要环节,因为它能反映出医院决策40 辽宁科技大学硕士学位论文者的需求,并且对系统的物理实施有着其重要的指导作用。思维型形式规划在数据储藏室处理步骤的重要项,此项给予体系理论策略指引道路,并且能反映出医院决策者的需求。首先,本系统对患者结构探究和治理能力探究的中心思想展开的探究。规划思维型形式在于选取的程度化、规划数据表格、确定关系形式、精确找出数据信息。(1)选取的程度化:运用简单的程度规划。(2)规划数据表格:由于中心思想表与表数据信息少,所以不用划分数据表的信息。(3)确定关系形式:对于星型形式、雪样形式和实际形式三个形式里,星型形式比雪样形式联系处不多、搜寻及时的特点,所以此体系的形式运用星型形式。此体系的形式构造如图4.5到图4.13所示。单病种患者结构事实表时间维时间关键字地区关键字地区维性别关键字年龄段关键字年龄段维职业类别关键字职业类别维疾病编码疾病名称住院人数图4.5病种患者结构分析主题星型模型Fig.4.5thestarshapemodelofdiseasestructuralanalysis单病种医疗质量事实表时间维时间关键字归转情况关键字归转情况维疾病编码疾病名称出院人数诊疗总费用人均住院费用图4.6病种医疗质量分析主题星型模型Fig.4.6thestarshapemodelofdiseasemedicalqualityanalysis41 4.病历决策系统的设计与实现疾病分布事实表时间维时间关键字职业类别维地区关键字职业类别关键字地区维疾病编码疾病名称住院人数图4.7疾病分布分析主题星型模型Fig.4.7thestarshapemodelofdiseasedistributionanalysis住院业务绩效事实表时间维时间关键字科室维科室关键字疾病编码疾病名称住院人数人均住院费用日均住院费用图4.8住院业务绩效分析主题星型模型Fig.4.8thestarshapemodelofhospitalbusinessperformanceanalysis事实表时间关键字时间维表地区关键字性别关键字时间编号年龄段关键字日职业类别关键字月科室关键字年归转情况关键字图4.9时间维表模型Fig.4.9Timedimensiontablemodel42 辽宁科技大学硕士学位论文事实表地区维表时间关键字行政区域编号地区关键字区县性别关键字市年龄段关键字省份职业类别关键字科室关键字GBT2260-2007归转情况关键字图4.10地区维表模型Fig.4.10Areadimensiontablemodel事实表年龄段维表时间关键字地区关键字编号性别关键字15岁以下年龄段关键字5-14岁职业类别关键字15-44岁科室关键字45-59岁归转情况关键字60岁以上图4.11年龄段维表模型Fig.4.11Agestructuredimensiontablemodel事实表时间关键字地区关键字性别关键字年龄段关键字科室维表职业类别关键字科室关键字科室编号归转情况关键字科室名称图4.12科室维表模型Fig.4.12Departmentdimensiontablemodel43 4.病历决策系统的设计与实现事实表归转情况维表时间关键字地区关键字归转情况编号性别关键字治愈1年龄段关键字好转2职业类别关键字未愈3科室关键字死亡4归转情况关键字其他5图4.13归转情况维表模型Fig.4.13Regressionincasedimensiontablemodel4.3.4物理模型设计物理模型是逻辑模型在物理环境中实现的模式,是建立机理认识在与分析现象基础上的形式构造。思维型的主体通常变换理论型数据表格,其中维度主体不需要变换成理论数据表格,仅仅用作筛选考虑和搜寻用。对理论型展开规划后,应该从修护的费用、时空使用度存取时间,可以用增加附属、产生数据、合成表格、多方面引用设定等方法增强数据储藏室的功效。充分发挥数据储藏室的理论形式构造。要做好下面几方面:(1)知道时空、岁月、功效的改善和保持数据模式、运行次数、数据外在情况、应用方法、跟随步骤等策略。(2)知道数据库治理体系,特别是保存的构造与保存的形式。(3)知道外在保存设施的发散式特点。4.4体系性能规划此体系包括医院数据体系、搜寻记录表格、集体探究建议三个下级体系。4.4.1医院信息子系统医院数据体系分医师数据管理层、病人数据管理层、治疗数据管理层、系统设置模块。医生信息管理模块的主要功能是增删改查医师的信息;病人数据管理层的关键性能是增删改查治理病人的信息;治疗数据管理层的关键性能是增删改查治疗的基本信息;系统设置模块的关键功能是客户变更密码、管理者录入管理、客户限制、信息保护、系统刷新等。它的流程图如4.14所示。44 辽宁科技大学硕士学位论文图4.14医院信息子系统流程图Fig.4.14thesubsystemflowdiagramofHIS4.4.2检索统计报表子系统检索统计报表子系统的关键性能在于顾客依据检索的内容找到合适的数据,进而设定记录搜寻内容,能够找到合适的综合数据,制成表格与程序图。检索记录表格等级体系有病人数据检索、医院数据检索、消费数据检索、病人情况数据检索、记录单等。其程序流程图4.15所示。判定搜寻限制医生信息医生信息表患者信息患者信息表用户费用信息费用信息表病历信息病历信息表查询结果统计图表病历统计视图图4.15检索统计报表子系统流程图Fig.4.15thesubsystemflowdiagramofsearchandstatisticsreporting45 4.病历决策系统的设计与实现4.4.3综合分析决策子系统统一探究下级体系的关键性能在于依据要求探究,进行数据开发,开发以前没有的可利用数据,给医院的决定者合理的治理策略,发现潜在关联的医疗信息,对加强医院的治理设施能力有保证。统一探究建议下级体系包含病因不同病人构造联系探究层次、病种医疗质量分析模块、疾病分布分析模块、住院绩效探究模块。统一探究建议体系的构造流程图如图4.16所示。系统登录判断用户类型管理员、决策者医生、患者分析病种患者结构关联分析病种医疗质量分析疾病分布分析住院绩效分析结束图4.16综合分析决策子系统流程图Fig.4.16Comprehensiveanalysisdecisionsubsystemflowdiagram4.5病历管理决策支持系统的实现4.5.1病历管理决策支持系统的实现流程病历管理决策支持系统采用了OLAP技术和数据仓库方法,病人履历治理建议保障体系的全面信息展开多方面,多等级的信息探究和信息开发,找到前所未有的规划,进而有价值地、有利地找到有关联的矛盾,可以开发病人履历数据关键的发展模式,给予最权的、威最好的策略。病人履历建议保障体系最后是设立有利用性、开发性、发展性的全方位数据储藏体系,完成对对决策支持有用的外部数据和NOVA终端平台中的信息的重组,保证数据的一致性和准确性,形成了一个辅助决策的全局视图,最后利用数据挖掘技术和OLAP技术,创建智能的数据挖掘模型、应用分析模型,提供给医疗决策人员一个灵活、高效、全方46 辽宁科技大学硕士学位论文位、多层次、实用的的决策支持系统。病历管理决策支持系统实现流程如图4.17所示。功能需求数据仓库OLAP设计数据服务程序数据服务数据系统分析模型设计设计校验模型设计编码模型联调校验联调项目整体数据字典数据清洗项目规范的编写规划设计数据字典的编写数据挖掘程序程序数据数据挖掘宽表设计编码设计挖掘结果回写MDDB钻界面数据展现模块数据展现取维度设设计设计程序编制计图4.17病历管理决策支持系统实现流程Fig.4.17Theimplementprocessesofmedicalrecordmanagementdecisionsupportsystem4.5.2病历管理决策支持系统的结构与建议结构病人履历建议保障体系在于建议保障体系的治疗方面的实行,完成此体系不是个渺小的体系模式,全面地使用了数据挖掘、数据仓库、决策支持系统、联机分析等技术。本系统还包含了数据管理层、支撑层、决策工具层、决策层这四个层次:支撑层主要负责采集病历信息、存取记录等业务方面的信息,并对这些数据进行处理和分析;数据管理层是病人数据治理、医师数据治理、治疗数据治理、记录病人情况等体系,提供了病历的数据采集、数据查询、数据统计等服务;决策层则是包括病历管理决策子系统,它通过多种决策工具深层次的决策分析。依据思维性判定,策略与建议展开选取,找到合理的处理办法,对治理患者的医师知道完整病人履历数据的发展有利,使得医师能方便快速的提出建议,实现有关的检索、记录、期望、探究等性能。对数据储藏室和信息开发的病人病因治理建议保障体系的构造如图4.18所示。47 4.病历决策系统的设计与实现图4.18病历管理决策支持系统体系结构图Fig.4.18Thesystemstructurediagramofmedicalrecordmanagementdecisionsupportsystem4.5.3对数据仓库的病人病因治理建议保障体系的构造通过数据仓库可以使先前的大量数据和外来数据排列,结合为数据群体,构成一定地区的集合病人病因治理数据。根据数据仓库,发觉病人病因治理建议保障体系。它的体系构造如下:(1)保障层:意义在于病人病因报表治理和找到建议的根本。运用存在的下级体系数据库资料,汇合外在的数据资料,设定病人病因治理数据仓库。保障层包括构造库、方案库、智力库、许多数据仓库等。(2)治理层:监制、统一和拥护保障层的数据来源。(3)决策工具层:为病历管理决策系统提供决策支持,决策工具层是由联机分析处理、专家系统和模拟分析三个模块组成。联机分析处理是以数据仓库的数据作根基,通过多元的探究方式展开数据探究,让提供建议者可以多方面、多等级展开数据探究解决策略。专家体系指通过智慧库里的智慧,可以两方面揣测提供建议探究,得到建议策略。(4)建议层:对于建议探究,按照体系的建议说明,使用建议展现探究,帮48 辽宁科技大学硕士学位论文助提议人员给予建议。病人病因治理建议不是完全体系性建议,非常注重智力和教授级人员的工作常识,所以要规划智力进行分层,进而得到教授级人员的智慧与常识,结论里找到可利用的数据。再选取信息开发计数,通过数据开发设备、实现规定的数据开发,得到潜在的数据信息,促使旧智慧库有新血液的加入。给予病人病因情况治理的分析主题有病种患者结构分析、病种医疗质量分析、疾病分布分析、住院业务绩效探究,有关的主要思想提供方案、探究步骤和结论,保存进智力库里,供医疗决策者提供参考。病历管理决策支持系统是面向医院的决策者,提供不同层次的决策支持和信息。顾客可以利用建议体系上传难题,通过专家体系、OLAP和模拟探究等建议设备,应用合适的形式构造、智慧和方案,进而探究数据仓库和数据库信息,通过获取相关的数据文献、图形图像和探究论文,给与治疗医师相关建议文件。病历管理决策支持系统的决策流程图如图4.19所示。49 4.病历决策系统的设计与实现用户决策问题与综合交互关系数据库模型库方案库技术数据库分析与决策集体数据库智力库数据储单住单病疾院病种病业种患分务医……者布收疗……结分入质构析分量分析分析析决策信息、知识分析图表报告数据文本输出决策方案图4.19病历管理决策支持系统决策流程图Fig.4.19Thedecisionflowdiagramofmedicalrecordmanagementdecisionsupportsystem病历管理决策支持系统通过数据库管理系统对方法库、知识库、模型库和数据仓库进行统一管理。方案库指保存形式的设备,通过多样的一致性、转换性大的、用来构成各种数据模型的算法程序组成;知识库对实现组织的协作与沟通有利;模型库是为各种分析工具提供指导;数据仓库是数据开发、多台机器探究治理和建议保障体系探究给予的集体数据处。4.6病历DSS的性能运用病人病因情况治理建议保障体系依据不一样的顾客需要、不一样建议机关的50 辽宁科技大学硕士学位论文概念,利用电脑设备与虚拟网的结合进行构造治理层,用“快准狠”策略进入模式和探究相关的人和事,给予多种形式的信息,建议人员对于病人情况的治理等建议事宜给予拥护。所以,设定合理的建议保障体系,应该根据性能探究主体性,组织有关的子体系和有关的性能层次,然后,该系统可以根据现实来探索和控制。系统必须满足医院病案管理系统和相关科室的网络互联,建立基于网络的医疗决策支持系统,并实现相关部门和病案管理部门在相关病史的病人信息、费用信息、医疗信息、医疗检查、文件输出、数据传输和数据信息的了解,完成医院在监督管理、信息记录探究和操作等层次的要求点。病历决策支持系统包括四个子系统,即综合信息子系统、数据转换子系统、查询统计报表子系统、分析决策子系统。这四个系统满足了数据采集、数据转换、查询统计、综合预测等方面的需求。其中综合信息子系统是对患者病历的增删改查等数据管理,完成了数据采集,为后期的数据挖掘做好了准备;数据转换聚合子系统是将采集上来的数据通过清洗、转换、变成有用的数据最后装载到数据仓库中;统计报表子系统主要是把患者的病历信息以数据表与图表的形式直观的展现出来,并且为综合查询子系统和综合分析决策子系统提供各类数据;综合分析决策子系统利用数据仓库中的数据,针对相应的主题创建模型(决策树模型、聚类模型、关联规则算法),并且从中得到潜在的、有用的信息帮助医院管理者制定出提高医院效益的方案,帮助医疗人员作为医疗技术提升的依据。其中医院综合信息子系统是数据的来源;数据转换聚合子系统是前端处理工作;统计报表子系统把数据直观的展现给医院相关工作人员。医院的决策者能够根据统计报表子系统和综合分析决策子系统,及时的掌握医院运行情况,对各类数据进行综合分析,从而达到加强医院的管理,有针对性的提高各科室的效益,提高医院医疗水平的目的。本系统的关系示意图如图4.20所示。图4.20系统关系图Fig.4.20systemrelationshipgraph51 4.病历决策系统的设计与实现4.6.1医院综合信息子系统医院综合信息子系统是对患者的个人基本信息、医疗情况、医疗费用情况、出院诊断情况、住院手术等数据进行采集和管理:对于配置医疗综合信息系统接口,系统将会自动地从医院综合子系统中读取病历的所有信息;完成在网络上对病历的资源共享,让医生通过这些资源提高工作效率和医疗水平,患者病历信息管理界面如图4.21所示:4.21患者病历信息管理系统Fig.4.21Patientmedicalrecordmanagementsystem4.6.2数据转换聚合子系统通常看来,展现一个建议的旅途里,应该运用参与工作数据和探究数据形式。参与工作数据指自动化的数据,可以一直转化和增加;另一种探究数据指原先存在的数据,,属于静态数据,一般不会随时间的变化而变化。间点康复病人的数量指末尾数据,不能反转。此时段内,数据又是静止的了,所以可以由自动化的数据转化到静止数据。可以认为是通常数据库转化到数据仓库,此经历了数据的集合,数据仓库的数据不对,则数据仓库也毫无意义。所以,数据传送进数据仓库后,应该展开合理的设计。因此数据集合体系运用于通常数据库到数据仓库的变化后,一定要对数据源关联的中心思想信息整理、打包和筛选,传送进数据仓库里(就是指没联系数据变成数据仓库指定的数据,然后根据顾客的建议生成数据集合)它的性能如下:52 辽宁科技大学硕士学位论文(1)数据的开头整理(选择,变化,传送):就是对医院病人履历信息从根本数据库选择出,集合起来,然后经修饰和处理的数据保存到数据仓库。(2)数据整体集合:依据顾客建议,实现多元化立方体,进行顾客探究。(3)数据构造查阅:给予数据仓库原始信息检索。4.6.3查询统计报表子系统查询统计报表子系统的功能如下:(1)生成和上报各种图表和记录表。(2)生成数据预览表服务。(3)多样图表展现。查询统计报表生成子系统能把来自于不同数据源中的数据进行清理、转换、整理,最终存放以统计患者病历信息为主题的数据,运用多样简明图像展现。目前运行的系统中,客户查询数据与生成表格通常采用的方法是用ADO数据库组件接入SQLSERVER,进入SQL语句和保存进行寻查数据,形成多种表格提供给顾客,利于顾客阅览、印刷和探究。此方式方案很广泛,可是运行时需要许多相同SQL语句,因此对于面对多数数据时,表格的实现要有大量的等待日期,从全面观看此体系工作效果慢。环境机关康复病人统计如图4.22。图4.22卫生部出院病人调查表Fig.4.22thesurveychartofpatienttoleavehospital53 4.病历决策系统的设计与实现体系性能如下:(1)规划特征步骤,选择开始数据和整合数据,通过表格规划设备完成。(2)按照建议完成运行表格。(3)全方位集合表格。顾客能自己完成集合各种表格在一起(各种图形,各种图表,各种数据库的集合),完成表格的转变与更新进度。(4)原先数据表。给予直接,方便立体化的展现。实现往年各种的不同时段数据的比较表格,以图像来展现。医院病人履历关联到多方面,因此要求多种数据,此时的病人履历情况,与一般的检索不一样,是通过数据的多元图像,让顾客多方位,宽领域的查阅病人履历数据仓库中的信息。还有不同等级与跨维的构造,让顾客明白此体系的真正意义,更方便更快捷的检索。有代表性的病人履历局势图如图4.23所示。系统具体功能包括:(1)查询业务的基本情况。如患者个人信息情况、住院费用情况、治疗情况、住院手术情况等。(2)全方位集合检索。顾客可从不一样的数据库,数据表和图像中检索。(3)病历资源共享。采取多种组合的方式进行模糊查询,以提供相关医疗工作人员以及患者对病历资源的查询借阅。(4)查询电子病历。搜索按照卫生部要求的病历标准格式,单项或批量的输入相应的电子病历信息。图4.23病历查询实例图Fig.4.23theexamplechartofsearchingmedicalrecord54 辽宁科技大学硕士学位论文4.6.4综合分析决策子系统当前,国内都积极使用信息管理系统(MIS)对医院病历进行管理和监测,在一直的运营之中,渐渐积累了大量的的数据,然而缺乏有效的措施让信息真正的发挥其作用。综合决策分析的目的是为医院管理者提供信息的分析、管理和发现潜在数据的含义并找出规律,为制定方案提供良好的依据。在完成计划中积极利用联机分析处理的强大的统计,以及报表处理和后期拓展的水平,使用联机分析处理的如切片、切块、下钻、上翻、旋转等基本操作。可以让用户可以从表面到深层一步一步的将数据剖析,进行全面的综合的进行比对。同时使用病历数据仓库的数据源,采用决策树算法、聚类分析算法、神经网络等技术进行模型构造,希望此数据模型能对医院的管理工作进行有意义的指导。患一种病的病人在年龄段结构方面的分析结果如图4.24所示,医院医疗水平分析结果如图4.25所示,科室业务绩效分析结果如图4.26所示。图4.24患者年龄结构分析图Fig.4.24theanalysischartonpatient’sagestructure55 4.病历决策系统的设计与实现图4.25医疗质量结构分析图Fig.4.25theanalysischartonmedicalquality图4.26科室业务绩效分析图Fig.4.26theanalysischartondepartmentbusinessperformance56 辽宁科技大学硕士学位论文5.改进的DIG算法在病历分类中的应用5.1病历的采集和预处理病人履历探究时有关的数据为各种疾病体现,像糖尿病、脑出血、胃病、冠心病病人履历情况,以上检索到的有关的数据都是位于医院数据库里没有特定分类选择得到的。此工作包含数据预整理期、特点筛选期和精神培育期。图5.1展示了对病历进行分类实验的整个过程。第l步首先是数据采集,即指集合不一样的病例数据;第2步指数据预整理,此阶段应该保证数据的可靠性才可运作;第3步意义重大,是选择数据特点,数据特点筛选对工作结论很关键;第4步指SOM(自由管理构成神经网)的策略培育工作组。图5.1病历分类实验的这个过程Fig.5.1Thewholeprocessofmedicalrecordsclassificationexperiment5.2向量量化数据预处理(datapreprocessing)是对不完整,不一致的脏数据进行清理的过程。在数据预处理之后就可以提取数据特征,否则达不到很好的实验效果。提取数据特征的方法有很多,例如:Skewness、Mean、Kurtosis、variance。我们提取病例特征是采用文本短语匹配的方法,其原因是在实际病历中,同一病种存在诸多相似的病症,然而对于不同病种则存在较低相似的病症。创建的文档索引图(DocumentIndexGraph,DIG),通过用图展示源文结构的形式,提取源文件中不同层次的意义,并且使源文件中的句子保持结构,我们更能利用信息而不是独立的单词进行短语匹配,这是基于短语的特征的提取方法。创建了DIG之后,在达到要求短语的匹配程度的基础之上以此得出文档的相似度,接下来我们结合实际案例来具体说明基于短语特征的提取方法。57 5.改进的DIG算法在病历分类中的应用家在李明沈阳人多是会省男孩Document1Document2Document3李明家在沈阳沈阳人多李明是沈阳人沈阳是省会李明是男孩图5.2文档索引图(DIG)示例Fig.5.2Documentindexgraph(DIG)case上面图5.2表明了用DIG表示这三篇文档,从图中可以明显的发现句子中每个字的关系,并且每个短语在不同文档中出现的次数也非常明显,从图5.2中可以观察到这三个文档中出现次数最多的就是“沈阳”和“李明”这两个词语。接下来,对这个方法进一步介绍。(1)文档索引图的表示gV,EiiiVi第I篇文档中的字符集,集合中不能出现重复的字符,在gi中表示为点E第I篇文档中的句子路径集,在g中表示为边ii(2)增长的DIG的表示GGgii1iG表示前i-1篇文档的DIG图;g表示第i篇文档的DIG图:G表示G图i1iii1与g图的组合生成的图。i(3)短语的匹配方法MggijijMgGiii1g,g表示第i篇和第j篇文档的DIG图;G表示前i1篇文档中的DIGiji1图;M则表示在g与前i1篇文档中的短语集;M表示在g与g中出现的短iiijij语集。我们能看到,DIG在不同文档中可提供全部信息,这些信息是完全匹配的短语,且对字符之间的关系很注重,这能很大地帮助确定文档之间的相似度,然而58 辽宁科技大学硕士学位论文传统的短语匹配技术只重视短语的提取和查询,在此方面,DIG与之有很大不同。p2[g(li)(f1iw1if2iw2i)]i1sim(d,d)(5.1)12jks1jw1js2kw2k参数说明:l:表示短语集中的短语长度;ip:表示短语集中的短语个数;g(l):表示测量M中第i个短语的长度;is、s:表示源文件d,d中每一个句子的长度,j和k分别表示d,d句子1j2k1212中的个数;w、w:表示测量M中每一个短语在d,d中的权重;1i2i12f、f:表示测量M中每一个短语在d,d中出现的频率;1i2i12通常情况下,各个文档间的相似度在0~1范围内,当文档相似度趋于l的时候,表示文档就越容易被分为一类。5.3改进的DIG算法即文本分类算法的步骤和结果5.3.1改进的DIG算法用创建的文本数据集公共匹配的短语库的向量使每个文本文档进行量化,并用SOM实现对文本数据集进行分类,这就是改进的DIG算法的基本思路。DIG算法改进之后,这个公共匹配的短语库也随之取得。改进的DIG算法的具体步骤如图5.3所示。59 5.改进的DIG算法在病历分类中的应用图5.3改进的DIG算法步骤Fig.5.3ThestepsofimprovedDIGalgorithm每对病历都将利用短语匹配算法,以此得到一个匹配的短语集合。把这个过程定义为:dijsk:k,1,piji,ijj(5.2)参数说明:d:表示文档i和j的匹配短语集合;ijdijs:表示匹配的短语;kP:表示文档和短语语匹配的个数;ij用同样的方法处理没对病历记录就,就能得到一个匹配的短语库。Ldiji,:j,1,N(5.3)其中L是去除多次重复出现的全部匹配的短语集合。N表示数据库中的文档的个数。d:表示文档i和j的匹配短语集合。为了确保L中具有唯一的短语,我ij们必须去除其可能存在的重复的短语,接着计算在文档i中的每个短语在L中的重复出现的次数,将获得:vr,r,r,,r(5.4)i123k其中r表示在文档i中短语k出现的重复次数,v表示文档i的向量。得到的ki是数据库中的每一个文档都被映射成一个向量。其实就是把数据库的分类问题变为向量集v的分类问题。将v归一化,使之能够进行相互比较,从而得到正确结ii果。最后,为了得到分类结果,必须将自组织映射神经网络应用到向量集合v中,i60 辽宁科技大学硕士学位论文综上所述,匹配短语的算法总结为5个步骤:(1)获取数据库当中每对文档的匹配的短语集合。(2)建立一个去掉重复出现的匹配短语的全部短语的集合,。(3)把每个文档都表达为一个向量,并对向量进行归一化。(4)用SOM工具创建一个分类器,它对应于这个向量集合的。(5)将分类结果可视化,得到和每类有关联的特征短语。用C#.net程序实现图5.3中的改进DIG算法的前三步,其程序流程图如图5.4所示。用MATLAB程序来实现最后两步,其程序流程图如图5.5所示。在C#.net程序中,我们首先导入两个病历文本,然后遍历病历文本信息,dijd得到匹配的短语ij,用这些匹配的短语建立一个短语集L,在L中删掉重复出现的短语,减少后面的重复工作,然后得到一个新的L;最后是用向量L来量化每个文档,同样依次导入病历文本,找到L中每个匹配短语在文档中出现的次数,V当全部的文档搜索完毕后即可得到向量的量化结果ij。图5.4C#.net程序流程图Fig.5.4TheC#.netprogramflowchart通过图5.4得到文本向量后,为使每个向量在同尺度下的比较存在意义,要进行归一化向量,使每个向量具有比较的基础。奇异值分解算法在次要成分上忽略,将主要的成分提出,而且能够减少数据量和下一步的运算量,在归一化以后61 5.改进的DIG算法在病历分类中的应用的文本向量矩阵应用。接着再把处理过的向量矩阵输入SOM神经网络进行分类,最终的可视化显示用MATLAB工具进行。文档向量集合(由C#.net主程序生产)向量归一化(normc(R))奇异值分解(svd(R))SOM分类图5.5MATLAB程序流程图Fig.5.5TheMATLABprogramflowchart5.3.2实验结果下面我们分三种情况进行分类实验,将胃病、冠心病、脑出血、糖尿病这四种病历集合在一起,把病例文本的序号打乱,然后分为三种情况。将数据进行预处理,并且量化病例文本,然后用自组织神经网络(SOM)把量化后的结果分类进行实验。(1)由脑出血、胃病、糖尿病组合的共1500份病历,其中每种病历包含500例。由图5.6能够得出2个结论:病种不同的病例,其病症基本不同;一种病例集中不同之间的病症相似性较高。因为图中表明糖尿病、胃病、脑出血这三种病历间匹配程度与相似性非常低,在经过了SOM神经网络训练之后能被完全分类。62 辽宁科技大学硕士学位论文图5.6实际分类与经S0M分类结果Fig.5.6TheactualclassificationandbyS0Mclassificationresults(2)由脑出血、冠心病组合的各500份病历,合计1000份病历。图5.7实际分类与经自组织神经网络分类结果Fig.5.7TheactualclassificationandbyS0Mclassificationresults从图5.7能够得出一个结论:病症有相同之处。与前一个实验相比,冠心病、脑出血这两种病历经过了自组织神经网络训练后,大多数的病历可以被正确地分63 5.改进的DIG算法在病历分类中的应用类,其匹配程度和相似性皆高于前一个实验。(3)由糖尿病、胃病、冠心病、脑出血这四种病,每种病历包含500例组合的2000份病历。从图5.8能够看出冠糖尿病、胃病、冠心病、脑出血这四种病历经过自组织神经网络训练以后,基本都能够被正确地分类的是胃病和糖尿病,而由于冠心病、脑出血与胃病和糖尿病的病历匹配相似性都很低,他们没有相同的病症,所以能够被正确的分类出来;而非常容易混淆的冠心病和脑出血这两种病历因为从症状上不易正确判断是哪一种病,需要经过更多的SOM才行。图5.8实际分类与经SOM分类结果Fig.5.8TheactualclassificationandbyS0Mclassificationresults利用SOM神经网络进行分类实验比较简单,程序每次的运行时间大约是2-3分钟,计算复杂度也低。以上三个实验结果的分析情况如表5.1所示,由糖尿病、脑出血、胃病这三种病组成的病历数据集可以被正确分类的概率是100%;而由冠心病和脑出血组成的病历数据集被正确分类的概率为95%;由糖尿病、脑出血、胃病、冠心病组成的病历数据集能够被正确分类的概率为91.25%。以上三个实验的平均正确率是95.417%。64 辽宁科技大学硕士学位论文表5.1三个实验中被分类数据集的正确率Tab.5.1Thesuccessrateofclassifieddatasetsinthreeexperiments病历集分类正确率脑出血、冠心病95%脑出血、糖尿病、胃病100%脑出血、冠心病、糖尿病、胃病91.25%Average:95.417%5.4结论与讨论文本分类是根据它的内容把这些语言分为一个或多个预定义的类别。它在信息组织和信息管理方面是一个很重要的角色。利用数据挖掘技术能够发现数据中潜在的不明显的机构,并且它涉及很多。一般来说,利用文本挖掘技术就能够进行文本分类。系统中的病历就是一类文本数据集。利用数据挖掘技术和分类病历,可以对这些病历数据集进行挖掘和分类,并且能够自动地在病历数据集中提取出来它的主要特征,分类病历能够帮助医务人员判断疾病的同时,还能够从病历中总结出某些表现特征,这些特征可能是不同病种之间从未发现过的。实验中对病历数据集的分类方法使用了自组织分类特征向量,其中每个特征向量都代表一个病历,并且应用了短语文本分类技术对数据集进行了提取特征和量化了向量。最后的实验中显示分类正确率平均值达到95.417%。冠心病和脑出血根据病历很难区分,因其在病历中存在许多相似特征,导致难以辨别是患有冠心病还是脑出血,而在实验当中,这两种不容易区分的疾病却能够被正确分类,而且分类的正确率竟然达到了95%。从以上的实验结果可以得出结论,本文使用的文本分类技术对病历的正确分类达到了很好的效果。65 6.总结与展望6.总结与展望6.1总结本文基于数据仓库的病历管理决策支持系统的研究与开发,是把商品化软件作为最终目的,符合软件工程所制定的规范,第一步先进行用户需求的调查核研究,再对系统整体的功能目标进行确立。我们仔细考虑了医院工作的实际需求,做了认真详细的调研,并根据客户需求制定出有价值的研究内容和合理的目标,并为此设立了课题研究小组,来做系统开发。对国内外相关的决策支持系统的文献资料进行集中和归纳、进行扬长避短,充分汲取了多年以来从事信息管理系统开发的经验和教训,制定了研究和开发的计划,为达到提高医院整体效益、使患者获取更好的医疗服务而努力。为了开发出符合医院自身特点的系统,是系统有良好的操作界面,并有实际用处,能为医院提升效益,帮助医疗人员提高医疗水平,我们项目组成员多次前往各医院的各部门进行交流调研,仔细深入了解其业务情况,对业务流程进行了详细分析,依据《医院计算机信息系统安全技术规范》,做出了系统需求分析、概要设计、详细设计、编码调试和实例测试,并且设立了对应的相关技术文档。在系统开发过程中,我们项目经理对编码进行了规范,对源程序采用了版本控制,重视团队精神,最终项目组成功的开发了病历管理决策支持系统,实现了对病历信息的管理,完成了对相关数据的采集、清理、转换、查询汇总、统计分析、决策支持等功能,达到了为医院里相关部门提供及时、准确的病历信息查询、统计和数据分析等目标。本系统现已试运行,得到了用户的一致好评,为医院内部的医疗水平提升和管理决策提供了基础信息和决策依据,也为医院对各科室的效益管理和医院管理者制定决策提供及时、准确的依据信息,促进了病历管理的智能化。论文的最后部分中阐述了进行改进后的DIG算法如何运用在中文病历的分类中,并且进行了相关的实验,通过实验结果,可以得出对病历数据集分类的正确率很高,平均值甚至达到了91.25%。在通常情况下,冠心病患者和脑出血患者的病历中有许多相似之处,仅靠依靠不容易加以区分病人到底得了那种病,但是通过实验发现这两种病可以很好的进行分类,正确率大大提升。所以根据这个结果我们可以得出,采取这种根据短语进行文本分类技术可以高效率的,更好的对中文病历进行分类。6.2展望目前信息化越来越广泛的应用在社会的各个行业,计算机使用者手中也掌握66 辽宁科技大学硕士学位论文了越来越多的历史资料,但是如何能够更好的将这些大量的数据进行应用和价值实现也成为当今社会一个重要的课题。总而言之,数据仓库技术就是对企业中已经存在的历史数据进行整合、清理、转换等处理后进行有效利用,找出相互之间潜在的不容易被发现的有关联、有价值的数据并且对数据进行查询、汇总、分析、预测,为企业机构优化、效益提升、制定重大决策提供最有效的依据。随着区域化医疗的发展,还能够挖掘出更多可以应用的方面,如在疾病预测控制、疾病预防保健等几个方面进行区域化分析和研究,都是比较具有意义的,但是同时这也需要更好的利用数据挖掘于病历分析系统中的应用。数据挖掘是社会所热点关注并且具有价值行的课题,本课题根据人工神经网络以及文本数据挖掘现已经很好的实现了对病历数据集进行分类,其实目前系统还存在很多需要改进的地方,比如进一步对更多类别的病历数据集进行分类的准确率。通过本系统的研究可以提高软件系统应用价值,给管理者带去一些决策方案的依据。我们可能所实验的范围比较小,只是运用在了医院的病历上,文中的分类方法也可以应用到很多领域当中。67 参考文献参考文献[1].陈文伟.决策支持系统及其开发(第二版).沈阳:清华大学出版社,2014:324--326.[2].於晓榛,李青.基于数据仓库的决策支持系统的研究与应用.计算机与现代化,2012(3):22.[3].EffemGMallach,DedsionSupportandDataWarehouseSystems,McGraw-Hill,Companies,Inc,2010:22.[4].俞文彬.基于数据仓库的决策支持系统框架研究.上海交通大学学报,2000(6):22.[5].AlbertA,TawfikJelassi.DSSresearchandpracticeinperspective.Decisionsupportsystems,2014,12:12.[6].董军等.决策支持系统中的知识库系统的增量式开发.山西大学学报(自然科学版),2014(1):3.[7].李家菁.基于数据仓库的决策支持系统的研究.天津大学硕士论文.2011.[8].李志刚.决策支持系统原理与应用[M].沈阳:高等教育出版社,2015:209--210.[9].W.H.Inmon.BuildingtheDataWarehouse.NewYorkJohnWiley&Sons,2015.[10].M.Serrano,C.Calero,M.Piattini.Validatingmetricsfordatawarehouses.IEEproc-Sofw,2012,149(5):56--60.[11].Z.L.Yang.PAID:Miningsequentialpatternsbypasseditemdeductioninlargedatabases.Proc.ofthe10thInternationalDatabaseEngineeringandApplicationsSymposium(IDEAS2006),2014:113--120.[12].S.Sarawagi,R.Agrawal,A.Gupta.Oncomputingthedatacube.TechnicalReportRJ10026,IBMAlmadenResearchCenter,SanJose,California,2015.[13].K.Beyer,R.Ramakrishnan.Bottom-upcomputationofsparseandicebergcubes.Proc.2013ACM—SIGMODInt.Conf.ManagementofData(SIGMOD’99),1999:359--370.[14].T.B.Pedersen,C.S.Jensen,C.E.Dyreson.Afoundationforcapturingandqueryingcomplexmultidimensionaldata.InformationSystem,2011.[15].Z.Shao,etal.MM-Cubing:computingicebergcubesbyfactorizingthelatticespace.Procof16thInternationalConferenceonScientificandStatisticalDatabaseManagement,2014:213--222.[16].D.Xin,Z.Shao,J.Han,H.Liu.C-Cubing:efficientcomputationofclosedcubesbyaggregation-basedchecking.Procof22ndInternationalConferenceonDataEngineering(ICDE’06),2015:4.[17].V.Harinarayan,A.Rajaraman,andJ.D.Ullman.Implementingdatacubesefficiently.Proc.ofACMSIGMOD,1996:205--216.[18].池太威.数据仓库结构设计与实施——建造信息系统的金字塔.沈阳:电子工业出版68 参考文献社,2015.[19].徐义峰,徐云青,陈春明.雪花模型在OLAP多维建模中的应用.科技情报开发与经济,2015,8(2):45--47.[20].张维明,邓苏等.数据仓库原理与应用.沈阳:电子工业出版社.2012:45--57.[21].王能斌编著.数据库系统原理.沈阳:电子工业出版社,2010.[22].安淑芝等.数据仓库与数据挖掘.沈阳:清华大学出版社,2015.[23].林杰斌,刘明德,陈湘等.数据挖掘与OLAP理论与实务.沈阳:清华大学出版社,2013.[24].徐义峰,徐云青,诸葛理绣.基于SQL的OLAP多维数据分析.微机发展,2015,15(7):66--68.[25].严任远.基于数据仓库的企业OALP多维模型的设计与实现.情报杂志,2014(3):32--34.[26].J.Han,M.Kamber著.范明,孟晓峰译.数据挖掘概念与技术.沈阳:机械工业出版社,2012.[27].H.Liu,J.Han,D.Xin,Z.Shao.Top-downminingofinterestingpatternsfromveryhighdimensionaldata.Proc22ndInternationalConferenceonDataEngineering(ICDE’06),2015:114--116.[28].HanJW,MichelineK.Datamining—conceptsandtechniques[M].沈阳:高等教育出版社,2011.[29].FayyadU.M.Dataminingandknowledgediscovery:makingsenseoutofdata.IEEEExpert,2014,11(5):20--25.[30].赵志宏,骆斌,陈世福.基于数据仓库的数据挖掘系统结构框架[J];计算机应用与软件;2012年04期.[31].朱邵文,胡红银等.决策树数据采掘技术及发展.计算机工程,2010(10):1--3[32].仇春光,刘玉树.自动生成决策树的通用算法模板.沈阳理工大学学报,2011,19(3):338--342.[33].杨卫民,谭骏珊.汪斌数据仓库和数据挖掘技术在DSS中的应用研究[期刊论文]--计算机工程与设计,2014(10).[34].韩家炜,MichelineKamber著.数据挖掘:概念与技术(第1版).沈阳:机械工业出版社,2015.[35].廖匠.数据挖掘与数据建模[M].沈阳:国防工业出版社,2010.69 致谢致谢本论文的工作是在我的导师张学东教授的悉心指导下完成的,张学东教授严谨的治学态度和科学的工作方法给了我极大的帮助和影响。另外衷心感谢多年来辽宁科技大学软件学院的各位老师对我的关心和指导。张学东教授悉心指导我们完成了相关医疗信息化的科研工作,在学习上和生活上都给予了我很大的关心和帮助,在此向张学东教授以及软件学院的各位老师表示衷心的谢意。孙国利所长对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。在实验室工作及撰写论文期间,徐磊同学对我论文中的相关医疗信息化研究工作给予了热情帮助,在此向他表达我的感激之情。另外也感谢我的父母及爱人,他们的理解和支持使我能够在学校专心完成我的学业。70 作者简介作者简介姓名:王军伟性别:男出生年月:1983年12月30日民族:汉籍贯:辽宁省鞍山市研究方向:医疗信息化简历:2002年9月至2006年7月沈阳理工大学电子信息工程专业学习2006年11月至2008年11月65367部队服役2009年5月至2010年9月锦州电子高等专科学校培训2010年10月至2012年9月鞍山铁塔制造总厂工作2012年10月至今鞍山市医学科学信息所工作71 啤-■;.1臟所有:迁宁科技大学研究生院1t部捧iWJ矜j■.,一:T-T-.T狐巧i巧或巧哥畔11——簡巧.。言,、—..-〔三w与 ̄_^一、-AmmMta*—'h,I■,■WJfc—^-子;fe^S^SSr*mM、'VMMk^■■*—■I-—_—' ̄ ̄、-^.BI趟編U强酷賊.娜離贼燕激er,;薪_'—^體^Hi-‘’.'-;耳.:'':這^:告v折:'.V';.p;';二.萬茜3:版面设计:过宁科技大学研究生院

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭