基于关联规则医生诊疗数据挖掘系统实现

基于关联规则医生诊疗数据挖掘系统实现

ID:5941580

大小:31.00 KB

页数:9页

时间:2017-12-29

基于关联规则医生诊疗数据挖掘系统实现_第1页
基于关联规则医生诊疗数据挖掘系统实现_第2页
基于关联规则医生诊疗数据挖掘系统实现_第3页
基于关联规则医生诊疗数据挖掘系统实现_第4页
基于关联规则医生诊疗数据挖掘系统实现_第5页
资源描述:

《基于关联规则医生诊疗数据挖掘系统实现》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于关联规则医生诊疗数据挖掘系统实现  摘要:数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有用知识的过程,它是一个新兴的边缘学科,其应用领域非常广泛,并且具有良好的应用前景。课题使用JAVA语言、ORM数据访问接口和XML技术设计了跨平台运行、多线程并发处理、架构灵活、支持增量同步更新的数据挖掘系统模型ARFDW和实现方案。关键词:关联规则;数据挖掘;诊断和治疗信息;ARFDW中图分类号:TN911.7?34文献标识码:A文章编号:1004?373X(2013)19?0124?03数据挖掘从20世纪80年代提出到现

2、在,不过短短20多年的时间,但其应用已非常广泛,不仅用于科研领域,在商业领域的应用也毫不逊色,尤其是用于银行、电信、保险、交通、零售(如超级市场)等领域。数据挖掘在医学领域的应用也有着广泛的前景。在医学领域存在着大量的数据,包括病人病史、诊断、检验、和治疗的临床信息,药品管理信息,医院管理信息等。数据挖掘应用到医学领域,对医学数据进行分析,提取隐含的有价值的信息能够促进医院管理者作出明智决策、医生对病人的正确诊断和治疗。这对促进人类健康、保持健康的生活质量都有积极的意义。1基于关联规则数据挖掘技术分析91.1数据挖掘概述1.1.1数据

3、挖掘的定义数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程。这个定义包含几层含义,数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海而皆准的知识,仅需支持特定的发现问题。1.1.2数据挖掘的过程数据挖掘过程一般需要经历数据准备、数据开采、结果表述和解释三个主要步骤。(1)数据准备。数据准备是数据挖掘中的一个重要步骤,数据准备是否做好将直接影响到数据挖掘的效率、准确度以及最终模式的有效

4、性。这个阶段又可以进一步分为三个子步骤:数据集成、数据选择、数据预处理。(2)数据开采。数据开采阶段选定某个特定的数据挖掘算法(如关联规则、分类、回归、聚类等算法),用于搜索数据中的模式。这是数据挖掘过程中最关键的一步,也是技术难点。9(3)结果表述和解释。根据最终用户的决策目的,对提取的信息进行分析,把最有价值的信息区分出来,并且通过决策支持工具提交给决策者。因此,这一步骤的任务不仅是把结果表达出来,还要对信息进行过滤处理。如果不能令决策者满意,需要重复以上的数据挖掘过程。1.2关联规则概述给定一个事务(交易)数据库,人们往往希望发

5、现事务中的关联事实,即事务中一些项目的出现必定隐含着同次事务中其他项目的出现,这是关联规则的一个简单的描述。设[I={t1,t2,…,tm}]是由[m]个不同项目组成的集合,[D]是交易数据库(交易数据库又称事务数据库),其中每一个交易或事务[T]是[I]中一些项目的集合,即[T?][I。]每一个交易或事务[T]都与一个惟一的标识符TID相联。对于项目集[X?I,]如果[X?T,]则交易或事务[T]支持[X。]如果[X]中有[k]个项目,则又称[X]为[k?]项目集,或[X]的长度为[k。]关联规则是指形式如下的一种数据隐含关系:[X

6、?][Y,]其中[X?I,][Y?I,]且[X?Y=?。]关联规则挖掘的任务是:在给定的交易或事务数据库[D]中,发现[D]中所有的频繁关联规则。所谓频繁关联规则是指这些规则的支持度、置信度分别不低于用户给定的最小支持度和最小置信度。2ARFDW系统设计与实现2.1ARFDW系统框架需求分析9作为通用的数据挖掘框架,ARFDW要提供对不同操作系统、不同处理平台的支持;对异构数据源的支持;支持多样化、可插拔、可组合的数据转换功能;提供统一的管理和调度功能;处理程序的继承和开放性;要有清晰的框架处理层次以及对元数据的管理等。下面对框架的关

7、键需求进行描述。2.1.1建立挖掘主题系统应该支持挖掘主题的建立。在对被挖掘对象进行充分分析并确定挖掘主题及数据来源后,系统能够通过挖掘主题配置工具来创建挖掘主题及关联维度,并生成相应数据库表及数据记录映射对象。2.1.2异构数据源数据抽取作为通用框架,系统应该支持尽可能多的异构数据源,异构数据源包括不同厂商、不同版本的数据库,不同格式的文本等。如ODBC数据源、(非ODBC)各种关系型数据库数据源、应用数据、电子商务数据、各种文件格式中数据等;同时提供通用数据访问接口:该接口能够跨平台、网络访问数据,支持在不同类型数据源间建立连接,

8、通过它可以屏蔽各种数据源之间的差异,为后序工作提供一个统一的数据视图。2.1.3建立转换规则9由于业务系统的开发一般会有一个较长的时间跨度,这就造成同一种数据在业务系统中可能会有多种完全不同的存储格式。这就要求ETL工具

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。