基于r的apriori算法在高额住院费用中的应用研究

基于r的apriori算法在高额住院费用中的应用研究

ID:32370926

大小:799.62 KB

页数:3页

时间:2019-02-03

基于r的apriori算法在高额住院费用中的应用研究_第1页
基于r的apriori算法在高额住院费用中的应用研究_第2页
基于r的apriori算法在高额住院费用中的应用研究_第3页
资源描述:

《基于r的apriori算法在高额住院费用中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、中国卫生统计2017年4月第34卷第2期·315·基于R的Apriori算法在高额住院费用中的应用研究△成都市第三人民医院信息部(610031)郭慧敏杜军黄路非【提要】目的通过Apriori算法分析高额医疗费用患者相关指标之间的关系,试图找到影响医疗费用的因素,利用R扩展医学统计的工作思路。方法利用R软件中的arules包对2015年某院出院的高额治疗费用患者做关联规则分析,探索出院科室、住院天数与总费用,出院科室与性别,出院科室与药费,出院科室与有无手术的关联规则,并分析其原因。结果某些科室住院天数越多,费用越高;而某些科室的住院天数与费用没有太大关系;胸外、心内、神

2、外、ICU、心外五个病区出院的高额费用患者通常为男性;呼吸、ICU、心外、胸外、神外五个病区出院的高额费用患者的药费一般大于2万元;心外、胸外、骨科等病区的高额医疗费用的出院患者通常要行手术治疗手段。结论Apriori算法可以挖掘数据间内在的关系,为临床决策提供一定的理论支持,R语言可以快捷的完成医学统计工作。【关键词】R语言关联规则高额住院费用数据挖掘目前新一轮医疗改革正在如火如荼的进行中,各用、药费等字段;由于在数据分析过程中只能对离散变方对医疗改革保持了非常高的关注度;当下,看病难、量进行分析,故需将某些字段进行离散化处理,例如数[1]看病贵成了医患矛盾的主要集中

3、点,而看病贵的一据挖掘需要用到是否手术字段,但是在原始数据中并个重要构成就是患者住院期间的医疗费用过高。高额未提供该字段,需将获得数据中存在手术名称的标记医疗费用患者往往为危急重症病人,其主要特点为单为有手术,而无手术名称的记为无手术。次花费巨大,消耗大量的医疗资源,这极易给家庭和社2统计学方法[10]会造成沉重负担,部分患者难以承受巨额费用,导致因R语言是专门为统计而设计的语言,R语言能[2]病致贫、因病返贫。另外,高额的医疗费用也容易够为不同的统计功能提供多种实现途径,它是一套开造成医患关系紧张,这也是滋生医闹等现象的主要诱源的数据分析解决方案,其完全免费,对于统

4、计工作者因。面对这样的境况,严控医疗费用不合理的增长成非常友好,而且在全球有一个庞大且活跃的研究型社[3][11]为亟待解决的社会问题。区维护。本文主要利用R语言中arules包中的关联算法是一种常见的数据挖掘手段,它可以发apriori()函数进行关联规则提取,在规则提取过程中,现一个事物与其他事物之间的关联和相关性;在我国,设定最小支持度为0020且最小置信度为0500为强[4-5]关联规则[12],得到强关联规则后,筛选出提升度大于该方法在中医学中的应用非常广泛,在医学其他领域的应用逐渐增加。本文通过整理高额医疗费用患1的强关联规则做分析;其中R的版本为33

5、1,arules者的病案首页信息,利用Apriori算法查找符合条件的包的版本为14-1。[6]关联规则,以期分析高额费用患者各个指标之间的结果[7]相互关系,通过关联规则的关系梳理找到高额费用[8]1一般资料描述产生的主要因素;同时,开拓传统病案数据统计的[9]在获得的613条有效数据中,男性379例,女性方式,为医院数据利用提供新的思路和方向。234例,男女比例为162:1;最小年龄为0岁,最大年资料和方法龄为95岁,平均年龄(6097±1908)岁。1资料来源2数据离散化首先在院内邀请多名专家,采用德尔菲法,在参考由于Apriori算法只能对离散变

6、量进行关联规则诸多相关文档的同时,制定本次研究的高额医疗费用分析,因而需要将原始数据按照相应的规则进行离散的起始标准为10万元人民币。按照上述标准,在某院化处理,具体整理规则见表1。病案数据库检索2015年1月~2015年12月住院费用3关联规则结果分析超过10万的患者信息,共获得613份符合统计条件的数据整理后,编写R程序,共计得到14477条有病案信息。根据数据挖掘的需要提取患者的基本信效的强关联规则,众多的强关联规则难以逐一说明,现息,包括费别、性别、年龄、婚姻状况等字段以及患者的挑选具有代表性的规则做大致分析。住院信息,包括出院科室、住院天数、手术名称、总费根

7、据提取的关联规则发现,心外病区住院天数为21~30天的患者其费用一般为20万到30万,而其住△通信作者:杜军院天数为16天到20天的患者,其总费用一般为10万·316·ChineseJournalofHealthStatistics,Apr.2017,Vol.34,No.2到20万;而骨科病区住院天数在21天以上的患者其表1变量离散化分组表费用一般为10万到20万,具体结果见表2。在高额项目组数赋值费别3医保=1,全公费=2,自费=3费用患者中,胸外病区、心内病区、神外病区、ICU病性别2男性=1,女性=2区、心外病区五个病区男性患者所占

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。