基于数据挖掘技术对心脏病诊断的研究

基于数据挖掘技术对心脏病诊断的研究

ID:17385032

大小:3.29 MB

页数:71页

时间:2018-08-30

基于数据挖掘技术对心脏病诊断的研究_第1页
基于数据挖掘技术对心脏病诊断的研究_第2页
基于数据挖掘技术对心脏病诊断的研究_第3页
基于数据挖掘技术对心脏病诊断的研究_第4页
基于数据挖掘技术对心脏病诊断的研究_第5页
资源描述:

《基于数据挖掘技术对心脏病诊断的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:10708论文分类号:2学校代码学号:1506045垂飧焱#技A莩SHAANXIUNIVERSITYOFSCIENCE&TECHNOLOGY硕士学位论文Thes’isforMastersDegree舒数据擁技术对碰病麵■i指导教师姓名:杨云教授I1I(11|论文答辩日期:2018年5月!|備_II言■■■■■■■■■■■■mm申请工学硕士学位论文论文题目:基于数据挖掘技术对心脏病诊断的研究学科门类:工学一级学科:软件工程培养单位:电

2、气与信息工程学院硕士生:岳千导师:杨云教授2018年5月RESEARCHONTHEDIAGNOSISOFHEARTDISEASEBASEDONDATAMININGTECHNOLOGYAThesisSubmittedtoShaanxiUniversityofScienceandTechnologyinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringScienceByQianYueSupervisor:Prof.YunYangMay

3、2018基于数据挖掘技术对心脏病诊断的研究摘要近些年来,心血管疾病引发的死亡已经持续成为居民首位死亡原因,而且,心脏病的患病人群也越来越年轻化。因此,心脏病的诊断与治疗已经成为医学研究的重中之重。心脏病种类繁多、影响因素多样,如何提高心脏病的诊断效率已经成为急需解决的问题。针对上述情况,论文以UCI机器学习数据库中298例心脏病数据集为研究对象,分别采用BP神经网络算法、支持向量机及随机森林建立心脏病诊断分类器,并对研究结果进行对比分析,找到最优分类器。经过对支持向量机进行集成优化,进一步提高了分类器的分类性能,从

4、而有助于帮助医生对病情进行更加精准的诊断。论文的主要内容如下:(1)充分理解心脏病的临床诊断指标,选取合适的属性作为本次数据挖掘的研究对象。心脏病数据集共有75项属性,最终选取其中的14项属性进行研究。(2)对获得的心脏病数据集进行数据预处理。首先,删掉所有属性中的缺失值,保证数据的完整性。其次,将数据格式转换成WEKA中支持的ARFF格式文件。将心脏病数据集中的所有属性按照相关算法的需求情况来展开规范化分析。最后,借助各种形式的属性选择方案来实现对无关属性的过滤操作,选出相关效果最好的属性子集构建分类器。(3)对

5、心脏病数据集建立模型。分别采用BP神经网络算法、支持向量机、随机森林三种算法建立心脏病诊断分类器。不同的算法对参数要求不同,要选取最优的参数组合,使得所建分类器的性能最优。(4)对上述三种分类器进行评估分析并对最优分类器实现再次优化处理。从建模时间长短、可解释性程度、误差大小以及成本投入四部分展开对比分析,找出性能最优的诊断分类器。经过评估分析得出,分类性能最好的是支持向量机分类器,在此基础上,应用Bagging算法来对单独的支持向量机构建得到的分类器完成集成优化控制,确保分类器实现工作的性能得到更大程度的优化增强

6、。实施的实验结果明确,经过对三种算法进行参数优化建立模型,得到的诊断分类器中支持向量机分类器性能最优,其分类准确率为84.8993%,而BP神经网络分类器和随机森林分类器的分类准确率分别为78.1879%、77.5168%。而使用Bagging算法进行集成优化后,ROC面积值上升0.9%,I所得均方根误差缩减幅度是0.54%,相对均方根误差缩减幅度是1.0905%,集成支持向量机分类器相较于单个支持向量机分类器,性能上有了一定的提升。关键词:数据挖掘,心脏病,B神经网络算法,支持向量机,随机森林IIRESEARCH

7、ONTHEDIAGNOSISOFHEARTDISEASEBASEDONDATAMININGTECHNOLOGYABSTRACTRecentyears,deathcausedbycardiovasculardiseasehascontinuedtobetheleadingcauseofhumandeath:patientssufferfromheartdiseaseareyoungerandyounger.Therefore,themosturgentandvitalmedicalresearchisdiagnosi

8、sandtreatmentofthisdisease.Therearevarietiesinfluencefactors,howtoimprovethediagnosticefficiencyisoneoftheveryimportantproblems.Thisarticleisbasedonthe298heartdiseasecasesdatainthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。