基于数据挖掘技术的中医乙型肝炎诊断模型研究

基于数据挖掘技术的中医乙型肝炎诊断模型研究

ID:44051112

大小:749.13 KB

页数:111页

时间:2019-10-18

基于数据挖掘技术的中医乙型肝炎诊断模型研究_第1页
基于数据挖掘技术的中医乙型肝炎诊断模型研究_第2页
基于数据挖掘技术的中医乙型肝炎诊断模型研究_第3页
基于数据挖掘技术的中医乙型肝炎诊断模型研究_第4页
基于数据挖掘技术的中医乙型肝炎诊断模型研究_第5页
资源描述:

《基于数据挖掘技术的中医乙型肝炎诊断模型研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、摘要乙肝患者在中国目前已经超过9千万人,社会危害大,已被列入重大危害病种。由于中医治疗慢性疾病有较好效果,对于中陕慢性乙型肝炎的研究已成为研究热点。目前基于数据挖掘技术研究中医乙肝,多关注于:病-症-证-药的相关性研究,本文重点研究病-症,期望通过病-症的关联性分析得岀屮医乙肝诊断模型,为辅助医生进行临床诊断提供技术支撑。本文收集了2015年某三甲中医医院肝病科住院患者数据1千多例,包括基本信息、西医检验项目等指标,采用主成分分析、决策树、adaboosting.bagging、随即森林等多种算法进行特征选择,根据计算结果综合比较,找出指标之间的相关性。结果发现红细胞与血红蛋白、血小板与血小板

2、压积高度相关。红细胞与白蛋白、l谷氨酰转移酶与碱性磷酸酶、白蛋白与胆碱酯酶、红细胞与胆碱酯酶屮度相关。最后根据相关性研究结果,利用线性回归和机器学习方法建立中医乙肝诊断模型,为临床医生提供辅助诊断。[关键词]乙型肝炎数据挖掘诊断模型目录摘要ABSTRACT错误!未定义书签。第1章绪论41.1项目背最41.2研究内容41.3论文结构5第2章相关技术基础62.1乙肝、肝硕化及肝癌62.1.1乙肝62.1.2肝硬化62.1.3肝癌72.2数据挖掘技术72.2.1基本原理72.2.2数据挖掘步骤72.2.3数据挖掘工具72.2.4数据挖掘与传统分析方法的区别82.2.5数据挖掘的现状及未来发展92.3

3、主要数据挖掘算法92.3.1k折交叉验证92.3.2主成分分析92.3.3决策树102.3.4随机森林102.3.5boostingbagging分类112.3.6Logistic回归禾口probit回归12第3章数据采集和预处理133.1病例来源133.1.1病例纳入标准133.1.2数据预处理的必要性132.2数据预处理142.2.1数据清洗143.2.2数据集成143.2.3数据变换143.2.4数据归约152.3数据描述152.3.1临床信息编码152.3.2基本情况及分布15第4章数据降维194.1与肝病科非乙肝患者对照193.2与非肝病科患者对照253.3与肝病科非乙肝及非肝病科患

4、者对照294.4汇总分析344.5降维后变量相关性分析36第5章诊断模型的建立404.110折交叉验证404.1.1下标集405.1.2测试集415.2数据建模415.2.1第一组筛选变量建模415.2.2第二组筛选变量建模505.2.3第三组筛选变量建模525.2.4综合变量建模555.2.5算法评估64第6章总结和展望666.1总结665.2展望66附录一691与肝病科非乙肝患者对照的R代码表示结果691.1logistic回归691.2probit回归701.3主成分分析711.4决策树732与非肝病科患者对照的R代码表示结果742.1logistic回归742.2probit回归752

5、.3主成分分析762.4决策树773与肝病科非乙肝及非肝病科患者对照的R代码表示结果783.1logisitic回归783.2probit回归791.3主成分分析803.4决策树824第一组筛选变量建模的决策树R代码表示结果82附录二83致谢1011.1项目背景乙型肝炎是由乙型肝炎病毒引起的,是一种危害极大,传播极广,治愈难度高的传染性疾病。其主要以血液、体液等为传播途径,临床以急性、慢性迁延性、病毒携带等状态存在于人体内⑴。目前全世界HBV携带者数量已经超过3.5亿人,我国约有9000万人,每肝病毒慢性感染者年大约有100万人死于该疾病,其中每年大约有28万人死于肝硕化、肝癌等肝脏相关疾病⑵

6、。近20年来,其死亡率一直位居我国法定传染病报告的前列,是世界上为此所付出社会成本最多的国家⑶。冃前为止尚无用于治疗乙型肝炎病毒携带和乙型肝炎的特效药物。西医曾通过痛病毒和抗肝纤维化的药物的方法控制乙肝肝硬化,但是其成本比较高,并且可能需要终生服药,需要很大的投入,并且效果不一定明显⑷。随着数据库技术和生物医学工稈的急速发展,信息技术已经渗透到包括医学在内的各个领域,但是我国目前将数据挖掘技术运用到医学领域才刚刚起步。越来越多的医院开始使用H1S(医院信息系统),以及电子病历的普及,使得医院收集到患者信息越来越丰富,与此同时也带來了信息爆炸的后果,使得很多信息之间的相关性被隐藏,于是医学数据挖

7、掘应运而生。H前除了将数据挖掘用在生物医学/DNA屮,还有用于疾病诊断、疾病相关因素分析,疾病预测、医学图像以及医疗质量管理等方面。本文开发岀预测模型,根据患者给定的西医检验项目,找出检验项目Z间的相关性,通过预测模型,得出他的西医诊断。根据患者多次的观测值,通过预测模型,得出这段时间疾病的病情转向,给出恶化或好转的概率。1.2研究内容1)指标筛选,根据疾病的诊断结果,运用多种算法,筛选出西医的主

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。