基于决策树的糖尿病诊断专家系统的研究与设计

基于决策树的糖尿病诊断专家系统的研究与设计

ID:77692613

大小:4.08 MB

页数:54页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于决策树的糖尿病诊断专家系统的研究与设计_第1页
基于决策树的糖尿病诊断专家系统的研究与设计_第2页
基于决策树的糖尿病诊断专家系统的研究与设计_第3页
基于决策树的糖尿病诊断专家系统的研究与设计_第4页
基于决策树的糖尿病诊断专家系统的研究与设计_第5页
基于决策树的糖尿病诊断专家系统的研究与设计_第6页
基于决策树的糖尿病诊断专家系统的研究与设计_第7页
基于决策树的糖尿病诊断专家系统的研究与设计_第8页
基于决策树的糖尿病诊断专家系统的研究与设计_第9页
基于决策树的糖尿病诊断专家系统的研究与设计_第10页
资源描述:

《基于决策树的糖尿病诊断专家系统的研究与设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

分类号:密级:UDC::单位代码会傲3:公乂fI硕壬学位论文故隹.论文题目:基于决策树的糖尿病诊断专家系统的研究与设计1320190314挙号,■TJ倪家远作者:计算机技术专业名称:2016年5月30日 安徽工业大学硕db学位论文论文趣目:基于决策树的糖尿病诊断专家系统的研巧与设汁民ese过rchanddesignexpertsystemfordiabetesdiagnosisbasedondecisio打化ee作者:倪家远学院:计黨机科学与技术学晓指导教赋汤亚務单位:安徹工化大学论文提交日巧!2016年5月30日学纖予单位:安微:学安徽马鞍山243002 独创性说明本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工作及取得研巧成果。尽我所知,除了文中特别加レッ标注和致谢的地方外,论文中不包含其他人己经发表或撰写的研巧成果,也不包含为获得安徽工业大学或其他教育机构的学位或化书所使用过的材料一。与我同工作的同志对本研究所做的任何贡献均己在论文中做了明确的说明并表示了谢意。。。签名日期;11…关于论文使用授权的说明本人完全了解安徽工业大学有关保留、使用学位论文的规定,艮P;学校有权保留送交论文的复巧件,允许论文被查阅和借阅;学校可公布论文的全部或部分内容,可レッ采用影印、缩印或其他复制手段保存论文,保密的论文在解密后应遵循此规定。)答名和心賓^导师篇名、秦^-。吏參它曰期;心r《。 摘要摘要随着人工智能的发展,人工智能在医疗中的应用也越来越广泛。专家系统作为人工智能应用一个重要分支,为解决医疗问题提供了一种有效的手段。决策树模型是专家系统的一个重要模型,它能够高效表示知识,具有较强的推理能力。本文基于决策树为马鞍山桃园社区医院研发糖尿病诊断专家系统,该系统用于社区居民糖尿病的诊断和治疗。本文主要研究内容如下:首先,介绍课题的背景意义以及国内外研究现状,指出几种常见专家系统开发技术的缺点和不足,研究决策树理论采用决策树技术开发专家系统。其次,通过分析糖尿病发病机理抽取出糖尿病属性,对糖尿病数据集实施预处理删除不必要属性、离散化属性、补充空缺属性,在此基础上进行决策树学习建立决策树模型,经过实验验证决策树对糖尿病诊断预测的有效性。然后,设计专家系统的结构、各组成部分、推理机制、推理方向以及决策树的存储形式等,并介绍所使用的相关技术。最后,利用软件工程思想设计编写系统,实现糖尿病诊断、病例载入、知识库管理、用户信息管理等功能。系统采用C/S结构,前台界面使用Eclipse采用JavaSwing编程实现,后台知识库和综合数据库使用SQLServer2008实现。并将系统应用安装到马鞍山桃园社区医院供医务人员使用。关键词:决策树;知识表示;专家系统;糖尿病I AbstractAbstractWiththedevelopmentofartificialintelligence,theapplicationsofartificialintelligenceinmedicinearemoreandmorewidespread.Expertsystemisanimportantbranchofartificialintelligenceapplications,whichprovidesaneffectivemeanstosolvemedicalproblems.Decisiontreeisanimportantmodelofexpertsystem,itcanefficientlyexpresstheknowledgewithstrongreasoningability.ThispaperdevelopsadiabetesdiagnosisexpertsystemforMa'anshanTaoyuancommunityhospitalbasedonthedecisiontree.Thesystemisusedforthediagnosisandtreatmentofdiabetesincommunityresidents.Themainresearchcontentsofthispaperareasfollows:Firstofall,thispaperintroducesthebackgroundandsignificanceofthesubjectandtheresearchstatusathomeandabroad,pointsouttheshortcomingsanddeficienciesofseveralcommonexpertsystemdevelopmenttechnologies,proposesusingdecisiontreetodevelopexpertsystem.Secondly,thispaperextractsthediabetesattributesbyanalysisingthepathogenesisofdiabetes,andprocessestheattributesincludingremovingunnecessaryattributes,discretingattributes,supplementingvacancyattributes.Onthebasisofdecisiontreelearning,thedecisiontreemodelisbuilt.Afterexperiments,thevalidityofdecisiontreemodeltodiagnosisdiabetesisverified.Then,thestructure,components,reasoningmechanism,reasoningdirectionoftheexpertsystemandthestorageformofdecisiontreearedesigned.Therelevanttechnologiesusedareintroducedtoo.Finally,thispaperusesthesoftwareengineeringtodesignthesystem,whichimplementsthefunctionofdiabetesdiagnosising,caseloading,knowledgebasemanagementandinformationmanagement.ThesystemisestablishedbyC/Sstructure.TheinterfaceofthesystemisdevelopedbyusingEclipseandJavaSwing,knowledgebaseandcomprehensivedatabasearedevelopedbyusingSQLServer2008.ThesystemhasbeinginstalledandusedtoMa'anshanTaoyuancommunityhospitalformedicalpersonnel.Keywords:DecisionTree,KnowledgeRepresentation,ExpertSystem,DiabetesII 目录目录第一章绪论..................................................................................................................11.1课题的研究背景及意义.....................................................................................11.2国内外的研究现状.............................................................................................21.2.1专家系统的研究现状...................................................................................21.2.2决策树专家系统研究现状...........................................................................41.2.3专家系统在医疗中的应用现状...................................................................41.3论文主要内容及组织结构.................................................................................61.4本章小结.............................................................................................................6第二章糖尿病及其属性提取......................................................................................72.1糖尿病和胰岛素.................................................................................................72.2糖尿病的分型.....................................................................................................72.3糖尿病病因与发病机理.....................................................................................72.4糖尿病病程........................................................................................................112.5糖尿病并发症...................................................................................................122.6糖尿病诊断标准...............................................................................................132.7糖尿病属性提取...............................................................................................132.8本章小结...........................................................................................................13第三章专家系统关键技术研究与分析....................................................................153.1专家系统简介...................................................................................................153.2专家系统体系结构...........................................................................................153.2.1知识库.........................................................................................................163.2.2综合数据库.................................................................................................163.2.3推理机.........................................................................................................163.2.4知识获取机制.............................................................................................173.2.5解释程序.....................................................................................................173.2.6人机接口.....................................................................................................173.3知识获取...........................................................................................................173.4知识表示...........................................................................................................183.5决策树知识表示模型.......................................................................................203.6本章小结...........................................................................................................21第四章决策树模型的建立........................................................................................224.1基于糖尿病属性决策树的建立.......................................................................22III 目录4.2实验分析...........................................................................................................284.3本章小结...........................................................................................................28第五章系统设计与实现............................................................................................295.1系统分析...........................................................................................................295.1.1系统设计目标.............................................................................................295.1.2需求分析.....................................................................................................295.2开发技术与软硬件平台...................................................................................295.3系统推理机制...................................................................................................305.4系统详细设计...................................................................................................315.4.1系统流程图.................................................................................................315.4.2系统用例图.................................................................................................325.4.3系统数据库表设计.....................................................................................335.5系统功能实现...................................................................................................365.6本章小结...........................................................................................................40第六章总结与展望....................................................................................................42参考文献......................................................................................................................43在学研究成果..............................................................................................................46致谢..............................................................................................................................47IV 第一章绪论第一章绪论1.1课题的研究背景及意义随着人工智能的快速发展,尤其是近期谷歌的人工智能程序AlphaGo在与韩国围棋九段李世石的“人机大战”中四比一战胜了对手,更是把人工智能推向了科技界研究的新高潮。谷歌深度智能CEO德米斯·哈希比斯宣称要将AlphaGo和医疗、机器人等进行结合。专家系统(ExpertSystem,ES)是人工智能应用的一个重要分支,近年来在医疗中的应用得到了快速的发展。专家系统本质上是一种计算机程序,它把大量专家知识和经验存储在计算机中,利用人工智能相关技术进行知识表示和推理[1]。专家系统可以代替人类专家处理一些专业性较强的问题,如医疗诊断等。医疗专家系统则是在专家系统一般原理上开发的一种特殊类型的专家系统,它主要是针对医疗领域。医疗专家系统通过模拟医生来诊断患者的病情,给出相对应的治疗方案[2]。它可以作为医生的辅助工具来帮助他们解决一些复杂的医学问题。糖尿病是一种严重危害人们身体健康的疾病。根据国际糖尿病联盟2013年提供的数据显示,目前全世界有3.82亿人患者糖尿病,到2035年全球糖尿病患者有可能达到4.71亿人[3]。我国是糖尿病发病大国,糖尿病患者人数居世界第一,达到1.14亿人,约占全球糖尿病人数总量的30%。马鞍山桃园社区现有居民2万多人,其中老年人居多。随着近年来生活水平的提高,老年居民中患糖尿病的人数越来越多。作为直接服务基层群众的马鞍山桃园社区医院,由于等级资质比较低,软硬件方面都无法满足需求。糖尿病专业医生数量较少,相关治疗设置也很短缺,因此需要一种有效的工具来帮助医生诊断糖尿病。另一方面长期以来我们国家无论是中医还是西医都积累了丰富糖尿病的诊疗知识、经验和方法,由于没有很好的传播途径,导致这些宝贵的财富没有在临床医疗中得到广泛的应用而造成了极大的浪费。传统的纸质媒介、一对一的师徒帮带以及班级教学的方式都只能在小范围内传播,无法满足当今社会巨大需求。尤其是优势医疗资源集中于大医院不能有效共享,基层医院诊疗资源相对缺乏,导致供需矛盾突出。基于上述背景本文提出开发糖尿病医疗诊断专家系统,来满足马鞍山桃园社区医院的需求,同时该系统还可以保存和传播糖尿病医学专家的知识和经验。本系统将实现诊断过程的电子化和病例电子化,以方便查询诊断的过程和依据,也可以对已有病例进行查询。因此具有重要的实际应用价值。1 基于决策树的糖尿病诊断专家系统的研究与设计糖尿病诊断专家系统的工程意义在于其具有可复制性,可以批量复制,它可以使专家知识和经验得到更大范围的利用和更广泛的传播。1.2国内外的研究现状1.2.1专家系统的研究现状专家系统诞生于20世纪中期,它作为人工智能应用的一个分支,一直是人工智能领域研究的热点之一。专家系统促使人们从对知识的一般性探讨走向运用知识解决实际问题的转变。世界上第一个专家系统是1965年斯坦福大学在美国国家航空般天局(NASA)要求下研制成功了DENRAL系统[4],当时NASA计划发射无人飞船到火星,需要一个能够分析火星土壤化学成分的系统,因此该系统包含了丰富的化学知识。后来DENRAL系统被世界上许多国家的实验室和大学所采用,用于分析推断分子结构。1970年代卡内基·格隆大学成功研制了世界上第一个商用专家系统——XCON,该系统用于帮助美国数字设备公司设计计算机系统配置,每年可以为其节省2000万美元的成本。20世纪80年代以后,专家系统开始发展变化,朝向更专业化精细化方向发展[5],涌现了一批专业性实用性很强的专家系统,并在生产生活的各个领域中得到应用。进入21世纪,专家系统仍然是一种有价值的智能工具。早期的专家系统主要是基于规则的系统,后来随着面向对象技术发展,面向对象技术开始应用到专家系统中[6]。之后框架、神经网络、模糊逻辑、案例推理等技术的逐渐成熟,为专家系统的研究和开发提供了灵活的手段和技术支持。近年来专家系统的开发越来越专业、越来越智能,已经在工业、农业、医疗、军事等各个领域得到广泛应用,取得了较好的经济和社会效益。常见的专家系统有如下几类:(1)基于规则的专家系统基于规则的专家系统包含从人类专家处获得的信息,并把这些信息以规则的形式呈现[7],如IF-THEN形式。为了达到预期的目标,可以用规则来执行数据上的推理操作。这些规则本质上就是计算机程序,它既能够提供基于规则库或者知识库的信息推理方法,也能够规划结论。基于规则的专家系统已经应用如下领域中:状态转换分析、咨询系统、教学辅导系统、生产规划、电力规划、汽车工艺规划、农业规划、超图表示、DNA直方图、调度策略、欺诈评估、知识获取、知识表示、知识验证与确认、知识库维护、通信系统故障诊断、生物分离设计、材料加工、资源利用、生化技术、概2 第一章绪论率故障诊断、调度传感器控制等。基于规则的专家系统的缺点是:1)必须精确匹配。系统在检索规则库时必须把已知实事与知识库中知识规则前件进行精确对比。对于一些较模糊的的事实无法与知识规则进行对比。这类专家系统解决问题的领域有限。2)规则的逻辑关系容易混乱。前一条规则的结论有可能是下一条规则的前提,当问题比较复杂或者规则的数目较大时,推理链的逻辑关系容易混乱。3)推理的速度可能会很缓慢。推理机不仅要保存记录推理过程中使用的各规则的逻辑关系,还要检索规则,由于规则存放在知识库的位置没有规律,推理机需要检索整个知识库,当知识规则很多知识库很大时,推理机需要大量的时间检索匹配,造成系统推理速度变慢,推理效率降低。(2)基于神经网络的专家系统人工神经网络(ArtificialNeuralNetwork,ANN)是模拟生物神经网络的模型。这个概念是用来实现软件模拟的大规模并行处理,包括处理网络体系结构中的元件互连[8]。人工神经元的输入类似于电化学脉冲,人工神经元的输出对应于从一个生物神经元发出的信号。这些的信号可以改变神经突触的物理变化。应用神经网络的专家系统领域包括:故障诊断、最优功率流、决策制定、报警处理系统、推理机制、诊断系统、机器学习、电力负荷预测、设施布局设计、过程控制、知识学习、黄金开采工艺设计、机器人系统、参数设置、废物处理、工程陶瓷、缓解过程控制、声信号诊断、原油蒸馏、和生物医学等。由于神经网络本身的特点导致其在应用到专家系统中也出现了许多不足:1)缺少交互性。神经网络在推理过程中无法向外界提出必要的询问,无法及时弥补运算过程中所缺少的必要信息,从而导致系统不能正常工作。2)无法解释自身的推理依据和推理过程。3)神经网络把知识和规则转换为数字,把推理过程转换为数值计算,而在转换过程中可能会丢失信息。4)神经网络体系结构通用性比较差。(3)基于模糊理论专家系统模糊(Fuzzy)理论专家系统利用模糊逻辑的方法模拟正常人的推理过程[9],它涉及到不确定性推理。由于决策并不总是一个非黑即白、非真即假的问题,它往往涉及到灰色领域和可能性问题,因此可以使用这种模糊方法。在创建决策过程的特征可能是非结构化的、有争议的、无规律的,这时候就就可以使用模糊理论来处理。模糊理论中模糊语言用隶属函数表示。应用模糊专家系统如:电力负荷预测、在线调度、化工过程故障诊断、生态3 基于决策树的糖尿病诊断专家系统的研究与设计规划、控制系统、不确定性推理、知识集成、故障诊断、电力系统分类、故障检测、需求评估、废水处理、加工数据选择、供水预测、造影分类、联机分析处理、酒店选择、干燥机工具集成、汇集洪水频率分析、医疗咨询系统、工作匹配、性能索引、计算机安全、手势识别和医疗诊断等。基于模糊理论专家系统也有其自身的弱点:1)模糊知识获取比较困难,学习能力差。2)模糊语言与隶属函数之间的相互转换比较困难。1.2.2决策树专家系统研究现状决策树模型是一种效率较高的归纳推理方法,它以实例学习为基础,在学习过程中从无序、零乱的事例中提取规则,用决策树的形式表示出这些规则之间的逻辑关系[10]。决策树的优点是:1)结构简单,检索速度快。决策树是一种树形结构,不需要用复杂的形式就能表示出许多属性。2)决策树能够处理不同类型的属性,包括数值型和常规型。3)决策树是一种白盒模型,它不仅能够对每一个输入产生一个输出,还能清楚的展示出其逻辑推理过程。这一点对专家系统尤为重要,因为专家系统具有解释机制,需要解释其推理过程。4)决策树具有良好的学习能力,能够处理较大型的数据源。5)决策树对噪声有很好的健壮性。决策树作为一种有效的知识表示和推理方法,近年来在专家系统中也得到了应用。2008年东北电力大学曲朝阳、高宇峰等人把决策树应用到网络故障诊断专家系统中,利用决策树获取知识、表示知识[11]。2012年西班牙罗维拉-威尔吉利大学的JoanAlbertLopez-Vallverdu和DavidRiano等将决策树应用到医疗专家系统中,采用组合的方式筛选诊断标准,使用统计学方法来分析结果[12]。2014年中国民航飞行学院包勇、张德银等基于决策树设计了一种诊断飞机电气故障的专家系统,该系统采用模型化事实对知识进行编码,并能够运行在Android平台上[13]。1.2.3专家系统在医疗中的应用现状斯坦福大学的EdwardShortliife和B.G.Buchanan于1972年合作研制了一个用于诊断血染感染的专家系统MYCIN[14],1976年基本完成。该系统是基于规4 第一章绪论则的产生式系统用LISP语言写成。它可以根本患者的病症、病史和血液的化验结果推导出导致感染的细菌,并给出针对这些细菌的药物治疗方案。MYCIN给出的治疗方案可信度达到了69%左右,比同时期其他方法的基于同一数据集给出的方案的可信度高很多。2011年土耳其AgriIbrahimCecenUniversity大学的AliKeles等人开发了基于神经模糊规则的乳腺癌诊断专家系统,其推理机采用的是模糊神经网络方法[15]。2013年印度VishwakarmaInstituteofTechnology大学的SwatiShilaskar和AshokGhatol提出了混合前向选择技术用于心血管疾病诊断专家系统[16]。该系统通过正向包含、正向选择和反向消除搜索技术对距离测度进行搜索,得到改进的分类结果子集。2015年剑英国桥大学临床医学院的PhilippeJ.Giabbanelli和PiperJ.Jackson两位博士在设计专家系统时使用可视化分析技术来集成专家知识。他们通过对医学模型案例的学习,证明了无论是对检测带有底层数据概念模型的适应性还是评估这些模型的可能性差异,可视化技术都是很有效的[17]。1978年北京中医学院关幼波教授及其团队开发了关幼波肝病诊断系统,该系统是我国第一个医疗专家系统[18]。2003年东华大学叶进、邢传鼎把人工神经网络运用到心肌梗塞、心绞痛疾病的智能诊断专家系统中,该系统中把从专家系统人机接口中获取的信息作为神经网络的输入,利用多层前馈网络建立神经网络模型[19]。2005年广东工业大学李江平、韦玉科研制的亚健康中医诊断系统,实现了健康状态智能化诊断,该系统采用产生式规则表示知识并运用逆向演绎推理机制[20]。糖尿病诊断专家系统近年来也有许多专家学者在研究,但依然存在着一些问题和不足。2008年杭波、马计采用二次推理技术开发了糖尿病诊断专家系统,他们利用正向与反向、精确与不精确相结合的推理方法来实现糖尿病诊断专家系统的推理机制[21]。但该系统中把知识与推理结合在了一起,两者之间并不相互独立,知识库无法得到及时调整。2011年沈丽容、黄洪合作研究的基于贝叶斯和可信度的糖尿病诊疗系统,用贝叶斯定理来推断患者得糖尿病的概率[22]。但该系统依然使用产生式规则表达知识,因此它还是具有产生式的一般弱点如组合爆炸等问题。2013年哈尔滨工业大学的罗洋开发了基于案例推理的糖尿病诊断专家系统[23]。该系统在每做一次决策之前都要检索整个案例库,耗费时间很多,且案例之间的联系比较弱,当问题比较复杂时不能联合不同案例解决问题。通过对以上问题的分析和对各技术的比较,发现决策树模型不仅具有结构简单、存储方便、推理准确等特点,而且还有搜索速度快、对噪声有很好的健壮性等优点。因此本文采用决策树技术来开发糖尿病专家系统。运用决策树实现医疗诊断专家系统的知识表示与推理,可以有效提高专家系统的推理效率、推理准确5 基于决策树的糖尿病诊断专家系统的研究与设计性[24]。1.3论文主要内容及组织结构本文首先介绍了专家系统的国内外研究现状,对专家系统的各种开发技术进行分析比较,指出其各自存在的缺点和不足,提出本方所采用的方法和技术。本文把决策树理论应用到专家系统中,以解决专家系统最核心知识表示和推理问题。同时结合糖尿病的实际应用情况运用权值表来解决具有相同信息增益属性的选择问题,对决策树学习过程进行改进。同时采用数据库技术来存储知识以达到快速高效检索知识。然后运用Eclipse平台Java语言编写专家系统的各功能界面,用SQLServer2008来实现专家系统的知识库和综合数据库。最后把该系统应用到马鞍山桃园社区医院。本文的共五章,具体组织结构如下:第一章,绪论。主要介绍本课题的研究背景和意义、国内外研究的现状及存在的问题,提出了本课题的研究方法和思路。第二章,糖尿病及其属性提取。主要介绍糖尿病的基础知识和分类标准,对每一种糖尿病从病理到症状特征进行分析,提取出建立决策树所需要的属性。第三章,专家系统关键技术研究与分析。详细设计专家系统的各组成部分,并说明了所采用的关键技术。第四章,决策树模型的建立。首先对糖尿病数据集进行预处理,然后利用糖尿病属性数据进行决策树学习,建立起二叉决策树模型,并对其做适当修正以使其符合本课题的实际需求,结合糖尿病知识规则进行算法实现,通过实验验证了决策树模型的有效性。第五章,系统的设计与实现。主要描述利用软件工程思想详细设计系统各功能模块以及实现过程。第六章,总结与展望。对全文的研究内容和所做工作进行总结,并指出了本文工作的不足之处以及对未来工作的展望。1.4本章小结本章首先阐述课题的背景意义、国内外研究现状等,指出存在的问题,然后提出本文的方法和思路,最后概括全文的主要研究内容和组织结构。6 第二章糖尿病及其属性提取第二章糖尿病及其属性提取2.1糖尿病和胰岛素糖尿病是一种慢性疾病,主要是因胰岛素分泌缺陷而导致的内分泌代谢紊乱。临床上症状表现为高血糖。长期的高血糖可能会损伤机体组织,甚至可能造成严重的残疾甚至危及生命[25]。胰岛素是一种由胰腺分泌的激素,它可以使血液中的葡萄糖进入机体细胞并将其转化为可供人体使用的能量。胰岛素最早是在1921年发现的。它是由加拿大科学家FrederickBanting和医生CharlesBest合作从狗的的胰腺中提取的一种特殊物质。在一系列反复的实验后,他们发现即使摘除了狗的胰腺也可以通过给狗注射胰岛素使它能够继续存活下去。后续的实验中他们又从牛胚胎的胰腺中提取出胰岛素,并其注射给一个14岁的小男孩糖尿病患者,之后小男孩的病况得到明显好转,这也是世界首例人接受胰岛素治疗的病例。2.2糖尿病的分型人们对于糖尿病的认识是随着研究的深入和技术的发展而逐步的科学化细致化的。自从1965年世界卫生组织(WHO)第一次对糖尿病进行分型以来共进行了四次,每一次都相较前一次更加细化更加科学。目前最新的分型是由国际糖尿病联盟2013年提出,并得到了世界卫生组织的专家委员会确认,同时批准通过了该建议作为世界卫生组织的执行标准。糖尿病的分型如下:(1)1型糖尿病。(2)2型糖尿病。(3)妊娠糖尿病。(4)特殊型糖尿病2.3糖尿病病因与发病机理(1)1型糖尿病1型也称胰岛素依赖型糖尿病(Insulin-DependentDiabetesMellitus,IDDM)主要是由人体免疫系统缺陷所引起的。这类患者机体中的β细胞容易被免疫系统破坏,造成β细胞无法合成胰岛素提供给机体吸收血液中的葡萄糖尿病。β细胞在个体中被破坏的程度差异很大,一些患者在短期内β细胞被大量破坏,导致起病较急,多见于青少年患者,典型症状:7 基于决策树的糖尿病诊断专家系统的研究与设计1)明显口渴、舌燥2)尿频3)身体疲惫乏力4)易饥饿5)体重骤降6)伤口愈合较慢7)反复感染8)视力模糊另外一些患者的β细胞在若干年内被逐渐破坏,因此症状不是很明显,临床上被称为成人隐匿自身免疫糖尿病(LADA)。1型糖尿病发病机理如图2-1所示:图2-11型糖尿病发病机理1、遗传因素在导致1型糖尿病发病的众多因素中,遗传是一个不可忽视的因素[26]。在对患有糖尿病的家族进行长期的跟踪研究后发现,1型糖尿病在这些家族中具在明显的家族遗传倾向。如果家族中上一辈中有人患糖尿病,则其子女患糖尿病的概率高达三成。多各种基因因素共同作用导致1型糖尿病的发生。其中白细胞的8 第二章糖尿病及其属性提取HLA抗原和DR抗原对1型糖尿病起着至关重要的作用,其他与1型糖尿病有关的基因如表2-1所示:表2-11型糖尿病相关联基因1型糖尿病想关联的多基因染色体定位连锁标志系统IDDM16p21HLADR/DQIDDM211pl5InsulinVNTRIDDM315q26D15S107IDDM411ql3MDU1,ZFM1,RT6,FADDIDDM56q24~27ESR,MnSODIDDM618ql2~q21D18s487,D18s64IDDM72q31D2s152,IL-1IDDM86q25~27D6s264,D6s446,d6s281IDDM93q21~25D3s13032、环境因素病毒感染、化学物质和饮食习惯等也是引起1型糖尿病的因素,其中病毒感染尤为明显。医学家根据长期的临床医疗诊断研究表明患者在1型糖尿病发病前经常有过病毒感染的经历。更为明显的迹象是在一些病毒流行之后往往会出现1型糖尿病的相对集中发病。另外一些化学物质也会对1型糖尿病有一定的影响,例如一些对β细胞有毒性的化学物质会破坏β细胞的组织结构,导致胰腺无法分泌胰岛素,人体组织无法从血液中摄取葡萄糖,从而诱发1型糖尿病。(2)2型糖尿病2型也称非胰岛素依赖型糖尿病(Non-Insulin-DependentDiabetesMellitus,NIDDM)。2型糖尿病是目前临床医疗中最为常见的一种糖尿病,其主要发病在中老年人群中,但近年来也呈现出低龄化的趋势。2型糖尿病的成因是胰腺可以分泌胰岛素,但是分泌量相对不足,不能够满足机体的需要,或者是胰岛素作用缺陷(胰岛素抵抗),而导致的血糖值升高。肥胖、不规律的饮食、缺乏体育锻炼、年龄增长、家族患糖尿病的历史、种族等都是引发2型糖尿病的因素。与1型糖尿病不同的是,2型糖尿病不依赖胰岛素治疗,主要是通过调节饮食、增加体育锻炼和服用一些降低血糖的药物来治疗。只有在极端情况下,才会通过注射胰岛素来治疗。引发2型糖尿病的先天因素少一些,后天社会生活环境因素的影响更多一些,如城镇化的发展、人口老龄化、生活水平提高体力劳动减少、饮食习惯的改变等等。近年来2型糖尿病发病人数增长很快,与人们的生活水平的改9 基于决策树的糖尿病诊断专家系统的研究与设计善有着密切的关系。2型糖尿病的发病机理如图2-2所示:图2-22型糖尿病发病机理1、遗传因素最新的医学研究结果表明遗传因素在2型糖尿病发病机理中起着更重要的作用。2型糖尿病比1型糖尿病更具遗传性。若父母双方都患有2型糖尿病,则遗传给子女的概率高达80%,这就是2型糖尿病的家族聚集现象。2、环境因素1)饮食习惯随着经济社会的发展生活水平的提高,人们的饮食习惯也发生了巨大变化。在以前生活水平不高的情况下人们主要吃的是比较素的低脂肪低蛋白食物,尤其是淀粉类的食品。但是现在人们的饮食高脂肪、高蛋白、高热量的食物摄入明显增加,这样就导致谷物类食物摄入量的减少。高脂肪高热量是食物容易导致血液浓度增加,不利于机体吸收血液中的葡萄糖尿病,从而引发2型糖尿病[27]。2)体力活动减少经济社会的发展给人们生活带来便利的同时也带来了一系列诱发糖尿病的因素。如交通工具的发展,减少了人们出行的不便,同时也减少了人们出行的运动量。互联网的发展给人们生活带来便利的同时,也减少了人们与之相关的活动10 第二章糖尿病及其属性提取的体力消耗。骨骼是人体内葡萄糖利用的最大器官,由于长期缺少足够的运动量,人体的骨骼和肌肉葡萄糖的利用率会大大降低,导致骨骼钙的流失和肌肉萎缩。同时由于缺少锻炼肌肉的脂肪量会增加从而导致肥胖,进而诱发2型糖尿病。3、其他因素肥胖也是导致2型糖尿病的重要诱因,尤其是在中老年人群中,超重和肥胖的人比标准体重的人更易患上2型糖尿病。从以上对1、2型糖尿病的分析可以看出导致糖尿病发病的因素有很多,其中家族遗传史是一个重要因素,因此本文把家族史作为糖尿病的属性之一。另外由于2型糖尿病主要发病的人群是中老年人,这与1型糖尿病主要发病在青少年不同,因此本文把年龄因素也作为糖尿病的一个属性。此外饮食、肥胖、病毒感染也作为诊断时的参考因素。(3)妊娠糖尿病妊娠糖尿病(GestationalDiabetesMellitus,GDM)是指妇女在妊娠期发生的葡萄糖耐量减退,而导致血糖值升高形成的糖尿病。如果是原有糖尿病患者妊娠称为糖尿病合并妊娠,这类糖尿病则不属于妊娠糖尿病范畴。妊娠糖尿病一般发病在孕妇妊娠的第6~7月,起病的原因可能是孕妇在妊娠期胎盘产生的某些供胎儿成长的激素抑制了胰岛素在母亲体内作用,使胰岛素的活性降低。由于妊娠也会导致糖尿病的发生,因此把妊娠作为诊断糖尿病的属性。(4)其他特殊型糖尿病青少年发病的成人型糖尿病(MaturityOnsetDiabetesofYoung,MODY),这类糖尿病的主要表现是青少年发病带成人特征的糖尿病,其一般年龄不超过25岁,体型消瘦,在家族3代以上连续出现。这种糖尿病出现的比例比较小,一般只占2%~5%。2.4糖尿病病程糖尿病病程分为四个阶段:1)糖尿病发病前阶段。2)糖尿病期。3)糖尿病慢性并发症期。4)糖尿病致丧残期。如图2-3所示。11 基于决策树的糖尿病诊断专家系统的研究与设计图2-3糖尿病病程糖尿病是一种慢性疾病,糖尿病发病前阶段潜伏期比较长,一般可达10年。糖尿病期的诊断标准是血糖值已经达到可确定为糖尿病阶段。糖尿病慢性并发症期开始出现各种并发病。糖尿病致丧残期是糖尿病的终末阶段,对于糖尿病控制不良的会导致器官衰竭严重者会致残致死。2.5糖尿病并发症糖尿病是一种慢性病症。通常1型糖尿病起病比较急症状明显,容易出现酮症酸中毒。2型糖尿病起病比1型糖尿病更缓慢一些,不容易察觉。2型糖尿病早期症状不明显,但随着病情的加重会出现三多一少症状,如多饮、多食、多尿、体重减轻等。有时可能直到导致心血管、脑血管等并发症以后才会被发现确诊。糖尿病的并发症一般有以下几种[28]:(1)糖尿病酮症酸中毒。(2)心血管疾病。糖尿病会导致心血管疾病。伴随出现的还有心绞痛、心脏病发作、卒中、外周动脉疾病等。(3)肾脏疾病。糖尿病会引起肾脏病变。患有糖尿病人比没有糖尿病患更容易发生肾脏病变。肾脏疾病包括肾小管肾病、肾盂肾炎等。(4)眼病。长期的高血糖、高血压会导致眼部病症的发生,典型的是视网膜病变。12 第二章糖尿病及其属性提取(5)神经损伤。由于糖尿病患者的血糖和血压长期得不到很好的控制,就会导致神经组织损伤,通常发生病变的部位是四肢尤其是足部,表明为疼痛、麻木甚至丧失知觉。知觉丧失会使患者身体对的某些触觉的反应迟钝和麻木不能够及时感知到自身的某些损伤,导致伤口感染溃烂,严重会导致截肢。由于1型糖尿病和2型糖尿病的并发症的表现不同,诊断时可明显区别这两类糖尿病,因此把并发症作为糖尿病的诊断属性之一。2.6糖尿病诊断标准目前糖尿病的诊断标准:世界卫生组织标准有下列任何l项即可诊断糖尿病:1)有典型症状的,如多饮、多尿、多食、消瘦、乏力等,则要求空腹血糖值≥7.8mmol/L,任何时候血糖值≥11.1mmol/L可诊断为糖尿病。2)空腹血浆血糖不止一次≥7.8mmol/L。3)空腹血浆血糖为临界值:口服葡萄糖耐量试验(OGTT)后两小时以内有1次以上≥11.1mmol/L可确诊为糖尿病。如表2-2所示。表2-2世界卫生组织给出的糖尿病诊断标准诊断口服葡萄糖耐量试验静脉血浆葡萄糖水平mmol/L(OGTT)糖尿病(DM)空腹≥7.8餐后2小时≥11.1糖耐量受损(IGT)空腹<7.8餐后2小时≥7.8~<11.1空腹血糖调节受损(IFG)空腹≥5.6~7.8餐后2小时<7.82.7糖尿病属性提取由上述分析可知,造成糖尿病发病的因素有很多,本文根据每一种糖尿病的特征提取出最能区分不同糖尿病的属性包括:性别、年龄、症状、并发症,家族史、妊娠等。同时把饮食习惯、肥胖、病毒感染也作为诊断时的参考因素。2.8本章小结本章主要介绍糖尿病相关知识,分别从糖尿病的分型、病因与发病机制、病13 基于决策树的糖尿病诊断专家系统的研究与设计程、临床表现和并发症、诊断标准等方面对糖尿病进行了研究和分析,提取出用于建立决策树所需的糖尿病属性。14 第三章专家系统关键技术研究与分析第三章专家系统关键技术研究与分析3.1专家系统简介专家系统中的“专家”是指在某领域中能解决专门问题的专业人士,他们具有比较丰富的专业知识、理论技术和实践经验,具有独特的思维方式和分析问题解决问题的能力[29]。专家系统背后的想法就是将掌握大量专业知识的专家,由人转换为计算机。专业知识存储在计算机中,当用户需要用到专业知识来解决特定问题或任务的时候就唤醒计算机,计算机可以利用知识做出推理并得到一个特定的结论。这样就得到了一个类似于人类专家给出的建议或结论,而且还可以根据需要解释这些结论背后的逻辑依据。对于用传统常规的方式无法解决的一些问题,专家系统可以提供一些更有力更灵活的方法[30],尤其在决策支持和问题求解方面。专家系统的特点主要有以下几点:(1)启发性。专家系统具有获取知识和自主学习的能力,它可以运用专家领域知识经验进行推理、判断和决策,它可以总结规律模并拟人类专家的智能并对其进行延伸和扩展。(2)灵活性。专家系统可以不断的调整其所使用知识,不断增加修改知识,使用的灵活性很高,可以运用在各个领域。由于其灵活性特点,使其也有利于专家知识的保存和传播。(3)透明性。专家系统具有交互和解释机制,使用其在推理过程中的可以回答用户的提问,并给出系统推理过程的解释,增加了系统的可信度。3.2专家系统体系结构专家系统的体系结构是指专家系统各组成部分的构造方法和组织形式。由于的实际应用领域各不相同,因此专家系统的结构也是多种多样。要根据系统应用的环境和执行的任务选择合适组织结构,一般来说程序最好采用模块化结构,以便系统的功能有扩展的可能性[31]。通常基本的专家系统结构如图3-1所示,包括人机接口、推理机、解释程序、知识获取程序、综合数据库、知识库六大部分。15 基于决策树的糖尿病诊断专家系统的研究与设计图3-1专家系统结构3.2.1知识库知识库是以一种特定形式存储领域专家知识的集合。以何种形式表示知识是建立知识库的关键。知识库还负责是把用自然语言知识转化为计算机可识别的形式化知识。本文中设计的知识库存放着在糖尿病数据集上学习所得到的决策树模型。知识工程师可以对知识库进行维护,更新从糖尿病医疗专家处收集整理的专业诊疗知识。这些知识包括糖尿病的成因、并发症以及相关的案例等,同时还包括一些治疗性知识。当系统开始推理诊断时把决策树一次性调入内存,系统通过与用户对话,推导出患者得的糖尿病并给出治疗方案。3.2.2综合数据库综合数据库也称全局数据库用于存放在系统在推理过程中产生的中间性或者临时性数据,同时也包括一些辅助信息等。本系统中综合数据库用于记录患者的病例信息以及治疗方案等。3.2.3推理机推理机是专家系统的“大脑”[32],它在控制策略下模拟糖尿病医疗专家的思维过程,结合综合数据库中的已知事实,对知识库中的决策树进行遍历匹配。本系统基于决策树采用正向推理,即数据驱动推理方法,从患者的症状、并发症及16 第三章专家系统关键技术研究与分析相关检测化验数据出发推出诊断结果。3.2.4知识获取机制知识获取机制包括自动获取和人式获取,主要是获取知识数据以形成可以使用的知识库。本系统从糖尿病数据集中对糖尿病知识进行识别和选取,删除脏数据和多余属性,然后进行决策树学习将其转换成计算机可识别的形式,并不断完善知识库。3.2.5解释程序解释程序是对系统的推理过程和推理依据作解释,以增加用户对系统的信任度。本系统采用路径追踪法,即对系统求解过程中遍历过的决策树节点依次记录下来,在推理完成之后对这些信息进行显示。3.2.6人机接口人机接口即人机界面,是人机交流的桥梁,用户通过人机界面输入专家系统所需的数据和信息,系统通过人机界面显示结果和相关解释信息。3.3知识获取知识获取是指从知识源获取专门知识用于专家系统的推理,并对知识进行整理,运用适当的形式表示为计算机可以识别的形式[33]。专家系统知识的来源称着知识源,知识源有很多例如相关专家及其知识经验、文献参考书籍、实验数据和系统自身运行情况记录等。知识获取包括四个步骤首先抽取知识,然后对抽取的知识运用适当形式进行表示,再输入知识,最后对知识检测和核对。知识获取的过程如下图3-2所示:图3-2知识获取过程(1)抽取知识17 基于决策树的糖尿病诊断专家系统的研究与设计抽取知识是利用适当的方法把蕴含在知识源中的知识提取出来,以便建立可用的知识库。通常自然语言知识不能直接拿来给计算机使用,这需要对知识进行抽取,抽取出有规律的形式化的知识。对知识进行抽取需要做大量的工作。例如,对领域专家,虽然他们可以利用自己的经验解决该领域中的各种困难问题,但他们往往缺少对自己经验的归纳与总结,甚至有些经验是只可意会不可言传的。另一方面,如果要求系统在运行过程中具有自学习的能力从已知实践经验中归纳总结出新的知识,这就对知识抽取的设计提出了更高的要求。(2)表示知识知识源中的知识通常不是计算机可识别的形式,它往往以自然语言或者图表形式存在。为使专家系统能够使用从知识源中的抽取出来的知识,需要首先把这些知识用计算机能够理解的形式表示出来。(3)输入知识知识输入是指经过抽取和以适当的形式表示知识后输入计算机的过程。在输入的过程中有很多方法,对于简单、方便、无须特殊处理的知识可利用已有的通用计算机编辑软件进行输入操作,对于针对性强有特殊要求的知识可专门编写专用的程序进行输入操作。(4)检测知识知识的有效性和正确性对专家系统的推理有着重大的影响,因此需要对输入知识库的知识进行检测和验证。以保证知识库有良好的正确率。3.4知识表示知识表示是专家系统的核心,选择适当的知识表示方法不仅关系到知识的存储还影响到推理机的推理效率[34]。好的知识表示方法要与问题贴近,要有利用于问题的求解[35]。知识表示就是将自然语言知识进行组织形成计算机可识别的符号化形式[36]。对计算机而言,知识表示就是用计算机的语言如特定的编码、符号来表示人的自然语言,在这个过程中通常需要建模以实现面向计算机的数据结构。经过处理的问题得以解决后,计算机再利用知识的表示方法把内部只有计算机才能够别的知识还原成自然语言,以供人类使用。这一过程如图3-3所示:18 第三章专家系统关键技术研究与分析图3-3知识表示的一般过程知识表示必须要确保计算机可识别可读取,这就要求知识表示要具有可行性。在这一基础上知识表示还有一些需要注意的问题:1)适当性。知识表示要符合具体问题的实际,要有利于问题的求解,不宜过于复杂增加知识处理的工作量,也不宜太过简单导致计算机无法有效识别。2)高效性。专家系统要能够快速检索知识,知识表示就需要高效,简单形式不需要过多的控制条件。知识表示有效有利于算法的执行的效率的提高。3)可理解性。知识表示要在利于人类的理解,可以很方便的转换成自然语言。4)无歧义性。知识表示应当确保结果唯一,无论以何种方式表示结果应当是无歧义的。常用的知识表示方法有如下几种。(1)产生式表示法这种知识表示方法可以描绘各类知识之间的因果关系,它通过“认识→行动”的形式来表示人类求解问题的基本特征[37]。事实性、过程性、确定性、不确定性知识都可以运用产生式表示出来。一般产生式规则表示形式如下IFPTHENQ(如果P则Q)或者P→QP是前提也称前件,由事实构成;Q是结论或操作也称后件。产生式的含义是:如果P前提满足则得出Q结论或者执行Q操作。(2)语义网络表示法语义网络是一种结构化的知识表示方法,它把知识用图解形式表示出来,图由节点和弧线构成。节点代表实体、概念、情况等,弧线代表语义。一个语义基元可用三元组(顶点1,边,顶点2)来表示。一个基本的语义单元如图3-4所示,A、B表示顶点,R表示两者之间的某种关系。19 基于决策树的糖尿病诊断专家系统的研究与设计图3-4基本语义单元(3)框架表示法人们在认识新事物的过程中往往会套用自己经历过的已有的知识结构,这种结构就是框架。由于人们所经历事物和学到的知识量巨大,无法把具体的细枝末节全部存放在大脑中,只能抽象出一个轮廓一个框架,每当遇到新事物时,就会迅速搜索出一个个框架用新事物的具体细节去填充框架形成对新事物的认知。例如当一个人去一个陌生学校时,他会想到学校有教学楼、教室、食堂、操场等,而这些建筑具体细节和风格他无法知道,只有走进学校亲眼看到才会知道。但是这样一种知识结构却是事先可预见的。3.5决策树知识表示模型决策树是一种实现分治策略的层次数据结构,它能够有效的进行非参数学习,优点是层次表达能力强,对噪声和不完整属性有很好的健壮性,同时决策树的遍历和搜索的速度也比较快。而且以决策树形式表示的知识还可以避免规则的冲突和冗余。同时决策树的存储形式比较简单,只要将树的节点作为一个实体包含不同属性存储起来,这种存储方式所占用的存储空间也比较小,所以其在工程实践中的可用性很强。对糖尿病属性数据进行学习,表示成决策树形式,系统可以方便地对决策树的节点实施匹配与遍历。构造决策树的关键是选择合适的属性和确定节点的划分规则[38]。决策树是逐层构建的,每一层都选择一个最优的属性作为分裂属性。在决策树的构造过程当中,首先计算每个属性分类训练样例的能力,这样就量化了属性的分类能力,然后选择分类能力最强的属性作为根节点的测试属性。接着根据根节点属性值的个数产生同等数量的分支进行分裂,然后把具有相同属性值的样例安排在相应的分支下。重复执行这样一个过程,在每个新的分支下排放的实例中选择分类能力最强的属性作为新节点的测试属性。结束整个过程执行的条件有两个:一、所有训练样例都被归为同一类,二、没有剩余属性可使用。对于缺少属性的训练样例,可以把该节点的训练样例中该属性最常见的值赋给它。ID3算法是决策树学习中较为流行的算法,算法的理论清晰,方法简单,学习能力较强,在此采用该算法。ID3算法通过学习,自上而下地构造决策树[39]。ID3算法的核心是确定何种属性作为建树过程中节点的测试属性[40],在此引出信息增益的概念。信息增益:是指在对数据进行操作前和操作后熵的差值。熵的减20 第三章专家系统关键技术研究与分析小,信息增益的增加意味着信息无序性的减小。熵是描述事物无序性(或不确定性)的度量指标,熵越大则无序性越强,在信息领域定义为“熵越大,不确定性越大”。构造树的基本想法是逐步使节点的熵减小[41]。设有C个不同类的样例集S,则熵的定义为[42]:cEntropy(S)Pilog2Pi(4-1)i1公式4-1中,Pi是样例集S中任意样例属于类别i的比例。一个属性A相对样例集合S的信息增益Gain(S,A)可定义为:|S|(,)()v()(4-2)GainSAEntropySEntropySVvValues(A)|S|公式4-2中,Values(A)是属性A的值域,Sv是S在属性A上的值为v的子集,即Sv={s∈S|A(s)=v}。上式值越大说明选择属性A对于分类提供的信息越大。ID3算法在建树的过程中每一步都选择信息增益最大的属性作为树节点的测试属性。但熵函数也不足之处,它的缺点是更倾向于选择属性值数量多的属性[43]。例如:A属性有两个属性值,B属性有三个属性值,则熵函数会偏向选取B属性。然而属性B在判断病情的时候并不一定比A属性更有价值,如年龄的属性值的数量会有很多,但它在判断病情的时候并不一定是最重要的。由此本文采用二叉树作为决策树的模型来解决这个问题,这样使得在建树的过程中各属性具有相同的机会被选中作为测试属性,同时也可以避免规则的冲突和冗余,便于诊断过程中对决策树节点进行匹配和遍历[44]。对于出现信息增益相同的情况时,本文采用权值表来选择进行下一步分类的属性。3.6本章小结本章对专家系统进行了深入的分析和介绍,设计了专家系统的各组成部分,同时又研究了几种常见的知识表示方法,指出了其各自的缺点,从而引出本文所采用的决策树知识表示和推理方法。21 基于决策树的糖尿病诊断专家系统的研究与设计第四章决策树模型的建立4.1基于糖尿病属性决策树的建立上一章对决策树知识表示模型的研究和分析后,本章通过决策树学习糖尿病属性建立决策树模型来表示糖尿病知识以形成专家系统知识库。本文采用国家临床科学数据中心2014年5月发布的糖尿病数据集(http://www.datatang.com/org/2572628/r020-p2),该数据集是某医院2009年就诊病例记录,包含诊断表(76731条记录)、检验表(446240条记录)、处方表(213495条记录),生命体征记录表(671017条记录)等。其中诊断表部分数据如图4-1所示。图4-1诊断表源数据截图根据上文第二章提取的糖尿病属性包括性别、年龄、症状、并发症、家族史、妊娠对数据集进行预处理:(1)删除多余属性。(2)对属性进行离散化,如年龄属性只保留大于等于30和小于30两个值。(3)使用均值或出现频率最高的属性值填充空缺属性值。经过预处理后保留789条记录。例如图4-1数据经过处理后如表4-1所示,ID3算法可以从这个数据集属性中学习建立起决策树模型。22 第四章决策树模型的建立表4-1处理后的糖尿病数据序号性别年龄症状并发症家族史妊娠糖尿病类型1女>=30明显无有否2型2男<30明显有有否1型3男<30明显无有否1型4男>=30明显无有否2型5男<30不明显有无否1型6女>=30不明显无有否2型7女<30明显无有是妊娠型8男<30不明显无有否特殊型9女>=30不明显有无否2型10男>=30明显有无否1型11女<30明显有有否1型12男>=30明显无有否2型13男>=30明显无无否2型注:症状是指多饮、多尿、多食、明显消瘦,体力减少等典型症状。并发症指有较明显的酮症酸中毒,眼底视网膜病变、肾脏病变和神经病变并发症等。家族史指亲属有患糖尿病历史的。决策树模型的建立过程如下:设表4-1训练样例集合为S,样例个数为13,其中糖尿病类型为1型的有5例,2型的有6例,妊娠型的有1例,特殊型的有1例,则集合S的熵为:cEntropy(S)=pilog2pii1=-p1型log2(p1型)-p2型log2(p2型)-p妊娠型log2(p妊娠型)-p特殊型log2(p特殊型)55661111=-log2()-log2-log2-log21313131313131313=1.616如果按性别属性划分训练样例,则性别=男的样例中,糖尿病类型为1型的有4例,2型的有3例,妊娠型的有0例,特殊型的有1例,其熵为:Entropy(S,男)=-p1型log2(p1型)-p2型log2(p2型)-p妊娠型log2(p妊娠型)-p特殊型log2(p特殊型)44330011=-log2()-log2()-log2()-log2()88888888=1.406而性别=女的样例中,糖尿病类型为1型的有1例,2型的有3例,妊娠型的有1例,特殊型的有0例,其熵为:Entropy(S,女)=-p1型log2(p1型)-p2型log2(p2型)-p妊娠型log2(p妊娠型)-p特殊型log2(p特殊型)11331100=-log2()-log2()-log2()-log2()55555555=1.370所以按性别属性划分训练样例,其信息增益为:23 基于决策树的糖尿病诊断专家系统的研究与设计|Sv|Gain(S,性别)=Entropy(S)-Entropy(S)vv{男,女}|S|85=Entropy(S)-Entropy(S,男)-Entropy(S,女)1313=0.224同理:76Gain(S,年龄)=Entropy(S)-Entropy(S,>=30)-Entropy(S,<30)1313=0.71994Gain(S,症状)=Entropy(S)-Entropy(S,明显)-Entropy(S,不明显)1313=0.19258Gain(S,并发症)=Entropy(S)-Entropy(S,有)-Entropy(S,无)1313=0.38594Gain(S,家族史)=Entropy(S)-Entropy(S,有)-Entropy(S,无)1313=0.096112Gain(S,妊娠)=Entropy(S)-Entropy(S,是)-Entropy(S,否)1313=0.393从以上各属性信息增益计算结果可以得出属性年龄的信息增益最大为0.719,年龄属性是最佳分类属性,所以选择年龄作为决策树的根节点如图4-2所示:图4-2选择年龄作为决策树的根节点按年龄属性把训练样例集S划分成为S1,S2两个子集,下面就要考虑从S1,S2两个子集中分别选择除年龄以外的其他属性作为进一步分类的属性,重复上面的计算过程:11660000Entropy(S1)=-log2()-log2()-log2()-log2()77777777=0.59224 第四章决策树模型的建立11330000Entropy(S1,男)=-log2()-log2()-log2()-log2()44444444=0.81100330000Entropy(S2,女)=-log2()-log2()-log2()-log2()33333333=043Gain(S1,性别)=Entropy(S1)-Entropy(S1,男)-Entropy(S2,女)77=0.129同理:Gain(S1,症状)=0.076Gain(S1,并发症)=0.306Gain(S1,家族史)=0.199Gain(S1,妊娠)=0从上述各属性的计算结果可以看出在样例集S1中,属性并发症信息增益最大,并发症属性是最佳分类属性,因此S1选择并发症作为其分类属性进一步划分。同上:样例集S2中,各属性的信息增益分别为:Gain(S1,性别)=0.380Gain(S1,症状)=0.380Gain(S1,并发症)=0.462Gain(S1,家族史)=0.112Gain(S1,妊娠)=0.652因此选择妊娠属性作为样例集S2的分类属性进一步划分。如图4-3所示:图4-3选择并发症、妊娠分别作为S1、S2的分类属性从上图可以看出此时决策树学习过程中已经出现了叶节点,即糖尿病的类25 基于决策树的糖尿病诊断专家系统的研究与设计型。重复以上学习过程可进一步得到:Gain(S11,性别)=1Gain(S11,症状)=1Gain(S11,家族史)=0Gain(S11,妊娠)=0此时出现属性增益值相同的情况,在此对算法进行改进,用权值表来解决属性增益值相同的问题。根据医学专家给出的各属性与糖尿病诊断相关性的一个权值表来选择最佳属性。如表4-2所示:表4-2属性权值表属性性别年龄症状并发症家族史妊娠权值0.10.50.70.60.40.3根据上表,在性别和症状信息增益值相同的情况下选择权值较高的症状属性作为S11的分类属性。继续计算机S22各属性的信息增益:Gain(S22,性别)=0.073Gain(S22,症状)=0.322Gain(S22,并发症)=0.322Gain(S22,家族史)=0.073根据表2,在症状和并发症信息增益值相同的情况下选择权值较高的症状作为S22的分类属性。进一步分类,如图4-4所示:图4-4选择症状作为S11和S22的分类属性此时仅有样例集S222内分类,继续选择分类属性。Gain(S222,性别)=0Gain(S222,并发症)=126 第四章决策树模型的建立Gain(S222,家族史)=1由于并发症和家族史有相同的信息增益,因此根据表2权值的不同选择并发症作为S222的分类属性,最终形成决策树如图4-5所示:图4-5最终生成的决策树决策树由一些内部决策节点和终端叶结点组成。决策树从根节点到任意一个叶节点的路径对应一个合取式,而整颗树是这些合取式的析取[45]。决策树算法用Java编程实现结果如图4-6所示:图4-6决策树算法Java实现结果27 基于决策树的糖尿病诊断专家系统的研究与设计4.2实验分析本文在预处理后的数据集上选取部分病例数据作为训练集,训练建立起决策树。然后再选取部分病例数据作为测试集,对决策树进行推理预测测试。其中训练集所占整个空间的比例=训练集合数/全体数据集数。成功率=(测试集合数-预测错误数)/测试集合数。测试结果如表4-3所示:表4-3实验结果训练集合大小占整个空间比例测试集合大小预测错误数成功率500.063400990.7521000.127400330.9183000.38040080.9805000.63440060.9857000.88740010.997由实验可以看出,当训练集较大时,决策树对糖尿病诊断分类准确率比较高,预测分类的错误数在可接受的范围内,满足系统要求。4.3本章小结本章主要介绍了用决策树模型表示糖尿病知识规则。首先通过ID3算法建立起二叉决策树模型,把糖尿病知识规则用决策树表示出来,然后结合本课题实际对学习过程进行改进,采用权值表来选择具有相同信息增益值的属性,最后通过实验测试的方式表明这些经过训练建立起来的决策树模型对未知糖尿病病例具体较好的分类预测性。28 第五章系统设计与实现第五章系统设计与实现5.1系统分析5.1.1系统设计目标上一章通过决策树学习算法建立起诊断树模型,形成糖尿病诊断专家系统的知识库。有了专家知识库作为基础,便可开发出糖尿病诊断专家系统。本系统设计的主要目标与任务有:(1)采集专家知识,建立决策树模型。(2)基于这些知识对一些新的病例进行诊断,并能够给出治疗方案。(3)管理知识库及用户信息。5.1.2需求分析(1)业务需求马鞍山桃园社区医院需要一种能够帮助医疗诊断糖尿病的软件系统。(2)功能需求1)系统登录功能,从登录开始就有不同的权限。2)诊断功能,用户输入相关信息,系统输出诊断结果3)载入病例功能,对已有的病例可进行重新载入。4)打印病例功能,诊断结束后可以打印病例。5)知识库管理功能,可以对知识库进行维护和更新。6)用户信息管理功能,可以增加、删除用户,也可以修改用户信息。系统提供两种不权限的用户功能:1)普通用户。普通用户就是糖尿病诊断专家系统的使用者,医生可以使用系统对患者进行诊断治疗,糖尿病患者也可以利用该系统进行自查自诊。2)管理员用户。管理员用户,可以对系统进行维护,包括知识库的更新和用户信息的管理。5.2开发技术与软硬件平台本系统采用C/S结构,开发技术的选择上,选择了现今比较流行的JavaSwing编程技术,Swing是不包含本地代码的轻量级组件,因此Swing组件可以不受硬件平台的限制,具有更多的功能、更强的适应性。如:Swing中的按钮和标签不29 基于决策树的糖尿病诊断专家系统的研究与设计仅可以显示文本信息还可以显示图标,或同时显示文本和图标;大多数的Swing组件还可以添加和修改边框;Swing组件的形状是可以任意设置的,而不仅限于长方形。系统的数据库选用Microsoft公司的SQLServer2008。SQLServer2008数据库平台是Microsoft公司经过多年打造出来的,该产品提供了简单易用的界面,丰富的服务集合来与数据交互作用,包括搜索、查询、数据分析、报表和数据整合等[46]。系统开发的软硬件平台如下:1)硬件平台:联想M715E;处理器,英特尔Pentium双核E6600@3.06GHz;内存,2GB(DDR31333MHz);主硬盘,500GB(HDS7210050CLA362)。2)操作系统:MicrosoftWindows73)开发平台:Eclipse4.54)开发语言:Java5)数据库平台:MicrosoftSQLServer20085.3系统推理机制推理的关键是逻辑关系和推理策略的选择,推理策略就是选择合适的规则从已有的知识出发来推理出另外一种结论[47]。在糖尿病诊断专家系统中,现有的知识规则是基础,在这个基础上选择何种推理控制策略是实现专家系统的关键。推理控制策略包括推理方向、搜索策略等。推理方向用于确定推理的驱动方式。本系统采用正向推理方式,即数据驱动推理方式。正向推理是从条件推出结论的方向进行推理[48]。在本系统中,按照由症状推出诊断结果的方向进行的推理方式。一颗决策树从树的根节点到一个叶子节点就对应一条规则,整颗树就是若干条规则的析取。一个病人是一个对象,他的各项指标就是他的属性,他得的病就是目标问题。本系统首先根据病人的基本症状搜索决策树,再根据在综合数据库中给出的已知事实,正向使用规则遍历决策树,树的遍历过程就是规则与已知事实的匹配过程。若有多条规则可用,则采用队列优先级原则,将执行规则的结论添加到综合数据库中,并将用过的规则置上激活标志,直到得出诊断结果或没有可用规则为止。在系统的推理机的设计中,把诊断决策树中的所有节点对象存储在关系型数据库中,节点对象之间的逻辑关系即指针通过其父节点编号以及父节点到子节点之间的状态来实现,糖尿病诊断推理规则包含在对象之间的逻辑关系中。推理过程中会遇到三种状态:(1)当前节点是决策树的根节点;30 第五章系统设计与实现(2)当前节点是决策树的判断节点;(3)当前节点是决策树的叶节点。推理算法如下:①根据用户输入的症状从知识库中选择决策树,Ttee*T,T=root,Initstack(S);②P=P->Rchild;//进入根节点的下层节点,根节点下只有一个子节点,默认为右子节点③if(当前节点是判断节点){if(P未入过栈)//即P->Flag=false{Push(S,P);P->Flag=true;}else//P已经入栈{回答判断节点所提出的问题;if(回答==否)P=P->RChild,goto③;//进入下层右子节点,转到③else(回答==是)P=P->LChild,goto③;//进入下层左子节点,转到③}}elseif(当前节点是叶节点){结出诊断结果;if(用户满意)诊断成功,给出诊断结果;elseif(栈为空)诊断失败,结束;else判断节点出栈,Pop(S,P),goto③;}5.4系统详细设计5.4.1系统流程图流程图通过线框图形方式描述系统功能的处理过程,主要描述功能的执行顺序、分支和循环的逻辑。31 基于决策树的糖尿病诊断专家系统的研究与设计本系统的流程图作业如图5-1所示。图5-1糖尿病诊断专家系统诊断流程图5.4.2系统用例图用例图是一种UML的类图表示方式,其从用户角度描述系统的功能,并指出用户在系统功能中的操作权限。本系统用户角色及其权限描述如表5-1所示。系统用例图如图5-2所示。表5-1系统角色及角色说明角色(参与者)角色描述普通用户诊断权限管理员修改知识库、管理用户权限32 第五章系统设计与实现图5-2糖尿病诊断专家系统用例图分析5.4.3系统数据库表设计数据库中数据表的设计是专家系统的核心之一,合理设计数据表及表的结构可以提高系统的访问速度,提高系统的运行效率。本系统数据库中表的结构图5-3所示。图5-3系统表其中UserInformation表用于存储用户信息主要字段包括用户名、密码和权限,如表5-2所示,其在数据库的存储内容示例如图5-4所示。33 基于决策树的糖尿病诊断专家系统的研究与设计表5-2UserInformation表列名数据类型主键非空Namenchar(10)是是Passwordnchar(20)否否Typenchar(10)否否图5-4UserInformation表内容示例MedicalRecord病例表用于存储患者信息包括病例号、姓名、性别、年龄、实验检查血糖值、症状、并发症、家族史、妊娠及其他信息等,如表5-3所示,内容示例如图5-5所示。表5-3MedicalRecord表列名数据类型主键非空MedicalRecordIDnchar(11)是是Namenchar(10)否否Sexnchar(4)否否Ageint否否Glucosefloat否否Symptomnchar(10)否否Complicationnchar(10)否否FamilyMedicalHistorynchar(10)否否Gestationnchar(4)否否othernchar(100)否否图5-5MedicalRecord表内容示例34 第五章系统设计与实现DecisionTree表用于存储决策树也即专家系统知识库。本文将决策树每个结点作为一个实体存储在数据库中。其节点属性包括ID(节点编号)、NodeType(节点类型)、AttributeName(属性名)、AttributeValue(属性值)、Parent(父节点编号)、LeftChild(左子节点编号)、RightChild(右子节点编号)、Note(备注)如表5-4所示,内容示例如图5-6所示。其中节点类型分为三类:1)root(根节点)2)judge(判断节点)3)leaf(叶节点)每一个节点在数据库中对应一条记录。决策树所有节点的记录就构成了专家系统的知识库。把所有决策树节点存放在一个数据库简表中,节点位置在表中相对固定,通过节点指针(节点ID)指向节点所在位置,这使得系统可很快根据症状信息找到诊断树和节点,并根据指针表遍历决策树,从而节省了大量的搜索时间。表5-4DecisionTree表列名数据类型主键非空IDnchar(5)是是NodeTypenchar(10)否否AttributeNamenchar(10)否否AttributeValuenchar(10)否否Parentnchar(5)否否LeftChildnchar(5)否否RightChildnchar(5)否否Notenchar(50)否否图5-6DecisionTree表内容示例35 基于决策树的糖尿病诊断专家系统的研究与设计Conclusions表存储诊断结果,其是根据采集患者的症状等信息通过决策树遍历算法从知识库即DecisionTree表搜索出患者所得的糖尿病类型,并给出相应的治疗方案,如表5-5所示,内容示例如图5-7所示。表5-5Conclusions表列名数据类型主键非空MedicalRecordIDnchar(11)是是Namenchar(10)否否Conclusionnchar(50)否否Treatmentsnchar(1000)否否图5-7Conclusions表内容5.5系统功能实现本系功能模块有诊断、知识库管理、用户管理、帮助等。系统各功能整体关系如图5-8所示:图5-8系统功能关系图本系统的程序结构图5-9所示:36 第五章系统设计与实现图5-9专家系统的程序结构图(1)登录功能界面:是系统的入口,主要包括用户名、密码等,其中最为关键是用户类型的选择,不同用户类型有着不同的权限,从而实现对本权限内不同功能的操作,不同权限之间不可交叉操作,以保证系统的安全性、稳定性和可靠性。登录界面如图5-10所示:图5-10系统登录界面(2)主界面:登录成功后进入主界面,主界面从登录入口处获得用户权限参数,并根据用户权限开放和屏蔽相应的功能。主界面如图5-11所示:37 基于决策树的糖尿病诊断专家系统的研究与设计图5-11系统主界面(3)诊断功能界面:主要记录患者的主诉及体征信息,当单击开始诊断按钮后,把病人的信息存入病例数据库中,同时触发推理机制,根据各种参数搜索知识库,给出诊断结果和治疗方案。如图5-12所示:图5-12诊断功能界面(4)病例报告界面:是在以上诊断过程结束后生成的病例报告单。如图5-13所示:38 第五章系统设计与实现图5-13病例报告界面(5)载入病例功能界面:用于查询已有病例。如图5-14所示:图5-14载入病例功能界面(6)知识库管理界面:用于对专家系统知识库进行维护管理,可以对决策树进行修改。如图5-15所示:39 基于决策树的糖尿病诊断专家系统的研究与设计图5-15知识库管理界面(7)用户信息管理界面:是管理员对用户信息进行管理的界面,可添加、删除用户,可以对现有用户信息进行修改。如图5-16所示:图5-16用户信息管理界面以上界面为糖尿病诊断专家系统的主要界面。本系统已经成功应用于马鞍山桃园社区医院,帮助医务人员诊断治疗社区居民的糖尿病。5.6本章小结本章主要是在上一章基础上,具体实现专家系统。首先介绍需求分析,其次设计糖尿病专家系统的推理机制和推理算法,最后按照软件工程的开发流程一步步实现专家系统,流程图、用例图、数据库数据表、系统编码实现等。本章主要40 第五章系统设计与实现用Java编程语言实现专家系统前台的界面,用SQLServer2008实现专家系统的后台数据库,包括知识库、综合数据库等。41 基于决策树的糖尿病诊断专家系统的研究与设计第六章总结与展望专家系统的方法和应用是一个广泛的研究课题,为糖尿病的诊断和治疗提供了一种有效的工具和手段。本文为解决马鞍山桃园社区医院诊治糖尿病的实际需求,结合专家系统理论方法,研制开发了糖尿病诊断专家系统,为社区医院医务人员提供诊断治疗的辅助工具。为研发糖尿病诊断专家系统,本文所做的主要工作有:(1)研究决策树理论介绍熵和信息增益的概念,对于熵函数的缺点倾向于选择属性值数量多的属性,本文结合课题实际对决策树进行改造,采用二叉树作为决策树模型,使所有待学习属性有同等机会被熵函数选中。同时在决策树学习过程中出现的信息增益值相等的情况,根据属性与糖尿病的相关性即权值表中属性的权值来优先选择待测试属性,对学习过程进行优化和改进。(2)分析糖尿病的诱发因素和发病机理,提取出诊断糖尿病的属性包括性别、年龄、症状、并发症、家族史、妊娠等作为决策树学习基础。(3)对糖尿病诊断数据集进行预处理,删除不必要属性,对属性进行离散化,使用均值或出现频率最高的属性值补充空缺属性值,使数据集符合决策学习的要求。(4)在糖尿病数据集上进行决策树学习建立起诊断决策树模型,通过实验验证决策树模型的有效性。(5)设计糖尿病诊断专家系统的系统结构及各组成部分包括知识库的存储和表示方式,推理机制,推理方向等。把通过学习建立的决策树模型存储在关系数据库中作为整个系统的知识库,每个决策树节点作为一条记录,各结节之间的逻辑关系用节点编号表示。最后运用软件工程思想设计系统的各功能模块,采用C/S结构,在Ecelipse平台下开发出了糖尿病诊断专家系统,并应用到马鞍山桃园社区医院用于糖尿病的防治。由于能力有限本文尚存在一些不足需要在今后的工作中继续研究。(1)本文研究的糖尿病诊断专家系统的知识获取主要还是采用人工获取的方式,后续工作需要持续对知识库进行维护和更新,因此本课题将继续研究知识的自动获取方式,以提高系统的智能化程度。(2)本文开发的专家系统跨越了不同的学科,需要对医学领域糖尿病知识进行深入学习,更加科学的提取出糖尿病诊断的属性,同时还需要进一步研究跨学科专家系统的开发技术。(3)随着云计算和大数据的发展,今后将进一步研究把云计算和大数据相结合开发专家系统。42 参考文献参考文献[1]武波,马玉祥.专家系统[M].修订版.北京:北京理工大学出版社,2003:9-16.[2]钱宗才,屈景辉,刘敬华,周智明,李志宏,张国鹏.专家系统知识表示及其在医疗诊断系统中的应用[J].医疗卫生装备,2003,25(10):120-123.[3]迟家敏.实用糖尿病学[M].第4版.北京:人民卫生出版社,2015:1-5.[4]施鸿宝,王秋荷.专家系统[M].西安:西安交通大学出版社,1990:3-4.[5]杨兴,朱大奇,桑庆兵.专家系统研究现状与展望[J].计算机应用研究,2007,24(5):4-9.[6]蔡自兴,王勇.智能系统原理、算法与应用[M].北京:机械工业出版社,2014:4-9.[7]陈世福,陈兆乾.人工智能与知识工程[M].南京:南京大学出版社,1997:82-90.[8]张绍兵,季厌浮,高志军.基于神经网络专家系统的研究与实现[J].计算机工程与科学,2008,30(4):156-158.[9]AsifIqbal,NaeemUllahDar.Optimalformationoffuzzyrule-baseforpredictingprocess’sperformancemeasures[J].ExpertSystemswithApplications,2011(38):4802-4808.[10]冯永新,杨文广,蒋东翔.基于决策树分类算法和专家系统的风力发电机齿轮箱故障识别方法[J].广东电力,2013,26(4):17-21.[11]曲朝阳,高宇峰,轰欣.基于决策树的网络故障诊断专家系统模型[J].计算机工程,2008,34(22):215-217.[12]JoanAlbertLopez-Vallverdu,DavidRiano,JohnA.Bohada.Improvingmedicaldecisiontreesbycombiningrelevanthealth-carecriteria[J].ExpertSystemswithApplications,2012(39):11782-11791.[13]包勇,张德银,庄绪岩.基于动态故障树技术的故障诊断专家系统[J].四川大学学报(自然科学版),2014,51(6):1211-1216.[14]张志彬,汪为希,侯杨.专家系统在医疗领域中的应用与发展趋势研究[J].医疗装备,2008,21(9):17-19.[15]AliKeles,AyturkKeles,UgurYavuz.Expertsystembasedonneuro-fuzzyrulesfordiagnosisbreastcancer[J].ExpertSystemswithApplications,2011(38):5719-5726.[16]SwatiShilaskar,AshokGhatol.Featureselectionformedicaldiagnosis:43 基于决策树的糖尿病诊断专家系统的研究与设计Evaluationforcardiovasculardiseases[J].ExpertSystemswithApplications,2013(40):4146-4153.[17]PhilippeJ.Giabbanelli,PiperJ.Jackson.Usingvisualanalyticstosupporttheintegrationofexpertknowledgeinthedesignofmedicalmodelsandsimulations[J].ProcediaComputerScience,2015(51):755–764.[18]马逸,陈斌.专家系统在医学上的研究现状及进展[J].中国医疗设备,2008,23(6):42-44.[19]叶进,邢传鼎.基于人工神经网络的病症诊断原型系统[J].东华大学学报(自然科学版),2003,29(4):43-47.[20]李江平,韦玉科.亚健康中医诊断系统[J].计算机工程,2005,31(15):222-231.[21]杭波,马计.基于二次推理的糖尿病诊断专家系统研究[J].微计算机信息,2008,24(22):221-222.[22]沈丽容,黄洪.基于贝叶斯和可信度的糖尿病诊疗系统研究[J].计算机与数字工程,2011,39(11):51-53.[23]罗洋.基于案例推理的糖尿病诊断系统的研究与应用[D].深圳:哈尔滨工业大学深圳研究生院,2013.[24]EarlChrysler.UsingDecisionTreeAnalysistoDevelopanExpertSystem[J].InformationSystemEducationJournal,2006,4(55):1-11.[25]蔡永敏.糖尿病临床治疗学[M].上海:第二军医大学出版社,2006:10-17.[26]龚文华.临床糖尿病学[M].杭州:浙江工商大学出版社,2014:33-40.[27]吕仁和.糖尿病及其并发症中西医诊治学[M].第2版.北京:人民卫生出版社,2009:79-85.[28]吴晶,马振成,刘永强.糖尿病及其并发症[M].北京:化学工业出版社,2012:55-67.[29]Shu-HsienLiao.Expertsystemmethodologiesandapplications—adecadereviewfrom1995to2004[J].ExpertSystemswithApplications,2005(28):93–103.[30]BastianWemmenhove,JorisM.Mooij,WimWiegerinck,MartijnLeisink,HilbertJ.Kappen,JanP.Neijt.InferenceinthePromedasMedicalExpertSystem[J].ArtificialIntelligenceinMedicine,2007(27):454-460.[31]刘峡壁.人工智能导论方法与系统[M].北京:国防工业出版社,2008:269-288.[32]李金,吕汉兴.医疗诊断专家系统推理机的设计与实现[J].微机发展,2004,14(9):42-44.[33]生佳根.基于本体的知识获取、管理和应用方法研究[D].南京:南京航空44 参考文献航天大学,2011.[34]杨云,冯亚.基于决策树的GSM网络优化专家系统[J].微型电脑应用,2009,25(11):23-25.[35]胡博,王智学,董庆超,牛彦杰.基于描述逻辑的上下文知识获取与推理方法[J].计算机科学,2013,40(4):199-203.[36]陈传波,郭天杰.面向对象的知识表示方法在故障诊断系统中的应用[J].计算机工程与科学,2006,28(12):121-123.[37]敖志刚.人工智能及专家系统[M].北京:机械工业出版社,2010:34-41.[38]EthemAlpaydin著,范明等译.机器学习导论[M].第2版.北京:机械工业出版社,2014:113-127.[39]J.R.Quinlan.InductionofDecisionTrees[J].MachineLearning,1986(1):81-106.[40]谭义红,陈治平,李学勇.基于决策树的中毒诊断专家系统实现[J].计算机应用,2005,25(10):2315-2317.[41]于希宁,牛成林,李建强.基于决策树和专家系统的短期电力负荷预测系统[J].华北电力大学学报,2005,32(5):57-61.[42]MitchellT.M.著,曾化军等译.机器学习[M].北京:机械工业出版社,2003:40-45.[43]OlcayTanerYıldız,OnurDikmen.Parallelunivariatedecisiontrees[J].PatternRecognitionLetters,2007(28):825–832.[44]郭冬梅,李朝品.基于检索决策树的螨种分类鉴定专家系统[J].计算机工程与科学,2012,34(3):192-195.[45]徐翔斌,周新建.基于决策树和规则引擎的挖掘机液压故障诊断专家系统[J].液压与气动,2008(3):13-16.[46]刘卫国,刘泽星.SQLServer2008数据库应用技术[M].第2版.北京:人民邮电出版社,2015:32-44.[47]王莎莎,孙继银,李琳琳.故障决策树模型在诊断专家系统中的应用[J].计算机应用,2005(S1):293-294.[48]王文晶,刘锐,张丽梅.基于故障树的故障诊断专家系统推理机的设计[J].电脑知识与技术,2014,10(2):404-406.45 基于决策树的糖尿病诊断专家系统的研究与设计在学研究成果发表学术论文:[1]倪家远,汤亚玲.基于决策树和面向对象技术的糖尿病诊断专家系统设计[J].苏州科技学院学报(自然科学版),2016,33(1):70-74.46 致谢致谢时间过的真快,转眼间三年的研究生生活即将结束,回想当初刚入学时的情景依然历历在目。在这三年里我不仅学到了知识学会了做学问,更进一步学会了做人。学校、老师、同学都给了我很多的帮助和关怀,使我顺利的完成了学业。首先感谢我的导师汤亚玲副教授,汤老师学术精湛师德高尚,为人和善,每次当我遇到一些专业上的问题请教他的时候,汤老师都耐心细致地指导我,给了我很多启发和思考问题的不同方式。每当我写论文遇到瓶颈写不下去的时候,汤老师都能给我指出很多点,给了我很多灵感。在生活上,汤老师也给了我很多照顾,让我做他的助教领一点补助补贴我的生活费。汤老师润物细无声的关怀,学生永远铭记在心,感谢我的导师汤亚玲。然后要感谢人工智能实验室的兄弟姐妹们,一起讨论学术问题,一起聊天一起玩。学业上我们是互帮互助的好同学,生活上我们是无话不谈的好兄弟好姐妹。感谢我的师兄刘彦鹏和师姐黄华、潘唯,在我刚来学校的时候,无论是学术上还是生活上给了我很多帮助。感谢实验室的朱丽琴、金建辉、王雷、陈梅同学,在同一个实验室三年里,我们一起走过来,留下了很多欢笑和美好的回忆。最后也最要感谢的就是我的父母,当年我考研的时候无条件的支持我,不管我考的怎样都对我没有半句怨言,虽然家里很困难,还是到处凑钱供我读书。今天我顺利地完成了学业,背后都是我父母的巨大支持。没有父母默默的支持我不可能走到今天。感谢学校的栽培,老师的指导,同学的帮助,父母的支持。47

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭