基于语义分析的糖尿病健康教育系统研究与实现

基于语义分析的糖尿病健康教育系统研究与实现

ID:77703149

大小:10.87 MB

页数:76页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于语义分析的糖尿病健康教育系统研究与实现_第1页
基于语义分析的糖尿病健康教育系统研究与实现_第2页
基于语义分析的糖尿病健康教育系统研究与实现_第3页
基于语义分析的糖尿病健康教育系统研究与实现_第4页
基于语义分析的糖尿病健康教育系统研究与实现_第5页
基于语义分析的糖尿病健康教育系统研究与实现_第6页
基于语义分析的糖尿病健康教育系统研究与实现_第7页
基于语义分析的糖尿病健康教育系统研究与实现_第8页
基于语义分析的糖尿病健康教育系统研究与实现_第9页
基于语义分析的糖尿病健康教育系统研究与实现_第10页
资源描述:

《基于语义分析的糖尿病健康教育系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

论文题目基于语义分析的糖尿病健康教育系统研究与实现学科专业控制科学与工程研究方向语义网技术论文作者樊春雷指导教师王学武副教授定稿日期年月日 学位论文使用授权声明本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华东理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编学位论文。保密论文在解密后遵守此规定。论文涉密情况回不保密口保密,保密期年月日至年月日学位论文作者签名噢笼雷日期知年,月邓日,日旨期导老洲。年、少州厂日式 华东理工大学硕士学位论文第工页分类号密级华东理工大学学位论文基于语义分析的糖尿病健康教育系统研究与实现樊春雷指导教师姓名王学武副教授华东理工大学上海市梅陇路号申请学位级别硕士专业名称控制科学与工程论文定稿日期,论文答辩日期学位授予单位华东理工大学学位授予日期答辩委员会主席侍洪波教授评阅人刘漫丹教授方建安教授 第页华东理工大学硕士学位论文作者声明我郑重声明本人烙守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的结果。除文中明确注明和引用的内容外,本论文不包含任何他人己经发表或撰写过的内容。论文为本人亲自撰写,并对所写内容负责。论文作者签名、叮年〕月弓日 华东理工大学硕士学位论文第页基于语义分析的糖尿病健康教育系统研究与实现摘要语义网是当前万维网的延伸和扩展,它能够让人和计算机协作效果更好。基于语义的糖尿病知识检索分析系统就是采用了语义网技术,实现了糖尿病知识的优化组织和管理,并且为更好的帮助用户查询到理想的糖尿病知识提供了可能。基于语义网的检索机制与传统的基于关键词的检索相比较更加智能,并且能够有效提供资源检索的查准率和查全率。糖尿病知识本体的建立是实现语义检索的关键。目前,糖尿病影响了全球很多人的生命。由于糖尿病病人的生活方式、预防保养和治疗等方面知识的宣传和普及能够极大地改善病人的生活质量。本文在糖尿病本体建立完成的基础上,设计了一个用户友好的糖尿病健康教育系统。对于本体的操作使用来实现,使用来计算本体概念类之间的语义相似度。但是语义相似度由多种因素决定,而且各种因素对语义相似度的影响各不相同。因为语义相似度影响因素的人为定义很大程度上影响到最终的结果,所以本文使用神经网络算法来更好地实现相似度算法,实现用户输入关键词在语义方面的扩展。这种方法能够更好地解决关键词查询带来的弊端,及其能够解决语义相似度算法受人为因素的影响,最终能够更好地实现语义相似度算法,从而使得搜索引擎能够达到很好的查全率和查准率。在检索方面使用来实现全文搜索技术,对糖尿病资源描述库中的内容进行索引和检索。为了避免人工实现语义标注而带来的资源有限的不足,本文考虑在现有的基础上采用爬虫来对网页知识进行抓取,从而扩充糖尿病知识库。关键词语义网糖尿病本体 第页华东理工大学硕士学位论文认,如耐,玩亡一耐一,,灿,,一角知,而而硕,硕,,朴刀加耐叮而知叮叮,一,了,知,亡 华东理工大学硕士学位论文第页目录第章绪论﹃上,刁人`自口上课题背景……国内外基于语义的健康教育发展现状……,……,…语义网国内外研究现状及其应用……本文的工作和组织结构……第章语义网技术……元数据……本体的定义……本体的分类……本体的建模元语、……,……,……构造的规则……和语义网……小结……第章糖尿病知识本体的设计与实现……糖尿病本体的设计原则与方法……糖尿病知识本体的类……糖尿病知识本体的属性……语言……糖尿病知识本体的描述……糖尿病知识的语义标注……语义标注的基本要素……语义标注方法……使用乙已建立糖尿病知识本体……`乙简介……乙句法规则……``建立糖尿病知识本体结果演示……小结……第章基于神经网络算法的语义相似度研究……相似度研究现状……现阶段相似度算法的不足和改进……语义相似度计算原则……语义相似度计算应该考虑的因素……相似度的计算……神经网络算法…,……基于神经网络算法的语义相似度计算……神经网络初始值的选取……隐含层及其节点数的确定……网络输入层、输出层的设计…… 第页华东理工大学硕士学位论文训练样本集的设计与测试……语义相似度算法的应用……小结……第章糖尿病知识本体的语义检索系统……基于糖尿病本体的语义检索模型……用户查询和结果反馈模块……本体建立与管理模块……本体的建立……。…本体的操作和管理语言……持久化本体到数据库……实现关键词的语义扩展……实现图的查询……实现网页信息获取及其搜索……简介……十创建基于语义的垂直搜索引擎……小结……,……第章总结与展望……参考文献···……致谢……攻读硕士期间发表的学术论文…… 华东理工大学硕士学位论文第页第章绪论课题背景随着互联网、计算机及其相关技术突飞猛进的发展,信息资源遍布到世界的每个地方,使人们置身在一个信息资源极度发达的社会之中。数以万计的信息资源以“秒”为时间单位迅速膨胀。信息也以多种多样的形式存在着,有的信息经过处理保存在数据库中,有的信息以文件的形式保存起来,有的信息则发布在网络上。如何有效地利用及其存储信息,如何在海量的信息中迅速、准确和有效地查找到人们所需要的信息,这些都是信息存储、查询和获取过程中面临的问题。怎样利用好海量及其日益剧增的信息,以及怎样才能不造成应用时信息系统的重复建设和数据资源的浪费已经成为人们急需解决的问题。人们迫切需要把这些模式上异构、地理上分布不同、管理上自治的数据信息有效地组织起来,所以数据信息集成问题便引起人们关注。由于集成系统信息的模式异构性、管理自治性和地理分布性,使得信息系统集成之后的查询并不等同于传统查询。集成信息系统的查询面临着诸多挑战各种各样数据信息的数据模式各不相同各数据信息的查询能力相差很大传统的查询优化需要的统计信息很难得到查询所消耗的代价考虑最多的不再仅仅是硬盘的读取速度,而且还有更多诸如网络传输速度等因素进行全局查询需要分解到每个数据信息每个数据信息原始查询送回的结果一般都需要进一步处理等等。数据信息集成之后的查询面临的这些问题,已经不可能用传统方式的查询来完全解决。目前,不能为网络用户提供更方便上网环境的问题主要是由于网页内容的含义不是机器可解读的,一旦牵涉到解释句子含义和提取对用户有用的信息,现有的软件能力很有限。就目前技术而言,以下两个句子的含义是很难区分的我是一个自动化学院的院长。你不妨认为,我是一个自动化学院的院长。解决这个问题的方法是使用一种更加容易被机器处理的方法来描述网上内容,并采用智能技术来利用这种表示方式所提供的便利。考虑到万维网在信息表达、获取、搜索、存储和管理方面的不足,万维网之父一于年月在的会议上提出了语义网的概念,并于年月在“”杂志发表文章“”〔'〕。语义网是对未来网络的一个设想,在语义网中的信息都被赋予了明确的含义,计算机可以自动地处理信息,也能够自动完成网络信息的集成。在语义网中,来实现标签格式的定制而表达数据则采用灵活的完成,使用本体网络语言来描述术语的含义以及术语之间的关系。本体具有一个丰富的词汇库,使用本体表示的概念可以支持多种数据源的转换,而且本体在知识的管理的一致性及其对于不一致信息的识别方面都很有优势。 第页华东理工大学硕士学位论文语义网是当前万维网的延伸和扩展,它能够让人和计算机协作效果更好。基于语义的糖尿病知识检索分析系统就是采用了语义网技术,实现了糖尿病知识的优化组织和管理,并且为更好的帮助用户查询到理想的糖尿病知识提供了可能。基于语义网的检索机制与传统的基于关键词的检索相比较更加智能,并且能够有效提供资源检索的查准率和查全率。语义网的发展得到了产业界的大力支持和各国政府的大量资助。美国政府设立了项目,欧盟第六研究框架计划也将语义网作为关键内容之一。“在二十一世纪的第一个十年,中国糖尿病患病率翻了近两倍,已成为世界第一糖尿病大国,目前疾病防治形势十分严峻。”中华医学会糖尿病学会主任委员、北京大学人民医院内分泌科主任纪立农教授指出,“中国城市化进程导致的生活方式的改变影响了以糖尿病为代表的慢性病的发病率和疾病的进展,当前糖尿病患者的疾病特点复杂,走好糖尿病防治的未来之路,当下要做到“三个必须”即必须全面降低心血管疾病风险、必须早期诊断和治疗、必须贯穿始终地规范用药。”年月日是世界糖尿病日,今年的主题是“控制糖尿病,刻不容缓”中国糖尿病最新调查发现,我国的糖尿病发病率高达,全国糖尿病人接近亿。毫无疑问,我国已经成为全球范围内糖尿病增长最快的地区,且超过印度成为糖尿病第一大国糖尿病年轻化趋势明显,糖尿病发病在科岁的“事业型”人士中增长最快我国至少有的糖尿病应该使用胰岛素而没用。糖尿病知识的缺乏以及中国医疗和疾病知识方面的宣传造成了很多病人耽误病情。据今年月日《新英格兰医学杂志》刊登的“中国人群中的糖尿病患病率”的研究论文公布数据显示,目前中国已有超过万的糖尿病患者。纪立农教授指出,糖尿病患者人数增速迅猛与中国十年来的城市化进程加快、人民生活水平提高、不健康的生活方式增加而导致的城市“富贵病”人群增多密不可分。这一结论源于中华医学会糖尿病分会一年发起的一项覆盖全国个省市,年龄岁以上人的调查,最终人最终完成了调查。此项调查还显示,糖尿病已经开始在岁至岁的中国年轻人中流行,这一年龄段的患病率占,而糖尿病患病前期人数更是达到了。目前,糖尿病影响了很多人的生命。由于糖尿病病人的生活方式、预防保养和治疗等方面知识的宣传和普及能够极大地改善病人的生活质量。然而一个好的知识查询和组织系统才能很好地帮助用户了解糖尿病方面的相关知识,对于糖尿病知识的普及和研究都有很大的帮助。由于目前的查询系统都是基于关键字的搜索,然而就而言,在信息大爆炸的时代,这个被认为全球最强大的搜索系统只能够查询到所有数据量大一。目前,大多数信息都存在数据库中,由于计算机对于数据库信息的不可理解性,需要人为维护,数据库维护的成本是很高的。基于语义技术的搜索实现了基于概念层次的检索,提高了检索的性能。 华东理工大学硕士学位论文第页国内外基于语义的健康教育发展现状健康教育管理实现需要很多方面的努力,涉及患者及其家人,专业卫生保健供应商,医疗计划,支援小组,和雇主。其中最重要的是所有利益相关者之间能够更好地获取和分享可靠的信息。互联网允许所有利益相关者的健康护理管理团队获取和分享健康保健信息。这些共享的健康教育知识使患者,家属成员,医生和卫生保健提供者能够更好地管理健康或疾病。这也为卫生保健提供者计划更好的医疗保障提供帮助。虽然万维网目前允许共享和分发信息,但它一直被纯粹的数据量的信息而困扰,却没有数据连接之间的语义关系,其中大部分信息是无关紧要的,很难保证准确性。互联网目前包含有价值的和容易获取的信息,但仍然有很多限制。该信息量是不合并或汇总影响的检索时间和成本。搜索返回链接数千页,其中一些是相关的。通常情况下,介绍的信息是很少的保证冲突准确性。网站大多非互动,不提供定制,使之具体要求很难找到一个最佳的解决方案。此外,现有的互联网缺乏认识或提供个性化的能力,只是直观的支持团队协作和信息共享。为了提供一个更好的医疗保健服务需要的情报添加到数据。然而语义网络的目的是使数据信息之间有很好的结构,数据与数据之间有很好的语义关系,使得人们对于知识信息的管理更加有效,从而更加智能地完成任务。这将打开一套新的,可以被利用来改善健康的机会,在护理管理上也为个人和医疗保健提供了很好的方法。语义健康教育研究的目的是帮助人们更好地得到知识和科技进步所带来的好处,能够帮助人们更好地了解自己的身体,不仅在知识上,而且在饮食、作息、医疗和预防上更好地了解健康。语义网络的目的是使网络变得尽可能智能。语义网络使得描述之间的关系对象和对象属性的网站不再被视为是网页之间的链接,而是作为一个大型数据库信息。病人可以在健康教育虚拟社区会提供一个个性化,使用方便,包括卫生保健管理方案,从而实现了健康教育管理系统最基本的价值,进而能够更好地改变病人的生活。为了能够更好地发挥基于语义的医疗保健系统,应该使得从交换一致的病人的信息内容而得到的利益必须变得更加透明,信心必须加以培育,这些病人的数据信息将是安全和可信的,信息的组织者必须信任与他们共享信息的人,以及信息共享不能被视为与业务或法律的冲突。我们确信这里的工作将有助于实现为全体人民的利益的美好未来。患者将越来越多地使用网络资源的学习来实现对自己的照顾。临床医学与医学技术进步和新的治疗方法将势必更加昂贵。医疗的广度和多样性,生命科学,心理和环境知识和他们的健康相关性将继续迅速扩大。开发和集成一些具有医疗决策支持和知识管理能力的本体将成为一个关键的优先事项。这样的话基于语义的健康教育系统所产生的经济效益以及社会效益将会进一步增加。世界卫生组织的合作伙伴在语义卫生主管公共健康问题,推出了“公共健康信息关键人物调查”,以评估的要求的可行性和优先使用各种案件公共健康信息。语义网在健康管理方面的应用比较多,目前有一些医疗保健网站,如, 第页华东理工大学硕士学位论文刀攻,和伍等。一等创建了一个典型的个人健康档案的例子。语义医疗保健和生命科学的兴趣集团成立了以万维网联盟“发展,倡导和支持语义网技术的生物利用科学,转化医学和卫生保健”为框架的项目。他们声称,这些应用程序是有用的,尤其是在“因为它们依赖于信息互操作许多领域和决策过程的效率支持”等领域。儿。,和等利用语义技术和临床文件架构来构建一个定义良好的接口,帮助临床医生设想临床表现以及如何诊断一个病人在医疗程序的检查结果。用来确认诊断的建议,研究的重点集中在青光眼在世界范围内,它是导致盲症的第二大原因的诊断、临床管理和评估执行工作。随着互联网的发展,搜索引擎已经被成为一个重要的人们获取信息的方式。每当公共健康情况发生时,大量的公共健康信息需要及时,准确地公布在网上,供用户去查询。不过一般信息搜索引擎在这些类型的查询方面检索达到的效果不够好。主要的原因是信息搜索引擎处理所有查询关键字和关键字不能完整表达用户的需求。因此,为了实现在公共健康情况突发时大量数据信息更有效的查询,通过定义语义本体,大量的语义信息被有效的管理,用户的检索过程将在语义层面上实现,因此这搜索引擎将能够更好地理解用户的需求,从而提供给用户所需要的搜索结果。等提出了一个原型系统的面向主题的空间信息搜索引擎,并采取例如出现危害公众健康。该原型可以从上的网页,建立网页数据库,提取关于空间信息的出现从这些网页公众健康的危害,正式表示这一领域本体和对待用户的输入信息语义的方式。吨等讨论索引和文件包含在语义标记搜索。不同于传统的网络搜索引擎,它使用信息检索对于非结构化的文本,语义文档设计技术搜索引擎必须处理半结构化数据组成的文件。此外,数据的含义是指那些由相关的本体同时编码为语义文档的处理可能需要大量的推理。等【'“提出了一个对于现有文献进行基本的语义搜索的调查。在现有文献中对语义搜索技术进行分类到六大类文献语义搜索引擎,语义搜索方法,混合语义搜索引擎,语义搜索引擎的,语义本体论的语义搜索引擎和搜索多媒体引擎,我们分别审查其特点。此外,在审查的语义搜索的问题方法和引擎是基于四个方面总结,分别为设计师和用户之间的看法分化,静态的知识结构,精度低和高召回和实验测试的不足。在未来,我们的工作将侧重于更深入和更广泛的研究,在语义搜索领域,随着目的总结该领域的现状和促进了语义搜索技术的进一步发展。虽然基于语义的搜索技术有很大的发展空间,但是就目前而言,在搜索引擎方面传统的关键词搜索技术仍然占据主导地位。等`研究了语义搜索搜索引擎的性能。起初,选择三个基于关键字的搜索引擎谷歌,雅虎和和一个语义搜索引擎巍公司作搜索性能比较研究。然后,进行十种查询,从不同的主题,有不同的语法,但类似含义,进行了测定。在每一次查询是在每个搜索引擎上运行,以及每个短语含有的查询是运行在语义搜索引擎上。后来,精确度和规范化召回率分别计算各分界点评估基于关键字的搜索引擎和语义搜索引擎。总体而言,雅虎在查准率计算方面表现得最好,而谷歌在标准化的查全率方面是最好的搜索引擎。但是,据搜索发现,语义 华东理工大学硕士学位论文第页搜索性能引擎在关键字的搜索引擎和语义搜索引擎两个方面的搜索效率都比较低。因此语义搜索技术的研究和应用还有很长的路要走。语义网国内外研究现状及其应用语义网技术的用途很多,其中主要包括以下几种,分别为以为代表的横向的信息产品、以奥迪为代表的数据整合和以瑞士人寿保险公司为代表的技能寻获,还包括服务和设备可共用性等。的横向信息产品是一家科技出版商,它在科技出版物方面居于世界领先地位。目前,它的产品主要是按照传统的刊物订阅的形式组织的。这些传统刊物可以用纵向信息产品一词来描述出版物可以分成许多门类,使得任何一个产品只涉及一个门类的内容。但是,由于各个学科的快速发展,如果只是把杂志按照不同学科来区分的话,以后将得不到读者的认可。的用户感兴趣的是跨越各个学科的主题领域。例如,一家制药公司可能要购买的全部有关阿尔茨海默症的科研资料,而不关心这些资料是来自生物刊物还是化学刊物。这种情况下,所需求的是所谓的横向信息产品。正在进行实验,探索借助单一界面访问生命科学领域中多个信息源的可能性。实验以作为单一的底层本体,所有纵向信息源的索引均依据该本体。实际上,在试图使信息内容适应新的发送和组织形式方面,是先行者之一。奥迪的数据整合在各个公司尤其是跨国公司,数据整合是一个重大的以及急需很好地解决的问题。就目前而言,数据整合被普遍认为是大公司信息技术预算中最昂贵的开支项目。如奥迪这样的公司,需要操作和管理数千个数据库,常常对相同的信息多次重复存储,而且因为信息源没有相互连接而时有遗漏。使用本体作为语义数据模型可以将各不相同的数据源合理地融合为单一的信息整体。通过为数据和内容源创建本体,以及添加通用的领域知识,整合企业内各不相同的数据源的工作就可以在不干扰已有应用软件的情况下进行。奥迪不是唯一一个为了解决数据整合问题而研究语义网技术的公司。波音、惠普等大公司都面临着同样的问题。、、等遍布全球的公司也正在把市场前景寄托在语义网技术的应用上。本体的其他应用及其研究在国内外的研究和应用很多。目前广泛使用的本体列表如下。年和归纳出了种本体分别为知识表示本体、普通本体、顶级本体、元本体、领域本体、语言本体、任务本体、领域本体、方法本体和应用本体。在理论上,本体的研究主要涉及类及其类的分类。等人提出了指导概念分类的理论。在这个理论的基础上,而又提出了如何对本体驱动进行建模,这些在 第页华东理工大学硕士学位论文本体理论上的研究形成了一个通用的建模模式。表留应用现状几名称描述其以”为单位组织信息,是基于心理语言规则的英文词典。们具有很强的语义分析能力,采用称为的描述框架。面向自然语言处理,为计算机翻译提供概念结构。面向自然语言处理,多语言处理的支持,包括独立于各种具体语言的概念组织方式及基本概念。面向自然语言处理,多语言处理的支持,采用一种中间语言来表示语言中间的知识。。的本体理论研究大体可以作出如下归纳【'概念分类理论的基础是概念的元特性。以概念的元特性为参考依据,把那些拥有共同元特性的概念归为一类,从而实现概念分类体系。概念的基本元特性包括反持久性、半持久性、持久性、非持久性、外部依赖性、载体标识性、支持标识性等。在国内外的研究很多。一吨等【'提出本体学习,旨在发现本体论知识从数据自动或半自动的各种形式,为了能够克服获取本体的发展瓶颈。现在存在的大多数本体构建工具仅支持手动建设,这使得在构建本体的过程中会出现低效率,高工作负荷和许多错误等问题。知识更新和及时维修是非常困难的。为了解决这些问题,提出了一个领域本体框架体系自动化建设的项目。通过本体学习使用企业数据库和巨大的存在在网站的知识,使得产品相互关联的领域知识配置域本体得以建立。关键技术本体学习领域概念,如在不同的提取数据源结构提取概念之间的语义关系,也进行了研究。别比等提出了一种本体的管理框架设计,它支持的本体开发过程的管理。该框架支持面向对象的知识表示。基础设施配套建设的知识重用和本体知识为基础的系统开发是一个不断发展的部分。该框架目前正在开发一个客户端服务器环境。随着本体管理系统的发展,开发人员可以集中对一个问题域的概念化和本体建模的研究,经营和管理的建模过程将自动支持。和'提出了一种从来学习轻量级领域本体的新方法。要使语义成为现实,自动创建本体是充满挑战和关键的问题。许多方法己报告了利用本体论的网络学习分析网页内容。然而,他们不适用从组织网站学习本体论,其中一个概念或一个人的描述是分布在多个网页,以及本体论的信息只能被发现考虑网站结构。所以提出了一个网站结构的方法从组织网站来提取组织本体。多个同一领域的组织本体可以合并成领域本体。'介绍了谓词逻辑的本体表示语言和基于图的本体表示语言,并介绍当前发展的主体环境和工具。提出一个基于本体的面向对象开发的一个简单的过程。肠一等【”提到是一个开放,分布的环境,其中包含了大量信息,它可以帮助用户通过使用本体从网络上得到信息资源。在上有很多不同版本的本体,并且可以实现互操作和重用本体之间的引用关系。由 华东理工大学硕士学位论文第页于的迅速发展和网络本体具有独立的格式,因此如何组织本体支持本体重用成为一个关键问题。提出一个方法来转换本体为一阶谓词表示逻辑,然后检查本体和其所指的本体之间的一致性,并提出了如何组成本体的方法。目前本体用于信息查询的项目如表所示表本体用于信息检索的项目几项目名称说明用户可以在万维网上查询到自己所需要的本体。用户可以在万维网上查询到自己所关心的网络信息。信息系统中语义异构的排除及其解决异构系统之间的互操作问题。本文的工作和组织结构本文的主要工作有使用亡构建本体,根据该本体对糖尿病知识进行手动语义标注对本体进行操作,实现语义相似度的算法及其用户关键词的语义扩展基于神经网络算法的语义相似度算法研究设计知识检索系统原型,使用、、和等实现知识系统界面及其业务逻辑层的开发使用创建基于语义的全文搜索引擎本文的组织结构第章绪论第章语义网技术第章糖尿病知识本体的设计与实现第章基于神经网络算法的语义相似度研究第章糖尿病知识本体的语义检索系统第章总结与展望。 第页华东理工大学硕士学位论文第章语义网技术元数据目前的网络内容更适合让人而不是程序来阅读。是直接或借助工具书写网页的主导语言。一个理疗师的网页片段如下所示勿爪勿地庄口一一亡一一一印虽然这样的信息人们阅读起来可以理解,但对于计算机来说就有很大的问题了。计算机分不清哪个是医生、哪个是秘书,更难区分具体的咨询时间,这就是问题所在。只有通过改变网页表示的方式才能解决目前的问题。如何使用更好的语言来描述网页内容,从而让人和计算机都可以很好地理解网页的内容。本文举了如下的实例八且卜叼刁卜叼上述的语言与相比能够让计算机更好地理解网页内容。元数据就是“关于数据的数据”。元数据刻画的是数据的含义,也就是语义网络中的语义。本体的定义刚开始属于一个哲学的范畴。随着人工智能的迅速发展,本体被人工智能界赋予了新的定义。凭着人们对的理解不断完善,对于本体的定义也正在不断的发展之中,其中具有代表性的定义如表所示。」 华东理工大学硕士学位论文第页表本体定义范畴提出时间提出人定义哲学客观存在的系统说明,客观现实抽象本质概念模型的明确的规范说明计算机加等给出构成相关领域的术语和关系,以及领域知识外延规则的定义忍共享概念模型的形式化规范说明共享概念模型的明确的形式化规范说明其中'”对于本体的描述总的来说可以归纳为以下几点概念模型通过抽象出客观现象的概念就能够获得的概念模型。明确性本体类及其类的约束都有确切的定义。形式化构建的本体应该是计算机可读的。共享性本体中的概念是被大家认可的术语,特定领域中公认的知识。本体的目标〕是获取专业的领域知识,使得人们对该领域产生共同认识和得到共同认可的词汇,并从形式化模式上给出这些词汇之间相互关系的明确定义。本体的分类根据本体的主题,可分为以下五种类型知识表示本体它的研究重点是语言对客观事物的表达能力。如斯坦福大学的知识交换格式的知识描述语言。通用本体关注于常识的使用。如工程。领域本体是指在特定领域可以复用,提供该领域的主要理论和原理。如医学概念本体。语言学本体是指语言和词汇的本体。如普林斯顿大学研制的。任务本体它是本体研究的一个分支,主要解决共享问题,涉及动态知识。本体的建模元语等人用分类法组织了本体,归纳了以下几个基本的本体建模元语类使用自然语言描述客观概念和概念间的关系。关系是指本体领域中概念类之间的交互。函数是指一类特殊的关系。公理代表永远正确的断言。实例代表元素。实例就是类的实例,也就是对象。用于对类进行语义标注。另外,从语义网的层面上讲,本体的关系共有以下种,如图所示 第页华东理工大学硕士学位论文泊滚示类之间部分与整体的关系面七滚示类之间的继承关系语义的基本关系访如滚示类的实例与概念之间的关系叭谊滚示类是另一个类的属性图语义的基本关系可是在具体的建模过程中,本体概念类之间的相互关系不只是局限于这种基本关系,当然可以考虑本体领域的具体情况定义特定本体概念类之间的关系。构造的规则考虑到各自问题领域和具体工程情况的不同,构造本体的过程中也存在很大的差异。到目前为止,在本体的构造方法方面暂且还没有一个统一的标准。而年'提出的条规则最有影响力明确和客观本体能够使用自然语言对术语进行明确和客观的语义定义。完全性类的定义可以完整地表述领域术语的含义。一致性术语的含义及其推论不会形成概念上的冲突。最大单调可扩展性向本体中添加术语时,不会影响现有的本体概念。最小承诺建模对象的约束不可以太多。一。罗和语义网提高网络信息检索的质量必须在两个方面进行努力如何在现有的信息资源的基础上面设计出检索技术更好的搜索引擎如何实现使得七上的信息资源可以被计算机理解,便于计算机对信息的处理,即提供一种计算机可以理解的表示信息资源的手段。基于后者,一在年月日的的会议上提出了语义网。语义网的目标是使得网络上的信息资源能够被计算机所理解,使得信息资源具有语义,满足智能软件代理对万维网上异构和分布信息的有效访问和检索。下面是一为未来网络发展提出的基于语义的体系结构的语义网体系结构 华东理工大学硕士学位论文第页图语义网体系结构第一层和犯。是一个字符集,基本上包括了所有语言的字符,用来处理资源的编码,租用来唯一标识概念或资源。第二层十。该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表示形式、数据结构和内容分离。第三层。提供词汇嵌入的框架,在该框架下描述上的资源及其类型。第四层。用户可以定义概念及其各种资源之间的联系。第五到第七层、、。负责提供公理和推理规则。通过对概念的严格定义和概念之间的关系来确定概念精确含义,表示可共享的、共同认可的知识,从而解决计算机理解信息语义的问题。因此在语义网络中,本体具有很重要的地位,它是解决语义层面上网络信息共享和交换的基础。为了使得网络上应用程序使用方便,就应该具有一中通用的语言来描述本体,如同是标准的数据交换语言一样。目前正在开发中的语言有、、、形、和。目前语义网是一个新兴的研究方向,本体在其中的应用刚刚起少。小结本章主要对的定义,建模元语,构造本体的规则和本体现状进行了叙述,能够更好地说明本体是什么,本体如何实现,本体的研究现状和未来发展前景。语义网才刚刚起步,它的应用前景很大,进一步说明了本文的研究意义。 第页华东理工大学硕士学位论文第章精尿病知识本体的设计与实现本体的构建是一种信息的组织方式,能够更好地实现领域知识的共享。提出本体作为“正式的,明确的共同规范概念化”可以方便数据共享和与这些机构之间的合作。本体“概念组成,他们的等级一组织,它们之间的关系除了一和一。,公理是正式的定义和关系”。领域本体模模仿了一个特殊的领域,或世界的一部分。这提供共享和特定领域的共同理解。等提出了一个半自动建立语义模型的医学诊断知识的方法。该方法可以一举多得。首先,它是建立疾病本体的基础。同样方法也可用于建筑的本体医疗诊断技术。语义模型因为它允许统一的代表性异种数据而被应用。在医学方面,这允许从不同的未来诊断技术实现异种数据的融合。在后果的所有数据收集为特定病人可以进一步处理与援助相同的数学技术。因此很容易建立一个机制,通过比较病人所获得的数据与疾病的语义模型诊断推理可能的疾病。整个本体的建立过程是自动的,使用自然语言设置处理方法。本体构建的步骤方面根据研究和相关工程应用经验,和提出本体构建可使用四个步骤如下领域分析和知识链的建设。在这第一步,获取一个领域或一些领域的知识和分类这些知识是主要方面。结构本体。在这一步,我们将根据知识链建立结构本体。它包含了一些活动,如识别领域概念,属性的概念和相关的值。此步骤将是由系统开发人员根据知识链来虚拟建立的。它包括三个过程领域知识词典建设,常量定义,公式的定义。使用形式语言本体模型实现。正式语言是语言来构建本体。在是我们发展到正式本体的语言。我们使用面向对象的设计。本体评价。评价本体的性能是为了使本体得到改善。这种方法可以提高本体建立的可重用性和灵活性。糖尿病知识本体的实质是通过形式化的手段描述了糖尿病知识领域相关概念及其概念之间关系。本体是对于现有的海量数据的组织形式,它让本来没有联系的知识概念之间建立关系,让知识带有语义,并被计算机所理解。专业领域的本体知识构建好以后,对于实现专业领域知识的处理和检索都有很大的益处。本章主要讨论糖尿病知识本体的建立及如何通过建立好的本体对糖尿病资源进行语义标注。糖尿病本体的设计原则与方法在糖尿病本体设计中要遵循下面四个基本原则标准化概念的选择尽可能遵循本领域相关的标准,保证选用概念定义及其关系的客观性,从逻辑上确保概念定义的前后一致性可扩展性保证糖尿病资源本体方便进行扩展智能性糖尿病知识本体表示领域知识,使得计算机可以理解,从而更有利于 华东理工大学硕士学位论文第页信息的集成和管理可重用性糖尿病知识本体的数据格式决定了其具有重用的能力。考虑了本体设计的原则,本文通过使用以下方法来创建糖尿病知识本体使用自顶向下的方法来定义糖尿病知识本体的结构层次定义的属性明确其和实例存入知识库中与本体分开存放,本体的语义标注标明实例的。糖尿病知识本体的类本文需要建立一个糖尿病知识本体,首先要分析糖尿病领域的一些基本概念及其概念之间的相互关系,通过这些关系和概念来完成本体的建立。明确本体的领域为“糖尿病”领域归纳一些主要概念和属性,及其概念之间的关系实例的选取,及其语义标注的实现构造概念之间的层次结构分析,完成本体框架的建立使用本体语言对糖尿病知识本体进行规范化描述。糖尿病知识本体分为大类糖尿病及其并发症,糖尿病知识,糖尿病的治疗,糖尿病的防治护理,糖尿病食谱。知识树如图所示。 第页华东理工大学硕士学位论文用药糖尿病眼病治疗糖尿病及`共升汉址肾病·胰岛素治疗糖尿病治疗·手册一降搪药物叶红英一糖尿病的糖尿病联系方式治疗糖尿医病院洽疗胰岛素泵塘尿病治疗搪尿病糖的药物仪器'尿病的防治护理·血糖仪糖尿病主食糖尿病标准类食谱米米饭制作原料糖尿病水产类食谱海米冬瓜糖尿病食谱制作方法糖尿病素菜类食谱功效图糖尿病知识树糖尿病及其并发症代表所有由于糖尿病引起的并发症,如心肌病、糖尿病眼病、糖尿病足、肾病和糖尿病神经病变等。如图所示。 华东理工大学硕士学位论文第巧页图糖尿病及其并发症分类糖尿病知识其子类包括糖尿病型、糖尿病病理和病因、糖尿病都有哪些征兆、中医治疗糖尿病效果如何和糖尿病患者死亡原因等。如图所示。图糖尿病知识,糖尿病的治疗其子类包括糖尿病治疗手册、药物疗法、糖尿病治疗医院、糖尿病治疗的药物仪器、定期监测、饮食治疗和运动治疗等。如图所示。图糖尿病治疗的分类糖尿病的预防和保养其子类包括临床护理、定期体检、改善生活方式、运动保健、心理调节和防治并发症等。如图所示。 第页华东理工大学硕士学位论文图糖尿病的预防和保养的分类糖尿病食谱其子类包括糖尿病主食类食谱、糖尿病水产类食谱、糖尿病素菜类食谱和糖尿病肉食类食谱。如图所示。图糖尿病食谱糖尿病知识本体的属性有两种属性对象属性,将对象相互关联,例如由…讲授和监督是两个对象属性。数据类型属性,将对象与数据类型值相关联,例如电话、标题、年龄等。没有任何预定义数据类型,也没提供特别的定义机制。例如,本文在糖尿病本体中定义了如下属性医生属性如表所示表医生属性几性别数据类型属性科电室话职称擅长医生简介对象属性所在医院 华东理工大学硕士学位论文第页糖尿病并发症之心肌病的属性如表所示表心肌病的属性几预防和保养治疗数据类型属性症用状药饮食日常生活注意点知识对象属性治疗医院语言语法使用基于的语法。定义了一些其他的语法形式一种更容易读懂的语法,可是这个语法不符合惯例。语法规范文档中使用的一种更紧凑和易读的抽象语法。基于统一建模语言约定的图形化语法。头部一个本体的根元素是一个元素,用来指定一系列命名空间州瓜创一一幼爪刀一个本体可以以一组断言开始,这些断言包括注释、版本控制及其其他本体导入等。类元素我们使用元素来定义一个类。例如,本体中副院长这个概念类我们可以作如下定义“副院长”“医生”断言副院长、助理院长和院长这三个概念类是不相交的,可以用元素。这些断言可以通过引用其。“副院长” 第页华东理工大学硕士学位论文诚“院长”诚“助理院长”叼元素可以很方便地定义类等价“苹果”“”属性元素语言有两种属性对象属性,将对象相互关联,如由…治疗是对象属性。数据类型属性,将对象与数据类型值相关联,如年龄等。没有任何预定义数据类型。下面是数据属性的一个例子“由…治疗”“医生”“胃病”实例类的实例声明如下医生“”肋从医时间“”叼从医时间医生语言不使用命名唯一性假设,这也是它与典型的数据库系统的不同之处。糖尿病知识本体的描述本体语言用于对领域模型进行显示的形式化描述。本体语言的主要需求是语法的定义必须优良,语言在支持高效率的推理,必须具有形式化的语义,很强的表达能力和表达的方便性。形式语义能够精确刻画知识的含义。形式语义允许人们推理知识。对于本体知识,可以进行如下的推理类属关系。若是类的实例,是的子类,则可推出是的实例类等价。若等价于,等价于,那么等价于相容。分类。语义是推理支持的先决条件。语义推理支持的作用主要包括以下几点检测本体和知识之间的相容性推理出类与类之间的隐含关系 华东理工大学硕士学位论文第页为实例实现自动分类。使用自动推理支持其效率要比人工检查高许多,这对于大型本体设计来说,是十分有益的,可以节省很多成本。对应于描述逻辑,利用现有描述逻辑推理机如和。通过前面所述,就可以使用语言对教学资源进行描述,下面是该本体的片段,,”介,,二认八切囚一一,,,,二刀”,,刀”,,二”,,刀一而””一耐”,,””定期体检”介,,糖尿病的预防和保养”介”防治并发症”介,,糖尿病的预防和保养”介,,脑血管疾病”介一糖尿病及其并发症”介”,,”糖尿病型”二,,糖尿病型”介叼,,糖尿病患者死亡原因” 第页华东理工大学硕士学位论文,,糖尿病知识”,知识”,,糖尿病”,刀认,乃从,,刁糖尿病的国外研究进展”研究所',知识”,'知识叼糖尿病的国外研究进展健康教育”行为矫正,知识】犷,,,,仪知识叼健康教育叼糖尿病知识的语义标注语义检索随着语义网的提出得到了很快的发展,它的发展也得到了人们很大的关注。可是现有的信息资源很大程度上是以非结构化的文档形式存在,这给计算机处理信息带来了很大的困难。目前己经有了一些关于语义标注的研究工作,包括自然语言处理的方法、系统信息抽取技术和本体的信息抽取方法等。语义标注的基本要素利用本体对数据信息进行语义标注,有三个基本要素标注对象就是指资源库。记为,,…,…,标注知识就是概念类、实例和关系。知识库记为,,…,…标注方式第一种是内嵌式,内嵌式把标注作为本体内容的一部分,缺点主要是修改起来比较困难,而且内嵌式方法在不断的修改中会使得本体越来越复杂。另一种是非内嵌式,这种方法避免了对本体的直接修改,而是把标注结果存储在数据库中。当然,一个本体概念类可以有多个知识资源对其标注,一个知识资源也可以被多个关系所标注。如图所示 华东理工大学硕士学位论文第页日目`一一势劝。匀份图语义标注方式要表达词汇与文档的相关程度可以考察词汇在文档中出现的词频,词频越高则相关度越高。本体中实例与文档之间的相关度计算可以通过公式一来表达。犷,,一、其中,了,是指在中出现的次数和分别表示和的字符串长度。通过公式一可以得到如下数据信息表实例和文档之间的相关度几知识关系知识资源物理地址相关度糖尿病足文档,糖尿病足糖尿病文档,糖尿病型饮胰岛素文档,餐后运动对胰岛素的影响从上面的数据我们可以得到每一个本体实例同知识库中各个文档的相关程度,从而得到不同的语义标注结果。语义标注方法语义标注的方法是依据文本内容,所以对于非纯文本的文件,我们需要采取一定的方法来对其进行解析。如图所示,目前本体能够标注的文档类型有、、 第页华东理工大学硕士学位论文和,当然也包括纯文本川浏月一一一一一一代包含图文档解析器对于,它是公司开发的电子文件格式。这种文件格式与操作系统无关。本文使用最常用的一种文本抽取工具。接下来使用来解析文件。解析程序如图所示困皿四圈曰河妞扭口巨困笔肺盆如甘妞加走鹅土时月翻,叮卜吐肠闷好万,书枷,以公冬夕,津韶遭·李盔港爵赞留,留一班今,·`,心留津留里匕狱、今令·解山”含护妙犷梦登团`止口,。路缪簧裁不黔默卜麟争茹全誉攀“七一七,甘七口七七巴,已工口汾日妙泌日已七飞,一加,理嗜甲一已哎,,外。,几,甲色昌亡,七口《,七咋二`廿扣介“」盯,,口卯已夕口巴亚盯,盯刀,亚盯谧亚即吐盯妞七'」二仁,砖砂礴压`主丈《习一`』已,卜田宋出乡为二立。双目,刃峪匕︸竹刁夕`,`口已双七已,了已仁浮七巴,口已七仁”八已口几月吐。丈】魂已弓丁公图解析只要在中输入文件所在的物理地址就能把文件转换成文件。执行后会生成一个由内容转化好以后的文件,如图所示 华东理工大学硕士学位论文第页`刀妞回圈四文件之〕编辑亿查若注收魂伍具江帮助以〕后。,守彦万,,泛文件,皿,詹阶笋而百五无反眨尾于三这才艾位令三一熟仁一竺一—图解析结果当然我们也可以使用来处理中文文件,使用或者来处理文件格式,使用来提取文件内容等。糖尿病知识的语义标注主要是参照糖尿病知识本体使用语言对资源进行语义标注并保存到资源描述库中,资源描述库的内容实际就是糖尿病知识本体的实例。由于糖尿病知识本体的属性就是相关类的知识,所有把资源描述库中知识的班标识为对应类的实例。如下,定义数据属性“知识””知识””糖尿病”,,从八切”对类“糖尿病型治疗的建议”进行语义标注如下糖尿病型二,,糖尿病型治疗的建议”知识,,,,二知识糖尿病型其中'过为心血管死亡原因实例的甩地址。 第页华东理工大学硕士学位论文糖尿病型治疗的建议·树其中,圆表示本体中的概念类,矩形表示标注文档。图糖尿病本体片段糖尿病型的治疗建议票悬羹鑫幕坐复鑫景嘉矗彝纂篡堡篡忑羡鳌馨禧拜怠薯鬃馨彝瘾瞿爵譬盒藻翱誓鳍方血图糖尿病型的治疗建议文本文档帅把这些已经通过语义标注的糖尿病知识资源保存在一起,就构成了糖尿病资源描述库。在对糖尿病本体资源进行搜索时,不必对网页进行检索,只要对糖尿病知识本体进行查询,找到查询到的本体的概念类即可。由于已经对本体中的概念类进行了语义标注,所以查询到本体概念类后就可以找到其标注后的实例,也就是与该概念类相关的糖尿病知识资源。使用``建立糖尿病知识本体己亡简介电`软件是斯坦福大学基于语言开发的本体编辑和知识获取软件,属于开放源代码软件。这个软件主要用于语义网中本体的构建,是语义网中本体构建的核心开发工具。由于其优秀的设计和众多的插件,其己经成为目前最广泛的本体论编辑器之 华东理工大学硕士学位论文第页电已提供了本体概念类,关系,属性和实例的构建,并且屏蔽了具体的本体描述语言,用户只需在概念层次上进行领域本体模型的构建。电`是自由开源的工具软件,用于构建域模型与基于知识的本体化应用程序。电提供了大量的知识模型架构与动作,用于创建、可视化、操纵各种表现形式的本体。可以通过用户定制实现域友好的支持,用于创建知识模型并填充数据。`可以通过两种方式进行扩展插件和基于的。该是一个开放源码的己本体语言和的库,而且提供的类和方法来加载和保存文件,查询和操纵模型数据,并进行推理的描述逻辑引擎。对于独立应用程序开发,己是一个灵活的,对于任意模型驱动的应用程序和组件的开发配置平台。己己有一个开放的体系结构,允许程序员集成插件,它可以出现一样,不同的标签特定的用户界面组件,或执行目前的模式任何其他任务。电编辑器提供了许多编辑和浏览设施的模型,因此可以作为一个有吸引力的出发点快速应用开发。开发人员可以初步乙标签包装到一个部件及其部件和提取它们分发后,作为一个独立的应用程序的一部分。说句法规则己句法规则包括所有的数据类型、值为真、等于确切的数值、和画分别是对本体概念类进行交和并操作的运算符、枚举等。一一一一一一一日岁岁日一匕日〕〕卜丫三三丫一】二一之之一一石一二匕一,,一旧门】日旧…】图``句法规则己电`建立糖尿病知识本体结果演示电己建立糖尿病知识本体,建立完成的本体类界面如图所示 第页华东理工大学硕士学位论文嘿黔黔黔畔呻甲一,`卿,旷一只鑫鬓、介叩曰,明薰鑫裹洲特仁丢`二声声丫压「毛盯倪浏一一知石仁万苗冬叨之铲羹鑫参东蓬介孚滚羹皿资犷公通、二…出辛争`娜脚哪洲由图糖尿病知识本体界面乞`中的界面如图所示匕`肠始甘`饰公公。树酬陌了月陌月内内印印州州,,,咚获跳留筑哪、冷产垂族乏的息六角瓜盆艾介井绷心翻或称病食,改成件认今式有心助自竹俩的毕亡成产更任岛矜城交者产里缺芝目昌获的班,及合户抽心峨`匆,,庄尹卜川饮食百乒`“”粼簇今联岛东技雌,旅城、去。改一翻场幼理。登时。国阴吧川严军斌乏件协邢认起起居居口、,、汇冷产垂族乏的息六角瓜盆艾介井绷心翻或称病食仁线岛水枝峨望肠床犯怒店希还动始像甲松榷瑞及阵并发叼心取病侧帐从菊器病、协肠坛药神经玩炭,樵城病足此,韧域拼二翻白份成俄廿烧饭狡少,若,括脉锅编先外淤呢理状三…有…心助自竹俩的毕亡成产更任岛矜城交者蕊产里…缺芝目昌获的班肖,及合户抽心峨一匆,,`庄一乒…节欲球药的价扮定期路魏`,手卜黔钧昨法触遥丽蔽污面伏食特叮详〕乞卜,甲联尿坑角段阶和介斧赶故教穷`劫,”扩`趁动价疗足用伟抢眨,急价狱一禅祥介篇沸撇拼姗拼碑、城渐珠甭刊州玲多……一今联岛东技雌,旅城去、。改一翻晰场幼理才。图界面 华东理工大学硕士学位论文第页小结本章按照本体设计的原则与方法构建了糖尿病知识本体。本体概念类建立和语义标注的实现都是通过来编辑的。糖尿病本体主要分为大类糖尿病及其并发症,糖尿病国内外研究现状,糖尿病的治疗,糖尿病的预防和保养,糖尿病知识。但可能也有考虑不到位的地方,希望以后的工作中可以完善糖尿病知识本体。 第页华东理工大学硕士学位论文第章基于神经网络算法的语义相似度研究语义相似度研究,是知识表示以及数据信息查询领域中的重要内容。语义相似度的计算方法通常是使用大规模的语料知识库进行统计。本体给语义相似度计算带来了新的发展机会。使用本体知识来计算词语之间的相似度,其基础是两个本体概念之间具有一定的语义相关性,而且它们在本体概念间的网络结构中存在一条通路。到目前为止国内外学者在词语的相关性和相似度研究方面做了大量工作。例如而根据两个本体概念的公共祖先节点来计算两个词的语义相似度。等在采用计算词语的语义相似度时,除了考虑本体概念间的路径长度外,还考虑了本体概念层次树的深度路径长度相同的两个本体概念,如果位于本体概念层次树的深度越深,其语义距离就越大、本体概念层次树的区域密度因素。鲁松研究了如何采用词语之间的相关性来计算本体概念的相似度。从知识工程的方面考虑,语义概念在某一方面的相似性等同于语义概念在某一表述方法下的相似性刀。描述的本体概念可以是类或者关系,实现了典型的构造子,使其拥有足够的语义和有效的推理能力。因此考虑到定义本体的方式,语义概念相似度计算只有综合考虑下列特性才能准确地获取本体中隐含的语义关系其一,概念名称和自然语言描述其二,类层次关系子类、父类关系其三,属性定义值域、定义域、约束其四,类的实例最后,类描述也是一个重要的因素。本文提出了综合使用本体概念类关系中的多种因素来计算本体概念间的相似度的方法及其结合神经网络算法来优化和权衡各个影响因素在概念相似度计算中的比重。本体概念相似度的计算综合考虑语义重合度、语义距离、层次深度等多种因素,来计算领域内部本体概念之间的语义相似度。相似度研究现状概念相似度计算的基本理论最主要来源于离散数学中图和树的匹配技术、数据库的模式处理技术和谓词逻辑中的处理技术。其中有些方法来源主要是自然语言处理困领域,如信息查询,采用传统的词语相似计算方法,选取一些词语作为关键词,但是采用这些方法的话在计算相似度时就无法考虑词语间的关系。由于不同本体之间计算本体概念类相似度的问题相对复杂,一种现实有效的办法就是在本体之间建立映射。的研究侧重于两句话之间文字的异同。其中提出了基于知网的计算句子之间的语义关联的方法。有些不但考虑语法结构相似性,而且考虑两个句子之间词语的相似性。主要研究包括以下几个方面一提出了一个结合词序异同的相似性的句子相似度计算模型。一建议相似句子检索应该基于改进的编辑距离。从值提出汉语句子语义相似度模型的建立依赖于语义结构和依附语法的结合。根据特殊句子相似度的定义和计算需求,一和一'设计了一个基于框架的 华东理工大学硕士学位论文第页依赖关系树句子相似度计算模型。表明,句子的相似性包括结构的相似性和语义的相似性。现有的概念相似度计算方法主要从以下的几个方面考虑基于词汇的方法此方法来源于模式匹配技术和自然语言处理技术,常用的数据信息是概念的名称。编辑距离算法是由俄国科学家在年提出,用来比较两个字符串之间的相似匹配度。编辑距离是两个字符串之间进行转换所需的元操作的最小数目,元操作的基本方法包括字符的替换、删除、插入及相邻字符之间的调换。词汇相似度算法是在算法基础上,德国大学学者提出一种词汇相似度计算方法,用来比较两个字符串之间的相似度。有时也采取计算语义层次结构距离的方法,如果两个词语在语义层次结构中的距离小于阂值则判断它们相等。基于结构的方法利用对象的结构信息来得到对象之间的关系。本体语义距离模型在本体概念类之间需要考虑距离或边的长度,计算两个概念结点之间的最短路径,这两个概念节点之间的路径越短说明它们之间的相似性越高。统计学方法贝叶斯定理采用两个本体进行映射实验,由于非叶子概念结点需要实现最终的匹配选择必须考虑自身子孙概念结点的匹配系数,所以采用了统计学中的贝叶斯定理。贝叶斯算法假设领域本体中所有的概念结点相互之间独立,那么两个本体概念之间的相似度为,、,如果中的概念,同时满足条件`和条件,则分析概念,和,存在最佳匹配关系和具有很好的相似性。基于规则的方法本体概念相似度的计算过程中定义了一些启发式的规则,这些规则的主要来源是语义结构信息和本体概念的定义,由领域专家手工完成规则的定义,如“如果这两个概念的子概念都相同,那么这两个概念是相似的”、“如果两个本体概念类的属性相同,那么这两个本体概念类是等价的”等等。基于特征方法在概念中使用各种各样的特征来完成语义相似度的计算,此方法适用于不同本体间的语义相似度计算,以这些本体的特征属性作为相似度函数的计算参数。向量空间方法也常用于信息查询中的本体概念之间的匹配计算,设本体概念有个不同属性,而且每个本体概念用维的向量表示。向量空间算法本体概念和分别用维的向量和表示,那么就可以采用如下函数计算本体概念和的相似度,如公式一所示砂又,万少万,万下一 第页华东理工大学硕士学位论文现阶段相似度算法的不足和改进基于词汇的方法来计算相似度虽然简单,但自然语言的一词多义问题会很大程度上影响词汇匹配过程,所以此方法不能解决词语的一词多义现象,在检查本体中不同概念的相似性时问题更大。有人会提出利用常用词库,因为有了相关领域的词典词汇支持,使用词汇方法计算相似度就比较有效。可是就目前而言,可以直接利用的领域词汇较少,需要在这方面付出更多的努力,才能够有效地利用词典词汇来加速语义相似度研究。基于结构的相似度算法,在计算过程中,相似度的计算不单单要考虑单独的词汇,还要考虑词汇与词汇之间的关系。这类相似度计算方法常常使用模式匹配技术,结构层面上的匹配可以采取全部匹配,也可能采取部分匹配。这取决于相似度算法想要达到的完整性和准确性程度。总的来说,这种方法在概念的语义上存在较大的局限性。统计学算法主要是采用公式、数学定理等计算概念相似度问题,如贝叶斯定理主要用来解决相似比较的不确定性、采用概率分布计算本体实例的相似性等。但计算难度比较高。基于规则和推理的相似度计算方法,主要采用人工参与的方式。人工的活动虽然能够提高相似度,但是由于人工行为的优先性,从而会影响本体的大量开发、集成和广泛应用。就现在情况而言,还需要领域知识专家干预本体相似度计算,这在数据量较大及其一直要维护的本体应用中完全是不现实的。基于特征的语义相似度计算方法在现实中常常使用。但是,具有代表性的参数的选择非常关键,这几乎成为语义相似度算法能否取得理想效果的根本,而且,那些参数还要考虑计算结果而采取合理的调整。语义概念之间的相似度受很多的因素影响。其中包括词汇关系、同义词和近义词关系、子类父类关系、语义距离和语义深度。考虑各个因素的时候,最好的办法就是综合考虑所有因素。计算相似度的时候给各个因素赋予一定的权重。但是到底给每个因素赋予多大的权重,受到很多主观因素的影响。权重的人为选择完全影响相似度的计算。本文考虑使用神经网络算法,由于其是反馈学习算法,在学习的过程中一直会修改权重,优化相似度的计算。语义相似度计算原则为了使得本体概念知识之间的相似度计算能够达到客观准确的效果,考虑国内外的研究经验,本文提出语义相似度计算过程中应考虑的几个原则量化原则概念相似度是个取值范围一般在,之间的数值。两个本体类之间没有连通路径时,语义相似度值为,而一个词语与其本身的语义相似度值为简单原则在计算语义相似度过程中,必须考虑相似度算法的复杂度,保证语义相似度计算具有尽可能低的复杂度,从而方便计算。充分考虑本体的特性。如父类子类关系可调节性相似度是个主观性很强的概念,如果语义相似度的计算结果能通 华东理工大学硕士学位论文第页过一些参数调节,那么语义相似度的可调节性就可以保证,使得相似度计算结果可以满足不同的实际需求综合性是指概念之间的语义相似度计算需要考虑影响计算结果的各种因素,而不能以偏概全,避免语义相似度结果存在很大的偶然性。语义相似度计算应该考虑的因素根据上述计算相似度的基本原则,本文在基于糖尿病知识本体的语义相似度计算过程中考虑以下几个影响因素语义重合度是指本体两个概念类包含相同的父类概念的个数。语义重合度在一定程度上体现了两个概念类之间的相似程度。在计算相似度过程中,可以把语义重合度考虑成两个概念的公共节点数目。如果用表示本体概念上溯到根节点的父类节点数目,那么可用门来表示,两个本体概念的语义重合度。如图,,的值为,的值为,,,的值为。计算可知门的值为,自,的值为。由此可知,随着本体概念的语义重合度提高,本体概念之间的语义相似度也随之提高。例如,图中概念。与,之间的语义相似度,大于。与。之间的语义相似度。语义距离两个本体概念之间的语义距离,是指在本体图中连接这两个本体概念类的所有通路中最短路径的边数。本文使用,力定义本体概念与之间的语义距离。语义距离是语义相似度的基本因素之一。一般情况下,两个本体概念最短连接通路的距离越大,它们之间的语义相似度也就越低反之,两个本体概念最短连接通路的距离越小,它们之间的语义相似度也就越大。由图计算可得,。层次深度语义距离相同的两个本体概念,语义相似度随着两个本体概念层次深度总和的增大而增大,随着它们层次差的增大而减小。图,的本体中,。与,之间的语义相似度,比。与。之间的语义相似度要高。因此,在计算本体概念之间的相似度时,应该考虑层次深度这个因素对语义相似度的影响。另外,考虑在不同深度的两个本体概念之间的语义相似度时,层次深度大体上可以通过本体概念之间的深度差反应出来。随着深度差的增加,本体概念之间的语义相似度反而会下降。如图所示,节点,和。之间的相似度大于,和之间的相似度。 第页华东理工大学硕士学位论文厂”气”'”,了图一个简单本体而相似度的计算综合上述诸多因素,本文使用语义相似度的计算公式如下算法一基于网络距离的算法。通过本体概念相对应的节点之间的距离表示,概念之间路径越短,它们之间的相似度就越高。使用这种计算方法在假定边距离都为的情况下,和】提出了计算节点,和。之间相似度方法,如公式一所示从,一从其中,和为从,和到它们最近公共父节点的路径长度,。为。到本体根节点的路径长度。算法二基于语义重合度、语义距离和层次深度的方法。此方法综合考虑语义重合度、语义距离和层次深度对于本体相似度计算的影响来计算本体概念相似度。如公式一所示门,一尸,,,,权一】其中—概念与之间语义重合度,力—概念与之间语义距离,,—概念,对应的层次深度。算法三基于词汇的算法。构造和的相似矩阵,如下所示 华东理工大学硕士学位论文第页广﹂`,夕,夕,夕。,夕,夕,夕。一,,夕,。,夕。,夕二其中,元素,,凡表示词语,和词语凡之间的相似度。矩阵中的每一行表示句子中的某个词语与句子中所有词汇的相似度。对矩阵中的每一行取最大值,,凡,即求句子中的某个词语与句子中所有词语的相似度的最大值。其中,,凡的计算使用编辑距离算法是由俄国科学家在“年提出,用来比较两个字符串之间的相似匹配度。编辑距离是两个字符串之间进行转换所需的元操作的最小数目,元操作的基本方法包括字符的替换、删除、插入及相邻字符之间的调换。将矩阵压缩到一维。再求,。一艺,,,,,。,·考虑到矩阵的对称性,故同理求出。所以最终的相似度为,。要实现上面的算法必须实现句子的分解,这一点可以考虑使用分词工具,正分词工具的使用如图。算法三的实现思路如下图所示同样对本体概通过相似矩阵计句子的分词遍历本体中的在中对用户输入语念类进行分算和,句进行分词结果存入数组概念类,获取配置分词词,并存入数并最终得到汕印旧组,图词汇算法思路同样,把计算得到的相似度结果存入由三种相似度算法结果构成的三维数组。相似度计算人为因素影响很大,不能说上面哪种算法效果更好。目前相似度算法中最大的问题就是知道哪些因素影响了本体概念相似度,但是不能精确权衡各个因素在计算概念相似度时所占的权重。如果人为地给各个影响因素添加权重,那么相似度计算结果很大程度上受到人为设定权重的影响。就目前面临的问题,本文提出了综合使用本体概念类关系中的多种因素来计算本体概念间的相似度的方法及其结合神经网络算法来优化和权衡各个影响因素在概念相似度计算中的比重。本体概念相似度的计算综合考虑语义重合度、语义距离、层次深度等多种因素,来计算领域内部本体概念之间的语义相似度。 第页华东理工大学硕士学位论文甲甲嘿熙黔嘿只呷嘿黑黔瞥恩嗯,,犷全,蕊自公夕·墓三辞谓一音磷留链一自嘴一三攀。·飞,心时口,爵,刃。。合砂浮回级,俐,哈铸,令哪、,`比,`汾人魂`二口一乙,﹄`心。声一穿么嘴料年,君加价已脚盯田舀且翻口日刀,,且日盆力艺叮毛砚《七日卜比。艺。已七廿刀盯。何治疗粗尿病,函皿,,藕拍嫩初·吻抓筑拐料巧杯户功均托祠贾几竹肠上已。州撅麟参钧声田切,,,几甘月万名刀夕名毋一函瓜引`田国介。'幻田劝叮`。`公”二·匕工了`·,吧稗如种娜,汗即,汤脚世口二夕,阵球茹靖叻,,,已日一日《川,”声王吐万,卜叮吃生《已,已匹姗斗田吐口卜。”贷磺岭田吐取〔廿。一`卜。夕,仁,七卜多,`七毛甲田由场弘。”此已`朗介已〕姿助袭蓝滋轰落嚣蒸黛戴戴获篡葱势二惫昼到途泛拍》如何子台疗粗尿病如何治疗粗尿病、、二……一落八汤二一卜、,。一竺图分词实现神经网络算法切峨和于年提出了神经网络的误差反向后传叩学习算法,从此神经网络算法走向了辉煌。算法的基本原理是采用输出后的误差值来估计输出层直接前导层的误差值,接着用这误差估计再前一层的误差值,如此一层一层的反向传递下去,就得到了剩下所有其他各层的误差估计值。神经网络算法的激活函数必须处处可导,一般都使用型函数。当使用型激活函数时神经网络输入与输出关系如公式一和一所示输入,…,。一输出,一示一神经网络算法学习的过程是在外界输入样本的影响下不断修正神经网络各层单元的权值,通过这种误差反传的方法来最终实现神经网络的输出结果能够越来越接近期望的输出。神经网络算法学习的本质也就是通过误差反传来实现各单元连接权值的修正。神经网络算法的核心思想是将输出值与期望输出之间的误差通过某种形式向神 华东理工大学硕士学位论文第页经网络的输入层反传。误差反传是误差以某种形式在各层表示进而修正各层单元的权值。只有在输出值与期望输出之间的误差减少到可接受的程度或者最大学习次数达到的时候神经网络算法才会停止。神经网络算法计算步骤如下所示'第一,网络参数初始化给神经网络各单元权值分别赋值,连接权值的大小在一到之间,设定网络误差函数,精度值和最大学习次数。第二,随机选择第个样本和期望输出,如公式一和一所示。,,…,。一。一,,,…,。第三,计算隐含层各神经元的输入和输出值,公式如下所示。`、一艺,力,一、一一一,`。一艺。。一口一。。第四,使用期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数第五,使用隐含层到输出层的权值、输出层到隐含层的输出来得到误差函数对隐含层各神经元的偏导数第六,使用输出层和隐含层的输出修正各单元的权值第七,使用隐含层和输入层的输入修正各单元的权值第八,计算全局误差值一`一蠢菩菩凤`,一“第九,判断网络全局误差是否满足要求。当全局误差小于设定精度或者达到了最大学习次数,就停止计算。否则,使用另一个样本和期望输出,返回到第三步,从而进行学习。基于神经网络算法的语义相似度计算,神经网络初始值的选取神经网络权值的初始值的选取直接影响到神经网络训练误差曲面的起始位置, 第页华东理工大学硕士学位论文所以神经网络的初始化采取的方法很大程度上影响着网络的训练。神经网络是个非线性的系统,网络初始值有时决定了学习时间的长短、训练能否收敛和能否达到局部最小。如果神经网络的初始值太大,可能会使加权以后神经网络的输入落到激活函数的饱和区,会使其导函数八变得很小,但是在计算权值修正公式中,由于占正比于厂,当厂峥时,则有占斗和如。一,最终会使调节过程几乎停顿下来。所以,希望在初始加权之后的神经元的输出值都能接近于零,这样就可以保证所有神经元的权值都可以在型激活函数变化到最大的时候进行调节。一般而言,初始权值取,之间的随机数。神经网络算法应用到语义网相似度计算中,是考虑到目前相似度算法中最大的问题就是知道哪些因素影响了本体概念相似度,但是不能精确权衡各个因素在计算概念相似度时所占的权重。如果人为地给各个影响因素添加权重,那么相似度计算结果很大程度上受到人为设定权重的影响。为了解决这个问题,本文提出使用三种经典的计算本体相似度的方法计算得到两个相似度值,分别为汕、和,综合考虑两种方法的结果是采用算法如加,其中十因此在创建神经网络的时候设定权值初始值,使得口』刃七口」夕刃匕口隐含层及其节点数的确定通常情况下,隐含层数量增加,同时会使得神经网络误差得到降低和提高计算精度,但这也会使得神经网络变得复杂,因而提高了神经网络出现“过拟合”的可能和增加了网络学习时间。设计神经网络一般情况下应优先考虑层网络。因为,采取增加隐含层节点数来获得较好的训练结果的方法,其网络学习效果实现过程要比增加隐含层数目更方便。而对于没有使用隐含层的神经网络模型,它实际上也就是一个回归模型,它的技术己很成熟,所以在神经网络中没有必要考虑。网络输入层、输出层的设计神经网络的设计包括神经网络结构设计、样本设计和训练与仿真三个过程。神经网络结构设计需要确定隐含层数、隐含层节点数。目前为止,神经网络的设计最主要靠积累的经验和反复训练,而缺乏理论上的指导。样本设计需要完成原始数据的收集和整理、数据的分析、变量的选择、样本特征提取和样本数据预处理等工作。为了保证神经网络具有很好的泛化能力,可以通过训练与仿真交替进行找到一个较好的训练次数而实现。神经网络的分类能力取决于神经网络信息的容量大小,神经网络的信息容量和训练样本数目之间具有一定的匹配关系。样本数一定的情况下,如果神经网络参数数目很有限,那么就不能够表达样本所具有的所有规律,但是神经网络参数很多而样本信息少的情况,会使得神经网络训练不充分。因此在设计神经网络时,应该考虑在能够表达所需变量的基础上尽量减少神经网络参数个数,达到神经网络设计目的。 华东理工大学硕士学位论文第页本文使用两种经典的计算本体相似度的方法计算得到两个相似度值作为样本输入,所以神经网络算法在语义相似度的计算过程中采用输入层为三个输入节点的网络。对于输出层节点个数,结合语义相似度算法希望达到的结果为一个最终的权值调整后的相似度输出,所以输出层节点数只有一个。神经网络模型如图所示图神经网络模型朴内训练样本集的设计与测试神经网络的性能与训练使用的样本密切相关,只有充分考虑了样本规模和样本数量,才能设计出一个较好的训练样本集。样本数目的确定,除了考虑神经网络的大小之外,还应考虑神经网络输入和输出的分布和测试的需要等因素,其中神经网络的大小是关键,一般比较大的神经网络需要较多的数据进行训练。要想达到理想的输出结果,只有通过神经网络训练来实现网络权值的调整。从某种意义上说,所采用的训练样本集的质量直接决定着神经网络训练质量。要选择具有代表性的样本,能够均衡区分样本的类别,在训练时不同类别的样本可以采用交叉输入的方式〕。本文样本集的生成主要是通过本体概念之间使用两种方法计算相似度实现。语义相似度算法一为,,其在中的实现的程序片段如下所示刀计算两个本体概念之间的距离,,一· 第页华东理工大学硕士学位论文切根据算法一得到本体语义相似度,,,而,加语义相似度算法二为,力门尸,,,,气一其在中的实现的程序片段如下所示,己,,,二加切,,诵词汇相似度算法三为`才脚,其中朋一艺,,,,了。,,反之。本文使用算法实现语义相似度算法的目的是为了实现对用户输入关键词相匹配的本体概念类的语义扩展。假设与用户输入关键词相匹配的本体概念类是,本体概念类包括,,和,那么就使用两种相似度算法计算分别于,和的相似度。计算得到的结果作为样本存入二维数组供神经网络算法训练使用。首先对于用户输入关键词与本体概念匹配的过程,本文采用了字符串相似度算法算法算法思想字符串变化的方式可以采取替换、增加和删除字符,如果,要把字符串变换成,可以采用替换、增加和删除字符方法来实现,以上操作所使用的次数最少的时候,那么这个次数就是直接的相似度。如与 华东理工大学硕士学位论文第页度为与度为和度为字符串相似度算法可以使用算法。这算法是由俄国科学家提出的。算法流程图如图所示开始创建以两个字符串的长度为行和列的数组对数组进行初始化遍历两个字符串如果字符相等则护,否则企计算得到数组行之和与列之和的最小值,即两个字符串之间的距离结束图算法流程图本文使用算法计算用户输入关键词和本体中所有概念类之间的字符串相似度,但必须要得到与用户输入关键词最相似的概念类,以便接下来使用神经网络算法来对此概念类进行扩展。得到用户输入关键词的本体匹配概念后,就可以计算此概念类与本体中其他概念类的相似度作为样本集。样本的采集流程如图所示。程序返回的是个二维数组,里面存储的就是通过两种相似度算法得到的样本集。神经网络得到这个相似度样本集就可以进行训练。 第页华东理工大学硕士学位论文开始使用方法把糖尿病本体导入获取糖尿病本体中的概念类取出本体中一个概念类的使用中算法计算与用户输入的相似度把计算结果存入三维数组,供咧练使用图样本采集程序流程图田肌输入查询语句“如何治疗糖尿病”后,得到查询语句和本体中概念分别使用三种相似度算法得到的结果作为训练样本。糖尿病本体中有个概念,通过样本采集后可以得到个样本。其中个样本作为训练,提取个样本进行仿真。样本如下表所示本文使用的神经网络为输入,隐层和输出的网络结构,每个输入向量的取值范围为,,隐层的激活函数为,输出层的激活函数为,训练函数为,训练次数为次,目标误差为一,训练步长为采用个样本进行训练,误差曲线如图所示。 华东理工大学硕士学位论文第页表样本用户输入关键词如何治语义相似度算语义相似度算语义相似度算期望相似疗糖尿病法一法二法三度输出糖尿病的治疗中医治疗糖尿病效果如何药物疗法糖尿病治疗要戒七过度胰岛素治疗糖尿病糖尿病治疗手册运动保健糖尿病的预防和保养糖尿病患者死亡原因糖尿病知识饮食治疗糖尿病药物糖尿病秋季治疗时间佳改善生活方式糖尿病病理和病因家庭护理胰岛素泵生活起居糖尿病型合理饮食血糖和胰岛素糖尿病都有哪些征兆感染性疾病死亡原因糖尿病主食类食谱防治并发症精神神经系统糖尿病病理和病因糖尿病的国外研究进展消化系统 华东理工大学硕士学位论文第页网络模型训练后进行仿真,仿真结果如图所示。从图中可以看出训练以后,本体中这个概念与用户输入关键词的相似度得到很好的修正,图中的仿真结果可以看出,这个概念排序结果和期望的排序顺序一样,最终把优化好的查询结果反馈给用户。。,。。、吸叹柳、得已目。二一一一图仿真结果语义相似度算法的应用在语义查询系统中,为了实现海量数据信息的知识共享,可以使用本体对一些专业的领域知识进行建模。基于领域知识本体的查询,可以在中发现很多同义或近义的概念,使得检索结果实现语义概念的匹配。语义相似度的思想,在某种程度上避免了关键字查询的局限性,对于查询结果可以进行语义上的扩展,最终实现搜索系统的优化。本文实现了基于神经网络算法的语义相似度,采用优化的语义相似度计算技术对用户输入的关键词进行本体知识层面上的扩展。搜索引擎根据本体领域知识概念扩展后的检索词再到有关的网站和网页进行信息检索。这样,避免了传统的关键词机械匹配方法所造成搜索过程中的不确定和不稳定问题,从而提高搜索引擎的智能度。整个算法的计算过程可以通过以下几个步骤来实现,如图所示。其中虚线框部分使用了语义相似度。整个过程如下初始概念用户输入检索关键词,利用字符匹配相似度算法计算该关键词与本体概念之间的相似度,并得到相似度最高的那个概念类 第页华东理工大学硕士学位论文概念扩展集设定语义相似度的闭值,采用闭值是为了实现查询系统的过滤机制,对本体概念进行扩展时,采用语义相似度计算得到的结果保留大于设定闭值的那些本体概念,从而得到检索概念的扩展后的本体概念集信息查询使用扩展后的本体概念,进行检索查询,从而找到满足条件的信息结果排序根据本体概念相似度及其系统,对检索结果进行排序。一一一一一一一一一一一一`一飞一一飞巫回缨料竺鳖,片曰矩画鳄黯侄困一`图计算语义相似度的步骤实际实现过程中,可利用神经网络算法计算语义概念相似度,进行本体概念扩展。采用本体概念扩展集,可以大大提高搜索引擎系统查询的查准率和查全率。小结本章主要讨论了相似度研究现状和不足,提出了本人的改进想法,在综合考虑多种语义相似度影响因素的基础上设计了基于神经网络的语义相似度算法。对于神经网络算法实现语义相似度思路和设计过程作出了详细的阐述。 华东理工大学硕士学位论文第页第章精尿病知识本体的语义检索系统基于糖尿病本体的语义检索模型语义检索模型主要分为四个模块,包括用户查询扩展和结果反馈模块、本体建立与管理模块、检索引擎模块和信息获取模块。用户查询扩展和结果反馈模块主要使用、和实现,是用户交互界面。本体建立与管理模块主要使用来建立糖尿病知识本体,对本体进行操作,包括本体推理,本体持久化。检索引擎模块主要完成对糖尿病本体知识库中的内容和获取到的知识进行索引,并完成查询。信息获取模块是对糖尿病本体知识库的扩展,用来弥补人工语义标注带来的知识的有限性,主要通过爬虫获取网页信息和本地、和等文件来转化为文本文件供索引和查询使用。语义检索模型的创建思想,如图所示网页信息查询结果网络爬虫界面网页预处理用户界面图语义检索模型的创建思想二用户查询和结果反馈模块本系统主要分为三个界面,分别为管理员界面、医生界面和病人界面。管理员界面主要完成管理员对系统数据库的管理和本体知识的完善等。医生界面是医生的系统操作平台,用来完成一些病人及其糖尿病知识的收集和管理。病人界面主要用来病人对医生 第页华东理工大学硕士学位论文一信息及其糖尿病知识的查询,帮助病人找到自己想要的医生和更好地学习糖尿病知识。主界面如下图所示“,命·因圃铃户,☆必公·备目,毖矛似睑吝浏卜哟`扮``内布民比口刀皿尹冲诲目洲峰,喂留,厄二二二二二二二囊么十呼“,,参“,从卜话山·姗加灿卜汤卜理印脚,旧理丛至路睡生圣几』娜人圣咭扮殆沁下二一一万一一丫万二刃万井泣一一…一勺祥````图系统主界面在这本文主要介绍一下医生界面的功能,点击主界面中“医生登陆”按钮,加入医生登陆界面。医生界面主要功能包括病人列表、病人查询、添加病人信息、糖尿病知识搜索,个人资料的查看和修改等。点击“病人列表”,进入如下界面,如图所示。病人列表中列举了登陆账户的那个医生治疗过的所有病人。在这个列表中可以对病人信息进行删除、查看病人详情和病人信息修改等操作。点击病人李四的详情,可以看到李四的所有信息,其中包括很多与病人身体和病情状况有关的信息,如年龄、性别、身高、体重、血压和病史等。 华东理工大学硕士学位论文第页文件卿侣日谧〕班若叩心目伍工三江〕月助叩舞后。,窃困画汾,介。,书,一分国,少户毅豁吞乞圣翔地二。司。。。“,二,、,。一一一一一一一一一一二目蒯份。嘿婴一酥二二二二二二二万斗僻到旧口、。。,禅`晓,'一云二卜汤,,们圈趁国国碑,糖尿病知识查询系统脚人甘班”翻人列理』医生界面系统便用导位万丰石一布一而一杯人列稚一一厂二〕一王五毛份生一二竺匆诬三些卜丈`刀``瓜病人聋旬添加病入信息精尿病知识摺萦用户佑息八人资科医生资料峰改习钧完毕兮本均卜。、图病人列表文件健〕口扭亿〕获若卿收口咕〕工月江〕招助叩淤勇两。斤体月图给病人开处方在病人信息的最下面有个“给病人李四开处方”的按钮,点击此按钮会实现查询,主要是根据病人的年龄、性别、身高、体重、血压和病史信息来获取医生所需要的信息,为医生对病人情况实现诊断作出决策支持。 第页华东理工大学硕士学位论文碑葬黔嘿瀚嗯州鲜溯钾溯攫军曰样钾“一守港纷尹”☆必乡奋国一公尹截容甚桩技蜷址边目`,场几。。幽即产侧簇目”倒已卡琴`“。,漆翻卜故往·易`二间·汤,分娜目曰麟,台糖二尿病知识杳询系统枪尿病型鱼些医生界面开药成功系统使用导旅病人到农目洲湘病人音询弩黯窦要缭播蒸声命病煮,廿添加病人信息型植尿病是遗传易感性个体通过自身抗原介导的免疫反应引起胶岛肉胞破坏的自身免疫性疾病目前认为在临床明显的松尿病发生以前,型植尿病经过一较长时间的枪尿病前期负响在褚尿病知识技索前期预换瀚尿病的发生,筛选型松尿病的高危人群及时进行免疫干预抬疗是预防型枪尿病的关悦因而型植尿病的生化徨侧粕标显得尤为重要。型枪尿病的早期预防可分为三期一期是有型植尿病发病倾向高危人群。如型植尿病的亲属和一彼人群中具遗传素质者,此时免疫学标志尚未出现,可用遗传基因标志检倒二期即免疫破坏期,此时血润内己有抗胶岛细胞用户仓息的自身抗体出现是型植尿病预防的关健。三期即型植尿病发病的早期己出现馆尿病症状,但族岛幽胞尚有一定功能干预治疗可保护残存的胶岛内胞不被破坏或延缓破坏,个人资料,医生资料修改图查看结果矶开药后会查询到相应的信息反馈到页面上,点击相关的超链接就能获取查询的知识。本系统的目的就是帮助医生实现病人信息的管理、获取糖尿病知识及其针对病人情况帮助医生作出决策支持,病人可以通过此系统了解医生的情况,获取糖尿病的相关知识,从而更好地管理自己的生活、就医、用药、锻炼、精神调节等。本体建立与管理模块本体的建立本文建立了一个糖尿病知识本体,首先要分析糖尿病领域的一些基本概念及其概念之间的相互关系,通过这些关系和概念来完成本体的建立。明确本体的领域为“糖尿病”领域归纳一些主要概念和属性,及其概念之间的关系实例的选取,及其语义标注的实现构造概念之间的层次结构分析,完成本体框架的建立使用本体语言对糖尿病知识本体进行规范化描述。糖尿病知识本体分为大类糖尿病及其并发症,糖尿病知识,糖尿病的治疗,糖尿病的防治护理,糖尿病食谱。本体的建立除了考虑本体领域的概念类还要考虑类的属性及其类与类之间的关系。 华东理工大学硕士学位论文第页对于类的属性,有两种属性对象属性,将对象相互关联,例如由…讲授几和监督是两个对象属性。数据类型属性,将对象与数据类型值相关联,例如电话、标题、年龄等。没有任何预定义数据类型,也没提供特别的定义机制。类之间的关系可以通过定义一个对象属性来实现概念类之间的和关系。有些蕴含的关系可以通过推理来实现。举一个简单的例子若类与类等价,类与类等价,则与等价。本体的操作和管理语言本体的操作和管理主要是通过来实现。的最主要包括个包,具体描述如下所示帅包这是最重要的劝包。其中包含了、·、和以及其他接口·包它包含一些指南中所使用的例子的源代码··包其中包含了的实现,这些都是用于将整个模型状态装入内存的。在这个包中包含了所有使用实现基于内存模型的创建·包在中包含了对于诸多通用的实现类。在这个包中定义了类,和。坤为盼包。在对本体使用操作时,想要更好地开发好本体,这些包都是必须的。例如只有导入包··后,才能对本体进行导入操作。持久化本体到数据库要实现持久化本体到数据库,便于以后更好地对本体的操作,首先必须在中配置好,接着就可以在中实现持久化本体。首先完成数据库的连接,代码如下所示一,,,一王腼,一,,一接着就可以实现本体存入数据库的操作,从文件读取本体并将其存入数据库的代码如下所示,, 第页华东理工大学硕士学位论文,再者,存入数据库的本体如果不能被方便的利用,那么就失去了把本体持久化到数据库的意义。从数据库中得到己存入本体代码如下所示,,位妓实现关键词的语义扩展查询服务器实现用户输入关键词的分析,本文的检索服务器的内部结构主要包括全文检索系统和基于神经网络算法的查询关键词语义扩展。对于用户提交的查询关键词的优化主要分为同义词查询扩展和本体查询扩展。等'提出了一个新的基于本体的框架语义扩展搜索。基于领域本体构造,语义注释推理算法和语义扩展算法的详细介绍,这是有关与语义标注单位和语义扩展推理引擎的分别。完成了一个语义搜索原型系统的设计和实施。本文提出的实现关键词语义扩展的思路如图所示 华东理工大学硕士学位论文第页搪尿病知识本体用户输入的查询关键词实现关键词语义扩展图实现关键词语义扩展的思路实现图的查询是的数据工作组设计的一种查询语言和协议,用于查询数据。中实现的查询是基于三元组的。具体查询实现如下所示认八一厂”,,对于一些查询的特定需要,有些需要返回的数据信息可能不存在,可是有一些需要返回的数据信息存在于这些不存在的数据中,这时候就需要采用可选查询信息的方式进行查询,比如工丑认氏切囚一二在查询语句中添加过滤条件的语句是,”,,【,””。其中 一第页一华东理工大学硕士学位论文是声明过滤,是过滤模式作用的变量,后面的是具体的限制条件,如刀一毛,”,,,””其中”表示,名字中必须出现的字母”或者”””'表示,对签名的字母限制,对大小写并不敏感若是要对大小写敏感则去掉这个限制即可即,”尸如果已经可以运行使用的程序。这样就可以直接编写查询程序。一个简单查询的代码片段如下汀,,,,”,,,,”,,一”,,,实现网页信息获取及其搜索简介周登朋和谢康林提出作为一个开源的全文信息检索包,正在为越来越多的应用程序提供搜索功能。也是目前常用的基于的全文信息检索包,随着搜索技术正在成为计算机行业研究的热点领域,将得到更加广泛的应用。是一个全文索引引擎工具包,它是用代码开发的,要是考虑实现特别应用的全文检索功能,只要完成在特定应用中的嵌入就行了。开发了,在此之前他作为主要开发者的身份开发了搜 华东理工大学硕士学位论文第页索引擎,后在担任高级系统架构设计师期间,主要从事的研究工作是底层架构。的发展到目前为止,经历了一段时间。刚开始把发布在'·和飞上,最终成为嫩基金会砍。的一个子项目是在年底。迄今为止使用作为全文搜索引擎已有很多项目论坛系统邮件列表归档系统,属于的项目基于的发布框架,在全文检索部分使用了其帮助部分的全文索引使用了。可是中文用户最关心的问题是如何使用实现中文全文搜索引擎。值得庆幸的是只要扩展的语言词法分析接口就可以使得支持中文检索。主要由个部分组成,具体如图所示一飞·味赢赢赢装司。·。二,……图的个组成部分具有很多比较方便的接口,的输入和输出结构与数据库很像,因此很多传统的文件和数据库可以方便地把文件映射到的存储接口。对于一本书来说,为了能够让读者尽快找到关键词所对应的页码,在书的最后会附上索引表。在提高搜索速度方面,数据库的索引也是一样的原理,并且索引是排好序的,这更有利于提高检索的效率。检索系统的核心问题说到底就是排序。最重要的特点是使用了反向索引机制能够实现数据库的索引,并且也提供了很多相应的扩展接口。全文检索最大的优点是其搜索结果中匹配度最大的头个就可以满足以上的查询需求。如想使用实现查询,必须对等待搜索的所有文档等资料进行索引,索引的步骤如下首先根据文件的路径来取得文件名,其次需要把所有的文档以内容和路径两个字段的方式存储,然后使用索引。不同内容有不同的索引方式,具体如表所示 第页华东理工大学硕士学位论文表对字段的索引操作'方法索引存储用途,索引并存储,如标题斌,索引不存储,索引并存储,如日期,不索引只存储比如文件,只全文索引,不存储对文档的索引'实现代码如下所示,,咬料,,”,,,,,,,勿,,,别五由上可知提供了两个分析器,分别是和刀,可是它们都不支持中文,但是我们可以在分析器中添加中文的语法规则,来实现对中文的支持。在中只要可以把数据源解析成对象即可,所以数据源的形式可以是、、和数据库等。索引完了就可以实现搜索,进行检索后得到的是对象,我们可以通过对象来访问的字段中的内容。搜索的代码片段孩口下所示 华东理工大学硕士学位论文第页,仃,””,·,,,,上述内容说明了是如何实现查询的,而且为了满足不同用户的需要,我们可以对,和这些抽象接口进行定制。创建基于语义的垂直搜索引擎开发的垂直搜索引擎是专注于特定领域的搜索系统,主要使用完成特定的信息抓取任务,使用实现专业领域信息的索引和搜索功能,再加上本体对于专业领域术语的规范和语义扩展,这样的搜索引擎比传统意义上的搜索引擎要更加的专业,搜索的查全率和查准率都能够达到很高的要求。本文的优点就是采用语义网技术和垂直搜索引擎的结合,在完成用户关键词输入后,就将关键字映射到本体知识中,并利用本体的领域专业性知识对本体概念进行扩展,扩展后的知识作为查询的输入,接着系统在运行中采用网络爬虫模块获取专门的领域数据,通常具有定向数据采集抓取能力。然后使用正则表达式和进行网页内容分析,实现有效信息的提取,并把信息存储起来。以上收集到的信息,通过的对信息的索引后就可以完成搜索操作,最终能够更好地满足用户的检索需求。考虑到搜索需要,本系统实现的思路场口图所示图垂直搜索系统设计实现流程结构选取数据信息来源网站和网页由于垂直搜索系统的专业性强的特点,在实际使用时,为了保证信息专业性,信息来源网站和网页的选择成为首先要解决的重要问题。从垂直搜索系统的使用来考虑,信 第页华东理工大学硕士学位论文息来源的选择基本要遵循以下几个原则】网页可以被爬虫抓取。作为信息来源的网站没有反爬虫技术。这个原则主要考虑到有些网页不允许信息被网络爬虫抓取。所选择的信息来源网站必须能够满足爬虫争取信息的操作是有效的。网页信息没有采用动态产生。对于使用了匆和的网站,信息内容是动态生成的,爬虫要抓取这些信息必须模拟网页浏览器,对于大量的网页信息就不是很合理了。网站的页面结构不会时常改变。由于在网站和网页的内容进行分析的时候考虑了网页的结构,特别是提取网页信息的程序很大程度上考虑了网站的页面结构。所以对于页面结构不会常常变化的网站,对于网络爬虫的信息抓取和网页内容的有效提取都很有帮助。当然,以上提到了在选择网站时应该考虑的几个技术层面的问题,同时要考虑到垂直搜索引擎的专业性,选择的时候应该挑那些知名网站。这样,可以保证垂直搜索引擎系统信息的专业性和完整性。对于糖尿病知识领域,可以选择中国糖尿病网,糖友网,和健康网等。网站和网页内容分析就拿健康网来说,对于网络爬虫对于网站内容的抓取操作实质上就是获取相关内容的链接,爬虫通过链接就可以抓取目标网页的信息。打开健康网主页的页面源文件,查找其部分源码如下韶,,,,,,,,介,即,,叼饥乒,,,癌症叼月尸,沪艾滋病叼月卜,,砍灼哟,,阿尔茨海默叼少饥”介”灯瓜'叼少叼卜,,欣峥讯班,,白瘫风叼护月卜,,砍订,白内障叼切尸,呱订叭扁桃体炎叼切叼,,,介,,灯,,叼饥卜,,,砍而,,高血压叼月介,砍而双麒”冠心病少切卜,,砍咖掀,骨质疏松叼少切卜,,洲乙盘灯左叭,,咳嗽少月介,,砍订,,口腔溃疡叼饥尸,灯湘叭七阑尾炎叼少叼卜,,砍订公,漫`性咽炎沙饥叼 华东理工大学硕士学位论文第页将健康网主页源码存为文件,在中利用页面解析的代码,就能够完成相关工作。代码片段场口下所示砒斌,王”,,”饮,,”,,”,,,,”一一斌,机狱”,,认的,,”定制爬虫抓取网页内容网络爬虫川是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部分。网络爬虫的抓取网页的思路如图所示。垂直搜索系统的开发包括网络爬虫的设计,因为网络爬虫可以通过抓取行为为搜索系统提供精确的数据信息,但是就目前使用的的所有功能组件,还不能够满足特定需要的抓取任务,比如需要对中国糖尿病网的信息进行抓取,还不能实现,所以要进行定制。还有糖尿病健康知识网络爬虫需要实现保存健康知识页面和不保存其他无关的页面的功能。其中保存健康知识页面很容易实现,由于这是组件本身所具有的功能。但对于不保存无关信息这个点爬虫还不能达到要求,所以需要对进行定制开发。 华东理工大学硕士学位论文输入关键字获取种子种子加入队列从队列中获取下一个种子从七上下载该网页存储网页提取网页,并加入到队列图网页抓取流程图的定制考虑对进行扩展。爬虫的选择策略实现的功能是允许抓取的网页信息必须是中所具有的。进行抓取的时候就会把满足条件的放入队列。这样就可以实现对网络爬虫抓取操作的限制。代码通过重载方法,实现链接字符串的过滤功能。定制完以后接着就实现网络爬虫的抓取任务。首先完成配置,如下图 华东理工大学硕士学位论文第页户川口沉,,毋习协`创侧加沂`含以阵肠玄带时心侧国万以卜坛吸孟的曦辉日目侧作,日沐创留廿脚巴厅廿加口曰胡口“侧而盯侧护”】,片七认拜二理白欣如,,,卿比晚喇压林地脚山笼拍比「`灿卿从加夕`口曰胡山泊、留廿如动曰而比七片工二。,叹几、毛`肛一、“`班工工一、``三一生丁。屯七,廿`闷田妞翻侧盯几巴习记七人工二出乞巴工七几洲已。止`廿由已口山功血翻公划口叹妇茂日,二仁亡吕已,仁巴几巴。卜乏口工乙口`吧口口间山陇司山,亡七℃口加,夕口七梦巴吧巨咤。日,奋廿幽口口间山陇以山”,傲目月口寸的口翻确嘴已呢以夕廿加已口翻胡份功俄口夕比八口翻如护以沙份廿加。山动留廿如。出妇斤`苦廿翻口洲汤,卜即“长曰以眨厂`甘廿幽口喃卜份成时留廿如翻比臼泊份廿`口,确「明中戊“盯口如刀诵口时以祠`一,。,,一图议配置接着登陆,在中启动,打开浏览器输入密码,进入管理界面,如图所示图管理界面选择链接,添加新的工作任务。接下来就可以开始抓取了,在管理界面中选择控制台,启动新添加的任务就完成了。网页内容提取和正则分析 卸乎…………一一进生些达生竺兰鱼丝网页内容如何有效地提取关系到整个搜索引擎的性能。在提取文本的时候,如果很大程度上使用正则表达式来获取想要的网页信息,那么就要处理很多细节的东西。面对这样的问题,本文考虑采用来实现对网页信息的获取。在网页信息数据获取方面具有方便快捷的优点。假如现在想使用来获取网页中的图片信息,具体的方法场口下所示首先创建一个标签名过滤器几,使其可以获取具有标签名为“”的链接标签,为了找到所有的超链接。其次创建第二个标签名过滤器,使其可以获取具有标签名为“”的链接标签,在找到超链接的基础上再筛选那些是图片的超链接。代码如下所示二,,,,,,,,,想获取网页中的图片信息的思路首先找到网页中所有的链接,接着在链接中筛选图片的链接。所以使用把对于获取标签名“”的链接作为第二次的过滤操作,这样的组合操作使用刀函数实现。当然,对于除了图片的网页信息的操作也是同样的思路。使用建立己经下载的网页内容索引通过爬虫抓取相关的网页并使用对网页内容提取和正则分析以后把内容存入本地计算机,接着就可以对相关内容进行索引。在中使用以下工具来建立索引在索引过程中认叭的主要任务是把文档信息加入到索引之中,为索引的做准备。主要用于分析搜索引擎将要处理的各种文本信息,包括对“的',、“了”、“啊”等词的分析和标点符号的分析,对于英文会分析空格。其中最常用的有山功分析器等。提供了两种索引存放的位置,一种是磁盘,另外一种是内存。需要被索引的文件在进行索引之前都要转换成对象才行。字段。介绍了那么多方法,以下就是使用对一个文件夹中所有饮文件进行索引的代码片段。,,”,,俪”刀五,, 华东理工大学硕士学位论文第页【””【」,”””,,,,,””,,,卫,在这里你会发现只能处理文件,当然,很多网页内容经过处理后就可以转化问文件。而对于,和等有专门的插件进行处理后同样可以转化成能够处理的文件。垂直搜索实现对文档建立完索引以后就能够实现搜索了。在中帮助完成搜索的工具大体有以下几种】是中最基本的检索工具,任何一个检索的实现都要使用到顶具查询,中支持模糊查询,语义查询,组合查询等。是一个解析工具,通过解析用户输入的字符串,生成对象。,在搜索完成之后,需要把搜索结果返回并显示给用户,只有这样才算是完成搜索的目的。在中,搜索结果的集合是用类的实例来表示的。实现查询的程序代码片段如下所示仃,卿一”中华” 第页华东理工大学硕士学位论文””刀,,,,,卜小结本章主要讨论了糖尿病知识本体的语义检索系统的实现。整个系统包括界面的设计、后台数据库的实现、内部组件的实现、对本体的持久化、实现关键词的语义扩展及其构建一个基于语义的垂直搜索引擎。系统的研究主要在关键词的语义扩展,系统的目标就是通过语义网和相似算法的优化使得搜索变得更加智能,同时提高查全率和查准率。 华东理工大学硕士学位论文第页第章总结与展望语义网的未来充满了希望,它能够让人和计算机协作效果更好〔。基于语义的糖尿病知识检索分析系统就是采用了语义网技术,实现了糖尿病知识的优化组织和管理,并且为更好的帮助用户查询到理想的糖尿病知识提供了可能。基于语义网的检索机制与传统的基于关键词的检索相比较更加智能,并且能够有效提供资源检索的查准率和查全率。本文的主要工作包括川使用电构建本体,根据该本体对糖尿病知识进行手动语义标注及其相关度算法来实现非嵌入式的标注方法对本体进行操作,实现语义相似度的算法及其用户关键词的语义扩展使用神经网络算法来实现本体中语义相似度的研究,最终实现将优化的查询结果反馈给查询用户,实现了搜索的查准率设计知识检索系统原型,使用、、和等实现知识系统界面及其业务逻辑层的开发使用创建基于语义的全文搜索引擎。通过这些方法本文实现了基于语义的糖尿病知识检索分析系统,有效地改善了传统的检索方式所带来的不足,提高了检索的智能化水平。希望本文能给糖尿病患者带去一点点的帮助。可是由于时间的关系,该检索分析系统还是有很多不足之处,下一步将通过以下几点来深入和完善系统糖尿病知识本体的进一步完善语义标注的自动化由于要实现大量的信息集成,最大限度地发挥语义网的优点,必须实现语义知识的自动标注语义相似度算法的优化本文采用的神经网络算法来实现语义相似度所使用的网络结构比较简单,通过改进算法来实现语义相似度算法的优化还要继续努力和实现垂直搜索引擎的优化。 第页华东理工大学硕士学位论文参考文献」周文彬一个本体的采集系统东南大学硕士学位论文,七,们,眼范正一,,七甩习爪·,,,,,,七一一,,川,,一,、恤,【陈欣基于服务的数据语义集成技术研究「东南大学硕士学位论文,一,一,一【,,田刀【」,田刀肠一,一,,,众垃,,一一 华东理工大学硕士学位论文第页,一一,「」一亡,一【」,一,,【」,,知,为陈洁项目管理系统及知识管理研究【南京理工大学硕士学位论文,【邱明语义相似性度量及其在设计管理系统中的应用浙江大学博士学位论文,【」·,一【,,,一,,胡哪一,一【」,,,一,】宋玲,郭家义概念与文档的语义相似度计算计算机工程与应用,,【李鹏,陶兰一种改进的本体语义相似度计算及其应用计算机工程与设计,【王冠亚神经网络算法在教务管理系统中对学业方向识别的研究与应用【中国海洋大学硕士学位论文,一【梁颖蕾网站用户交互行为模式的可视化系统的设计和实现【中山大学硕士学位论文, 第页华东理工大学硕士学位论文周登朋,谢康林搜索引擎计算机工程,白坤,耿国华基于舰的垂直搜索引擎的研究与应用计算机应用与软件,片月`郎小伟,王申康基于的全文检索系统研究与开发计算机工程,管建和,甘剑峰基于全文检索引擎的应用研究与实现计算机工程与设计,一,`内」﹄︸片月,,丫么一邱哲,符滔滔,王学松开发自己的搜索引擎一人民邮电出版社,,一,,勿咖,一`人`一﹄乙何伟,薛素静,孔梦荣基于的全文搜索引擎的设计与实现情报杂志,张铭晖基于语义的教学资源检索系统的研究与实现【华中科技大学硕士学位论文,协阵李世勇基于混合式客户端蜜罐的恶意网址收集系统的设计与实现武汉科技大学硕士学位论文,吕玉鹏基于领域本体的网页信息采集与检索研究大连理工大学硕士学位论文,孙垒基于神经网络的模拟电路故障诊断系统的设计与实现南京理工大学硕士学位论文,陈叶旺国家农业本体协同建构与语义检索若干技术研究复旦大学博士学位论文,一 华东理工大学硕士学位论文第页致谢本论文是在尊敬的导师王学武老师的悉心关怀和指导下完成的。从选择课题内容,学习和了解相关的研究方向的知识,论文的题目的选择,研究思路的确定,到最后论文的撰写和修改无不凝聚了王老师的心血。王老师每周督促我的学习进度,及时提出反馈意见,使我的研究有了很明确的思路,帮助我拓展了自己的视野,强化了自己的专业知识技能,也使我不断地为自己的理想和目标奋斗。正是由于王老师的亲切关怀和悉心指导,为我的论文的顺利完成提供了很大的帮助。除了在学习上,王老师还特别关心我的生活,教导我如何做人和做事。他严谨的治学态度、孜孜不倦的教诲、精益求精的工作作风都深深地影响着我,使我受益终身。值此硕士论文完成之际,谨向王老师致以最衷心的感谢和最崇高的敬意。同时,我还要深深地感谢院长侍洪波老师,在本人论文修改的过程中,特别是答辩后的修改工作中花了很多心思。在论文的修改过程中张凌波老师和钱峰老师也给了本人很多的指导意见,在此表示感谢。同样感谢黄道老师、顾幸生老师,李绍军老师、王振雷老师、牛玉刚老师、杨富文老师、刘漫丹老师、黎冰老师、王华忠老师,感谢他们在百忙之中抽出时间对我的论文进行指导,并提供建设性的意见,在此向他们表示真诚的感谢。我还要感谢信息学院所有的老师,是他们的无私奉献使我学到了很多专业知识,为我的课题研究打下了牢固的理论基础,在生活中,他们也给我提供了很大的帮助,让我学会了很多做人的道理,使我受益匪浅。感谢李飞在我神经网络算法的学习中给予了很多支持,帮助我解决了很多困难。感谢何海娟、李师、张剑和陈展雄在我论文撰写各环节提供的帮助。感谢实验室的全体同学,在我遇到疑难的时候,是他们伸出了热情的双手,与大家的探讨过程中使我受益匪浅。感谢杜伟、丁小东、丁朋三位室友在生活上和学习上对我的关心和支持。最后,要感谢我的父母对我的养育之恩,所有家人朋友对我的关心和期望。我今天所取得的成绩,与他们默默的理解和支持是分不开的。感谢大家最后,感谢我的父母一直以来对我学习、生活的关心和支持,我会一直努力、奋斗,报答他们的养育之恩。 第页华东理工大学硕士学位论文攻读硕士期间发表的学术论文【王学武,樊春雷基于语义分析的远程高血压健康教育系统研究与实现知收录

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭