基于本体的概念语义相似度测量研究

基于本体的概念语义相似度测量研究

ID:35066289

大小:5.83 MB

页数:62页

时间:2019-03-17

基于本体的概念语义相似度测量研究_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《基于本体的概念语义相似度测量研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、单位代码10602I学号2013011509分类号TP391级公开瓜'>呼爲序變V::::^GUANGXINORMALUNIVERSITY硕壬学隹冷文基于本体的概念语义相似度测量研究StudyonConceptSemanticSimilarityMeasureBasedonOn化logy学院:计算机科学与信息王程学院专业:计算机软件与理论研究方向:自然语言处理年级:2013级研究生:李飞指导教师:朱新华教授完成

2、日期:2016年4月’I基于本体的槪念语义相似度测量研究?专业名称?计算机软件与理论申请人:李飞指导教师:朱新华教授*、!论文答辩姜员会.主席.姿员.!齡吗f王麵\{Ma*V广西师拖大学硕古研苑生学位论义基于本体的概念语义相似度测量研究研巧生:李飞导师!朱新华教授学科专业:计算机软件与理论研巧方向:自然语言处理年级:2013级摘要一个重要的研究内容概念语义相似度的测量是自然语言处理的,它在信息检索一、机器额译、词义排歧

3、、自动问答等领域都有广泛的应用,它是个基础的研一巧课题。目前对概念语义相似度的测量研巧大致分为两大类:类是依据某种世一界知识来计算,主要是使用种语义词典,通过词典中概念结点间的关系(上下-部分关系等一位关系、同位关系、整体)来测量概念间的相似度;另类是使用一种大规模的语料库,通过统计学的方法依据上下文信息的概率分布来度量概念间的语义相似度一一,这类方法通过研巧者的证明同样适用于种近似于语料库的本体中。随着本体结构的完善和本体库词汇量的增加,越来越多的研究者开始使一用本体进行语义相似度

4、测量研巧,但都存在定的局限性,实用性受到效率W及一现状不同应用领域的严重质疑。针对这,本文从该方向着手进行探索研究。本文结合前期的研究工作L义及参阅相关文献,选用国内的《词林》扩展版和o一国外的WrdNet,就相关研究遗留的问题,分别提出种模型用于计算概念语义相似度:。本文的主要工作如下(1)在中文词语相似度测量中,分析具有代表性的田久乐提出的算法存在的不足,然后针对存在的问题提出了较好地解决办法30,使其与标准测试集MC数据集的人工判定值之间的皮尔逊相关系数由0.53提高到0.

5、85,具有较好的实用价值。(2)通过对众多化秀算法的研究W及对《词林》扩展版的了解,WDekangL一in的相似度理论为基础,通过理论分析与推导,最后提出种新的概念语义相似度测量方法。(3)在对中文词语相似度测量方法效果进行评判好,由于国内缺乏具体的一评判标准,本文参考国外的评判标准,,转化出了种中文词语相似度评判方法一种评估标准为国内的词语相似度方法的评估提供了。(4)在英文概念语义相似度测量中,基于WordNet的研究,考虑到本体中普遍存在的不规则密度,导致计算结果不佳的

6、问题。首先从己有的算法中通过部一分改进抽取出种基于密度权重的算法,用于证明通过密度补偿路径可W改善不一,然后提出种基于区域密度补偿的路径计算模型规则密度引起的问题,将该模型运用于流行的基于路径距离的算法中,通过国际标准测试集测试,发现应用本文的模型的算法比之前的算法与标准测试集的人工判定值之间的皮尔逊相关系I广西师范大学硕±研巧生学位论文数有了很大的提高,具有较好的效果。(5)考虑到随着大数据时代的到来,本体中的概念数量可能随时发生变化,一目前效果最好的基于信息内容的方法

7、可能不能适应这发展趋势,本文提出的基一定的参考价值于区域密度补偿的路径计算模型对相关领域研究人员可能具有。,Woret,关键字:同义词词林dN语义相似度路径计算模型,自然语言处理,II广西师范大学硕±研%生学位论义StudyonConcetSemanticSimilaritMeasureBasedonpyOWologyratestut-Gduaden:LeTuor:Pro.niFitXihuaZhuMaor:ComuterSoftwarean

8、dTheorjpy;民esourceare汉:Natur泣1LanguageProcessingGrade:2013.ABSTRACTThemeasurementofthesemanticsimilaritybetweenconceptsisanimportantresearchareainnaturallanguageroces

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。