基于角度—相似度转换模型的义原相似度计算

基于角度—相似度转换模型的义原相似度计算

ID:44050898

大小:244.86 KB

页数:21页

时间:2019-10-18

基于角度—相似度转换模型的义原相似度计算_第1页
基于角度—相似度转换模型的义原相似度计算_第2页
基于角度—相似度转换模型的义原相似度计算_第3页
基于角度—相似度转换模型的义原相似度计算_第4页
基于角度—相似度转换模型的义原相似度计算_第5页
资源描述:

《基于角度—相似度转换模型的义原相似度计算》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于角度一相似度转换模型的义原相似度计算黄洪屠肖龙浙江工业大学计算机科学与技术学院摘要:义原的相似度是基于《知网》计算词语、句子相似度的基础•最早的义原相似度计算方法是刘群等提出的根据义原距离转换为义原相似度的方法,之后许多研究者在计算公式中引入了其他影响相似度计算的因素•这些因素本质上都可以由父节点深度、父节点到第一个义原的深度和父节点到第二个义原的深度等三个基本因素组成.将这三个因素作为基本变量,分析变量对义原相似度的影响方式并构建角度一相似度转换模型,实现了根据义原角度转换为义原相似度的方法•最后,通过实验分析比较新方法与同类方法在区分度、正区分度和距离课差上的优势,验证了其合理

2、性.关键词:义原相似度;角度一相似度转换模型;知网;作者简介:黄洪(1964—),男,江西丰城人,教授,研究方向为软件开发、智能电子商务和自然语言处理等,E-mail:huanghong@zjut.edu.cn.收稿日期:2017-02-17Thecalculationofsememesimilaritybasedonangle-similaritytransformationmodelHUANGHongTUXiaolongCollegeofComputerScienceandTechnology,ZhejiangUniversityofTechnology;Abstract:Seme

3、mesimilarityisthebasisforcomputingsimilarityofwordsandsentencesinthe“Hownet”.TheearliestsememesimilaritycalculationmethodwasproposedbyLiuQu.Tnthismethod,thesememedistancewastransfonnedintosememesimilarity.Afterthat,manyresearchershaveintroducedotherfactorsthatinfluencesimilaritycalculationsinthe

4、calculationformula.Thesefactorsessentiallyconsistsofthreepreliminaryparts:depthofcommonfatherpoint,distancebetweenthefatherpointandthefirstsememe,anddistaneebetweenthefatherpointandthesecondsememe.Takingthesethreefactorsasbasicvariables,theeffectofthesefactorsonsememesimilaritywasanalyzedandanan

5、gle-similarit)^transformationmodelwasconstructedtotransformsememeangleintosememesimilarity.Finally,theexperimentsanalyzedtheadvantagesondistinction,positivedistinctionanddistanceerrorbetwecnnewmethodsandsimilarmethods,andverifieditsrationality.Keyword:sememesimilarity;angle-sim订aritytransfonndti

6、onmodel;Hownet;Received:2017-02-17相似度计算是人工智1能和自然语言处理领域的一个研究重点,词语相似度普遍应用于信息抽取、文本聚类山、词义排歧、机器翻译和自动问答等领域[2-3]・在计算词语相似度时通常有两种经典的方法;第一种是统计分析的方法,该方两个词语的相似度[4-5].另一种是基于词语分类体系的方法,该方法需要依赖于某种知识库,目前英文世界知识库研究较多的是Wordnet,中文世界研究较多的是《知网》[6]和《同义词词林》.《知网》是由我国著名的机器翻译专家董振东老师耗费十多年时间建立的一个知识库•它能够以概念的形式来描述汉语的词以及词所对应的英文

7、,并且对概念具有的属性及概念相互间的关系做了详细的描述.《知网》中有两个主要的概念:“概念”和“义原”•其中,“概念”表示词语语义,一个概念只能表示某个词语的一种语义,但是一个词语可能由一个或者两个及以上的概念组成.“概念”用一种特定的“知识表示语言”來描述,这种“知识表示语言”又是由“义原”作为基本描述语言来表示•“义原”是《知网》用于描述“概念”的最小的意义单位.《知网》中一共确定了一千五百多个义原,分为:Event

8、事件、Entity

9、实

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。