基于知网的语义相关度计算.pdf

基于知网的语义相关度计算.pdf

ID:54367441

大小:260.13 KB

页数:6页

时间:2020-04-29

基于知网的语义相关度计算.pdf_第1页
基于知网的语义相关度计算.pdf_第2页
基于知网的语义相关度计算.pdf_第3页
基于知网的语义相关度计算.pdf_第4页
基于知网的语义相关度计算.pdf_第5页
资源描述:

《基于知网的语义相关度计算.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第25卷第5期北京理工大学学报Vol.25No.52005年5月TransactionsofBeijingInstituteofTechnologyMay2005文章编号,1001-0645(2005)05-0411-04基于知网的语义相关度计算许云樊孝忠张锋(北京理工大学信息科学技术学院计算机科学工程系北京100081)摘要,为解决句法分析中的结构性歧义引入了语义相关度计算-基于语义相似度计算及知网的语义信息提出了语义相关度计算方法;利用知网的义原纵向与横向关系及实例信息计算不同词性的相关度-在计算义原距离时考虑了义原之间的解释关系对义原的距离进行修正-根据相似度的对称性计算实例的影响

2、因素提高了相关度的准确率-实验结果表明使用该计算方法得出的语义相关度结果更加合理-关键词,语义相关度;知网;自然语言处理中图分类号,TP391文献标识码,ASemanticRelevancyComputingBasedonHownetXUYunFANXiao-hongZ~ANGFeng(DepartmentofComputerScienceandEngineeringSchoolofInformationScienceandTechnologyBeijingInstituteofTechnologyBeijing100081China)Abstract,Semanticrelevancy

3、computationisusedtosolvestructuraldisambiguityinparsingsyntactic.Semanticrelevancycomputationbasedon~ownetisproposedbasedonsemanticsimilaritycomputation.ThemethodcancomputetherelevancyofdifferentPOSwordsusingresourcesof~ownetsuchastheexamplestherelationshipofhoriontalandverticalprimarily.Consider

4、theexplanatoryrelationsofthetwoprimarilytoamendtheprimarydistancewhencomputingtheprimarydistance.Accordingtothesymmetryofsemanticsimilaritytheresultofrelevancyisimprovedbycomputingtheeffectfactorofexamples.Experimentalresultsshowthattheresultsaresatisfactory.Keywords,semanticrelevancy;~ownet;natu

5、rallanguageprocessing语义相关度与语义相似度是两个不同的概念(ontology)或分类体系(taxonomy)计算一种是利但两者之间有着密切的联系-语义相似度是两个词用大规模语料库进行统计-刘群等人利用知网计算在不同的上下文中可以互相替换使用而不改变文本语义相似度12I但无法计算不同词性之间的相似度的句法语义结构的程度1I-语义相关度包含了语义(新版知网用该方法计算语义相似度);李素建综合相似度的概念并且相似度的计算方法对相关度的了知网和同义词词林计算语义相似度3I但由于知研究有参考价值-目前对中文语义相关度的研究甚网与同义词词林是完全不同的组织方式所以计算少大部分为

6、相似度计算方法的研究-语义相似度有结果不太理想1I-统计方法则是在大规模语料中统两类常见的计算方法一种是根据世界知识计分析每个词的特征词向量然后利用这些向量之收稿日期,20040708基金项目,云南省信息技术基金资助项目(2002IT03)作者简介,许云(1976)男博士生E-mail,xuyun1976@sina.com;樊孝忠(1948)男教授博士生导师-4l2北京理工大学学报第25卷间的相似度<用向量的夹角余弦计算)作为这两个词用等特点,其中,对词语相关度影响最大的是语义相的相似度[4,5]关度.定义相关度为一个O到l之间的实数..目前,未见有利用知网计算语义相关度的报道.作者在语

7、义相似度计算的基础上[l,B]定义1语义相关度是在句法分析中一个短语,提出了利用知网计算语义相关度,并实现了该算法的结构中的两个词能够组成修饰关系主谓关系同指程序.关系的程度.定义2在知网中,设W和W为任意的两个l21研究背景词,W有n个义项:S有m个义lll,Sl2,~,Sln;W2语义相关度可以应用于信息检索句法消歧文项:S如果存在S2l,S22,~,S2m.li=S2j,lin,l本分类文本聚类等领域.在基于规则的句法分析jm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。