汉语语句主题语义倾向分析方法的研究

汉语语句主题语义倾向分析方法的研究

ID:36634822

大小:287.84 KB

页数:6页

时间:2019-05-13

汉语语句主题语义倾向分析方法的研究_第1页
汉语语句主题语义倾向分析方法的研究_第2页
汉语语句主题语义倾向分析方法的研究_第3页
汉语语句主题语义倾向分析方法的研究_第4页
汉语语句主题语义倾向分析方法的研究_第5页
资源描述:

《汉语语句主题语义倾向分析方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、汉语语句主题语义倾向分析方法的研究姚天昉娄德成上海交通大学计算机科学与工程系上海200240E-mail:yao-tf@cs.sjtu.edu.cnlou-dc@163.com摘要:本文介绍了如何识别汉语语句主题和它与情感描述项之间的关系以及计算主题的极性。我们利用本体来抽取语句主题以及它的属性,然后在句法分析的基础上,识别主题和情感描述项之间的关系,从而决定语句中每个主题的极性。实验结果显示,我们在研究中所采用的方法是合理和有效的。关键词:主题,语义倾向,网络评论,句法分析,意见挖掘ResearchonSemanticOrientationAnalysisfor

2、TopicsinChineseSentencesYaoTianfangLouDechengDepartmentofComputerScienceandEngineering,ShanghaiJiaoTongUniversity,Shanghai200240E-mail:yao-tf@cs.sjtu.edu.cnlou-dc@163.comAbstract:ThispaperpresentshowtoidentifythetopicsinaChinesesentenceaswellastherelationshipsbewteentopicsandsentiment

3、aldescriptivetermsandhowtocomputethepolarityoftopics.Weextractthetopicsandtheirattributesfromasentencewiththehelpofanontology,identifytherelationsbetweentopicsandsentimentaldescriptivetermsbeasedonparsingresults,andfinallydeterminethepolarityofeachtopicinasentence.Theexperimenthasshow

4、nthattheadoptedapproachintheinvestigationisreasonableandeffective.Keywords:topic,semanticorientation,Webreview,parsing,opinionmining.1概述目前,英特网上的信息与日剧增,蕴藏着巨大的信息量。但是,要想在很短的时间内获得人们对于诸如人物、事件、传媒、产品等有价值的评价信息,往往是十分困难的。面对这样的现实问题,意见挖掘(opinionmining)技术应运而生。根据美国南加州大学Kim和Hovy对意见的定义[1],意见由四个元素组成,即

5、主题(topic)、持有者(holder)、陈述(claim)和情感(sentiment)。这四个元素之间存在着内在的联系,即意见的持有者针对某主题发表了具有情感的意见陈述。例如,“我昨天买了一辆汽车,它不但外观漂亮,而且性能很好。”在这句语句中,一共有三句子句。第一句是客观句,所以它不包含意见的陈述。第二、三句子句则是主观句,而且是包含意见的陈述。对于这两个陈述,它们的主题分别是“外观”和“性能”,它们都是“汽车”的属性(特征)。这两个陈述的意见持有者是作者“我”。在陈述中所描述的情感词(sentimentalword)是“漂亮”和“好”,都是褒义的。另外,“很

6、”是一个修饰词,用以修饰情感词,以加强褒义的程度。意见挖掘的过程就是要在自然语言主观性(subjective)文本中自动确定这些元素以及它们之间的关系。一般来说,它有四个子任务:1)主题抽取(topicextraction):识别主题术语和领域相关的本体概念;2)意见持有者识别(holderidentification):确定意见表述的作者和说话者;3)陈述的选择(claimselection):确定意见表述的范围和过滤客观性表述;4)情感分析(sentimentalanalysis):决定意见陈述的语义倾向(semanticorientation),即极性(po

7、larity)。本文的研究工作涉及对汉语汽车网络评论进行意见挖掘。主要介绍如何识别语句的主题、它和情感描述项(sentimentaldescriptiveterm)之间的关系以及计算主题的极性。它涉及主题抽取子任务以及主题和情感描述项之间关系的识别和主题极性的计算。2主题和情感描述项关系的识别以及主题极性的计算主题是句子中情感描述的对象。在实际应用中,用户往往关注某类产品的特征(feature),一个特征词需要满足以下三个条件之一[2]:1)给定主题的一部分;2)给定主题的一个属性;3)给定主题的部分的一个属性。在研究中,我们选取了四类特征:1)汽车的品牌和型号(

8、make&

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。