基于潜在语义分析和最大熵中文情感分析的研究

基于潜在语义分析和最大熵中文情感分析的研究

ID:32248511

大小:2.86 MB

页数:64页

时间:2019-02-02

基于潜在语义分析和最大熵中文情感分析的研究_第1页
基于潜在语义分析和最大熵中文情感分析的研究_第2页
基于潜在语义分析和最大熵中文情感分析的研究_第3页
基于潜在语义分析和最大熵中文情感分析的研究_第4页
基于潜在语义分析和最大熵中文情感分析的研究_第5页
资源描述:

《基于潜在语义分析和最大熵中文情感分析的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文摘要摘要:目前微博、论坛、贴吧等已经成为人们发表意见、表达情感的重要渠道,这些渠道产生的大量情感信息反映了人们对热点事件、话题的褒贬态度。因此,对这些情感信息进行挖掘和分析能够更好地分析热点舆情,了解大众的观点,给政府、企业等提供重要的决策依据。传统的信息检索技术,大多以关键词为基础,无法对这种需求提供很好的支持;而传统的信息抽取和文本分类技术也均未涉及深层次的语义理解,常常不能很好地挖掘和分析情感信息。文本情感分析从情感的角度对带有情感色彩的主观性文本进分析,能更快地从海量信息中发现网络中新的热点话题、突发性事件,把握社会的舆论导向。它是传统话

2、题发现与跟踪研究的拓展和深化,并为文本分类、信息抽取、自动摘要等提供了新的思路和方法,在企业智能分析、政府舆情分析、信息安全和自动文摘等领域具有广阔的应用空间和发展前景。情感倾向分析研究的涉及面很广,本文着重对其中情感词、句的识别和分类的关键技术进行了深入的研究。本文首先对文本情感倾向分析的国内外现状进行了介绍。其次,本文提出了基于潜在语义分析和最大熵模型的情感词识别及褒贬分析方法,其主要思想是利用潜在语义分析方法,计算情感词与人工选择的褒贬基准词的相似度,并结合多种情感词特征函数建立最大熵情感词识别模型。本文在情感词识别的基础上提出了一种融合多种特

3、征的中文情感句倾向性分类方法。最后,对情感词、句识别模型进行了实验验证,选取第一届中文倾向性分析测评数据(CoAE2008)中935篇中文文档测试,情感词褒贬分类得到83.5%的准确率及79.3%的召回率,情感句褒贬分类得到76.8%的准确率及78.3%的召回率。关键词:情感分析情感词识别情感分类潜在语义分析最大熵分类号:TP319ABSTRACTABSTRACT:Currentblogs,BBS,barshavebecometheimportantchannelsforpeoplet0expresStheiropinionsandemotion.E

4、motioninformationproducedbythesechannelsreflectspeople’Sattitudetowardshotissues.Accordingly,tominingandanalysis啪otionalinformation,wecanbeReranalysishotissues,understandtheuser'sintereSts,providegovernmentandenterprisesimportantinformationanddecisionsupport.The仃aditionalinform

5、ationretrievaltechnologybasedonkeywords,cannotprovidegoodsupportforthisdemand.TraditionalinformationextractionandtextclassificationtechniquesalsowcTenotrelatedtodeeplysemanticunderstanding.TextSentimentanalysisisakindoftechnologywhichanalysisemotionalinformationintext.ItCanfind

6、l踟hoteventsmorequicklyfrommassinformationonnetandgrasptheorientationofpublicopinion.Itimprovessubjecttrackingresearchandprovidesnewideasfortextcategorization.informationextraction,andsummarization.Ithasbroadapplicationspaceinenterpriseintelligenceanalysis,governmentpublicoplmon

7、analysls'informationsecurityandautomaticabstract.Sentimentanalysisresearchinvolvesinwidefields,thispaperfocusesonemotionword.sentencerecognitionandclassification.Thispaperfirstanalysistheresearchbackgroundandmeaningofsentimentanalysisathomeandabroad.Secondly,thispaperpresentsaw

8、ord-levelsentimentanalysisbased011thelatentsemanticana

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。