基于评论文本情感分析研究

基于评论文本情感分析研究

ID:32016204

大小:2.28 MB

页数:62页

时间:2019-01-30

上传者:U-22505
基于评论文本情感分析研究_第1页
基于评论文本情感分析研究_第2页
基于评论文本情感分析研究_第3页
基于评论文本情感分析研究_第4页
基于评论文本情感分析研究_第5页
资源描述:

《基于评论文本情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

摘要随着互联网的普及与广泛应用,越来越多的人在互联网上发表白己的主观言论,使得带观点的文本呈爆炸式增长。观点信息(也称情感信息)的收集与分析对个人、商业组织、国家政府等都有重要的作用。然而,由于网络中数据规模异常庞大,且呈现出散乱、无结构化、语言不规范等特点,给信息抽取任务带来了极大挑战。因此,针对WEB的观点挖掘研究应运而生。产品评论是指用户在购物网站或专业评论网站中发表的对某商品或服务的评价信息,它对个人用户和商业组织有很大的利用价值,是一种重要的情感信息源。为了更全面的挖掘情感文本中的关键信息并以更简洁的方式呈现出来,本文以产品评论为研究对象,研究了WEB观点挖掘中的评价搭配抽取以及篇章情感倾向性判断问题。本文的主要工作和创新点如下:(1)针对情感抽取问题,提出融合核心句与依存分析的评价搭配抽取方法。传统的情感抽取任务以评价对象为中心,但是单一的评价对象抽取的应用价值不大,且这种方法忽视了评价对象与评价词之间的共现关系。评价搭配的抽取弥补了这一不足,评价搭配是指评价对象与其修饰词之间的搭配,能够完整表达评论文本的关键信息。本文以评价对象与评价词之间的固有依存关系为核心提取评价搭配,针对网络文本的不规范性给依存关系分析带来的影响,提出了核心句抽取的预处理方法,针对省略评价对象的评价信息,提出了潜在评价搭配抽取规则。实验结果表明,与只使用依存关系分析的方法相比,核心句抽取以及潜在评价对象抽取提高了抽取的准确率和覆盖率。(2)针对篇章情感倾向性判断问题,提出基于混合粒度模型的分析方法。传统的情感倾向性判断往往只关注同一粒度下的文本,如词语级、句子级。然而,网络中的评论文本规模并不平衡,有些篇章由大量长旬组成,而有些仅包含少量词语,因此,基于单一粒度的篇章情感倾向性判断方法并不适用。考虑基于不同粒度文本的算法各有其优势,本文提出基于混合粒度模型的篇章情感倾向性判断算法,将基于词语级的篇章情感倾向性判断与基于句子级的篇章情感倾向性判断相结合。实验结果表明,相对于单一粒度的篇章情感倾向性判断方法,基于合混 綦于评论文本的情感分析研究合粒度模型的篇章情感倾向性判断取得了更好的结果。关键词"WEB观点挖掘;倾向性判断;评价搭配抽取;依存分析 AbstractWiththewideapplicationandpopularizationofInternet,moreandmorepeopleexpresstheirviewsandopinionsontheIntemet,whichmakesthetextwithviewgrowexplosively.Thecollectionandanalysisofviewinformation(alsoknownasemotionalinformation)haveamajorimpactonindividuals,businessorganizationsandgovernments.However,thelargescaleinformationonintemet,whicharescattered,unstructuredandnon-standard,broughtsomedifficultiestotheinformationextractiontask.Therefore,theresearchontheopinionminingcameintobeing.Productcommentsmadebythecustomerswhoevaluateproductsorserviceine-commercesiteorprofessionalevaluatingsite,hasgreatvaluetocustomersandbusinessorganizations,itisalsoanimportantsourceofemotionalinformation.Inordertogetthekeyinformationfromtheemotionaltextandtoexpressitinamoreconciseway,thispaperconcentratesonproductcommentsanddiscussestwoimportanttasksinWebMiningResearch:extractionofevaluationcollectionandorientationjudgmentforemotionaltext.Inthispaper,themainworkandinnovationsareasfollows:(1)Aimingatthefirsttask,weproposedamethodmergingextractingkernelsentenceanddependencyparsing.Intraditionalemotionalextractiontask,thecoreworkisextractingevaluationobject,buttheapplicationvalueofthismethodislittle,itignorestheCO—occurrencerelationshipbetweenevaluationobjectsandevaluationwords(sentimentwords).Extractingevaluationcollectioncanmakeupforthisshortfall.Evaluationcollocationisacombinationofevaluationobjectsanditsmodifiers,andCancompletelyexpresskeyinformationonthecomments.Thispaperextractevaluationcollectionbasedontheinherentdependentrelationshipbetweenevaluationobjectsandevaluationwords.Consideredthatnon—standardcommentsseriouslyimpacttheresultofdependencyparsing,weproposedextractingkernelsentenceasthepreprocessingmethod.Consideredthatsomeemotionalexpressionomitstheevaluationobject,weproposedapotentialevaluationcollectionextractionrules.Experimentalresultsshowthat,comparedwiththemethodonlyused 慕于评论文本的情感分析研究dependencyparsing,ouralgorithmaccessestohigheraccuracyandcoveragerate.(2)Aimingatthesecondtask,weproposedamixedmodel.Traditionalalgorithmsusedtodealingwiththetextinthesameparticlesize,suchasword—level,sentence—level.HoweveLthescaleofthereviewtextinthenetworkisuneven,somereviewtextalecomposedbyalargenumberoflongsentences,whileotherscontainonlyafewwords,therefore,themethodbasedonasingleparticlesizeisnotapplicable.Consideredthatthealgorithmsbasedondifferentparticlesizehavecertainadvantages,thispaperpresentsamethodbasedonamixedmodelwhichcombinedthewords—levelemotionalorientationjudgmentandthesentence—levelemotionalorientationjudgmenttogether.Resultsofexperimentshowthat,relativetothesingle-granularityorientationjudgmentforemotionaltext,themethodbasedonmixedmodelachievedbetterresults.Keywords:WebMining;Orientationjudgment;Extractionofevaluationcollection;IV 日录目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯IABSTRACT⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.III目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.V第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11.1研究背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2WEB情感挖掘概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21.3基于属性的观点挖掘国P勺#l-研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一41.3.1属性抽取研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.3.2倾向性分析研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.3.3观点整合研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯51.3.4评价搭配抽取研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯61.4本文的工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.71.5论文组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.8第二章情感挖掘基础知识⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.1情感挖掘中常用的机器学习算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一102.2中文词法及句法处理技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一132.3常用语料库⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯152.4常用评价指标⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯16第三章融合核心句与依存关系的评价搭配抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.183.1引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..183.2相关工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯183.3融合核心句与依存关系的评价搭配抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯193.3.1核心句抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.203.3.2依存关系模板与潜在评价搭配抽取规则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.223.3.3基于点互信息(PMI)的评价搭配筛选⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一23V 暴于评论文本的情感分析研究3.3.4算法描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯243.4实验与结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯253.4.1数据集及评价标准⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.253.4.2实验结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯253.5总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.26第四章基于混合粒度模型的篇章情感倾向性判断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.284.1引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.284.2相关工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一294.3基于混合粒度的篇章级情感倾向性判断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯314.3.1特征选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯314.3.2基于词语极性的篇章极性判断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯324.3.3基于句子极性的篇章极性判断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯344.3.4基于混合粒度的篇章情感分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯354.4实验及结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯354.4.1文本预处理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯354.4.2LMRO模板⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯364.4.3混合粒度模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.394.5小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一41第五章总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯435.1本文工作总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯435.2未来工作展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.44参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯46附录A图索引⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯53附录B表索引⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯53AppendixA.FigureIndex..............................................................................54AppendixB.TableIndex................................................................................54致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯55VI 目录攻读学位期间发表的论文目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯56 第一章绪论1.1研究背景及意义第一章绪论随着网络越来越深入人们的生活,越来越多的用户参与进了互联网的建设中。互联网的信息共享方式逐渐取代了传统依赖于纸质的信息传递方式。在发展迅速的电子商务的影响下,越来越多的网民选择在网上进行商品交易,从而实现足不出户即可解决购买商品的问题。由中国互联网络信息中心(CNNIC)发布的《第30次中国互联网络发展状况统计报告》11J显示,截止到2012年6月底,中国的网民数达到5.38亿,互联网普及率达39.9%,中国网民人均每周上网时长增加至19.9小时,其中网络购物用户从2011年底的1.49亿升至2.1亿,增长了8.2%,占网民总数的39.0%,由此可见,网络购物仍然保持平稳的增长。2012年4月,著名的全球市场研究公司Nielsenzai在全球范围内对消费者信任的广告方式进行了调研,给出了一份名为(GlobalTrustinAdertisingandMessages))的报告[21,该报告显示,排在第一位的消费者信任的广告方式是身边亲朋好友对产品的推荐,网络上主观商品评论排在第二位,且有70%的被调查者表示其信任并使用在线评论帮助选择商品,这个结果相比2007年提高了15%。排在第三与第四位的分别是媒体报道与品牌官方网站。相对于排在首位的朋友推荐,网络评论所涉及的商品种类繁多、评论文本数大且更容易获得,因此适用性更强,但是网络中的海量数据使得评论中关键信息获取的难度增加,因此,文本挖掘中的相关技术被用来解决此问题。文本挖掘的目的既是通过一些算法挖掘出网络文本中的关键信息,全面、快速、直接地提供给用户。文本挖掘研究主要包括文本信息抽取[31、文本相关性检索[41、文本聚类‘5l与文本分类【6】等。情感信息是指带有情感倾向性的主观评论信息,如网络用户发表的商品评论。消费者和商业组织人员主要希望通过阅读商品评论得到两种信息:一是某产品在商品评论中表现出的总体倾向性,二是关于产品具体属性的评价信息。基于用户的这两种需求,情感挖掘被引入解决此问题。情感挖掘旨在抽取、组织、整理非结构化的网络评论文本中消费者感兴趣的内容,并将其转化成结构化的形式。情感信息资源主要有电子商务平台中的网络评论、专业评论网站中的评论、 暴于评论文本的情感分析研究论坛的帖子以及博客中的博文等等。情感挖掘的结果可以帮助用户选择适合自己的产品,提高购物的满意度,同时,也可以帮助商家了解产品的使用情况、同类产品的优劣以及用户的喜好,从而进行商场决策的调整以及产品的改进。然而,情感挖掘不仅仅可以应用在商品评论分析中,在其他情感信息分析领域也有广泛的适用性,例如,通过情感挖掘可以获得大学生中最受欢迎的课有哪些、公共问题的焦点等等,因此,情感挖掘研究具有广泛的应用价值。1.2web情感挖掘概述网络上有两类文本信息:事实与观点。事实是客观性文本,而观点是表达用户情感的主观性文本。目前,由于事实可以使用主题词表示,因此,对于客观事实的文本处理已经趋于成熟,然而,观点难以使用数个关键词表示,针对主观性文本的情感分析任务具有重大的研究价值。情感挖掘,又称观点挖掘,简单来说,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程t71。最初的情感挖掘是对网络中带有情感色彩的词语进行分析【8】,通常是对词语的褒贬性进行判别,如,“美丽"、“干净"、“好"属于褒义词语,“丑陋"、“脏乱”、“差"属于贬义词语。随着互联网上大量主观性文本的出现,单纯的情感词语分析已经满足不了用户的需求,研究者们开始对更为复杂的抽取任务以及句子、篇章的倾向性分析进行研究。Liu等人在属性层面将观点定义为一个五元组(oj,乃。,s‰,囊,f,)[91。D,是目标对象,在产品评论中通常是产品具体名称;厶是的o,一个特征(属性);曩是观点持有者;‘代表观点表达的时刻:%是观点持有者在时刻‘对目标对象D,的特征.厶作评价的情感倾向(褒义、贬义或中性)。观点挖掘的目标即是从给定的含有观点的文档中找出这五元组中五部分的对应信息。按照处理的粒度,可以将观点挖掘分为文档(篇章)层次的观点挖掘、句子层次的观点挖掘以及特征层次的观点挖掘。文档层次的主要任务是对整个评论作情感分类【10】【1I】【12】【13】,判断整篇文档的总体情感倾向性是『F面、负面还是中立的。文档层次的分析对大多数应用来说太粗糙,因此考虑句子层次。句子层次观点挖掘的工作重点在于主客观句的分类(主观句的识别)[141。文档和句子级别的情 笫一章绪论感分类可以从宏观的角度判断文本的情感倾向,但是仍然不能发现观点持有者对具体特征的评价,也不能挖掘出目标对象的具体某一特征的总体倾向性,因此需要深入到特征层次进行分析。传统的基于特征层次的观点挖掘主要有三个任务,一是抽取每个评论中评价的对象特征,包括评价的目标对象Oj和目标对象的特征.厶,抽取过程中考虑同一特征的不同表达方式,O,通常很容易得到或者是默认已知的,所以该任务以抽取目标对象的属性特征.允为主:二是判定该特征的观点倾向(正面、负面、中性),即倾向性预测。第三个任务是观点整合,在不同的评论文档中,相同的特征属性有不同的表达方式,且不同的人对相同的特征属性有不同的情感倾向(意见),观点整合实现了对多文档的评论文本中的评价对象(属性)及其情感态度进行综合整理的需求,最终提供给用户可靠、简洁的结构化数据【151。除此之外,近年来,评价搭配抽取任务【16】117】【18】【191受到越来越多研究者的关注。评价搭配是指评价对象与修饰该对象的修饰词之间的关系对,由于评价搭配深入分析了评价对象与评价词之间的共现关系,且评价搭配能完整展示评论文本中的关键信息,因此得到较广泛的关注。第三届中文倾向性评测(COAE2011)凹1将其作为新增的要素集抽取任务。基于属性的评论观点挖掘任务主要步骤流程如图1.1所示。图1.1基于Fi91.1TheProcessofPointMiningBasedonAttribute 慕十评论文本的情感分析研究1.3基于属性的观点挖掘国内外研究现状1.3-1属性抽取研究词性分析与语法分析首先被引入属性识别的研究中【8J。词性分析指的是目标词语的词性判断。由于目标对象的属性(以下称“评价对象”)通常是名词和少量动词组成,因此词性分析可以有效帮助评价对象预筛选。在词性分析的基础上,语法分析被用来对词语语法结构进行分析,大部分的评价对象不是由单独的词语构成,而是由一些特定结构特定词性成分的词语构成,如“诺基亚N97的按键蛮好用”,其中“诺基亚N97的按键”是需要抽取的评价对象,它由“诺基亚N97"和“按键”这两个名词组成,属于“的”字结构的名词短语,如果不考虑词语之间的结构关系,只考虑词性,则很难识别完整的评价对象。Yi等人【2l】采用基于词性的启发式方法对评论文本中的名词短语进行筛选和抽取,获得评价对象。Hu等人【221采用有监督关联规则挖掘方法进行评价对象的属性抽取,该方法假设一个最小处理文本中只含有一个评价对象,首先对评论文本按照标点符号和连接词(如“and”、“but”)进行分句,接着将已标注属性以及词性信息的训练文本作为训练集,使用关联规则挖掘的方法进行评价对象相关规则学习,得到候选规则集合,再通过剪枝算法得到最终的属性识别规则,在未进行标识的测试集中,使用训练集得到的抽取规则对评价对象进行抽取。Zhang等人【冽提出了基于浅层依存关系的评价对象识别方法,利用评价对象在依存句法中的结构关系对其进行抽取,实验结果表明,该方法优于文献[221所提出的方法。顾正甲等人【24】以依存句法分析为基础,提出SBV极性传递法识别评价对象,并引入ATT链对评价对象边界进行修正,该方法取得了不错的实验结果。1.3.2倾向性分析研究词语级的情感倾向性判断,即判断情感词的情感极性,以往的方法主要基于情感词典进行识别。由于情感词典包含的词语有限,且互联网上的评价词语呈现出口语化、现代化、网络化的特点,使得与情感词典中的词语匹配度不高,因此,现在研究人员致力于研究如何利用有限情感词典资源从文本中识别更多的情感词。Hatzivassiloglou等人【251利用词语在句中的共现信息,提出了一种有监督的学习算法,由已知词语的极性推测出未标注词语的情感倾向,例如由连词and连接 第一章绪论的两个单句中的形容词通常拥有相同的极性,而由“but”连接的两个文本片段中所含的形容词通常呈相反极性。Kamps等人【26J利用WordNet标注情感词,计算未标注情感词与已标注情感词之间的语义距离,以此判断未标注情感词的倾向性。Kim等人【27】利用磁性标签,对不同词性的词语分别建立情感分类器进行倾向性识别,同时也对句子级别的情感倾向性进行了研究。由于情感词语所表达的情感倾向性会随上下文语境或者所处领域的不同而发生变化,例如当形容词“低”在描述商品价格时呈褒义倾向,而在描述工资时呈贬义倾向,因此词语倾向性分析面临了一个新的挑战。Qiu等人【28】利用句子中各成分的语法结构关系,采用依存关系和其他有效关系间的信息传播构建了领域词典。COAE2011论文集【29】中,不少研究者将评价词语进行了严谨的分类,将WordNet中随语境变化的情感词去掉,并增加一部分不随语境变化的网络情感词,将极性容易发生变化的情感词与影响他们极性的评价对象结合起来研究,这种方法有效改善了情感词倾向性判断的正确性。对于篇章级(文档级)倾向性识别,研究者们通常将其看做二元分类问题解决。Pang等人130】采用机器学习算法分析评论文档的整体倾向性,并尝试了不同的分类算法,给出了实验结果对比分析。Dave等人【3】】也做了类似的尝试。中文方面,第一届中文倾向性分析评测(COAE2008)1321将中文文本的褒贬分析作为篇章级观点挖掘任务,乔春庚等人【33】利用模式的方法进行句子倾向性判断,再对所有句子的倾向性进行整合,得到文档的整体倾向性,该方法将待抽取信息抽象为一种模式表达,将模式定义为包含了主题类、情感类、否定词类、转折词类、程度副词类以及上下文辅助类的N元序列组合,该方法取得了不错的效果,但是基于句子极性累加得到篇章极性的方法不能完全表达篇章极性。全昌勤与任福继提出了在HowNet提供的情感倾向性词典的基础上,利用多项式核函数对中文评论文本进行褒贬倾向性判断[341,在COAE2008中取得了不错的成绩。1.3.3观点整合研究经过评价对象抽取及其倾向性判别之后,无结构化、松散的、充满大量冗余成分的评论文本被转化为结构化摘要信息的集合,但仍然存在如下问题未被解决:(1)海量的评论文本中可抽取出大量的评价对象极其倾向性对,全部浏览这些信息仍需要很多时间。(2)虽然评价对象极其情感倾向性对已经表现为结构化 皋于计论文小的情感分析研究文本,但是结构化程度较低,对同一评价对象的整体倾向性并未得到综合分析,且各评价对象受关注的程度未得到表现。基于此,观点整合研究致力于研究使用何种方式将这种摘要信息进行进一步的整合,从而呈现给用户更加简洁、可靠的结果。由于海量观点的存在,观点整合问题面临着巨大的挑战,专门针对这项研究的任务不多,目前的大部分学者采用一些统计的方法进行处理幽【35】【3611371,统计过程中,首先使用同义词词典或相似度计算的方法对同一评价对象的不同表达方式进行整合,接着计算各个评价对象的正面倾向性个数与负面倾向性个数,并按照倾向性个数总数的多少对评价对象进行排序。Hu等人【22】将挖掘出的观点使用图标的方式进行了直观的展示。Liu[35】等人搭建了一个观点挖掘系统,以柱状图的方式将挖掘得到的最终结果经过统计整合展示出来。还有部分学者【3811391采用筛选文本最优片段的方式将评价对象及其倾向性识别的结果进行直接展示。1.3.4评价搭配抽取研究传统的基于属性的观点抽取任务以评价对象抽取为核心,然而,在实际的评论文本中,评价对象与评价词之间存在语法结构上的固有关系,将评价对象抽取作为一个单独的任务忽视了这层关系,另外,评价对象不能完整表达评论文本中的关键信息,而评价对象与修饰它的评价词之间的搭配能够相对完整且具体的表现评论文本中的核心评价信息,因此,评价搭配抽取在近两年成为了观点挖掘的基础任务之一,收到了国内外研究者的关注。Bloom等人H们首次提出评价搭配的概念。最初,研究者们将评价对象与评价词之间的距离作为特征,首先确定评价对象,继而选择距离评价对象最近的形容词或者距离为K的形容词作为评价词进行抽取n小例,这种方法的经验性太强,系统性能较低。另外一些学者通过发掘评价对象与评价词之间的关系进行评价搭配识别。Kobayashi等人H31根据语法特性定义了评价对象与评价词的8个共现模板用以评价搭配的抽取,如“ofis”,其中“attribute”与“value”即是需要抽取的评价对象与评价词。这种共现模板较为简单且只停留在词的表面,为了更深入的挖掘并利用评价对象与评价词之间的关系,近期的学者大多数采用以依存句法关系为基础的方法。Bloom等人¨∞利用斯坦福句法分析器(StanfordParser)手工构建了3l条句法规则来描述评价对 第一章绪论象与评价词之间的关系。Popescu等人n们手工构建了10条依存句法模板用来匹配评论句中的评价搭配。中文方面,姚天防等人H明在依存句法分析的基础上,提出利用SBV、VOB、ADV这三种依存关系抽取评价搭配,并使用ATT链结构确定评价对象边界。1.4本文的工作在观点挖掘的各个层次任务中,细粒度的评价搭配抽取与粗粒度的篇章情感倾向性分析都能够完整表达主观文本中的情感信息,它们各有其优势且具有互补的作用。评价搭配的表达更为具体,能够将用户对于某一具体评价对象的态度抽取出来,并且能够对所有评价对象受关注的程度进行排序,这些具体信息对用户和商家都非常有用,但是由于评价搭配抽取方法存在情感丢失的问题(即有些情感表达并不采用评价对象一评价词对的形式表现),因此,对于一些笼统的情感表达不能很好的识别。篇章情感倾向性分析可以很好的弥补平价搭配抽取的这种不足,篇章倾向性分析不能表达具体观点信息,但是能够利用篇章内情感词、情绪信息暗示词等信息充分分析篇章的整体倾向性,对情感表达识别的覆盖率较高。因此,本文从情感搭配抽取与篇章情感倾向性判断两个任务进行研究,具体内容如下:(1)针对情感抽取问题,提出融合核心旬与依存分析的评价搭配抽取方法。传统的情感抽取任务以评价对象为中心,但是单一的评价对象抽取的应用价值不大,且这种方法忽视了评价对象与评价词之间的共现关系。评价搭配的抽取弥补了这一不足,评价搭配是指评价对象与其修饰词之间的搭配,能够完整表达评论文本的关键信息。本文以评价对象与评价词之间的固有依存关系为核心提取评价搭配,针对网络文本的不规范性给依存关系分析结果带来的影响,提出了核心句抽取的预处理方法,针对省略评价对象的评价信息,提出了潜在评价对象抽取规则。实验结果表明,与只使用依存关系分析的方法相比,核心句抽取以及潜在评价对象抽取提高了抽取的准确率和覆盖率。(2)针对篇章情感倾向性判断问题,提出基于混合粒度模型的方法。传统的情感倾向性判断算法往往只关注同一粒度下的文本,如词语级、句子级。然而,网络中的评论文本规模并不平衡,有些篇章由大量长旬组成,而有些仅包含少量 某于评论文本的情感分析研究词语,因此,基于单一粒度的传统分析方法并不适用。考虑对不同粒度文本的分析算法各有其优势,本文提出基于混合粒度模型的篇章情感倾向性判断算法,将基于词语级的篇章情感倾向性判断与基于句子级的篇章情感倾向性判断相结合。实验结果表明,相对于单一粒度的方法,基于混合粒度模型的篇章情感倾向性判断取得了更好的结果。1.5论文组织结构本文各章节内容安排如下:第一章,首先介绍了Web观点挖掘(情感挖掘)的产生背景与研究意义,接着简要介绍观点挖掘基础概念以及国内外研究的现状,在此基础上介绍了本文所做工作以及本文的组织框架。第二章,情感挖掘简介。主要介绍了情感挖掘中常用的机器学习算法与中文词法及句法处理方法,同时给出了观点挖掘中涉及的各种资源,如常用工具包、中文语料库、情感倾向性词典等。另外,系统性能的好坏需要统一的指标进行衡量,故本章最后给出了本文所涉及的几种评价方法。第三章,基于核心句与依存关系的评价搭配抽取。考虑到评价对象与评价词之间的语义结构关系,本章以依存句法关系为基础构建了评价搭配识别模板,然而,依存句法分析对句子的规范性有一定要求,原始网络评论文本下的依存句法分析结果不够稳定且错误率较高,针对这一问题,本章首先引入核心句抽取的思想对评论语料进行冗余成分删除以及潜在评价搭配句抽取,在此基础上进行依存句法模板的匹配,同时,针对依存模板无法抽取的隐藏评价搭配问题,建立了隐含评价搭配抽取规则,最后将两种方法的抽取结果进行合并。实验结果表明,相较于单独使用依存句法模板的方法,核心句抽取的引入以及潜在评价搭配的抽取在一定程度上提高了评价搭配识别的正确率与覆盖率。第四章,基于混合粒度模型的篇章级情感倾向性识别。本章分别进行了各个粒度(词语、句子、篇章)的情感倾向性判断。尝试从不同粒度间的互补性角度对篇章级的情感倾向性进行研究。词语级倾向性判断主要存在领域相关的倾向性问题以及网络用词不规范问题,因此首先引入LMR序列模板进行词语之间序列关系的模拟,实验证明该方法可以获得较高的准确率和召回率。然后,采用基于词 第一章绪论语级与句子级情感极性分析的混合粒度模型解决篇章级情感倾向性判断问题。实验表明,使用混合粒度模型的篇章级情感倾向性识别综合了单一粒度方法的互补性优势,相对于单一粒度的情感倾向性判断,既提高了识别的准确率,也提高了识别的覆盖率。第五章,总结与展望。本章对本文所做工作进行了总结,具体总结了文中的两个创新性工作的贡献及不足之处。并对WEB观点挖掘领域中后续的研究与应用进行了展望。 幕于评论文本的情感分析研究第二章情感挖掘简介2-1情感挖掘中常用的机器学习算法机器学习是人工智能领域的几个主要问题之一,简单地说,机器学习的目的是设计一种算法,可以让计算机进行学习,即从数据中寻找统计规律或者发现一些模式。情感挖掘研究领域中的很多任务可以当做分类问题来解决,比如可以将情感褒贬倾向性判断问题看做二分类,将情感的褒贬程度判断看做多分类问题。机器学习中的很多算法对分类问题有很好的效果。机器学习算法按照有无监督指导可以粗略地分为以下三类:有监督学习、无监督学习和半监督学习。有监督学习是最常见的分类问题,往往是让计算机去学习已经创建好的分类系统,例如通过对已标注的数据集合(训练集)进行学习,从而为未标注的数据进行分类。这种方式要求训练样本足够大,需要学习的数据域训练样本的差异性较小,不能够对其他机制的数据进行有效的处理。无监督学习的目标是不告诉计算机怎么做,而是让他主动学习怎么处理数据(如聚类)。半监督学习是近年来机器学习研究的重点问题,它介于有监督学习和无监督学习之间,目标是使用少量标注样本和大量未标注样本进行训练和分类,相比有监督学习减少了样本标注代价,相比无监督学习能够提高机器学习性能。本节主要对机器学习中常用的算法做简要介绍。1.朴素贝叶斯朴素贝叶斯模型是应用最广泛的分类模型之一㈤,有着坚实的数学基础与稳定的分类效率。朴素贝叶斯分类的原理是:对于给出的待分类项,求解在此项出现条件下各个类别出现的概率,将出现概率最大的类别作为该待分类项的类别。朴素贝叶斯的正式定义如下:(1)设d_{a。,a:,⋯,a.)是一个待分类项,每个口是X的一个特征属性。(2)类别集合C={q,q,⋯,c。)。(3)计算P(qd),P(c:Id),⋯,P(c.,Id)。(4)如果P(ckid)=max{P(qld),P(c:Id),⋯,尸(巳ld)),贝Ud∈Ck。 笫二:章情感挖掘预备知识因此,关键问题是计算(3)中的各个条件概率,计算方法如下:(1)在己标注类别的训练样本集中,计算各类别下各个特征属性的条件概率估计。即P(a。ICI),P(a2IcI),⋯,JP(口埘Iq);尸(qiC2),P(a2lc2),⋯,尸(%Ic2);尸(qlq),尸(呸i乞),⋯,尸(%lq)(2)如果各个特征属性之间是独立的,那么根据贝叶斯定理有:P(qId)=等式(2.1)(3)由于分母对于所有类别是~样的,因此只要将分子最大化即可,又由于属性间是独立的,所以有:P(dlq)P(q)=P(atIq)尸(口2cf)⋯P(口。Iq)尸(q)=P(q)rIP(ajIq)式(2.2)2.最大熵算法(MaximumE11仃opy’ME)最大熵原理的主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。其中熵代表随机变量的不确定性,所谓最大熵,即是保留全部的不确定性,将风险降到最小。最大熵算法被证明在一些自然语言处理领域中非常有效H"。最大熵算法采用指数形式对尸(cId)进行估计:尸(cI力=玄l-exp(莩名,。f,。F'c))式(2.3)其中,z(d)是归一化函数,丑。。是特征权重参数,磊,。越大,表明特征Z能够更好地表征类别c,鼻.。是关于文本d中特征Z和类别C的函数,具体的定义如下所示:删∽=器ni(d)>0且c’=c其他其中,珥(d)是特征Z在文档d中出现的次数。3.支持向量机(SupportVectorMachine,SVM)支持向量机模型也是传统分类处理中较常用的分类算法之一,不同于贝叶斯算法使用概率方式进行分类,SVM通过分类间隔最大化方法,因此,通常情况 某于评论文本的情感分析研究下,其分类效果优于朴素贝叶斯算法【481。SVM的基本思想是在训练过程中找到一个超平面,用向量W表示,该平面不仅能将不同类别正确划分,且划分效果最优,即这种划分使得不同类别之间的距离最大。寻找超平面的过程属于有约束的优化问题。假设类别集c={o,1),在标注好的训练集中,勺类别下的文本为嘭,有约束化问题可以通过如下方法解决:访:=∑巳巳孑.,aj≥o式(2.5)i其中,巳可通过对偶优化方法得到,使得嘭被称为支持向量,由于使得乃大于0的文档向量(乃)是唯一对w有贡献的文本,因此这里的嘭被称为支持向量。对于未标注的测试集中文本的分类,直接观察其落在超平面w的那一侧即可。4.条件随机场(ConditionalRandomField,CRF)条件随机场模型由Lafferty于2001年,在最大熵模型与隐马尔科夫模型基础上,提出的一种判别式概率无向图学习模型,是一种主要用于标注和切分有序数据的条件概率模型[49】。在CRF的无向图模型中,输入的观察序列x=(而,而,⋯,矗)与输出变量(即随机变量)r--{y,,Y2,⋯,儿)是不相交的两类集合。对条件概率分布e(rIX)的建模如下:P(少lx,2)2高exp(善n莩乃z("·,乃一√))式(2.6)其中,zO)是归一化函数。fay,书Yi,x,f)是特征函数的表征,可以通过真实的观察特征b(x,i)来表示。5.k.近邻算法(k-NearestNeighber,kNN)k.近邻算法是一种基于实例学习的分类算法【501,也是最简单的机器学习算法之一,其基本思想是:如果一个样本在特征空间中的k个最相似,即特征空间中最邻近的的样本中的大多数属于某一个类别,那么该样本也属于这个类别。在kNN算法中,所选的邻居都是已经正确分类的对象。由于kNN方法主要靠周围有限的临近样本,而不是靠判别类域的方法来确定所属类别,因此对于类域交叉 筇一:章情感挖掘顶帑知识或重叠较多的待分样本集来说,kNN比其他方法更为适合。kNN算法可以具体表不如f=:p(t,q)=∑Sim(t,砖)少(砖,Ci一包)式(2.7)ki∈xr1后i∈cfy(ki,ci)={o舫鲥式(2.8)其中,p(f,q)为测试文本f属于q类别的分值,t表示文档集k中的一篇,Sire表示相似性计算结果,反为阈值。6.K平均值(K-means)K.meansalgorithm算法是一个聚类算法【511,把n个对象根据他们的属性分为k个分割,其中k,每个文档4均包含朋维向量。K.平均的目的是将n篇文档分成k个集合,即S=is,,s2,⋯,&),最小化计算各类间距离公式如下:七argmin∑∑IIdj一酬2公式(2.9)其中,鸬是墨中元素的平均。2.2中文词法及句法处理技术1.词法分析(1exicalanalysis)中文词法分析时中文信息处理的基础与关键。词法分析是指将字符序列转换为单词序列的过程,词法分析的主要任务是单词切分和词性标注。进行词法分析的程序或函数称为词法分析器,它同时也是语法分析的基础,通常以函数形式存在,以供语法分析器调用。常见的中文词法分析器有中科院的ICTCLASl521,中文分词库IKAnalyzer,智能中文分词模块imdict。chinese.analyzer等。除此之外,常用的语法分析器也包含了分词模块。2.句法分析(Parsing)句法分析是指对句子中的词语语法功能进行分析,是自然语言处理领域的一 捧于评论文本的情感分析研究个关键问题。如果能够将其有效解决,一方面,可对相应树库构建体系的正确性和完善性进行验证;另一方面可以直接服务于各种上层应用,如信息抽取、机器翻译、自动问答等其他自然语言处理的任务。研究最广泛的两类文法体系有短语句法分析和依存句法分析。可以处理中文的常用句法分析器有哈工大的语言技术平台LTPt531,斯坦福句法分析器(StanfordParser)等。由于本文使用的是依存句法分析器,因此下面对依存句法分析做大概介绍。依存文法最早由法国语言学家L.Tesnierezai1959年提出,对语言学的发展产生了深远影响,特别在计算语言学界备受推崇。依存句法分析通过分析语言单位(如一个句子)内各成分之间的依存关系揭示其句法结构,它主张句子中的各成分之间具有依存关系,且句子中存在一个核心词,核心词是支配其他成分的中心成分,不受其他任何成分支配。依存关系的5条定理如下:(1)一个句子中只存在一个成分是独立的;(2)其他成分直接地依存于某一成分:(3)任何一个成分都不能直接依存于两个或两个以上成分;(4)如果成分A直接依存于成分B,成分C在句中的位置介于A、B之间,则C或者直接依存于B,或者直接依存于A、B之间的某一成分;(5)中心成分左右两边的其他成分相互不存在依存关系。以哈工大LTP为例,对例旬“潘秀云今年40岁,长得高高壮壮”进行句法分析的结果为:Root潘秀云今年40岁,长得高高壮壮nhntmqwpVufl其中,nh,nt,m,q,v,u,a等表示词性,弧形的箭头代表依存关系方向,“SBV"、“ADV"表示依存关系的名称,如,“SBV”表示两成分是主谓关系,“ADV”表示状中关系。3.语义关系词语之间不仅会发生各种句法关系,还会发生语义关系。在语义学中,语义关系指的语言成分所表示的客观对象之间的关系,如:动作和受动者、动作和动 筇一二章情感挖掘预箭知识作者、动作和处所、动作和工具、两事物之间的关系等等,语义分析是通过分析找出词义、结构意义以及结合意义,从而确定语言所表达的真J下含义或概念【“1。2.3常用语料库在文本倾向性研究中,语料是研究的基础,本节将介绍现有的常用语料库。1.中文情感挖掘语料谭松波等人搜集了包含电脑、书籍、酒店三个领域的中文评论语料,每一领域包含正负倾向的评论段各2000篇。此外,COAE2008公开了其实验实验语料40000篇,该语料是主观文本与客观文本混合的语料,其中主观语料约有4000篇,主要包括影视娱乐、房产、教育、手机、电脑等领域。2.多领域主观文本集Blizer等人‘551通过抓取Amazon中的评论构建了一个包含多领域产品的主观评论集合,预料中包含正向评论、负向评论以及未标注评论三种,一部分语料还包含了用户对产品的打分标记(1至5分)。3.餐馆评论语料集Snyder等人【56-1构建了近5000条关于餐厅的评论语料集,评论来自于http://www.we8there.com/。该语料集包括原始评论文本以及文本的特征向量。每篇评论中都包含顾客对餐厅的5种属性(食物、服务、价格、环境以及整体体验)的评论以及打分。4.MPQA文档集合该语料是535篇新闻语料的集合,并以人工方法对句子以及词语进行了详细的情感倾向性标注,Wiebe等人【571详细的描述了其标注机制。5.对比句集合目前研究者们对于对比句的研究不多,该语料主要用于比较句识别研究‘581,该语料对于比较句所属类型给出了详细地标注,并对比较实体、比较词、比较实体进行了标注。6.产品评论句集合【59】【601两个语料库中分别包含了9种和5种电子产品评论,原始语料只要来自电子商务 幕于评论文奉的情感分析研究平台Anlazon和Cnet。该语料已经对原始评论进行分旬处理,并标注了产品属性以及属性对应的观点。7.Comell电影评论集合【61】该语料包含了正负倾向文档各1000篇、主客观句各5000句、正负倾向语句各5331句。Pang等人使用该语料进行了文本倾向性分析的研究。8.OpininFinder主观词典【62】作为OpinionFinder系统的一部分,该词典可以自行下载。词典的构建凝结了科研工作者多年的心血。许多研究者利用该词典进行词语级别的情感识别研究。9.SentiWordnett63】SentiWordnet是情感挖掘中常用情感词典资源之一。该词典的构建采用了半监督机器学习方法,利用WordNet中的同义词集合自动对未知词语进行情感极性标注。lO.NTU情感词典该词典需要通过注册才能获得,包含了众多由人工和机器标注的中文情感词。2.4常用评价指标情感挖掘中对挖掘结果常用的三种基本评价指标有准确率、召回率以及F值。信息检索系统评价中,常用平均准确率、R一准确率、二元偏好和PON进行系统整体性能评测。·准确率(Precision)准确率是指实验识别正确结果数除以识别结果总数的百分比。以评价搭配抽取为例,抽取的准确率计算如下:mc渤=裟群糕瓣公加.㈣n鲫册门2丽丽丽丽丽孤犷公式‘2·10’·召回率(Recall)召回率,即覆盖率,以评价搭配抽取为例,指的是识别正确的数目占文本中实际评价搭配总数(即人工抽取搭配总数)的百分比。 第二章情感挖掘预得知识酬F蒜燃●F值(F—measure)F值是对准确率和召回率进行综合的指标。计算方式如下:一2×Precision×RecaflPrecision+Recall公式(2.13)·平均准确率(MeanAveragePrecision,MAP)平均准确率反映的是全局性能,定义如下:一J谢尸=上尸(尺)积公式(2.14)其中,P㈣代表召回率为R的准确率。●二元偏好(BinaryPreterence)该项评价指标反映了在每一篇相关文本被检索到之前,非相关文本占已有结果的百分比。6Pr矿(9=j苦喜·一L望学公式c2·,5,其中,&为前%中的不相关文档集合,见代表不相关文档,‘指的是文档在检索结果中的排名位置。·R_准确率(R-Prec)该指标表示检索到R篇文档时系统的准确率。·P@N该指标指的是检索结果中排名最高的前N篇文档中包含的相关文档的比例。 拱于评论文本的情感分析研究第三章融合核心句与依存关系的评价搭配抽取3.1引言随着电子商务的快速发展,网络上的评论文本呈爆炸式增长,情感分析任务成为人们关注的热点,评价搭配抽取是情感分析的子任务之一。评价搭配是指评价对象与其对应的修饰词的组合嘲1,也称为情感评价单元或特征一观点对,表现为二元组<评价对象,评价词>。第三届中文倾向性分析评测(COAE2011)将评价搭配抽取作为新增的要素级评测任务汹1。传统的要素级评测任务包括观点词(评价词)的抽取和评价对象的抽取,评价词的抽取往往还包含了极性判断,但是由于:1)单一的评价词抽取及其倾向性判别只能够模糊判断文本的总体褒贬性,缺乏对具体评价对象的观点判断;2)评价对象和评价词在语法上存在很强的结构关系,在共同抽取过程中能够很好的提高识别率,若单独抽取评价对象或评价词,无疑会降低抽取效率,影响最终抽取效果。由以上两点可知,评价搭配抽取不仅能够有效抽取评论文本中的关键信息,还能够提高抽取的效率。本文首先利用核心旬抽取规则去除评论句中某些冗余成分,有效地减少了依存句法分析的识别错误,接着根据评价词语和评价对象的之间的依存关系建立了一系列搭配规则,进行评价搭配抽取,并且提出了潜在的评价搭配抽取方法,结合PMI相似度计算方法进行候选评价搭配的筛选,提高了抽取的准确率和召回率,实验表明,该方法是有效的。第二小节将介绍情感搭配抽取方面的相关工作,第三小节将详细说明本文采用的抽取方法,第四小节介绍实验,最后一节是总结。3.2相关工作近几年,面向英文文本的研究主要采用基于句法分析建立模板或规则的方法 第三章融合和核心fU与依存关系的评价搭配抽取【66】【67】【68】【69】【70】【711抽取评价搭配。Somprasertsri等人【66】在依存句法分析的基础上,首先使用限定词性的方法建立评价搭配候选集合,再使用最大熵模型的方法对候选评价搭配进行筛选,得到最终的评价搭配集合。这种方法挖掘了评价对象和评价词的结构关系,相比文献【4】使用的最近距离进行匹配的方法有了很大改进,但是该方法限定了评价对象和评价词的词性,并且假设评价对象和评价词在一个句单句中,对于评价对象和评价词分别在两个句子中的情况,无法做出正确处理,如句子“Don’.tgotothathotel,it’Stoobad!"。文献【16】使用的是模式匹配的方法,首先通过短语句法分析获取评价对象与评价词的句法路径,再通过泛化、筛选等过程得到句法路径库,以此作为模式库采用匹配算法进行评价搭配的抽取,该方法在英文语料上取得不错的结果,但是由于句法路径的扁平化特征,失去了评价对象与评价词的结构特征,在处理长句较多的中文语料时,正确率不理想【72】。国内对于中文评论文本的评价搭配抽取方法主要有基于最大熵模型以及基于模板或规则两种方法。章剑锋【73】等人提出了基于最大熵模型的方法自动抽取评价搭配,但评价对象和评价词需要事先确定。方明等人r74】做了类似的工作,证明了将评价词语的类别作为语义信息特征,能一定程度上提高识别性能,另外还将评价对象与评价词的依存关系加入到特征模板中。王素格等人【75J首先利用依存句法分析结果分别建立了名词、动词及形容词组块规则,从而分别抽取出评价对象和评价词,在此基础上进一步利用词与词之间的搭配关系,设计评价对象与评价词的搭配算法。顾正甲【76】等人利用SBV极性传递法识别需抽取的评价对象和评价词(极性词),并引入A1盯链算法以及互信息法确定评价对象的边界,进一步挖掘了评价对象与评价词的语义关系。文献[751和文献【76】类似,都是在依存句法分析的基础上,建立一系列规则进行评价搭配的抽取。但是由于依存句法分析器在处理文本时受文本规范性影响较大,而中文网络评论往往较为复杂,所以这两种方法的处理结果并不稳定,对依存分析的结果依赖程度较大。3.3融合核心句与依存关系的评价搭配抽取由以上的分析可知,依存句法分析在评价搭配抽取的任务中占有重要地位。然而,由于中文网络评论文本的不规范性,以及中文本身的复杂性,依存句法分 暴于评论文夺的情感分析硼f究析的处理结果存在一定的误差。为解决这一问题,设想如果能够删除句子中一些与评价搭配无关的成分,简化评论句的结构,再交由依存句法分析器处理,这样既可以提高处理的准确率,也能够一定程度上提高其召回率,基于这种假设,本文提出了融合核心句与依存关系的方法进行评价搭配抽取。此外,还研究了省略评价对象时,评价搭配的抽取规则,即潜在评价搭配的抽取。本章的算法将核心句抽取、评价搭配识别、以及评价搭配的筛选融合在一起,每个模块并不能完全独立于其他模块存在,为了叙述的方便,本章将每一个模块单独说明,最后给出最终的算法描述。3.3.1核心旬抽取核心句指的是按照一定的规则将去除句子中某些冗余成分得到的新句【771,文献[771提出了一些核心句抽取的规则,除此之外,本文还发现一些含有假设性倾向的句子由于不确定因素较高,即使其中含有评价搭配,也应该不予抽取,另外句首的一些词语如“就是”、“居然是”也会影响依存关系分析结果。通过对大量语料的观察,最终确定给出了以下6条规则,如表3.1所示。表3.1核心句抽取规则表Table3.1Therulesofextractingkernelsentence序列内容删除句子中的句首状语成分,如:“(根)据⋯⋯所说’’、“(根)规则1据⋯⋯报道”、“以(从)⋯⋯来说’’、“从⋯⋯来看"、“(当)(在)⋯⋯时候”序列。删除带有假设性倾向的句子,如:“如果⋯⋯,(那么)⋯⋯”、规则2“希望⋯⋯”、“但愿⋯⋯"、“建议⋯⋯”、“除非⋯⋯,⋯⋯"、“相信⋯⋯”等。若句子中含有冒号,则删除冒号以及冒号前面的部分,如果冒号规则3前面部分为“举⋯⋯为例”“例如”“举例来说”等等,则同时删除冒号前面部分和冒号后面的一句话。规则4删除句子中的括号及括号内的文字。如果句子以名词、名词性短语、名词词组开头,后面的动词为“说”规则5或者“感觉”、“认为”等主张词,则将这部分从句子中删去。其中主张词使用知网的主张词词典。规则6删除句首的“就是”、“居然是”、“记得”等词。20 第三章融合和核心句.‘j依存关系的评价搭配抽取除了核心句抽取规则之外,研究发现加LTP依存句法分析对于单句和复句的句法分析情况会有所不同,通常,相较于含有大量独立成分(在句中和其他成分不构成关系,因此成为独立成分)的句子或者冗余成分较多的复句和长句,依存句法分析对于冗余成分较少的单句处理结果较好,例如:例句l:“没想到过年了,送货和安装都那么迅速"(评价搭配:<送货和安装,迅速>)。例旬2:“送货和安装都那么迅速”(评价搭配:<送货和安装,迅速>)。分别对例句l和例旬2进行依存分析,依存句法分析结果分别如下:Root送货和安装都那么迅厦VCVdra从结果中可以看出,例句2的依存分析结果可以匹配3.2节所列的模板,而例旬1中虽然含有需要抽取的评价搭配,但是由于依存句法分析器将原本的SBV结构错误分析为CMP结构,导致模式匹配不成功,从而不能抽取出该评价搭配,由此可知,如果整句中的某一单句含有评价搭配,对整句进行依存句法分析可能会影响评价搭配抽取的正确性,因此,本文考虑将整句细化为单句,逐一考察每个单句中是否含有评价搭配,减少因对整句进行依存分析而发生的错误。这种方式是通过简化句子结构提高依存分析模板的匹配率,从而改善评价搭配识别效果。然而,还有一种评价搭配的表现形式不能由依存模板表示,即省略评价对象的情况。例如:“竟然没有热水!”、“还算干净”、“不能够上网!”。以往的研究没有将此类句子看作含有评价搭配的句子,但是由于此类句子表达了评价者的主观情绪(如:“不能够上网!”)或主观评价,所以应该作为评价搭配识别,本文称速a抛,都d蝶v和c黻v,帅卜1U牌,蒯。没d㈨ 幕于评论文奉的情感分析研究这种情况为潜在的评价搭配识别,并制定了相应的规则进行抽取(见3.2小节表3.3)综合以上的分析,在LTP分旬处理的基础上,对每个整句,制定了6条规则再次进行分句,如表3.2所列,识别包含评价搭配以及潜在评价搭配的最小句子。表3.2分句规则及评价搭配句识别规则Table3.2Therulesofsentencesegmentationandrecognizingsentimentalsentence序列内容单句中存在与模板匹配的结构,则将这个句子保留,识别为评价规则1搭配句。(随后按照模板进行评价搭配抽取)如果没有匹配的模板,但含有ADV(d,a)结构,则将此句与前一规则2句合并,考察其是否含有SBV结构。若含有,则识别为评价搭配句。(随后按照模板进行抽取)如果不符合以上规则,但句中含有“没有”、“不能够”等词,则规则3将这个句子识别为潜在评价搭配句。如果不符合以上规则,且句子中不含有SBV结构、总词数小于5规则4个且含有形容词,则将此句识别为潜在评价搭配旬。3.3.2依存关系模板与潜在评价搭配抽取规则本文使用两种方法抽取评价对象与评价词搭配,对于潜在的评价搭配旬,建立了潜在评价搭配抽取规则,由表3.3所示,对于其他评价搭配使用依存关系模板进行匹配抽取,由表3.4所示。表3.3潜在评价搭配抽取规则Table3.3TheRulesofExtractingPotentialEvaluationCollection序列内容若句子以“没有”开头后接名词或者以“不能(够)”开头后接动规则l词,则将此名词或动词作为评价对象,将“没有”或“不能够”作为评价词提取。若句子中含有形容词,则在已抽取的评价搭配集合中进行搜索,将匹配频率最高的评价对象作为该词对应的评价对象,若没有匹规则2配的评价对象,则将领域词(如在对酒店的评论中,将“酒店”作为领域词)作为该词对应的评价对象 笫三章融合和核心句。』依存关系的评价搭配抽取表3.4依存关系模板Table3.4TheTemplateofDependencyRelation评价搭配/<评价对序号依存关系模板象,评价词>1<(n+)n,(d+)a>^1TSBVADV(n..————一)n1.—————刮—————’-d)2《(v_f-)n,(d+)a>v·竺二J殴1(竺一◆d)3^:丌ATTSBVADV<(】叶nd+)n,(d+)a>(n..—————nd.一—————一}n..——————aI—————◆d)4<(n+)n+v,(d+)a>A丌SBVADV(n·————一)n·——————v..—————刮—————+-d)5<11+v,(d+)a>J~1-rSBVADVn.-—————_v..—————_al———————-司)6VOBSBVADViH·——叫—————◆d)7SBVADVn·._—————叫—————◆dA04a8<(n+)玛a>J幔TSBVVOB(n·——一)n..——一V———斗a9<(11+)n,n>^=丌SBVVOB(n·———1n·——一V—————◆n10<(n+)n,V>^1TSBVVOB(n|_————_)n·———一V—————◆v1lADVVOBv..1_—————a-——————◆d12^TTDE^TT(d·——一)a·———Ⅷ———叶V13A丌DE^TT(d一.卜———一)a..._——————-u—————◆n以上模板中箭头代表依存关系,箭头两端的小写英文字母代表具有依存关系的两个词的词性,箭头上方的标识(如“SBV”)表示两个词的依存关系类型,括号中的部分代表有可能存在的成分。3.3.3基于点互信息(PMI)的评价搭配筛选通过以上方法抽取的评价搭配存在一定得噪音,候选搭配集合中包含了一些 恭十评论文本的情感分析研究领域无关的部分,因此需要进行评价搭配筛选。在商品评论中,评价对象通常是领域相关的,而评价词的领域性并不强,所以本文采用筛选评价对象的方式问接筛选评价搭配。点互信息算法(PMI)可以用来计算两次词之间的相关度,在一定的文本中,两个词w。与w。的PMI值计算公式如下:pgz(w。,%)=Ⅳ(吼,%)/Ⅳ(w。)术N(wb)公式(3.1)其中,^,(%)表示仅包含w。的文本数,Ⅳ(%)表示仅包含w。的文本,Ⅳ(矿。,%)表示既包含W。又包含W。的文本数。本文利用PMI算法计算评价对象的领域相关度,首先选择一个具有代表性的领域词,然后通过百度搜索引擎分别得到包含评价对象与领域词的文本数,从而计算评价对象与领域词的PMI值,最后通过设定阈值的方法进行评价对象的过滤。3.3.4算法描述本节内容在使用L1P对评论语料进行分句的基础上,融合核心句抽取、依存关系模板等的完整评价搭配抽取算法。算法描述如下:输入:评论旬集合StcSetO={st,s2,S3。⋯,Sm)输出:评价搭配集合CombinSet={,...,)。Stepl:利用LTP对StcSetO中的每一个句子进行分词及词性标注,并按照表1的规则进行核心句抽取,得到新的句子集合StcSet=-{sl,S2,S3,⋯,S。)Step2:对StcSet中的整句Sk@=l,2,3,...,n),按照“,”、“:”、“;"分成单句集合{skl,sk2,sk3⋯,skp),对于每个sk(t=1,2,3,...,P),按照以下步骤进行处理:Stepl:若句子符合表2的规则1或规则2,则将句子按照表4的依存模板进行评价搭配抽取,将抽取结果加入候选评价搭配集CandiCombinSet中。Step2:若句子符合表2的规则3与规则4,则将句子按照表3的规则进行评价搭配抽取,抽取结果加入候选评价搭配集CandiCombinSet中。 第兰章融合和核心fU’j依存关系的评价{}}眦抽I改Step3:重复Step2,直至处理完StcSet中的最后一个句子Step4.-计算CandiCombin中每个评价对象与领域词的PMI值,将高于阈值的评价对象所对应的评价搭配保留,得到评价搭配集合CombinSet。Step5:算法结束。3.4实验与结果分析3.4.1数据集及评价标准本文的实验语料采用谭松波提供的酒店评论语料2000篇,正反面各1000篇,将其中的1200篇进行手工标注,作为依存关系模板的训练语料,其余800篇作为测试集S,手工标注出测试预料中的中的评价搭配作为实验结果的评价,包括省略评价对象的评价搭配(潜在评价搭配),并记为<评价对象,评价词>的格式,其中评价词部分不仅包含了情感词本身,还包含了修饰情感词的程度副词和否定词。实验的性能评估基于以下三个指标:召回率(R),表示正确识别的评价搭配占测试语料中实际存在的所有搭配的百分比;准确率(P),表示正确识别的评价搭配占实际识别的总评价搭配数的百分比;综合指标F,对召回率和准确率进行两指标进行综合,F=2PR/(P+R)。3.4.2实验结果为了验证核心句抽取规则与潜在评价搭配抽取规则的有效性,本文设置了两组对比实验,第一组实验仅采用表3.4中的依存关系模板进行评价搭配抽取,并将此组实验作为baseline实验。第二组实验在核心句抽取的基础上进行依存关系模板的匹配,以抽取显示的评价搭配,并使用潜在评价搭配抽取规则抽取潜在评价搭配。本文随机选取测试语料的30%、6096作为新的测试集S1、S2,在Sl、S2与S上进行重复试验。仅采用依存模板的实验结果如表3.5所示。为了分别验证核心旬抽取规则与潜在评价搭配抽取规则对抽取效果的影响,分次加入核心句抽取规则与潜在评价搭配抽取规则,实验结果如表3.6所示。表3.5baseline实验结果Table3.5TheresultofBaselineExperiment25 某于评论文奉的情感分析研究表3.6对比实验结果Table3.6TheResultofComparativeTest从表3.6的实验结果数据可以看出,当在依存模板中增加核心句抽取功能时,评价搭配抽取的的召回率得到显著提高,同时准确率也稍稍增加,当在此基础上再增加潜在的评价搭配抽取规则时,召回率共增加了约3个百分点,整体的F值增加了约7个百分点。由此可见,核心句抽取能够有效提高依存关系分析的正确性,从而提高模板匹配的正确率,而潜在评价搭配抽取能够识别句子中一些特殊的评价搭配。因此,本文所提出的情感搭配识别算法使有效的。3.5总结本文针对情感分析的子任务——评价搭配抽取任务,提出了融合核心句抽取与依存关系模板的方法,并且加入了潜在评价搭配抽取规则,考虑了省略评价对象的评价搭配抽取。通过实验证明了:(1)核心句抽取方法能够有效删除评论旬中的冗余成分,简化句子结构,从而提高句法分析器识别的正确性以及识别的效率,从而有效地提高了算法的性能。(2)潜在评价搭配的抽取能够识别一些依存模板无法匹配的特征评价搭配,即省略评价对象的评价搭配,引入该规则提高了评价搭配抽取的召回率。本章仍有一些评价搭配无法识别,分析原因如下:1)对于一些特殊旬式如还没有好的解决办法,例如,对于比较句,由于句子结构的复杂性,以及存在评价词的指代关系,针对此类问题,本章还未找出完善的抽取方法,对于一些否定26 第三章融合和核心句’j依存关系的评价搭刚抽取句,虽然本章将否定词作为评价词的一部分给予抽取,但是对于不是修饰情感词的否定词,本章的方法则无法将其识别,因而造成评价搭配识别的不完善,影响情感判断。2)对于潜在的评价搭配挖掘的不够全面,这主要是因为潜在评价搭配的表现形式多种多样,本文制定的规则过于简单。因此,在未来的研究中,应该进一步对隐含的评价搭配进行挖掘,对比较句、否定句等特殊结构的句子进行针对性研究。 綦于评论文本的情感分析研究第四章基于混合粒度的的篇章情感倾向性判断本章中将讨论篇章情感倾向性分析的解决方案,考虑到不同粒度的情感倾向性分析方法的互补性,提出了一种基于不同粒度合并模型的篇章情感极性判断方法,在词语层次,采用条件随机场模型(CRF)进行情感词的抽取,在句子层次,利用最大熵模型进行情感旬(主观句)的识别。实验表明,相对于采用单一粒度的篇章情感倾向性判断方法,该模型可以获得较好的判别结果。4.1引言互联网为人们打开了一个新的通道,得益于WEB2.0的强有力的交互性,人们通过计算机进行越来越多的交流、分享以及购物,因此互联网上的信息以及基于互联网的服务(如购物)越来越多,互联网逐渐成为了一个海量信息库,这又刺激了更多人使用网络获取信息或者服务,因此,当前,互联网在很大程度上改变了人们的生活,相对于传统的获取信息的方式,如报纸、广播、电视,越来越多的人开始习惯使用更为便捷的方式——互联网,来了解新闻或关注自己感兴趣的事物;相对于传统的面对面的(实体对实体的)获取服务的方式,越来越多人选择在网上进行购物、咨询、教学、开会等活动。由于互联网这种活跃性,导致互联网信息呈爆炸式的增长,这对人们的信息获取过程带来了一定的困难,人们需要花很长时间才。能在浩如烟海的信息库中选择到自己感兴趣的信息,且不能保证信息的全面性,另一方面,由于网络信息是零碎的、无结构化的,用户需要自己对信息进行总结,每一个人每一次的信息获取都需要进行这个过程。由此可见,如何在保障质量的前提下提高用户对于网络信息的获取效率,如何从松散、无结构化的海量网络文本中抽取关键信息并将其转化为有结构的信息重组是互联网带给学者的一个挑战。情感分析就是为解决这类问题而被提出来的。情感分析,又称情感挖掘,由上文背景描述可知,它的目的在于从海量网络文本中挖掘出有价值的信息。情感挖掘有着广阔的应用前景,如音乐、图书等产品推荐系统、自动知识问答、舆情分析、观点检索、垃圾西悉尼过滤功能等等。这些应用更加便捷地为用户的个性化需求提供了服务。情感分析领域包含的任务 第叫章基于混合粒度的篇章情感倾向性判断有很多,考虑到其中的两个任务——篇章情感极性判断(篇章情感倾向性判断)与评价搭配抽取的互补性,因此,选取这两个任务进行创新性研究。上一章讨论了评价搭配抽取研究,本章中主要讨论对于篇章级情感极性判断的研究。篇章级情感倾向性判断主要指的是判断篇章级文本总体的褒贬倾向,即判断一篇主观性文本呈现出褒义倾向还是贬义倾向,有些研究还讨论褒贬义倾向的程度。以往的篇章文本极性判断都是基于单一粒度的分析,比如基于词语粒度的篇章情感分析,往往使用简单的统计的方法将文本总所有情感词的极性加权平均,作为整篇文档的情感极性,这比较适合情感词在文本中密度较高且数量较大的情况,而网络文本的情况比较复杂,有些文本中只包含一两句话,而另一些文本含有大量句子,过于冗长,因此基于单一粒度的文本情感分析很难全面解决这类问题,考虑到不同粒度的篇章分析解决问题的角度不同,本章提出基于不同粒度的混合粒度模型来研究篇章级情感分析任务,主要对词语级和句子的篇章情感分析方法进行了融合。在基于词语级的情感分析处理过程中,本文使用了条件随机场(CI江)模型进行情感词识别,对于情感词的倾向性判断,本文提出了左中右序列(Left.Middle—Right-Order)模板,即通过目标词的左右相邻词语来辅助判断目标词语的倾向性。在基于句子级的情感分析处理中,本文利用最大熵模型进行了主观旬的识别以及倾向性的判断。利用以上两个粒度的篇章情感分析方法的融合结果,最终确定该篇章的情感极性。本章其他内容安排如下:第二节将介绍国内外对于文本极性判断研究的相关工作,第三节具体描述了本文提出的篇章情感分析方法,第四节为实验,并给出了不同粒度下的实验结果对比,同时对个文本特征之间的互补性进行了探索,最后一节为本章小结。4.2相关工作情感分析的子任务有许多,本章主要讨论情感倾向性判断方面国内外的相关工作。中文方面,最初的研究者们大多数采用基于HowNet的方法识别中文情感词的倾向性㈣。Yao㈣等人进行了进一步的研究,除了利用情感词典中的原始信息, 暴于评论义奉的情感分析研究同时结合了词语的上下文环境对词语的最终极性进行调整。乔春庚等人【33】采用自学习的方法迭代识别文本中的情感词极性,首先标注一部分的词语情感倾向作为已识别情感词,借助相关特征进行其他情感词的挖掘及倾向性判断,然后将这部分识别的情感词加入已识别情感词集合,迭代的进行这个步骤,直到识别到新的词语低于某个阈值为止。在句子和篇章情感分析方面,王克等人【80】采用基于属性的方法判断句子的主客观性。张猛等人18l】在情感词识别的基础上,采用支持向量机(SVM)模型,融合了多种特征对文本情感进行分类。刘康等【82】在观点的极性判断试验中对比了机器学习算法与基于情感词典的方法。面向英文的研究中,在情感词的识别与极性判断方面,Hatzivassiloglou等人【83】提出了一种基于全监督学习的评价词抽取方法,并通过已知的情感词极性,根据连接词与连接词两端形容词极性的关系,判断目标情感词的极性(如,”and'’两侧的句子中如果都含有形容词,则可以将这两个形容词的极性看作是一致的)。Turney等人聊】通过进行候选情感词与已标注情感词之间的相似度计算抽取情感词,通过分别计算情感词与褒贬义词语之间的互信息指来判断该情感词的褒贬倾向性。Wilson等人【85】认为在情感分析领域的研究中,对特征的分析是起到关键作用的。Hassan等人【86】通过建立词语间关系图的方法,实现对任何词语进行情感极性判断。Pang等人【871对篇章情感分析进行了研究,他们把篇章的极性判断问题当做情感分类问题处理,将文本分为褒义和贬义两大情感类,而不是传统的话题分类问题。文中对不同的分类算法进行了实验,如最大熵算法、SVM以及朴素贝叶斯。在之后的研究中【船l,他们对情感分析进行了更系统的研究,实现了基于最小割(minimum—cut)的情感分类系统。综上所述,目前的情感倾向性判断主要采用两种方法:基于情感词典的方法以及基于机器学习中分类算法的方法。在实际研究中,有时单独采用一种方法,有时结合两种方法进行实验,然而,不管使用怎样的方法,对于篇章级的情感极性判断,往往使用基于单一粒度的分析方法,本章将结合各粒度层次的优缺点,采用混合粒度的方式进行文本情感分倾向性判断。 笫¨章綦十混合粒度的篇章情感倾向性判断4.3基于混合粒度的篇章级情感倾向性判断4.3-1特征选取在进行情感分析工作之前,首先把原始文本通过各种特征进行表示,特征的选取如下表所示:表01文本特征Table4.1T’eXtFeature特征说明N.Gram模型是常用的语言模型,本章主要采N.Grams模型用一元和二元的模型作为特征有些词语的词性不是固定不变的,在修饰不同词性的对象时,表现出不同的情感倾向,因此,本章使用搭配标签进行词义消歧依存关系是句子中词语之间的支配与被支配依存关系关系词语(或词组)在句子中所表示的成分,由句依存句法成分法分析过程识别转折词连接的两个单句中的情感一般呈相反转折词的极性否定词会改变或者增强(减弱)句子的情感倾否定词向性程度副词作为情感词的修饰词,能够明显加强程度副词或减弱情感词的极性,有时还能够帮助识别情感词过多的初始特征项中包含了一部分冗余信息,本文使用设置阈值淘汰低频率特征的方法以及为每个特征设置不同的权重信息进行特征筛选,对于权重的设置,采用如下两种方法。(1)布尔权重:该值反映了特征Z在文本Z中的是否存在,具体表示如下:wc“,=忙宠浆三拍∽(2)词频权重:该权重使用特征出现的频率信息作为衡量该特征是否重要的一个标准,具体表示如下: 恭于评论文本的情感分析研究w(∥,Z)=矿(Z,4)4.3.2基于词语极性的篇章极性判断式(4.2)基于词语的篇章情感极性判断首先需要进行情感词识别及其倾向性的判断,本章使用条件随机场模型识别情感词,对于情感词的极性判断,传统的方式是使用词典匹配或基于情感词典的识别方式,但是,有些词语的极性在特定的上下文中才有具体的倾向性,如“油价很高"与“这种投资的回报率很高”,同样的情感词“高"在两个不同的句子里表现出了相反的极性,因此,在情感词极性判断中,除了使用情感词典之外,还将考虑上下文对词语的极性影响,本节提出了左中右序列(Left—Middle—Right—Order)模板解决这一问题。4.3.2.1LMRO模板词与词之间的位置关系通常与这两个词的情感表达有一定的联系,基于这个假设,本文设定了该模板,在有序排列的文本中,LMRO模板指的是目标词语与目标词语左右相邻词构成的模板,可以自行决定其窗口长度,如“房间很干净”,进行分词之后变为“房间很干净。",本文选择窗口门限值为3,特征为N-grams词组的LMRO模板,即L。MR。O模板,对此句的处理如下:Orderl:LSBeginM房间R很Order2:L房间M很R干净Order3:L很M干净R。Order4:L干净M。RSend对于每一条序列:(1)在序列(1)中,由于“房间”的情感极性为中性,因此该序列被认为是中性训练样本,不包含任何情感倾向。(2)序列(2)同序列(1)(3)序列(3)中,由于M词为“干净”,是褒义词,因此该序列被认为是带有褒义情感倾向的训练样本。(4)同序列(1)序列(2)。与L。MR.0模板类似,LMR通过设定不同的特征以及不同的窗口大小来得到更好的识别效果。本章选择N-Gram词组、词性、句法成分、依存关系、转折词、 第pq章揍于混合粒度的篇章情感倾向灶判断否定词、程度副词作为特征,采用CRF模型对情感词进行抽取。4.3.2.2基于CRF模型的情感倾向性判断由于不同特征的特点不同,在基于条件随机场模型的训练过程中,对不同特征采用了不同的LMRO模板。对于N.gram词组、词性、句法成分,采用L2LlMRlR20模板,即M词的特征与左右距离为2的两个词语的同类特征标签结合考虑。对于其他特征,只考虑目标特征本身,并给这些特征赋权值。对于否定词特征,其权重为否定词在句中出现的频数,否定词特征属于句子中每个词的共有特征,即同一个句子中的每个词语都有相同的否定词特征;对于程度词特征,如果句子中存在程度词,则该句子中所有词所对应的该特征都是1,若没有,则为0;对于转折词特征,其权重的赋值方法与程度副词相同;对于依存句法关系,词语的该特征值为其他词指向目标词的依存关系。下面将真实的观察特征记为。(毛f):』1.专三肇观察值为褒义公式(4.3)D(x,7)21o其他公瓦【4j)在情感分析问题中,状态和转移特征函数可以由o(x,f)表示,具体如下:肌删)={D(≯匈f-l为‰x糠义公删4.3.2.3篇章情感倾向性计算上一小节的算法对篇章内的情感词进行了抽取并对其情感极性进行了判断,具体结果如下:(1)情感词总数:SentiWordNum;(2)具有褒义极性的情感词数目:PosSentiWordNum:(3)具有贬义极性的情感词数目:NegSentiWordNum。利用下述公式,将一L面所得数据转化为篇章的情感分数(WSentiGrade):sSentiGra如=型Sen等tiWorum公式(4.4)dN?1利用SentiGrade以及设置的下限阈值WGL和上限阈值WGH,计算篇章的 璀于评论文本的情感分析研究情感极性(DP01)如下:f—lWSe门tiGradeSGH(式4.7’o其他在句子的级的情感分析中,由于不同的组合策略有不同的特点,为了更好的发挥各种组合策略的优势,对于不同的策略,本文设置了不同的上下门限阈值SGH和SGL。 筇心章捧十混合粒度的篇章情感倾向。眺判断4.3.4基于混合粒度的篇章情感分析在情感文本处理领域,基于不同粒度的文本处理方法有着各自的优势,基于细粒度的方法的文本处理的准确率较高,但是存在遗漏部分整体方面信息的问题,而基于粗粒度的文本处理方法刚好相反,已有学者证明,利用不同粒度的检索结果进行合并的检索方式可以得到较单一粒度更好的效果【89】,本文将这种思想引入到情感倾向性分析研究中,混合词语粒度与句子粒度的方法进行篇章情感分析,上两节分别介绍了基于词语与基于句子的篇章情感极性判断,本节将对混合粒度模型的合并方式进行描述。在混合粒度模型中,以基于词语的篇章情感分析结果作为基础,再使用篇章情感倾向判断对其进行修正,混合粒度模型篇章的情感分数计算方式如下:胁zGrade嘲黜ntiGrade川卅×禚,3e裟lrr凳aae篙。sLbe纂lrra警公式∽8,,’,玎Ij十刀ll口P其中,元为权重参数,五∈(O,1),用以表示基于词语与基于句子的篇章情感分析对篇章情感的影响比重。利用SentiGrade,同前面的计算方法类似,计算篇章情感极性如下:f_1㈣<倪DPol={1SentiGrade>GH公式(4.9)l0其他4.4实验及结果分析4.4.1文本预处理在进行文本处理的实验之前,首先需要为实验做基础准备,即预处理。由于使用的文本处理方法以句子为单位,以单词为最小单位,所以在进行实验前,需要进行网络文本的句子切分以及分词,由于网络文本包含许多冗余信息、句法分析器无法识别的内容等等,因此,除了分局和分词之外,还要对句子进行垃圾信息去除的工作。在本章的试验中,需要知道词语的词性、词语问的依存关系,词语在句子中的成分,因此,必要的句法分析是进行实验的前提。归结起来,在文本预处理阶段,需要进行句子切分、分词及词性标注、句法分析以及冗余成分删除。 皋于评论文本的情感分析研究4.4.2LMRO模板LMRO模板是基于词语级别的情感分析的基础,因此,首先考察其在情感分析应用中的有效性。本文使用谭松波提供的酒店评论语料作为训练集测试LMRO模板的有效性,语料中包含了褒贬义句子各1000句,并进行了部分情感词(评价词)标注。在实验过程中,结合了最大熵算法进行情感词的识别和情感倾向判断,实验结果的评估指标选择的是召回率(Recall)、P@50、P@100以及P@500(即返回结果中前N个词的准确率,即评估了准确率,将N设置为不同的值,也评估了算法的稳定性)。本节将探究使用不同数量的特征对实验结果的影响,选取词语本身(wora)以及该词语的词性(POS)作为特征,以词语序列窗口为2的情况为例,目标词语Mword的序列如下所示:LWbrd2,LPOS2,LWordl,LPOSl,MWord,ⅧOS,RWrordl,RPOSl,RWord2,RPOS2其中,LWordi指的是目标词Mword左边第i个词,LPOSi指目标词MWord词左边第i个词的词性,RWordi指的是目标词Mword右边边第i个词,LPOSi指目标词MWord词右边边第i个词的词性。根据不同的窗口值,设置了6组不同的特征,如表3.2所示:表4.2用于抽取情感词的6组特征Table4.2SixGroupsofFeaturesUsedtoExtractSentimentWord特征序列特征1MWbrdMPOS特征2LWbrdlMW.ordMPOSRWordl特征3LPOSlMWbrdMPOSRPOSl特征4LWordlLPOSlMWbrdMPOSRWordlRPOSlLWord2LWbrdlLPOSlMWbrdMPOSRW-0rdl特征5RPOSlRWord2LWord2LPOS2LWbrdlLPOSlMWbrdMPOS特征6RWordlRPOSIRWord2RPOS2通过以上6组特征分别进行实验,对于实验结果,采用召回率以及P@N值36 第叫章基于混合粒度的篇章情感倾向忭判断作为性能评估指标,在不同的特征下,情感词识别及极性判断的召回率结果如图4.1所示。从总体结果的召回率来看,说明LMRO模型是有效的以及特征的选取是科学的,从图像的变化趋势来看,特征1、2、3的召回率呈递进式增长,特征5特征6的召回率有所下降,这说明,随着有效特征的增加,情感词识别的召回率会随之增加,但是过多的特征会使系统的复杂度提高,且对目标词的识别影响较小,过多的不良特征会给系统带来更多噪声,影响识别结果。lO.8O.6O.40.2召口塞一J-特征l特征2特征3特征4特征5特征6特征图4.1情感词识别的召回翠Fig4.1Recallofsentimentwordrecognition本文采用a@i作为准确率的评价指标,并且通过比较P@50、P@100以及P@500的值考察该算法的健壮性,P@500的结果如图4.2所示。由图可以看出,当选取的特征数量最小时,没有准确率最低,随着特征数量的增多,准确率逐渐增加,并趋于平稳,特征3的准确率最高,特征5特征6虽然含有更多特征项,但是准确率却有所降低,考虑可能是由于特征项的增多导致噪声增多而造成的。 某于评论文本的情感分析研究1O.8O.6O.4O.2特征特征l特征2特征3特征4特征5特征6图4.2P@1000结果Fig4.2ResultofP@1000图4.3展示了该算法的健壮性信息,分别抽取P@50、P@100以及P@500的数据进行对比,由图可以看出在特征4下,P@50、P@100和P@500三者基本相同,说明在特征4下,该算法的健壮性最好,当特征项增加时,虽然准确率有所波动,但P@50、P@100和P@500的变化趋势趋于一致,这说明,随着特征项的增多,虽然准确率有所变化,但是算法的健壮性良好,系统具有很好的稳定性。123456·__。_。___--·。_。。-·。-____——P@500一一。一·一P@100⋯一一一P@50特征图4.3算法的健壮性Fig4.3RobustofAlgorithm结合上述几项的分析可知,LMRO模板对情感词的识别效果良好。9876540O0O 第叫章綦于混合粒度的篇章情感倾向性判断4.4.3混合粒度模型本节将介绍基于句子级的篇章情感极性判断的实验结果以及混合粒度的篇章情感极性判断结果。所谓混合粒度,指的是在基于情感词的篇章情感分析的基础上,引入基于句子的情感分析对前一个的结果进行修正。本节首先介绍实验的语料设置,实验的评估指标以及实验中的数据阈值设置,之后分别给出基于句子的篇章情感倾向性分析结果以及基于词语与基于句子结合的篇章情感倾向性分析结果,并对结果进行了分析。本节的实验数据来自COAE2008的实验语料,选取了其中1000篇文本作为训练文本,其中褒义情感文本400篇,贬义文本400篇,中性文本200篇,首先对这些语料进行了分句,并进行了情感句、情感词标注。测试文本来自另外未标注的原始语料1000篇。实验的评价指标选择常用的准确率、召回率以及F值。另外,对于三种文本(褒义、贬义、中性)的测试结果取平均值作为系统整体性能的衡量指标。实验中涉及到参数和阈值的设置,为了达到较好的效果,本文采用依据经验的方法进行设置,其中,WGL与WGH分别设为0.5和0.6,基于句子的情感分析中,方案1中的SGL和SGH分别设置为O.5和O.7,其他方案中,SGL和SGH分别设置为O.4和0.6,篇章整合中,GL和GH分别为O.5和0.6,最后,旯设置为0.7。表4.3列出了基于句子级的篇章情感倾向性分析结果,且分别列出了使用五种方案的结果对比,相应的评价指标下的最优结果使用黑体标识,观察该表可知:(1)在对褒义文本的处理中,方案3的准确率和F值均为最优,方案4与方案5在召回率指标下最高;对贬义文本的处理中,方案3的召回率最高,方案5的准确率与F值均为最优;在对中性文本的处理中,方案1的F值与召回率都是最优的,其他方案都拥有较高的准确率,但是召回率均不是很好,这也许与本章的阈值设置有关。由此可以说明,方案3对含有情感倾向的文本处理的效果明显,方案3中将否定词作为特征项,由此可知,否定词对于文本倾向性处理而言是一类非常重要的特征。而对于无明显倾向的中性文本,方案1的处理效果最佳。(2)从三类文本处理的平均指标来看,方案5的综合处理效果最佳,方案3的平均召回率最高,且平均F值也接近最优值,由此可见,有效地特征项的加入,有利于 甚于评论文本的情感分析研究情感分析的识别效果,且否定词作为特征项比程度副词对情感分析的影响大很多。表4.3基于句子的篇章情感倾向性判断Table4.3TextSentimentalAnalysisBasedonSentence方案评价标准褒义(%)中性(%)贬义(%)平均(%)准确率22.90968.99215.56935.823l召回率38.41547.93524.07436.808F值28.70256.56818090934.726准确率29.28469.45531.33143.3562召回率57.31734.29167.59353.067F值38.76345.91442.81542.497准确率30.69369.76032.76744.4063召回率56.70736.44571.29654.816F值39.82947.87744.89844.201准确率29.44869.64333.18444.0924召回率58.53768.51935.01054.021F值39.18446.59544.71243.497准确率29.17970.28035.04744.8355召回率58.53736.08669.44454.689F值38.94547.68746.58444.405表4.4给出了在词语级情感分析基础上加入句子级特征进行修正后的结果,并且对比了词语级情感分析结果与各方案下的混合粒度情感分析结果。表4.4混合粒度模型结果Table4.4TheResultofMixedgranularityModle方案评价标准褒义(%)中性(%)贬义(%)平均(%)准确率66.81493.81288.23582.953词语层召同率92.07384.38183.33386.596F值77.43688.84785.71483.999词语+准确率82.60989.23683.74885.108方案1召同率69.51292.28088.88983.560 第pq章基二J二混合粒度的篇章情感倾向件判断F值75.49790.73386.09984.109准确率60.09290.48761.63570.738词语+召回率79.87873.43090.74181.350方案2F值75.49790.73386.09974.355准确率60.28090.61163.69471.529词语+召回率78.65974.50692.59381.919方案3F值68.25481.77375.47275.166准确率60.73l91.18963.46271.794词语+召回率81.09874.32791.66782.364方案4F值69.45281.89975.00075.450准确率60.98792.05365.36072.800词语+召回率82.92774.86592.59383.462方案5F值70.28482.57476.62876.496从表4.4可以看出,相较于词语级的篇章情感倾向性判断结果,基于句子级的篇章情感分析结果较差,这与检索领域实验结果一致,即文本的粒度越小,检索结果会相对越好,因此,基于混合粒度的篇章情感倾向性分析与基于混合粒度的信息检索结果相对一致。由表可以看出,在混合粒度模型下的篇章情感分析中,在词语级的基础上引入方案A得到的平均准确率和F值均为最优,识别效果超过了了基于单一粒度的的篇章情感分析,同时也高于其他组合方案。由方案一的特征组成可以得出下面的结论:在篇章级情感倾向性判断中,词语级情感分析中使用的特征与带有布尔权重的N.Gram语言模型具有互补的特性,因此,将二者结合,会提高篇章情感分析的效果。另外,在对于贬义倾向的句子分析中可以看出,否定词特征在混合粒度模型中起到了显著的作用。单一粒度的词语级篇章分析对褒义文本的的识别效果较优,召回率达到92%,这说明,褒义词是篇章的褒义表达的主要影响因素或主要表现形式。4.5小结本章提出了一种基于混合粒度模型的篇章情感倾向性判断方法,具体来说, 基于评论文本的情感分析研究在基于词语级篇章情感分析的基础上引入句子级篇章情感分析方案,并对不同粒度的方法中所使用的各特征项的互补性进行了讨论。实验结果表明,在基于单一粒度的文档级别情感倾向性判断研究中,词语级别的情感分析结果在精确率和召回率上均优于基于句子模型的的识别结果;采用基于词语与基于句子的混合模型结果得到较单一粒度方法更优的F值,这说明基于词语的篇章级情感分析与基于句子的文档级情感分析具有互补的作用。总体来说,本章所提出的基于混合粒度模型的算法对于篇章情感倾向性判断有一定的有效性,但在混合粒度模型中仍存在一些问题需要解决:(1)由表3—3的数据可知,在混合词语级与句子级的模型中,词语级特征结合句子级各种方案时,不是所有类型的结合都有助于识别效果的提高,词语级和方案2、3、4、5合并的结果无论在哪种褒义、贬义或中性文本的识别效果上,都表现出评估值下降的趋势。(2)在基于情感句的篇章情感分析中,本章并未考虑将情感句的位置作为特征加入。句子在篇章中的位置往往包含了该句对于文章的重要程度的信息,比如,对文章主旨概括性的句子往往出现在一段的开始或末尾处,或段落中出现转折后的第一句,可以根据情感句的位置特征对情感句赋不同的权值信息,更加准确地表现篇章的整体情感倾向。(3)本章将篇章情感分析作为二元分类的问题来看,即判断一篇文档属于褒义还是贬义,但是对褒义或贬义的表达程度问题未给予充分的考虑。42 筇五章总结’j胜掣第五章总结与展望5.1本文工作总结随着信息技术,特别是人工智能领域的发展,以前必须由人工才能完成的复杂工作逐渐可以由计算机代替,相较于人工处理,计算机具有速度快、效率高且准确度高的优势。例如,在网络文本处理领域,近几年来,由于互联网信息的发达与便利,网络上的文本信息量呈爆炸式增长,若依靠人工方式从海量文本中获取有价值信息,将花费过多时间和精力,因此,如何利用自然语言处理技术对网络文本进行自动挖掘成为一项必须的任务。本文总结了WEB文本挖掘的历史,在前人工作的基础上,针对现存的主要问题,对评价搭配抽取与篇章情感倾向性判断这两方面分别作了相关研究,实验结果表明,本文所提出的方法具有一定的突破性,但是也存在许多不足之处,总结如下:WEB观点挖掘包含了许多有意义的子任务,考虑到细粒度的情感分析与粗粒度情感分析的互补性,本文选择了细粒度范畴的情感搭配抽取与粗粒度范畴的篇章情感倾向识别。在情感搭配抽取方面,本文首先说明了评价搭配抽取较单独的评价词抽取或评价对象抽取的优势所在,接着提出了解决这一问题的具体方法,即融合核心句抽取与依存关系方法抽取评价搭配,并且考虑了评论旬中省略评价对象时的潜在评价搭配抽取方法。核心句抽取的目的是减少因为评论句中存在过多冗余成分而造成依存分析错误以及依存分析效率降低的情况,因此本章设定了一系列冗余成分删除规则。依存关系是评价搭配抽取的关键,利用依存分析的结果,根据评价对象和评价词在句中的依存关系对其进行同时抽取,这种方法充分考虑了评价对像与评价词在评论句中的固有结构联系,且提高了抽取的效率。除此之外,一些句子中含有情感倾向,但并不表现为“评价对象。评价词”的模式,针对这类观点句,本文构造了潜在评价搭配句的识别与潜在评价搭配的识别规则,提高了抽取的覆盖率。实验结果表明,相较于未使用核心句抽取规则的依存关系方法,本文的方法在准确率与覆盖率上均有所提高,说明了核心旬抽取对于提高依存句法分析结果的准确性方面是有效的,另外,潜在评价对象的抽取进一步提高了抽取的覆盖率。 某于评论文本的情感分析研究在篇章情感倾向性判断方面,本文实现了基于混合粒度模型的中文篇章情感极性判断。混合粒度方法指的是结合基于词语级与基于句子级这两种粒度的方法识别篇章的情感倾向性。具体地说,在基于情感词篇章情感分析方面,首先通过LMRO模板模拟词语序列,结合目标词的词性特征、周围是否有否定词、周围是否存在转折词等特征,使用CRF模型抽取文本中的情感词。在基于句子的篇章情感分析中,分别考察了五种方案的特征组合,并对其有效性进行了分析。最后,采用取长补短的方法混合基于这两种粒度的篇章情感倾向性判断结果,实验结果表明,混合粒度模型在篇章情感极性判断的研究上表现良好,相较于基于单一粒度的篇章情感分析,在准确率和覆盖率上均有所提高。同时,实验结果了再次证明了细粒度的情感分析对篇章情感分析的重要性,以及否定词特征在贬义情感文本识别中的具有关键作用。本文的研究仍存在一些不足:(1)在情感搭配的抽取工作中,核心句的抽取规则还不够完善,对于冗余信息的过滤规则还有待更进一步的研究;依存关系规则只能抽取评价对象与评价词成对出现的情况,对于其他方式的情感表达,本文虽然制定了潜在评价搭配的抽取,但没有考虑到比较句的表达形式;在基于依存关系的抽取中,将修饰评价词的程度词或否定词与情感词合并为最终的评价词,但当否定词在句中并非直接修饰评价词时,很难将其抽取,因此造成情感倾向判断错误。(2)在构建混合粒度模型解决篇章情感倾向性判断时,仅采用了简单插值的方式对基于词语与基于句子的情感分析结果进行合并,对计算公式中参数的设定采用经验的方式,这使得最终的结果很可能不是最优解,对于实验本身来说,不够完整。如果能使用概率估计的方法估计模型中的参数值,理论上应该可以获得更好的结果。5.2未来工作展望本文探讨了针对互联网上用户生成数据的情感信息挖掘,所涉及到的情感搭配抽取以及篇章情感倾向性判断工作均为目前WEB文本挖掘中的热点问题,具有广泛的应用价值和现实意义,随着互联网不断发展变化,新需求不断增多,WEB文本挖掘仍然值得继续深入探讨研究: 第五章总结与展望(1)在对篇章进行情感倾向性分析中,应考虑与细粒度的情感分析互补,例如,基于情感词语的情感判断准确率较高,但情感词只是情感表达的一种方式,仅使用此方法容易造成情感判断的遗漏问题,因此,在篇章情感分析中,应更多考虑其他类型情感表达的特征,使得对篇章的情感分析更加完整。(2)在要素级别的抽取上,相较于以评价对象作为中心的抽取,中文评价搭配抽取的工作才刚刚开始,该工作目前的主要困难有一下几点:一,由于网络观点表达特别是商品评论的口语化,导致句法分析出现错误。二,由于中文表达的灵活性,修饰词语往往不是由一个词构成,且往往不是以形容词方式存在,这给抽取工作也带来了挑战。三,对于比较句和否定句的情感抽取还未得到广泛关注。针对这些困难,未来的要素级抽取工作应更好的解决原始语料的预处理问题,可以考虑将结构复杂的成分转化为语义相近的简单表达方式,从而提高句法分析的准确率与覆盖率;对于情感表达复杂的句子,通过研究其特征组成,对其进行情感倾向性的判断;最后,针对比较句与否定句的表达方式,应该首先构建完整的语料集,针对其特点进行专门性的研究。 綦于评论文本的情感分析1i】|:究参考文献[1】中国互联网信息中心.第30次中国互联网络发展状况统计报告.[EB/OL]http://www.cnnic.net.cn/research/bgxz/tjbg/201207/t2012071932247.html[2】GlobalTrustinAdvertisingandBrandMessages.Nielsen,2012年4月.【3】C.D.Manning,H.Schuetze.Foundationsofstatisticalnaturallanguageprocessing[C].TheMITPress,1999.[4】R.Baeza-Yates,B.Ribeiro-Neto.Modeminformationretrieval[C].ACMPress,1999.【5】刘远超,王晓龙,徐志明等.文档聚类综述【J】,中文信息学报,20(3),2006,pp.55—62.[6】F.Sebastiani.Machinelearninginautomatedtextcategorization[J].ACMComputingSurveys(CSUR),V0134,Issuel,2002,PP.1-47.[7】赵妍妍,秦兵,刘挺.文本情感分析[J】,2010,21(8)-1834—1848.[8】HatzivassiloglouV,McKeownKR.Predictingthesemanticorientationofadjectives[C].In-Proc.OftheEACL’97.Mordstown:ACL,1997174—181.【9】Kamps,M.Marx,R.J.Mokken,andM.D.Rijke.UsingWordNettomeasuresemanticoritentationofadjectives[C].In:PrceedingsofLREC一04,4minternationalConferenceonLanguageResourcesandEvaluation,Lisbon,2004,115—118.[10】BoPang,LillianLee,andShivakumarVaithyanathan.SentimentClassificationusingMachineLeamingTechniques[C】,preenstedatthe2002conferenceonEmpiricalMethodsinNaturalLanguageProcessing(EMNLP’2002),2002,79.86.[1l】徐林宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007年21卷第l期,96—100[12】唐慧丰,谭松波,程雪旗.基于监督学习的中文情感分类技术比较研究[J】.中文信息学报,2007,21(6):88.94[13】赵鹏,赵志伟,陶新竹等.基于语义的TriPos模式的中文主客观分析方法【J】.计算机研究与应用,2012,(10).[14]李龙澍,张晓红,赵志伟.基于粗糙集理论的中文文本主观性研究[J].计 参考文献算机技术与发展,2011,(06).[15】李思,郭军.WEB观点挖掘中关键问题的研究【D】.北京邮电大学博士论文一2012.【16】赵妍妍,秦兵,车万翔.基于句法路径的情感评价单元识别[J].软件学报,2011,22(5):887。898.【17】BolanleaOjokoh,Olumidekayode.Afeature—opinionextractionapproachtoopinionmining[J].journalofwebengineering,2012,11(1):051.063.[18】黄亿华,濮小佳,袁春风.基于句法树结构的情感评价单元抽取算法[J】.计算机应用研究,2011,28(9):3229.3234.【19】章剑锋,张奇,吴立德.中文观点挖掘中的主观性关系抽取【J】.中文信息学报,2008,22(2):0055.0059.【20】许洪波,孙乐,姚天防.第三届中文倾向性分析总结报告冈.第三届中文倾向性分析评测(COAE2011).2011,1.24.【2l】J.Ⅵ,T.Nasukawa,R.BunescuandW.Niblack.Sentimentanalyzer:Sentimentanalyzer:Extractingsentimentsaboutagiventopicusingnaturallanguageprocessingtechniques[C].InProceedingsoflEEEIntl.Conf.onDataMining(ICDM),2003.【22】M.HuandB.Liu.Opinionextractionandsummarizationontheweb[C].In:Proceedingsofthe21stnationalconferenceonArtificialintelligence(AAAr06).2006,PP.1621—1624.【23】J.Zhang,M.S.AckermanandL.Adamic.Expertisenetworksinonlinecommunities:structureandalgorithms[C].InProceedingsofthe16thinternationalconferenceonWorldWideWeb(WWW’07).2007,PP.221—230.【24】顾正甲,姚天防.评价对象及其倾向性的抽取和判别【J】.中文信息学报,2012,26(4):91.97.[25】VHatzivassiloglouandK.McKeown.Predictingthesemanticorientationofadjectives[C】.InProceedingsofAnnualMeetingoftheAssociationforComputationalLinguistics(ACL’97),1997.【26]J.KarnpsandM.Marx.Wordswithattitude[C].InProceedingsof1stIntemationalWordNetConference,2001,PP.332—341.[28]GQiu,B.Liu,J.BuandC.Chen.Expandingdomainsentimentlexicon4.7 暴于评论文本的情感分析研究throughdoublepropagation[C】.InProceedingsofthe21stinternationalfontconferenceonArtijicalintelligence.2009,PP.1199—1204.[29】许洪波,孙乐,姚天防.第三届中文倾向性分析总结报告【R】.第三届中文倾向性分析评测(COAE2011).2011,1-24.【3I)】B.Pang,L,Lee,andS.Vaithyanathan.Thumbsup:sentimentclassificationusingmachinelearningtechniques[C].InProceedingsofConferenceonEmpiricalMethodsinNaturalLanguageProcessing(EMNLP’02),2002.[31]K.Dave,S.LawrenceandD.M.Pennock.Miningthepeanutgallery:opinionextractionandsemanticclassificationofproductreviews[C】.InProceedingsofthe12thinternationalconferenceonWorldWideWeb(WWW’03).2003,PP.519—528.【32】赵军,许洪波,黄萱菁.中文倾向性分析评测技术报告[R】.第一届中文倾向性分析评.测(COAE2011).2008,1-20.[33】乔春庚,孙丽华,吴韶.基于模式的中文倾向性分析研究【R】.第一届中文倾向性分析评测(COAE2011).2008,21—31.[34】全昌勤,任福继.基于多项式核的中文文本褒贬自动判别[R】.第一届中文倾向性分析评测(COAE2011).2008,21—31.【35】B.Liu,M.HuandJ.Cheng.OpinionObserver;Analy血gandComparingOpinionsontheWeb.InProceedingsofthe14thinternationalconferenceonWorldWideWeb,2005,PP.342—351.【36】M.HuandB.Liu..Opinionextractionandsummarizationontheweb..InProceedingsofthe21stnationalconferenceonArtificialintelligence(AAAr06).2006,PP.1621—1624.[37】L.Zhuang,EJing,andX.-YZhu.Moviereviewminingandsummarization..InProceedingsofthe15thACMinternationalconferenceonInformationandknowledgemanagement(CIKM’06).2006,PP.43-50.[38】A.一M.Popescuand0.Etzioni..Exhalingproductfeaturesandopinionsfromreviews.InProceedingsoftheconferenceonHumanLanguageTechnologyandEmpiricalMethodsinNaturalLanguageProcessing.2005,PP.339—346.【39】LTitvoandR.Mcdonald.Modelingonlinereviewswithmulti-graintopic 参考文献models.InProceedingofthe17thIntemationalconferenceonWorldWideWeb(WWW。08).2008,PP.111-120.[40】BloomK,GargN,ArgamonS.Extractingappraisalexpressions.In:SidnerC,ed.Proc.oftheHLT-NAACL2007.Morristown:AssociationforComputationalLinguistics,2007.308—315.【41】HuMQ,LiuB.Miningandsummarizingcustomerreviews.In:KohaviRed.Proc.oftheKDD2004.NewYork:ACM,2004.168—177.【doi:10.1145/1014052.1014073】[42】KimSM,HovyE.Determiningthesentimentofopinions.In:NirenburgS,ed.Proc.oftheColing2004.Morristown:AssociationforComputationalLinguistics,2004.1367—1373.[doi:10.3115/1220355.1220555】[43】KobayashiN,InuiKMatsumotoYTateishiK,FukushimaT.Collectingevaluativeexpressionsforopinionextraction.In:NagaoM,ed.Proc.oftheInt’1JointConf.onNaturalLanguageProcessing.NewYork:Springer-Verlag,2004.584-589.【doi:10.1007/978-3-540—30211-7_63】[44】PopescuAMEtzioni0.Extractingproductfeaturesandopinions舶mreviews.In:MooneyRJ,ed.Proc.oftheHLT/EMNLP2005.Morristown:AssociationforComputationalLinguistics,2005.339—346.[doi:10.3115/1220575.1220618】[45】YaoTF,LouDC.ResearchonsemanticorientationanalysisfortopicsinChinesesentences.JournalofChineseInformationProcessing,2007,21(5):73—79(inChinese、舫tllEnglishabstract).【46】D.D.Lewis.NaiveBayesatforty:Theindependenceassumptionininformationretrieval.InProceedingsoftheEuropeanConferenceonMachineLearning(ECML),1998,PP.4一l5.【47】A.L.Bei-ger,S.A.D.PietraandVJ.D.Pietra.Amaximumentropyapproachtonaturallanguageprocessing.ComputationalLinguistics,22(1),1996,PP.39—71.[48】T-Joachims.Textcategorizationwithsupportvectormachines:Learningwithmanyrelevantfeatures.InProceedingsoftheEuropeanConferenceonMachineLearning(ECML),1998,PP.137—142.49 基于评论文本的情感分析研究[49】J,Laffeity,A.McCallumandRPereira.Conditionalrandomfields;Probabilisticmodelsforsegmentingandlabelingsequencedata.InProceedingsof18mInternationalConferenceonMachineLearning,2001,PP.282-289.【50】T.M.CoverandP.E.Hart.Nearestneighborpattemclassification.IEEETransactionsonInformationTheory,13(5),1967,PP.21—27.【51】J.A.HaitiganandM.A.Wong.AK-MeansClusteringAlgorithm.AppliedStatistics,V01.28,No.1,1979,PP.100—108.[52】中文词法分析系统IATCLAS.http://ictclas.org/[EB/OL】【53】语言技术平台.LTP哈尔滨工业大学社会计算与信息检索研究中心【DB/OL].http://ir.hit.edu.cn/【54】杜晓杰,张楠,魏蓉等.自然语言理解策略——中文语义分析及LSF随即化句法分析模型与应用【J】,天津师范大学学报,28(4):73.76【55】J.Blitzer,M.DredzeandEP.Biographies.Bollywood,Boom-boxesandBlenders:DomainAdaptationforSentimentClassification.InProceedingsofssociationforComputationalLinguistics(ACL),2007[56】http://people.csail.mit.edu/bsnyder/naacl07/data/【57】http://www.cs.pitt.edu/mpqa/mpqa_corpus.html【58】http://www.cs.uic.edu/~liub/FBS/data-1.tar.gz[59】http://www.cs.uic.edu/~liub/FBS/CustoxnerReviewData.zip[60】http://www.cs.uic.edu/--liub/FBS/Reviews-9-products.tar[61】http://www.cs.comell.edu/people/pabo/movie—review—data/[62]http://www.cs.pitt.edu/mpqa[63】http://sentiwordnet.isti.cnr.it/[64】赵妍妍,秦兵,刘挺.文本情感分析[J】.软件学报,2010,21(8):1834—1848.[65]许洪波,孙乐,姚天叻.第三届中文倾向性分析总结报告[R】.第三届中文倾向性分析评i煲tJ(COAE20111.2011,1.24.[66】GamgamSomprasertsri,PattarachaiLalitrojwong.MiningFeature—OpinioninOnlineCustomerReviewsforOpinionSummarization[J】.JournalofUniversalComputerScience,2010,16(6):938.955.50 参考文献[67]BLiu,MHu,JCheng.OpinionObserver:AnalyzingandComparingOpinionsontheWeb[C]HProcofthe14thinternationalconferenceonWorldWideWeb.NewYork:ACMPress,2005:342.351.【68]赵妍妍,秦兵,车万翔.基于句法路径的情感评价单元识另l[J1.软件学报,2011,22(5):887.898.【69】Bolanleaojokoh,Olumidekayode.Afeature·opinionextractionapproachtoopinionmining[J].journalofwebengineering,2012,11(1):051—063.【70】Aria-MariaPopescuandOrenEtzioni.extractingproductfeaturesandopinionsfromreviews[C]//proceedingsofhumanlanguagetechnologyconferenceandconferenceonempiricalmethodsinnaturallanguageprocessing(HLT/EMNLP),2005,339.334.【71】AlexandraBalahur,Andr6sMontoyo.SemanticApproachestoFineandCoarse-GrainedFeature—BasedOpinionMining[J].NaturalLanguageProcessingandInformationSystems,2010,57(23):142—153.【72】黄亿华,濮小佳,袁春风.基于句法树结构的情感评价单元抽取算法阴.计算机应用研究,2011,28(9):3229.3234.【73】章剑锋,张奇,吴立德.中文观点挖掘中的主观性关系抽取阴.中文信息学报,2008,22(2):0055—0059.[74】方明,刘培玉.基于最大熵模型的评价搭配识别川.计算机应用研究,2011,28(10):3714—3716.[75】王素格,吴苏红.基于依存关系的旅游景点评论的特征.观点对抽取[J】.中文信息学报,2012,26(3):116—121.[76】顾正甲,姚天防.评价对象及其倾向性的抽取和)glJ另lJ[j].中文信息学报,2012,26(4):91—97.[77】张莉,钱玲飞,许鑫.基于核心句及句法关系的评价对象抽取[J].中文信息学报,201l,25(3):23.29.[78]朱嫣M,l?】锦,周雅倩,黄置菁,吴立德.基于HowNet的词汇语义倾向计算【J】.中文信息学报,20(1),2006,PP.14—20.[79】T.YaoandD.Lou.ResearchonsemanticorientationdistinctionforChinese5l 慕十评论文本的情感分析研究sentimentwordsLCJ.InProceedingsofthe7thInternationalConferenceonChineseComputing,2007.【80]王克,张春良,朱慕华等.基于情感词词典的中文文本主客观分析[R】.第一届中文倾向性分析评测研讨会,2008,PP.56—62.【81】张猛,彭一凡,樊扬等.中文倾向性分析的研究.第一届中文倾向性分析评测研讨会,2008,PP.38-45【82】刘康,赵军.NLPR-OR:一种新的观点检索系统.第一届中文倾向性分析评测研讨会,2008,PP.115—124.[83】V.HatzivassiloglouandR.McKeown.Predictingthesemanticorientationofadjectives.InProceedingsofthe35thAnnualMeetingoftheAssociationforComputationalLinguisticsandEighthConferenceoftheEuropeanChapteroftheAssociationforComputationalLinguistics,1997,PP.174—181.[84】P.D.Tumey.Thumbsuporthumbsdown?;Semanticodentationappliedtounsupervisedclassificationofreviews.InProceedingsofthe40thAnnualMeetingonAssociationforComputationalLinguistics,2002,PP.417-424.【85】T.Wilson,J.WiebeandP.Hoffmann.Recognizingcontextualpolarity:anexplorationoffeaturesforphrase—levelsentimentanalysis.ComputationalLinguistics,v01.35,2009,PP.399—433[86】A.HassanandD.Radev.Identifyingtextpolarityusingrandomwalks.InProceedingsofthe48thAnnualMeetingoftheAssociationforComputationalLinguistics.2010,PP.395-403.【87】B.Pang,L.Lee,andS.Vaithyanathan.Thumbsup:sentimentclassificationusingmachinelearningtechniques.InProceedingsofConferenceonEmpiricalMethodsinNaturalLanguageProcessing(EMNLP’02),2002.【88】J.P.Callan.Passage—levelevidenceindocumentretrieval.InProceedingsofthe17thACMSIGIR,1994,PP.302—310.52 图表索0附录A图索引图1.1基于属性的观点挖掘流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3图4.1情感词识别的召回率⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..37图4.2P@1000结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.38图4.3算法的健壮性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯38附录B表索引表3.1核心句抽取规则表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.20表3.2分句规则及评价搭配句识别规则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.22表3.3潜在评价搭配抽取规则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.22表3.4依存关系模板⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.23表3.5BASELINE实验结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.25表3.6对比实验结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.26表4.1文本特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.3l表4.2用于抽取情感词的6组特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..36表4.3基于句子的篇章情感倾向性判断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯40表4.4混合粒度模型结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。40 致谢在论文完成之时,首先感谢我的导师赵鹏博士,研究生期间,赵鹏老师以她渊博的专业知识、敏锐的洞察力和丌阔的视野帮助我选定了研究方向,以她严谨务实的科研精神督促我的论文各期间的工作,又以她细致认真的态度帮助我修改论文。所以我感谢我的导师,她耐心的教导和无私的帮助,使得我研究生的三年生活充实快乐;她在学术上务实严谨的作风,使我深受感染,而且收益颇丰;她平易近人、循循善诱,使我更感到亲切和温暖。感谢计算机智能软件与知识工程组的李龙澍教授和李学俊副教授等老师,他们渊博的专业知识和高尚的敬业精神,对我的实践能力和理论把握方面的掌握能力有很大的帮助。我的进步离不开这些老师的不倦教诲,是他们给了我克服苦难不断向前的动力,才使我掌握了扎实的专业知识。由衷的对安徽大学计算机学院和计算机软件与理论专业2010届所有的研究生表示感谢,是他们的不懈努力和无私的帮助,为我创造了一个良好的科研环境和学习氛围。感谢我的师兄卓景文、赵志伟,我的同学王文彬、王芳、刘艳、张青、张生、朱超、赵礼良、章玉龙、华骁飞、赵发君、韩丽丽、汪旗、王孝贵、岳可诚、刘涛、朱伟伟,他们是我学习和生活上的朋友,他们乐于助人,勤奋好学,使得我几年的研究生生活丰富多彩而又受益匪浅。我很自豪也很骄傲我能有这么多可贵而又可爱的同学们。感谢我的家人和朋友,如果没有他们对我的无私帮助,这篇论文也没法被完成。尤其是要对辛勤培育和教育了我的父母表示特别的感激,是你们给了我生命,给了我现在所拥有的一切。 基于评论文本的情感分析研究作者:陶新竹学位授予单位:安徽大学引用本文格式:陶新竹基于评论文本的情感分析研究[学位论文]硕士2013

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭