欢迎来到天天文库
浏览记录
ID:55661100
大小:735.00 KB
页数:7页
时间:2020-05-23
《将词作为文的基本单位,先分析词的情感倾向,平均出语.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、将词作为文本的基本单位,先分析词的情感倾向,平均出语句的情感倾向,最后平均出文本的情感倾向。1,基于语料的情感词发现(两种方法):(1),连词假设(只适用于形容词)(2),基于PMI的系列方法(通用)计算PMI两种方法:(1),PMI-IR(需要提供一对种子词(positive-negative))用以判断目标词的情感倾向算法改进:(2),PMI-LSA(同义词识别)2,情感分析(两种方法):(1),将情感分类实现为三类(正面/中性/负面);(2),对于给定的文本先进行主观分类,再进行情感分类3,主观性分类:从语料中学
2、习得到形容词的语义方向,然后将之运用于句子的主观性识别。从训练语料中发现主观性搭配,并将之用于文本级意见分类4,句子,文本级的情感分类:(1),手工构造区分词字典,运用模糊逻辑来对文档进行情感分类。对于给定的一篇文档,他们首先识别出其中的倾向性词汇,随后将文档中所有有情感的极性累加(正面词汇为1,负面为-1,中立为0)得到整个文档的记性,然后据次文档进行情感分类(乐观/悲观/中立)。(2),基于PMI-IR的无监督情感分析。(Useful)词库搭建:(1)首先设定一组具有强烈褒贬意思的词语作为种子词,然后分别对两个词语
3、求同义和反义词,并添加到对应的类别中,反复上述过程,得到一个基本全面的情感倾向词库基于同义词词林的情感词发现方法SO-TC取词范围:形容词,名词,副词,少数动词Bayesw贝叶斯分类器原理Google之隐马尔可夫模型(HMM)Google之
此文档下载收益归作者所有