中文微博评价对象提取方法研究

中文微博评价对象提取方法研究

ID:35039295

大小:3.63 MB

页数:52页

时间:2019-03-16

中文微博评价对象提取方法研究_第1页
中文微博评价对象提取方法研究_第2页
中文微博评价对象提取方法研究_第3页
中文微博评价对象提取方法研究_第4页
中文微博评价对象提取方法研究_第5页
资源描述:

《中文微博评价对象提取方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP391密级中文微博评价对象提取方法研究研究生姓名:刘璟指导教师姓名、职称:朱艳辉教授学科专业:计算机应用技术研究方向:信息检索、文本分类湖南工业大学二〇一六年六月五日III摘要微博作为社交网络中最火热的平台,每天产生的微博文本不计其数,并且涵盖了新闻、娱乐、美食、商品、军事等多个领域。因微博文本数据内容丰富,最能反应当下人们讨论的热点问题,所以对微博文本数据的研究是当前的一大热点。为了在大量的微博文本数据中,找到人们谈论的对象,微博评价对象的提取这一课题因运而生。分词是微博评价对象提取的预处理步骤,分词的效果直接影响评价对象提取的准确率。本文围绕评价对象提取准确

2、率的提高,做了如下研究工作:(1)提出一种领域自适应的中文分词方法。针对中文分词领域自适应性差,对未登录词的识别和歧义词的处理显得力不从心的问题,本文提出一种基于条件随机场的领域自适应中文分词方法,提出了基本特征模板和字特征模板的条件随机场分词方法,并提出一种基于Trie树的逆向最大匹配算法来校正条件随机场分词,针对条件随机场分词的缺陷,提出了固定词串消解、动词消解和词频消解三种方法消除歧义。(2)提出一种多特征融合的条件随机场评价对象提取方法。为了更好的提取微博评价对象,找到条件随机场的最优特征模板,本文对大量的语料进行了实验统计,分析了语义角色特征、词频特征和形容词位

3、置特征与评价对象之间的关系,制定了基于条件随机场的基本词性特征模板、语义角色特征模板、词频特征模板和形容词位置特征模板提取评价对象。这种多特征融合的方法,有效提高了评价对象提取的准确率。关键字:评价对象提取,中文分词,领域自适应,条件随机场IAbstractAsthemostfierysocialnetworkplatform,themicro-blogtextgeneratedeverydaycountless,Itcoversthenews,entertainment,food,goods,militaryandotherfields.Becausemicro-blo

4、gtextcontent-richandthemostabletorespondtothecurrentsituationandthetrendofpeople'slife,sothestudyofmicro-blog'stextdataisoneofthehotspotsatpresen.Inordertofindtheobjectthatpeopletalkaboutinlargeamountsofmicro-blogtextdata,thushasproducedthistopicofresearchonopiniontargetextractionforChine

5、semicroblog.WordsegmentationispreprocessingstepsoftheopiniontargetextractionforChinesemicroblog,Theeffectofwordsegmentationdirectlyaffecttheaccuracyofopiniontargetextraction.Thispaperaroundtheimprovementofopiniontargetextractionaccuracy,dothefollowingresearchwork:(1)PutforwardamethodofChi

6、nesewordsegmentationwiththegooddomainadaptive.AccordingtotheConditionalRandomFieldforChinesewordsegmentation,thefieldishardtoadaptive.andthuscan’tbetterabletosolvetheunknownwordproblemandmostoftheambiguityproblem.AcombinationofCRFanddomaindictionaryisproposedtoimprovethefieldadaptability.

7、PutforwardakindofreversemaximummatchingalgorithmbasedonTrietreetocalibratethewordssegmentationresultofConditionalRandomFieldsandforeliminateambiguity,weusedfixedwordcollocation,verbdictionaryandwordprobabilitybytheruleofwordfor-mation.(2)Putforwardopiniontargetextra

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。