基于互联网文本的网络流行词提取与情感倾向分析

基于互联网文本的网络流行词提取与情感倾向分析

ID:37039097

大小:3.74 MB

页数:54页

时间:2019-05-17

基于互联网文本的网络流行词提取与情感倾向分析_第1页
基于互联网文本的网络流行词提取与情感倾向分析_第2页
基于互联网文本的网络流行词提取与情感倾向分析_第3页
基于互联网文本的网络流行词提取与情感倾向分析_第4页
基于互联网文本的网络流行词提取与情感倾向分析_第5页
资源描述:

《基于互联网文本的网络流行词提取与情感倾向分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级UDC编号中钟换义考幸硕±学位论文基子互联巧文木巧巧洛施巧询装取与化施傾向分折学位申请人姓名;申请学位学生类别;全曰網硕壬申请学位学科专业:计乂如lA巧捷朱指导教师姓名;珠皮W乂换硕击学位论文MA'STERSTHESIS硕±学位论文基于互联网文本的网络流巧词提取与巧感傾向分析论文作者:纖指^dlf:李波副觀受学科专业:计算机应用技术研究方向:自然语言处理华中脈妖判■脚洋院2016年5月硕壬学

2、位论文'?MASTERSTHESISNetworkBuzzwordExtractionandSen村mentAnalysisbasedonInt:ernetTextAThesisSubmitted化PartialFul仙mentof化eRequirementFor化eM.S.DegreeinComputerScienceByBinZhaoPostraduateProramggSchoolofComputerSuerv

3、isor:BoLipAcademicTitle:AssociateProfessorSignatureApprovedMay,2016’/Mi\硕去学位谁文|MMMA'STERSTHESISjgg华中巧洽大学学住冷文々铺牲方巧和徒巧按权化巧居刮性译巧,是本人在导师指导下,本人郑重声明:所呈交的学位论文独立进斤研巧工作所取得的研巧成果。除文中己经标明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的研究成果,。对本文的研究做出贡献的个人和集体均

4、己在文中W明确方式标明。本声明的法律结果由本人承担。>8化年谷作者签名:起减日期;月三日学侄冷文化权使用授权书学位论文作者完全了解华中师范大学有关保留、使用学位论文的规定,即:研.巧生在校攻读学位期间论文工作的知识产权单位属华中师范大学。学校有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅和借阅;学校可W公布学位论文的全部或部分内容,可允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解密后遵守此规定):本,在年解密后适用本

5、授权书。保密论文注释学位论文属于保密。非保密论文注释:本学位论文不属于保密范围,适用本授权书作者签名导师签名:曰期:少*6年月之曰日期:如,4年各月2^曰占""本人己经认真阅读CALIS高校学位论文全文数据库发布章程,同意将本人的学""""位论文提交CALIS高校学位论文全文数据库中全文发并可按章程中的规定享^一年受相关权益。同意论文提巧后滞后=□半年;□年发布。;作者签名:起減签名:i导师曰期年占月三曰曰期:(年占月义目射学隹论文ma’stersTOES巧

6、摘要互联网的快速发展,给人们的生活带来了翻天覆地的变化。互联网行为融入到了我们生活的方方面面,其中W网络语言为标志的网络文化是互联网的显著特一、征之。网络流行词的大规模使用,使得研究网络流行词对于舆情分析热点事件追踪和语言演化规律等应用任务有着重大意义。例如,目前网民对商品、影视、作品新闻等发表的评论往往含有大量网络流斤语,对这些流行语进行自动识别^^及语义分析是深入理解用户评论内容的基础。目前,对网络流斤词的研充主要是从社会科学的角度在展开,如对流行词构词方式、社会根源等

7、的剖析。这些研究通常基于人工收集的方式获取流行词集合,并对典型词的特点进行语言学、社会学等层面的定性研巧,缺乏对网络流行词的定量建模与分析,也缺乏利用计算机对这些流行词进行自动处理的技术支撑。鉴于此,,本文将W互联网文本大数据为基础利用自然语言处理技术对网络流行词_'进行自动抽取与分析。本文的研究工作主要包含下面两块内容:一一是网络流行词的自动识别。对于流行词的自动识别,本文首先设计了种无词典的候选词集构建方案,然后基于流行词在不同年度在使用特征上有明显差一N-异这特点实现自动

8、识别Gram,综合利用互。候选词集的构建t^切分为基础信息、左右邻接贿等计算成词概率构建流行词候选集流行词的识别则是综合考:量词语在两个相邻年度上的使用情况并构建动态使用特征。具体来说,本文中使用了动态特征和SVM算法两种方式对各动态使用特征进行融合处理,实验结果一表明:两种方式产生的网络流行语列表与人工愤同标记的词语列表具有高度的致性,并且基于SVM算法的性能优于简单动态特征的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。