基于文本挖掘的网络舆情分析应用研究

基于文本挖掘的网络舆情分析应用研究

ID:35065815

大小:5.26 MB

页数:59页

时间:2019-03-17

基于文本挖掘的网络舆情分析应用研究_第1页
基于文本挖掘的网络舆情分析应用研究_第2页
基于文本挖掘的网络舆情分析应用研究_第3页
基于文本挖掘的网络舆情分析应用研究_第4页
基于文本挖掘的网络舆情分析应用研究_第5页
资源描述:

《基于文本挖掘的网络舆情分析应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级码10151UDC:单位代雜乂是涂事乂掌在职人员攻读硕±学位研究生学位论文基于文本挖掘的网络舆情分析应用研究黄情指导教师鲁明羽教授企业导师史颂华高级工程师申请学位类别工程硕db工程领域计算机技术学位授予单位大连海事大学2016年11月分类号密级UDC单位代码10151大连海事大学工程硕±学位论文基于文本挖掘的网络舆情分析应用研究(学位论文形式;应用研究)黄情指导教师鲁明巧职称教授企业导师

2、史颂华称职学位授予单位大连海事大学申请学位类别工程硕±学科(专业)计算机技术2016.11.19论文完成日期2016.11答辩日期答辩委员会主席fitThestudyandAlica村onofPublicSen村me田tAnalsisppyBasedonTextMiningTechnology乂化esisSubmitted化Da化nMaritimeUniv化sityInartialfulfillmentofthereuiremenlsfor

3、thedereeofpqgMasterofEnineeringgbyHuaningQgComuterTechnolo(pgy)ThesisSuervisor:Profe化orLUMINGYUpNovember2016学位论文原创性声明巧使用授权说明原创性声明:本人郑重声明本论文是在导师的指导下,独立进行研究工作所取得的成果,""撰写成博/硕±学位论文某于义本挖撫的网络巧情分析应用研究。除论文中己经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中W

4、明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体己经公开发表或未公开发表的成果。本声明的法律责任由本人承担。学位论文作者签名;学位论文版权使用授权书本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研宛生学位论文的规定,即;大连海事大学有权保留并向国家有关部口或机构送交学位论文的复印件和电子版,允许论文被查阅和借闽。本人授权大连海事大学可W将本学位论文的全部或部分巧容编入有关数据库进行检索,也可采用影印、缩印或扫巧等复制手段保存和汇编学位论文。同意将本学位论文收录到《中国优秀博硕±

5、、学位论文全文数据库》(中国学术期刊(光盘版)电子杂志社).《中国学位论文全文数据库》(中国科学技术信息研巧所)等数据库中,并W电子出版物形式出版发行和提供信息服务。保密的论文在解密后遵守此规定。本学位论文属于:保密□在年解密后适用本授权书。""不保敏回(请在上方框内打V)论文作者签名导腥名:乂斗啼曰觀。|/>知月^)曰!|中文摘要摘要不同于传统的数据挖掘,文本挖掘要从海量的非结构或半结构化的文本数据中发现潜在的、可理解的知识模式,研究技术包括自然语言处理、机器学习、计,目前文本

6、挖掘己经被广泛应用在各个领域算机语言学等多个学科。网络舆情是由海量的互联网数据构成的,互联网数据是典型的半结构化数据,运用文本挖掘技术来处理分析互联网数据,对跟踪监测网络舆论导向具有重大的现实意义。论文的研巧目标就是深入学习文本挖掘技术,并理论结合实践,将该技术应用在网络舆情的分析应用领域。本文首先对文本挖掘技术从及网络舆情分析的国内外研究和应用现状做了综述性介绍,对用于实现网络舆情分析的中文分词、文本预处理、文本自动分类聚-means和s-。随后inleass类和语义相似度计算等算法进行深入学习研究,引

7、入kgp算法实现网络舆情热点话题发现与识别,并从考虑舆情时效性等三个方面对s-inglepass算法做改进实验。对负面突发事件引起的舆情危机进行预警监控,实质上是对互联网文本数据实现自动分类,在研究KNN、SVM和朴素贝叶斯算法等经典文本分类算法基础上,选取KNN算法实现敏感网络舆情的分类功能,并提出修正权重因子概念,解决实际应用中各类别样本数量分布不均衡导致的错分问题。在对网络舆惰做情感倾向性分析时会更多地收到汉语语义复杂性的影响,故利用文本的语义相似度计算方法实现情感倾向的分类功能,利用《知网》世界知识语

8、义词典计算词语的语义相似度,通过构造文本相似度矩阵和最大值序列层层推进计算句子、段落和文本的语义相似度。综上所述,本文利用文本挖掘技术实现了网络舆情热点话题发现与识别、敏感舆情预警监控和舆情情感

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。