基于web信息抽取的网络舆情统计与分析

基于web信息抽取的网络舆情统计与分析

ID:35059065

大小:4.15 MB

页数:71页

时间:2019-03-17

基于web信息抽取的网络舆情统计与分析_第1页
基于web信息抽取的网络舆情统计与分析_第2页
基于web信息抽取的网络舆情统计与分析_第3页
基于web信息抽取的网络舆情统计与分析_第4页
基于web信息抽取的网络舆情统计与分析_第5页
资源描述:

《基于web信息抽取的网络舆情统计与分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、-'?---'可-.;、I'.;节.二?、^.式\;V,:相V4单;/T;V7游;粟身校代码.八齋;穀努.聲;:万《脊#lf巧夺ft’,:'/诚‘节V敏端若乃冷《二、丰舊少7人名放’擎学鑽蔡慶钟藏丈學节方:’;:..;.硕±学位论文t;翻携;;:;^譜i/f.''..巧-..當:W^:,苗縣‘.:’、-在心..;'扭;;j掠基于Web信息抽取的网络舆情统计与分析/,;4輯'V.:成取伯—祀爲-.''话.jjrj:%.'?片J1V,V.?’’?'■?■?、..一、'‘;,,.V\V:'、

2、V-??j房為心1’:学号;Y13690006.;,;:击/己;輪,a纖!;女f娘y.:呼.J:学科专业;统计学;鴻邊巧、如作令尽知:研究方向;读:统计学习与预編务六7讀5。■'.■娘‘:■令,r尹..户?子气,户打疋VV常:.扣导师及职称:結胜教授的:;.知躬;满戶;承.户'-'乂、;20166..去7/论文答辩日期年月枯:.备y'授予学位日期:編年6月:户禱.耗夢剩P禱'f一‘户'..:>.....?.V..\;.掌V记八#.皆捉;立.?'^,V%呼.托發?聲;;作V.庆硕位评师范巧学员会办公古-:.

3、斋裝;就皆识為品皆;t句、??热..;;;珠鸿與髮麟泉郝謗乾k腳賢補安庆师范大学硕士学位论文基于Web信息抽取的网络舆情统计与分析StatisticsandAnalysisofOnlinePublicOpinionbasedonInformationExtractionfromWebpage作者姓名:黎康学号:Y13690006学科专业:统计学研究方向:统计学习与预测导师及职称:程玉胜教授论文答辩日期:2016年6月授予学位日期:2016年6月安庆师范大学学位评定委员会办公室基于Web信息抽取的网络舆情统计与分析黎康安庆师范大学硕士学位论文2016年5月26日(论文提交日期

4、)本论文经答辩委员会全体委员审查,确认符合安庆师范大学硕±学位论文质量要求。答辩委员会签名(姓名、职称、工作单位):主席;作;雜敵扳尉如足■委员:咱句喪^申辨矜备I护%辦巧‘心会也啼么、喻^备导师‘^;作不1独创性声明本人声明所呈的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加标往和致谢的地方夕h,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安庆师范大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说助并表示谢意。学位

5、论文作者签名:恭毛签字日期:W名年《月^日学位论文版权使用授权书本学位论文作者完全了解安庆师范大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和电子文件,允许论文被查阔和借阅。本人授权安庆师范大学可W将学位论文的全部或部分内容编入有关数据库进行检索,收录到《中国学位论、、文全文数据库》,可从采用影印缩印或扫描等复制手段保存汇编学位论文,向社会公众提供信息服务。(保密的学位论文在解密后适用本授权书)。学位论文作者签名:恭若指导教师签名:乎签字日期:击年/月《日签字日期;>(备年<月f日/摘要自19

6、94年中国正式接入Internet起,中国网民规模呈逐年持续快速增长的趋势。据2015年12月统计数据显示,中国网民已达6.88亿,超过半数的中国人已经开始使用互联网。互联网代替传统信息以纸质文字材料传播的形式,成为群众思想、文化、信息获取和交流的主要方式,又因为其传播速度快,波及范围广,参与人员多的特点,它也成为社会舆论的主要聚集地。大到震惊世界的朝鲜核问题、轰动全国的天津大爆炸事件,小到某明星参加奥斯卡颁奖典礼摔倒、某高校推出玉米炒提子菜系等,网络舆情的传播越来越牵动全社会人们的心。如何从数量庞大的网络信息中获取舆情信息,从而第一时间掌握舆情现状,预测舆情走势,及时正确引导舆情走向

7、,对社会健康稳定的发展具有非常重要的意义。本文的研究思路就是在这个背景下产生的,具体的研究内容如下:(1)首先对在本文研究过程中使用到的理论知识进行介绍,如Web信息抽取方法、文本表示方法,数据降维方法、聚类方法等。(2)针对网络信息(以新浪微博为例),主要是通过网络爬虫技术,大量爬取所需信息。本文采用的是企业开发并已投入使用的新闻爬取系统,该系统可以针对不同网页结构进行合适的DOM解析模板配置,从而方便快捷的进行数据爬取。(3)针对短文本的特

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。