基于主题的网络舆情分析模型及其实现

基于主题的网络舆情分析模型及其实现

ID:37376445

大小:547.33 KB

页数:7页

时间:2019-05-22

基于主题的网络舆情分析模型及其实现_第1页
基于主题的网络舆情分析模型及其实现_第2页
基于主题的网络舆情分析模型及其实现_第3页
基于主题的网络舆情分析模型及其实现_第4页
基于主题的网络舆情分析模型及其实现_第5页
资源描述:

《基于主题的网络舆情分析模型及其实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、总第163期2008年第4期情报分析与研究基于主题的网络舆情分析模型及其实现钱爱兵(南京大学信息管理系南京210093)=摘要>网络舆情分析是信息处理领域内的一个新兴且有实用价值的方向。分析网络舆情分析的基本问题,提出难点以及相关的解决方案,并在此基础上设计基于主题的网络舆情分析模型。=关键词>主题信息采集网络舆情舆情分析=分类号>TP391G202AModelforAnalyzingPublicOpinionUndertheWebandItsImplementationQianAibing(DepartmentofInformationManagement,N

2、anjingUniversity,Nanjing210093,China)=Abstract>Inviewoftheshortcomingsoftraditionalmethodsforanalyzingpublicopinions,thispaperproposesanew-ideaofpublicopinionanalysisundertheWeb,andthendesignsamodelforit.Expermientsshowthattheproposedmodelisaneffectivesolutiontoanalyzingpublicopinion

3、undertheWeb.=Keywords>FocusedcrawlingPublicopinionundertheWebPublicopinionanalysis1引言舆情也即舆论,西方用/PubicOpinion0表示,是指公众关于现实社会以及社会中的各种现象、问题所表达的信念、态度、意见和情绪表现的总和,具有相对的一致性、强烈程度和持续性,对社会发展及有关事态的进程产生[1]影响,其中混杂着理智和非理智的成分。在网络环境下,舆情的表现形式就是网络舆情,它具有表达快捷、信息多元、方式互动的特点,具备传统媒体无法比拟的优势,仅仅依靠传统的手工方法难以胜任舆情信

4、息的采集、分析和处理工作,从而舆情信息的正确性及传播范围都无法得到有效控制,舆情形成迅速,热点、焦点层出不穷,对社会影响巨大。如何加强网络舆情信息的管理已成为网络舆情监督部门和决策者迫切需要解决的问题。[2,3]当前,一些学者和研究机构已经取得一定进展,但同时也存在一些不足:一方面分析深度不够,仅停留在[4]相关数据的统计层面,没有剖析数据背后的深层含义;另一方面虽然提出一些分析模式和判据,但缺乏利用计算机自动化处理的可操作性,难以在实际工作中加以应用。因此,笔者结合法院系统的实际业务需求,设计并实现基于主题的网络舆情分析模型,并以江苏省法院系统作为案例阐述该模

5、型的实现原理。2模型设计基于主题的网络舆情分析模型主要由舆情主题规划、舆情信息采集、舆情信息分析、舆情预警处理4个部分收稿日期:2007-09-26收修改稿日期:2007-11-20XIANDAITUSHUQINGBAOJISHU49情报分析与研究组成,这4部分构成一个完整的网络舆情分析的生命3关键技术周期。笔者设计该模型遵循的基本原则是:充分利用3.1舆情主题规划计算机进行网络舆情分析工作,最大程度减少人工干舆情主题规划是指决策者或舆情监督部门根据自预。此外,期望该模型能够达到以下目标:实现网络舆己的舆情需求选择合适的舆情主题及其对应的种子情的自动采集、分析和

6、处理,及时应对网络舆情,由被URL集合,确定舆情信息采集任务。主要包括以下两动防堵转化为主动梳理、引导。模型的总体处理流程个部分:如下:(1)舆情主题选择(1)基于5中文新闻信息分类标准及代码6的一舆情主题选择的方法与文献[5]相同,均将5中文级、二级类目构建网络舆情主题列表及其对应的初始新闻信息分类标准及代码6的一级、二级类目作为系统种子URL集合,决策者或舆情监督部门根据自己的舆默认的舆情主题分类,每个主题下配备一个主题文本、情需求选择相应的主题;主题导向词表,在此不再赘述。(2)网络舆情采集模块按照设定的舆情主题和种(2)种子URL集合选择子URL集合自动

7、采集相关舆情信息,经过过滤处理,初始种子URL集合的选择对高质量完成舆情信剔除主题无关的舆情信息,将主题相关的舆情信息保息采集任务起着至关重要的作用。笔者根据美国康奈存到舆情信息库中;[6]尔大学教授JonM.Kleinberg的研究成果)))Web(3)舆情分析模块对采集到的舆情信息进行关注网页分布存在着Hub/Authority特性,进行初始种子度、热点、焦点、拐点和重点等分析,生成舆情分析报告;URL的筛选工作,具体做法参见文献[5]。(4)舆情预警模块根据舆情分析报告作出相应的3.2舆情信息采集处理,并将分析报告反馈给决策者或舆情监督部门,为舆情信息采集

8、是指根据舆情主题规划的任

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。