基于数据挖掘的网络舆情预警决策支持系统

基于数据挖掘的网络舆情预警决策支持系统

ID:28175655

大小:63.00 KB

页数:6页

时间:2018-12-08

基于数据挖掘的网络舆情预警决策支持系统_第1页
基于数据挖掘的网络舆情预警决策支持系统_第2页
基于数据挖掘的网络舆情预警决策支持系统_第3页
基于数据挖掘的网络舆情预警决策支持系统_第4页
基于数据挖掘的网络舆情预警决策支持系统_第5页
资源描述:

《基于数据挖掘的网络舆情预警决策支持系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于数据挖掘的网络舆情预警决策支持系统中图分类号:TU文献标识码:A文章编号:1008-925X(2011)09-0-02摘要:本文以基于数据挖掘的决策支持系统方法整合网络舆情信息,建立网络舆情信息仓库,对非结构化的模糊复杂的信息,运用数据挖掘中文本挖掘技术有效分析网络热点事件的舆情,及时发现重大突发事件,减少危机损失,提高政府管理和监控舆情危机的能力。关键词:网络舆情数据挖掘决策支持系统1、引言近几年,随着Web2.0的兴起与普及,互联网已成为一个开放的、个性化的社会环境形态,对社会稳定和国家安全的维护带来了严峻挑战。但是现在我们政府情报机构

2、网络安全管理和监控能力比较薄弱,难以适应复杂的环境。因此,建立基于数据挖掘的网络舆情预警决策支持系统,对非结构化的模糊复杂的信息,运用文本挖掘技术有效分析网络舆情事件,及时发现重大突发事件,减少危机损失,提高政府管理和监控能力势在必行。2、基于数据挖掘的决策支持系统决策支持系统(DSS>[1]是利用大量信息,数据结合众多模型,通过人机交互,辅助各级决策者实现科学决策的系统。它是融计算机技术、信息、技术、人工智能、管理科学、决策科学等学科和技术于一体的技术继承系统,包括数据仓库和数据挖掘分析系统,由以下三个主体[2]组成:(1)模型库系统和数据库

3、系统结合,作为该系统的基础,为决策问题进行模型计算和定量分析,提供辅助决策信息。(2)知识库系统和数据挖掘的结合,从数据库和数据仓库中挖掘知识放入专家系统的知识库中,通过知识推理定性分析,辅助决策。(3)数据仓库和OLAP,从数据仓库中提取综合数据和信息来反映了其内在本质。3、基于数据挖掘的网络舆情预警决策支持系统的定位从网络舆情预警决策支持系统的功能和实现方式对其定义:基于决策支持系统技术,将联机分析处理、数据挖掘模型(文本挖掘模型)、数据仓库、知识库、方法库等相结合,应用于情报机构的网络舆情预警中的人机结合系统。3.1数据仓库数据仓库[3]

4、的设计要满足决策支持系统的要求,即数据要具备概括性、抽象性、统一性三个特点。所以图1中数据仓库和部门数据库加上一个虚拟层,实现数据挖掘的数据清洗,为数据仓库提取有用数据。3.2数据挖掘方法数据挖掘[4],简单点说,就是从大量数据中寻找规律的技术,通过处理海量的、不完全的、随机的、结构复杂的数据选择有用数据,建立知识模型。网络舆情预警决策支持系统运用数据挖掘中文本挖掘技术,包括自动分类技术、自动关联技术、观点挖掘技术、自动分词技术、结构化抽取技术以及自动摘要、关键词技术等。图1决策支持结构系统4、基于数据挖掘的网络舆情预警决策支持系统的构建基于数

5、据挖掘的决策支持系统采集网络中的新闻网页、论坛、博客、新闻评论,贴吧等网络资源,发现突发性热点事件,进行热点跟踪定位和实时舆情预警,帮助政府及时掌握舆情动向,准确捕捉预警信息,对有较大影响的重要事件快速发现、快速处理,为政府决策提供信息依据[5]。4.1数据准备网络舆情预警需要多样化的信息,在整理信息的时候,需要做到全面、准确、及时。本系统涉及的信息有:文本信息:新闻、博客、产品评论、论坛帖子等文本信息,包括主题、关键词、时间、URL等。词汇信息:包括现在词典中的字或词和现在网络用语的语义、适用的语境和是否带有情感等。图像信息:主要是新闻、博客

6、、产品评论、论坛帖子等上发布的图片,包括主题、内容、时间、URL、浏览数量等。视频音频信息:主要是新闻、博客、产品评论、论坛帖子等上发布的视频音频,包括主题、内容、时间、、URL、浏览数量等。这些来自互联网的大量信息,通过收集、整理、存储、预处理在数据库中作为原始数据,这些数据是离散的、模糊的。4.2系统功能模块根据网络舆情预警的规划,如舆情分类、情感分类与趋势预测、舆情检索以及统计分析等,本系统建立了舆情信息采集管理系统、舆情分类管理系统[6]、舆情来源管理系统、舆情情感分类管理系统和用户管理系统。①舆情分类管理系统:舆情分类即对海量信息的自

7、动(文本语义分析)分类。通过关键字样本、文件样本、自定义等把原始信息分类,形成分类别(危害国家安全、危害社会治安、扰乱社会秩序等)的分类库,分类管理可以对分类的类别数据进行增加、删除、修改等操作。②舆情信息采集管理系统:舆情信息采集管理系统对文本信息、图像信息、视频音频信息的来源,如新闻、博客、产品评论、论坛帖子、网站及其网站的权威性进行分析统计。③舆情来源管理系统:舆情来源管理部门对文本信息、图像信息、视频音频信息的来源,如新闻、博客、产品评论、论坛帖子、网站及其网站的权威性进行分析统计。④舆情情感分类管理系统:舆情分类管理部门从根据新闻、博

8、客、产品评论、论坛帖子等收集的文本信息、图像信息、视频音频信息,经过预处理之后,通过观点挖掘方法对舆情信息的情感倾向进行分析,及时发现消极情感的信息,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。