可视化驱动的交互式数据挖掘方法研究

可视化驱动的交互式数据挖掘方法研究

ID:26436651

大小:53.00 KB

页数:6页

时间:2018-11-27

可视化驱动的交互式数据挖掘方法研究_第1页
可视化驱动的交互式数据挖掘方法研究_第2页
可视化驱动的交互式数据挖掘方法研究_第3页
可视化驱动的交互式数据挖掘方法研究_第4页
可视化驱动的交互式数据挖掘方法研究_第5页
资源描述:

《可视化驱动的交互式数据挖掘方法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、可视化驱动的交互式数据挖掘方法研究摘要:在当下的“大数据”时代,每一分每一秒都有无数数据正在不断产生,因此,如何挖掘数据蕴含的真正有价值的信息,成为人们关注的热点。数据挖掘这一学科的出现,正在逐步解决这一难题,而可视化驱动的交互式数据挖掘也不断带来新的发现。该文通过对可视化数据挖掘、交互式数据挖掘的简要概述入手,延伸到可视化与交互式数据挖掘的分类,并通过举例说明,介绍了各种的典型代表与实际应用。中国8/vie  关键词:可视化;交互式;数据挖掘;检索;技术  中图分类号:TP391文献标识码:A:1009-3044(2016)36-0004-02  互联网的迅猛发展使我们正逐步步入“大数据”时

2、代,当下,我们正面临着一个数据量空前庞大的世界。随着硬件设备的进步,我们的数据存储能力正不断提高。据英国伯克利大学统计,当下全球每年大概会产生1Exa字节的数据,超过一半的数据是电子数据形态,我们也可以由此估计,未来�啄瓴�生的数据甚至会超过原有的所有数据量。数据的产生无处不在,即使是我们日常生活中的不经意动作,如通话,上网等等,都会产生大量的数据。由于人们相信数据中蕴藏着大量有用信息,所以这些数据被人们保存下来,但是,人们却面临着一个艰难的问题:我们如何从海量数据中挖掘出真正有用的隐藏信息?如果我们不能从费力收集保存的数据中获得所需要的信息,那么这些数据将会失去自身价值,用于储存数据的数据库

3、将会成为“垃圾站”。  因此,面对众多的数据,如何进行挖掘和检索成为了一个棘手的问题。信息可视化技术的出现为我们解决此问题提供了很大帮助。计算机可视化技术借助计算机的储存功能和计算功能,加入人的观察力、创造性,使人能够在很大程度上参与数据检索,真正的实现人与计算机之间的交互。通过实践证明,可视化技术的应用在数据检索挖掘中潜力巨大,有着很大发展空间。  1什么是可视化数据挖掘  随着人们对数据挖掘的逐渐了解与深入,可视化数据挖掘的重要性日益凸显出来。简单来说,可视化数据挖掘是人们对数据进行直观的分析,并结合交互式算法进行计算研究。可视化数据挖掘需要充分利用可视化技术,并把数据挖掘的结果直观的表现

4、出来,得出可视化的结果。由于我们日常收集的数据自身带有很高的价值,当我们采用可视化的方式去处理数据时,视觉是观察数据的重要方式,这也帮助人们将视觉感官的作用不断发挥出来。可视化数据技术的基本作用就是将用户需要处理的大量信息通过计算机的计算分析功能转化为便于用户用感官去观察分析的数据。当计算机将数据整理成常见的科学模型时,用户就可以进一步的分析数据,找到数据中所蕴含的信息,从而找出问题的解决方法。  2什么是交互式数据挖掘  交互式数据挖掘作为一种数据挖掘的算法,在实际应用中有几种标准的分类。主要的方法是+V型方法与+M型方法。+V型方法更加侧重计算机的数据处理能力,用计算机来挖掘数据中的隐含信

5、息,将+V型方法与可视化相结合,可以更好地使用户提取信息。而+M型方法更加依赖与可视化技术,可视化技术是这种方式中最主要的数据处理方式。  3可视化与交互式数据挖掘技术的分类  3.1可视化数据类型  可视化的数据类型包括六类:一维数据、二维数据、多维数据、文本或超级文本、层次或图表以及算法或软件。  3.1.1一维数据  一维数据的典型特点是密集,时间序列数据就是一维数据的典型代表,时间序列数据中,每一个时点上都有与之相对应的一个或多个数据,例如一段时间内股票的价格等。  3.1.2二维数据  从名称上来看,二维数据即有两个不同维度的数据。地理数据就是二维数据的典型代表,地理数据中有经度和维

6、度两个不同的维度,并借助X-Y轴系图表示出来。  3.1.3多维数据  顾名思义,多维数据是有三个或三个以上的维度构成的数据,因此多维数据的可视化十分复杂。我们常用的数据库中的表格是多维数据的典型代表,一个表格中可能会有几十甚至上百列的属性,因此很难用二维方式去分析和研究,只能借助可视化技术进行处理。常用的技术包括平行坐标可视化技术,平行坐标的建立可以用折现将多维数据表示出来,使复杂的数据更加直观与可视化。  3.1.4文本和超级文本  由于数据种类的多样化,一部分数据是不能通过维度表示出来的。随着网络与计算机技术的进步,文本和超级文本成为了一种重要数据类型。对于此种数据类型,需要先将数据转化

7、成可以使用向量进行描述的数据,才能进一步使用多维技术与可视化技术。  3.1.5层次与图表  图表与数据记录有着密切的关系,图表的节点包含着被记录的对象,边界表示对象间的联系。典型代表包括电子邮箱之间的信息发送与接收,网页间的超级链接等等,针对这里一类数据有很多专门的可视化技术。  3.1.6算法与软件  算法与软件是一种大型的软件工程,这一类数据的处理也是一项很有难度的工程。在这种数据的处理上,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。