基于神经网络的数据挖掘研究

基于神经网络的数据挖掘研究

ID:23161123

大小:60.50 KB

页数:8页

时间:2018-11-04

基于神经网络的数据挖掘研究_第1页
基于神经网络的数据挖掘研究_第2页
基于神经网络的数据挖掘研究_第3页
基于神经网络的数据挖掘研究_第4页
基于神经网络的数据挖掘研究_第5页
资源描述:

《基于神经网络的数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于神经网络的数据挖掘研究随着计算机、X络技术的发展,获得有关资料已经非常简单且容易实现。但是对于数量大、涉及面宽的数据,采用以往那种由简单汇总、按指定模式去分析的统计方法是无法完成这类数据的分析。因此,数据挖掘(DataMining)就由此诞生了。数据挖掘是一种智能化的、综合应用各种统计分析、数据库、智能语言来分析庞大数据资料的技术。神经X络是一组连接的输入/输出单元,其中每个连接都与一个权相相联。针对神经X络良好的学习能力,提出了基于神经X络的数据挖掘方法。本文正对基于神经X络的数据挖掘进行研究。关键词:数据;数据挖掘;神经X络1.数据挖掘1.1数据挖掘  

2、简单地说,数据挖掘是从大量数据中提取或“挖掘”知识。数据挖掘是一个处理过程,它利用一种或多种计算机学习技术,从数据库的数据中自动分析并提取知识。数据挖掘所获取的知识是以一个模型或数据概化的形式给出的。数据库中的知识发现(Knoerica)使用数据挖掘侦测哪个客户正在使用美国银行的哪种产品,以便他们能够提供正确的产品和服务组合,更好地满足客户的需求。(4)科学应用  分析科学数据。对于γ射线爆是短暂的γ射线反射并且它于太阳系之外这种事件的记录已经有1000次之多。科学界普遍认为存在两种γ射线爆。Mukherjee等人使用统计聚类分析法发现了第3类γ射线爆。(5)游

3、戏  数据是X络游戏的最大资源,利用数据挖掘在不同数据类型中找出其中有价值的关联,汇总分析得出对游戏市场运营管理有参考价值的结论。数据挖掘为X络游戏运营公司提供了很大的方便。3.神经X络的基本结构  神经X络提出了一种数学模型,它试图去模仿人类的大脑。知识经常表示为互相连接的处理单元的层次集合。这些处理单元结点通常称作神经元(neurodes),来表明脑神经之间的关系。每个结点与邻近层次上的其它结点之间具有加权连接。各个结点从相连接的结点获取接受的输入,并结合一个简单函数,使用权值来计算输出值。  神经X络是由一个或多个神经元组成的信息处理系统。对于具有m个输入

4、节点和n个输出节点的神经X络,输入输出关系可以看作是m维欧氏空间到n维欧氏空间的映射模型。X络实际输出与期望输出之间的误差是衡量X络性能的指标。神经元是神经X络的基本处理单元,一般表现为一个多输入、单输出的非线性运算器件,X络结构可以从单个神经元结构展现出来,主要有三个基本要素:(1)一组连接(对应于生物神经元的突触),连接强度由各连接上的权值表示,权值为正表示激活,为负表示抑制。(2)一个求和单元,用于求取各输人信号的加权和(线性组合)。(3)一个激活函数,起到非线性映射作用并将神经元输出幅度限制在一定范围内。  基于神经X络数据挖掘的优点:(1)神经X络在数

5、据集中包含大量噪声输入数据时,也能工作得很好。神经X络评估函数,如S形函数能自然地平滑外部和随机误差所造成的输入数据变异。(2)神经X络不仅能处理和预测数字,还可以处理和预测分类结果。然而,分类数据的变换是个棘手的问题。(3)神经X络可用于在数据中要求包含时间单元的情况。神经X络在多个领域中一直运行得很好。(4)神经X络既可以用于由指导的学习,也可以用于无指导的聚类。  基于神经X络数据挖掘的缺点:(1)神经X络最大的缺陷可能是在解释自身行为的能力上的欠缺。(2)神经X络学习算法不能保证收敛到最理想的结果。对于大多数类型的神经X络,这个问题可以通过操作多种学习参

6、数得以解决。(3)神经X络很容易过度训练,从而导致在训练数据上工作得很好,而在检验数据上表现欠佳,这个问题可以通过不断地度量检验集性能能来监控。4.基于神经X络数据挖掘过程  基于神经X络的数据挖掘过程一般分为三个阶段:数据准备、规则提取以及规则评估。4.1数据准备  进行数据挖掘的首要条件就是要存在数据,当然仅仅拥有数据是不够的。数据准备是在实施数据挖掘之前的必要步骤。数据准备是指数据的定义、处理和表示,而这些数据是被挖掘后的数据,最后使它适应于特定的数据挖掘方法。数据准备又分为4个步骤,分别为:数据清洗、数据选择、数据预处理以及数据表示。  (1)数据清洗 

7、 由于数据库中的数据往往存在有噪声、不完整、不一致的数据,这样的数据如果进行数据挖掘,数据挖掘的搜索过程会被这些有问题的数据所误导,因此,要想提高数据集的质量,以便数据挖掘取得高质量的模式知识,数据清洗是必不可少的。数据清洗主要是填补不完整数据、纠正错误数据以及筛选重复数据。数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。目前,基于规则的数据清洗、可视化技术以及统计方法这三种方法作为数据清洗的主要方法。  (2)数据选择  数据选择是指将神经X络所用的数据清洗一起装入数据仓库中,选择本次数据挖掘所需的数据。数据选择实际上主要是指列或参

8、数维的选择以及行或记录的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。