数据分组处理方法(group method of data handling,gmdh

数据分组处理方法(group method of data handling,gmdh

ID:35311174

大小:76.00 KB

页数:3页

时间:2019-03-23

数据分组处理方法(group method of data handling,gmdh_第1页
数据分组处理方法(group method of data handling,gmdh_第2页
数据分组处理方法(group method of data handling,gmdh_第3页
资源描述:

《数据分组处理方法(group method of data handling,gmdh》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据分组处理方法(GroupMethodofDataHandling,GMDH),它实现数据挖掘过程的自组织控制,是一个简单高效的推导最优模型的原始输入变量表达式的算法,并以客观的方式建立一个最优复杂度模型。Ivakhnenko于1967年提出GMDH方法,也称多项式网络,它是前馈神经网络中常用的一种用于预测的神经网络。GMDH方法的基本思想是以生物有机体演化的方法构造数学模型。由系统各输入单元交叉组合产生一系列的活动神经元,其中每一神经元都具有选择最优传递函数的功能,再从已产生的一代神经元选择若干与目标变量最为接近的神经元,被选出的神经元强强结合再次产生新的神经元,重复

2、这样一个优势遗传,竞争生存和进化的过程,直至新产生的一代神经元都不比上一代更加优秀,于是最优模型被选出。它的特点是网络结构不固定,而是在训练的过程中不断地改变。作为一个归纳方法,它有效的解决了诸如通常神经网络运行时间长学习速度慢,小数据样本中噪声比较大时的多重共线性等问题。1.1GMDH网络理论GMDH网络的结构在训练过程中是变化的,如图1所示的是训练后的一个个比较典型的GMDH网络。y图1.GMDH网络结构该网络有4个输入和1个输出。GMDH网络的输入层将输入信号向前传递到中间层,中间层的每个神经元和前一层的2个神经元对应,因此,输出层的前一层(中间层)肯定只有2个神经

3、元。Adline图2.GMDH网络中的神经元(输入层神经元除外)一般采用自适应线性元件作为GMDH网络的神经元,如图2所示,该神经元的输入输出关系为:其中,表示第k层的第l个处理单元,且,(i=1,2,3,4,5)为神经元的权值。由上式可见,GMDH网络中的处理单元的输出是2个输入量的二次多项式,因此网络的每一层将使得多项式的次数增大2阶,其结果是网络的输出可以表示成输入的高阶(2k)多项式,其中k是网络的层数(不含输入层)。1.2GMDH网络的训练GMDH方法只利用输入和输出变量的观测数据,不需要事先设置任何参数和模型的具体形式,而是根据研究对象的具体情况,通过计算由某

4、些判据自动地寻找出数据间的函数关系。训练一个GMDH网络,包括从输入层开始构造网络,调整每一个神经元的权值和增加网络输入层数直到满足映射精度为止。第一层神经元数取决于输入信号的数量,每一个输入信号需要一个神经元。由于本文是对单变量时间序列进行预测,所以输入层只有一个神经元。假定在时刻k神经元的权向量为:输入向量为:由Widrow-Hoff学习规则可知其中,为神经元在k时刻的目标输出向量,为学习速率,取值在之间。按照上式可以调整神经元权值,降低神经元实际输出和目标输出之间的误差。1.3基于GMDH网络的预测用GMDH网络进行预测前,不需要了解时间序列的一些特征,仅仅根据已知

5、样本,通过网络自组织的形式建立网络模型。GMDH网络的构建过程主要是一个不断产生活动神经元,由外部准则对神经元进行筛选,筛选得到的神经元再结合产生下一层神经元,直至具有最佳复杂性的模型被选出的这样一个过程。GMDH模型的建立需要以下几个步骤:(1)数据预处理。包括数据规范化和除去数据中的静止直流成分。(2)决定网络输入信号。对于预测需要用到n个过去输出值。(3)将实验数据分为训练样本和测试样本。(4)建立输入神经元层。神经元数与输入信号数i有关。对于每个输入信号,都有一个神经元与之对应,因此相应的神经元数为。(5)将神经元权值的初始值设为0.(6)将训练数据组作用于输入层

6、的每一个神经元。在k时刻取(k=1,2,…)作为输入信号,为期望输出,计算每一神经元的输出误差,并修正其权值和均方误差和,当均方误差和大于上一循环计算值时,训练停止。(7)输入选择数据,计算每一神经元的输出均方差。根据差值确定一个阈值,选择方差小于阈值的神经元作为下一层神经元。(8)当本层最小均方差大于前一层神经元的最小均方差或本层仅有一个神经元时,停止训练过程。如果训练是由于最小均方差偏大而停止的,则将前一层神经元作为输出层,并重新整理网络;若训练是因本层仅有一个神经元而停止的,且本次方差小于前一层时,则以本层神经元作为输出层并重新整理网络,即舍弃那些与输出神经元没有联

7、系的神经元。(1)利用评价数据组检查训练好的网络性能。评价数据组可以是上述样本数据和测试数据的结合,也可以是一组全新的数据,从而实现预测功能。1.4GMDH在地下水位预测中的应用以B55的地下水位数据为例,先将原始数据做归一化处理,然后将其作为输入信号,再将数据的前132作为训练样本,建立网络,后100数据作为测试样本,检验网络性能。中间的计算过程在MATLAB7.1平台上实现。参考文献:[1]ZhangHong,ZhongSheng,TheInfluenceFactors’AnalysisonNetProfitBasedon

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。