基于有序聚类分析的测井曲线自动分层策略

基于有序聚类分析的测井曲线自动分层策略

ID:45580667

大小:516.68 KB

页数:15页

时间:2019-11-15

基于有序聚类分析的测井曲线自动分层策略_第1页
基于有序聚类分析的测井曲线自动分层策略_第2页
基于有序聚类分析的测井曲线自动分层策略_第3页
基于有序聚类分析的测井曲线自动分层策略_第4页
基于有序聚类分析的测井曲线自动分层策略_第5页
资源描述:

《基于有序聚类分析的测井曲线自动分层策略》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于有序聚类分析的测井曲线自动分层策略抠j要:测井曲线的分段要求样本分类时不打乱次序,本文基于有序最优分段的理论,针对样木过大的问题首先进行中值滤波处理进而运用边缘检测的方法压缩采样点数目,对于窗口大小的选择利用BP神经网络自我反馈寻求最佳窗口大小,在综合各种测井曲线的基础上运用主成分分析法提取主因子作为样本指标,结合有序聚类分析初步确定拟划分地层数,然后运用爬山法并做出分层数口—总变差图寻求最佳分段数,从而获得全局最优解。最后利用Fishers判别分析进行井的地层命名,通过对分类效杲进行检测,结果表明该模型求解效果精确度较高。关键词:总变差,最优分割,边缘检

2、测,主成分分析,爬山法,BP神经网络,Fisher's判别分析。一、最优分割的介绍:1.1、测井曲线的分层问题,可以等效为对一批有序样木进行划分分段问题,这类问题的提法如下:设有一批(N个)按一定顺序排列的样品,每一个样品测得p项指标,其原始资料矩阵:XuX12…XpX(N")=%21••■%22•••…XiP••••••Xn2…Xnp其屮元素兀)表示第i个样品第j个指标的观测值。如果把N个样品按顺序(不破坏序列的连续性)进行分割,其所有的可能分割方法共有:12N7_rAT(Cn—i+Cz+・・・+Cn_i=2_1种。现在要求在所有的分割中找出一种分割方法,

3、这种分割方法满足各段内的差异最小,而各段间的差异最大。称这样的一种分割方法为最优分割法。各段内部差异最小,即各段内的数值变化最小。段内数值变化可用变差(类的直径)表示,样品段{兀皿冲,・・・初}的变差可以表示为:-Xij)几表示样品段■,和,•…J内样品间的差异情况,越小表示段内各样品之间的数值比较接近,反之,厶越人表示段内个各样品数值之间的差异大,耍各段内的差异达到最小,即所分成各段内的变差总和(总变差)为最小。事实上,根据总变差的分解公式:S总=s段内+s段间对于给定的N个样品,北(总离差平方和)为一定值,若使段内离差平方和最小,则段间的离茅平方和必为最大

4、。所以,使段内离差平方和最小的分割法即为最优分割法。N个冇序样品分成k类,一切可能的结果冇,种可能,且其分法只能呈现它-1丿如下的形式:P(N,k):{=+++=o其中甘1勺2“3<…几VM这里我们简记仃为Xj,当样品分为k类时,GGG「G它们的直径用…D表示,定义分类误差函数E(n,k)二因此误差分1=1类函数越小,分类效果越好。E(n,k)二乞“厂1)+/-«KSjSN且由该递推公式可以很方便地求得使E(n,K)达到极小值的最优解,具体办法是:首先找到几使它达到最小,即E(n,k)=E(ik-1,k-l)+f),于是®二{⑴严…n},然后找至!J力_1,使

5、它满足E(ik_[fk-1)二E(°_i-l,k-2)+DG』广1)得到类G—i={"_i,力_i+l,…力-1},用类似的方法可以得到Gk・2,…,G1。如果分类个数不能事先确定,可让k二1,2,3,N,分别计算E(N,1)E(N.2)E(N,3)E(N,4)……E(N,N),用k-E(N,k)点图,在曲线拐弯处来确定ko但是当N(样本容量)很大时,用最优分割的计算量太大,为了减少计算量,我们采用分解法分类:首先将全部样木分割成两类,然后将这两类中使分类函数降低最多的一类再分割成两类,如此继续分割下去,便得到近似最优解。1.2、分解法的具体算法如下:Step

6、l:将全部样本分成两类G1G2o从N个样本选出一个组成G2,其余的样本组成G,使分类误差函数度达到最小,然后在G屮挑选出一个样本放到G?屮去,使得分类误差函数达到极小,这样每一次从°中挑选出一个样木到G2中,使分类误差函数极小,直至°屮所有的样本都挑选到G?为止。这个过程屮共有N-1种分类方法。比较着N-1种分法,找出分类函数最小的分法作为第一次分类的结果,这个最小值记为&・Stcp2:对第一次分的两类G1,G2,分别用Stcpl将其分成两类,比较它们的分类误差函数,将分类误差函数最小的那一类分成两类,分类决定后其分类误差函数记为£2Step3:设已有了k类:

7、g「G2,G?…Gk,将每-类都按照Stcpl分成两类,然后比较这k种分法,取使分类误差函数达极小值的一个分为两类,其余暂且不分,分解成K+1类分的误差函数记为£k+1o如果K+KN,则回到Step3,否则分解停止。Step4:利用£1£2£v,可将上述分解结果画成一个聚类图,用其决定分类的个数,或者用k-E(N,k)点图,在曲线拐弯处来确定ko1.3、进行最优分割的步骤:初始吋,由于各个因子的量纲不一致,我们首先将量纲归一、数据正规化。X11Xl2…XPX21•■■X22■■•…Xip••••••XniXn2…Xnp设原始资料矩阵为X旳将矩阵元素兀7变换为

8、矿mmXij-^i

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。