精简观测站的模型

精简观测站的模型

ID:23723960

大小:319.01 KB

页数:10页

时间:2018-11-10

精简观测站的模型_第1页
精简观测站的模型_第2页
精简观测站的模型_第3页
精简观测站的模型_第4页
精简观测站的模型_第5页
资源描述:

《精简观测站的模型》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、2011精品精简观测站的模型第3队张文颖李彦霖王婷婷摘要本文在保留足够信息量的前提下以尽量精简观测站为目标,把每年的降水量作为指标,利用SAS软件首先对观测站进行聚类,然后在所得分类的基础上得到24种不同的组合,利用matlab通过对该地区降水量的期望进行估计,将精简前和精简后所得到的期望值进行比较,得出精简后的信息量,其中最大信息量对应的组合为最优组合,即要保留的观测站。本文分为模型一和模型二,模型一是用平均值来表示降水量的期望,得到最优组合为1,2,3,5,6,8,12,对应的信息量为97.5%;模型二是用区间估计降水量期望,得到最优组合为1,2,3,7,8,10,11,

2、对应的信息量为88.27%。关键词聚类区间估计t分布置信区间置信度问题提出某个地区有12个气象观测站,已知这些观测站的地理位置和它们10年来所测得的年降水量。现在为了能够节省开支,想要适当减少气象观测站,应该减少哪些观测站可以使得所得到的降水量的信息量仍然足够大。问题分析在本题中,如果在该地区保留的观测站越多,则所测得的降水量的信息量就会越大,但是开支也会相应较高;如果在该地区保留的观测站的个数较少,则可以节省开支,但这样所测得的降水量的信息量又会较小。于是我们需要在信息量与开支之间寻求一个平衡。由于在地理环境相似的区域,降水量的梯度变化较小,这些区域的观测站所提供的降水量信

3、息会有很大重叠,因此可以缩减这些区域观测站的数量;而在降水量梯度变化较大的区域,观测站所提供的信息会有显著差异,因此这些观测站不可撤除。于是,我们考虑根据观测站10年来观测所得的数据,将观测站进行聚类,分在同一类的观测站处于降水量梯度变化较小的区域,这一类区域可以仅保留一个观测站。模型假设1.此地区的降水量服从正态分布,即降水量为x的概率为P(x)=。2.建立一个观测站会花费很大的费用。3.减少一个观测站可以节省很大的费用。4.不考虑地理位置对分类的影响。符号表示xi表示第i个区域的观测站。i=1,2,…12精简观测站前该地区每年降水量的期望ksdowe2011精品精简观测站

4、后该地区每年降水量的期望区间估计的置信度[,]置信度为时的置信区间模型建立与求解模型一通过分析,我们知道:在降水量梯度变化较小的区域,观测站所提供的信息会有很大重叠,这时需要适当减少观测站;而在降水量梯度变化较大的区域,观测站所提供的信息会有显著差异,这些观测站不可撤除。因此我们需要对观测站进行分类。基于以上的问题分析和模型假设,我们建立了以下模型现在,我们以1981—1990这10年所得到的观测数据为指标,对这12个观测站所在的地区进行聚类。利用SAS软件,得到以下结果:ksdowe2011精品伪F统计量(图2)其中,F=。它用于评价聚为G类的效果。F越大,类间离差平方和与

5、类内离差平方和的比值越大,说明聚为一类的样本越相似,而类间的差异越大,所以应该取伪F统计量较大而类数较小的聚类水平。图2中我们可以看出,当聚为8类时,F的值达到最大,这说明聚为8类可以使得类间差异与类内差异的比值达到最大;当聚为7类时,虽然F的值有所减小,但减小的幅度不大,也就是说聚为7类可以多减少一个观测站,并且可以使类间差异与类内差异的比值仍然保持较大;而当聚为6类时,F的值将有很大幅度的减小,这说明分6类会使类间的差异大幅度减小,故分6类是不合理的。ksdowe2011精品伪T统计量(图3)其中,T=它是用来评价聚类后的效果。图3中我们可以看出,当聚为7类时,T的值较小

6、,这说明由8类聚到7类时,类内样本差异的增量较小;当再由7类聚为6类时,T值突然有较大幅度的增加,这说明若聚为6类,类内样本差异的增量会大幅度增加,故聚6类是不合理的,应该选择分为7类。根据假设4减少一个观测站会节省很大的费用,再结合以上的分析我们可以得出,将观测站所在的区域分为7类既能够最大的节省开支,又可以使所得到的降水量的信息量仍然足够大。结合图1,我们可以得出分类情况如下:类别1234567观测站123471251061189现在,我们已经将观测站分成了7类,而一类中只需要一个观测站,由假设3建立一个观测站会花费很大的费用,为节省开支,我们不考虑新建观测站,即只需要在

7、原来的12个观测站中剔除5个。ksdowe2011精品于是,现在的问题就转化为:在同类中究竟应该保留哪个观测站,才能使最终所得到的降水量的信息量仍然足够大?我们的思路是:通过对12个观测站的测量值求期望,可以得出每年该地区的年降水量i0,再通过对7个观测站的测量值求期望,也可得出每年该地区的年降水量。然后用差值率

8、(-i0)/i0

9、表示第i年降水量的误差率,亦即信息损失率。求出10年的平均信息损失率后,利用公式1-即可求得信息量。信息量越大,则组合最优,此时的组合即为最终要保留的观测站。第一步:通过对1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。