支持向量机方法在单站降水预报中的应用探讨

支持向量机方法在单站降水预报中的应用探讨

ID:38112580

大小:151.22 KB

页数:4页

时间:2019-05-24

支持向量机方法在单站降水预报中的应用探讨_第1页
支持向量机方法在单站降水预报中的应用探讨_第2页
支持向量机方法在单站降水预报中的应用探讨_第3页
支持向量机方法在单站降水预报中的应用探讨_第4页
资源描述:

《支持向量机方法在单站降水预报中的应用探讨》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第26卷第2期暴雨灾害Vol.26No.2第2200期7年6月TORRENTIALRAINANDDISASTERSJun.2007文章编号:1004-9045(2007)02-0159-04支持向量机方法在单站降水预报中的应用探讨12王建生,熊秋芬(1.武汉中心气象台,武汉430074;2.中国气象局培训中心,北京100081)摘要:将武汉天空云量预报的81个预报因子运用到该站中等以上强度的降水预报中,基于SVM方法进行了交叉验证和预报试验。结果表明用81个预报因子建立的5~9月和全样本的降水预报模型有

2、较好稳定性、且对降水都有正的预报技巧。因此天空云量的预报因子可以用来做降水的预报因子,同时也证明了这些预报因子在天空云量和降水预报中是协调的。SVM方法为天空云量和降水的预报提供了客观参考依据。关键词:SVM方法;天空云量;预报因子;降水预报中图分类号:P457.6文献标识码:A1引言2SVM分类方法基本原理简介支持向量机(SupportVectorMachine,简记SVM)机器学习问题可概括的表述为:给定训练样本(x1,[1]N方法是基于历史数据训练学习的一种建模方法,但y1),(x2,y2),⋯⋯

3、,(xl,yl),其中xi∈R,为N维向量,yi∈[2-4][5-7]又不同于传统的卡尔曼滤波、ANN等方法。SVMI-1,1J或yi∈I1,2,⋯⋯,kJ,给出预报数据集:xl+1,xl+2,通过合适的内积函数定义非线性变换,把样本空间的⋯⋯,xm,通过训练学习建立分类模式M(x),使其不但非线性关系转化为高维空间中的线性关系,在变换后对训练样本能够正确分类,而且具有较强的推广能的高维空间中求出最优分类超平面,从而实现样本分力。即可以由模式对于输入的预报数据xi得到正确的类。而超平面只是由关键样本点(

4、少数支持向量)决对应输出值yi。定,其余样本均不起作用。它是Vipnik等根据统计学对于训练样本集的线性二类划分问题,就是寻求习理论(StatisticalLearningTheory,简称SLT)提出函数的一种新的机器学习方法,在解决小样本、非线性及y=f(x)=Sgn((w·x)+b)(1)[8]高维模式识别问题中表现出许多特有的优势。支持使对于i=1,2,⋯⋯,l满足条件向量机根据结构风险最小化准则,在使训练样本分类yi=f(xi)=Sgn((w·xi)+b)(2)N误差极小化的前提下,尽量提高分

5、类器的泛化推广能其中w,x,xi∈R,b∈R,w,b为待确定的参数,力。从实施的角度,训练支持向量机的核心思想等价Sgn为符号函数。显然(w·x)+b=0为划分超平面,w为于求解一个线性约束的二次规划问题,从而构造一个其法方向向量。超平面作为决策平面,使得特征空间中两类模式之间对于线性可分离的问题,满足条件形如(1)的线性的距离最大,而且它能保证得到的解为全局最优解。决策函数是不唯一的。图1给出二维情况下满足条件自2004年该方法首次被应用于气象要素预报以的划分直线的分布区域图。落在虚线区域内的任一直[

6、9,10]来,目前已在降水、温度、天空云量预报和短期气线都可作为决策函数。谁是最优的决策函数,就要对[10-14]候预测中得到初步成功的应用。由于云和降水的其进行判断。关系十分密切,所以本文将已用于天空云量的预报V.N.Vapnik提出一个间隔最大化原则。所谓间[12]因子来作降水的预报,并对预报效果的检验,探讨隔最大化原则是指寻求使间隔达到最大的划分为最提高降水预报准确率的问题,同时将SVM与ANN优,即是对w,b寻优,求得最大间隔:Max(Min(

7、

8、x-xi

9、

10、:w,b方法的预报结果进行了比较,为

11、业务降水预报提供Nx∈R,(w·x)+b=0,i=1,⋯⋯,l)),对应最大间隔的划分参考。收稿日期:2007-02-05;定稿日期:2007-06-20基金项目:“长江中游暴雨洪水定量预报系统”和“中国气象局数值模式创新基地”开放课题(2007)作者简介:王建生,男,1951年生,工程师,主要从事天气预报服务工作。E-mail:xg-wang@sohu.com160暴雨灾害第26卷超平面称为最优划分超平面,简称为最优超平面,如策函数。与式(3)相比,这里只是用Mercer核函数的计图2中的L。图2中两

12、条平行虚线l1,l2(称为边界)距离算代替了点积的计算,在整个求解过程中不需要知道之半就是最大间隔。非线性映射的显式表达式,而是通过支持向量(关键样本)来表达预报因子与预报对象的关系。其基本思想简单地说就是升维和线性化,通过非线性映射,把样本空间映射到一个高维乃至于无穷维的特征空间,在特征空间中,应用线性学习机的方法解决样本空间中的高度非线性问题。2训练样本集的构建和最优参数的选取2.1训练样本集的构建图1划分直线的分布区域图该文以武汉市(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。