基于混合核函数的svm及其应用

基于混合核函数的svm及其应用

ID:5521110

大小:519.50 KB

页数:20页

时间:2017-11-12

基于混合核函数的svm及其应用_第1页
基于混合核函数的svm及其应用_第2页
基于混合核函数的svm及其应用_第3页
基于混合核函数的svm及其应用_第4页
基于混合核函数的svm及其应用_第5页
资源描述:

《基于混合核函数的svm及其应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于混合核函数的SVM及其应用支持向量机的许多特性是由所选择的核函数来决定的,为了得到性能更为优良的支持向量机,一种改进的方法是把多个核函数组合起来,形成一种混合核函数。应用:将混合核函数的SVM算法用于血浆脂蛋白样本与其血浆胆固醇的含量的测定中,并将结果与由其它核函数构造的支持向量机方法进行比较,意在提出一个更合适的核函数来解决函数拟合问题。用于函数拟合的支持向量机给定训练数据{(xi,yi),i=1,2,⋯,n},其中xi∈Rd是第i个学习样本的输入值,且为一d维列量,yi∈R为对应的目标值。对于非线性不可分问题,通过非线性变换将x映射到某个特征空间,因而转化成线性可分问题,线

2、性估计函数可定义为:假设所有训练数据都可以以精度ε无误差地用线性函数拟合,即则可以通过求下列代数式的最小值来获得最小风险:常数C>0,C表示对超出误差ε的样本的惩罚程度。采用优化方法可以得到其对偶问题。构造拉格朗日函数求解式(4),可得到支持向量机回归函数为:其中K(x,xi)称为核函数,将只有小部分不为0,它们对应的样本就是支持向量。核函数所谓核函数就是存在一非线性变换,使K(xi,xj)=成立的一类函数。正是核函数的引入使SVM得以实用化,因为它避免了显示高维空间中向量内积而造成的大量运算。目前研究最多的核函数主要有3类:1)多项式核函数:2)径向基核函数(RBF):3)Sig

3、moid函数:式(6~8)中q,σ,c等参数都是实常数。在实际运用中,通常要根据问题的具体情况选择合适的核函数以及相应的参数。局部性核函数和全局性核函数SVM的许多特性都是由所用核函数的类型决定的,其非线性水平是由核函数决定的。在SVM中,通常所选的核函数必须满足Mercer条件。归结起来,核函数有两种主要类型,即:局部性核函数和全局性核函数。RBF函数即式(7)就是一个典型的局部性核函数图1为当σ分别取0.1,0.2,0.3,0.4,0.5时RBF函数的曲线图,0.2为测试输入,从中可以看出,局部性核函数仅仅在测试点附近小领域内对数据点有影响。而多项式核函数即式(6)是一个典型的

4、全局性核函数。图2为当q分别取1,2,3,4,5时多项式核函数的曲线图,这里依然取0.2为测试输入,从图中可以看出,全局性核函数允许远离测试输入的数据点对核函数的值也有影响。混合核函数函数就是混合核函数其中的一种,并且满足Mercer条件。为了保证混合核函数具有更好的学习能力和推广性,RBF核函数即K(xi,xj)=中σ2取值宜在0.01~0.5之间;对于多项式核函数,q值一般取1或2。应用实例随机取数据样本的三分之一进行训练,测试时使用全部数据样本。利用回归估计出的血样值样本对应的每种血浆脂蛋白的胆固醇含量与相应的实际含量之间的相关系数R来反映回归估计性能的优劣,即其中

5、R

6、≤1

7、,f(x)为回归估计出的血样值样本对应的每种血浆脂蛋白的胆固醇含量,y为相应的实际含量。如果存在一种理想的回归估计过程,也就是说回归估计值和相应的实际值恰好完全相同,此时R的值为1,也就是说,R越接近于1,回归估计的精度就越高。对于混合核函数Kmix=λKpoly+(1-λ)Krbf,λ一般在0.50~0.99之间,因此实验中取λ=0.98,取ε=0.1,C=1000,对于核函数RBF,实验中σ=0.01时不同训练样本训练后进行拟合的R值最好,而多项式核函数K(x,xi)=[(x,xi)+1]q中q=1。由于σ=0.01时单个核函数的结果很差,为了更好地体现混合核函数的效果,实验中

8、对采用不同训练样本训练后进行回归的R值的进行了比较,并与单个核函数的最好结果进行了比较,如表1所示。从表1中可以看出采用混合核函数进行函数拟合的效果更好,尤其是VLDL的精确度得到了大幅度的提高。表2是混合核函数在λ=0.98,q=1,σ取不同值时进行拟合的结果,由表2可以看出σ在0.01~0.5之间时效果较好.不仅如此,还发现,C值的选取影响训练时间的长短,C值越小平均训练时间越短,但当C值过小(C≤102)时,实验结果的精度会下降。表3是C取不同值时平均训练时间的值,因此实验中采用C=1000是较合理的,并且有效提高了SVM方法的训练速度。总结简要介绍了由混合核函数构造的支持向

9、量机,并将其运用于函数拟合中。通过对3种不同类别血浆脂蛋白样本与其血浆胆固醇的含量的测定,验证了选择这种混合核函数的实验具有很好的效果,实验中VLDL的精确度有明显提高,而且本实验中训练时间只有2.5秒左右,很好地解决了训练速度慢的问题。谢谢!!

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。