径向基核函数 (radial basis function)–rbf

径向基核函数 (radial basis function)–rbf

ID:1821355

大小:67.00 KB

页数:6页

时间:2017-11-13

径向基核函数 (radial basis function)–rbf_第1页
径向基核函数 (radial basis function)–rbf_第2页
径向基核函数 (radial basis function)–rbf_第3页
径向基核函数 (radial basis function)–rbf_第4页
径向基核函数 (radial basis function)–rbf_第5页
资源描述:

《径向基核函数 (radial basis function)–rbf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、径向基核函数(RadialBasisFunction)–RBF发表于297天前技术,科研评论数8被围观3526views+论文中又提到了RBF,虽然是个简单的核函数,但是也再总结一下。关于SVM中的核函数的选择,比较简单和应用比较广的是RBF。所谓径向基函数(RadialBasisFunction简称RBF),就是某种沿径向对称的标量函数。通常定义为空间中任一点x到某一中心xc之间欧氏距离的单调函数,可记作k(

2、

3、x-xc

4、

5、),其作用往往是局部的,即当x远离xc时函数取值很小。最常用的径向基函数是高斯核函数,形式为k(

6、

7、x-xc

8、

9、)=exp{-

10、

11、x-

12、xc

13、

14、^2/(2*σ)^2)}其中xc为核函数中心,σ为函数的宽度参数,控制了函数的径向作用范围。建议首选RBF核函数,因为:1.能够实现非线性映射;(线性核函数可以证明是他的一个特例;SIGMOID核函数在某些参数上近似RBF的功能。)2.参数的数量影响模型的复杂程度,多项式核函数参数较多。3.theRBFkernelhaslessnumericaldifficulties.———–那么,还记得为何要选用核函数么?———–对于这个问题,在Jasper’sJavaJacal博客《SVM入门(七)为何需要核函数》中做了很详细的阐述,另外博主对于SVM德入门学

15、习也是做了很详细的阐述,有兴趣的可以去学习,丕子觉得这个文章写得相当好,特意转载了过来,留念一下。如果提供的样本线性不可分,结果很简单,线性分类器的求解程序会无限循环,永远也解不出来。这必然使得它的适用范围大大缩小,而它的很多优点我们实在不原意放弃,怎么办呢?是否有某种方法,让线性不可分的数据变得线性可分呢?例子是下面这张图:我们把横轴上端点a和b之间红色部分里的所有点定为正类,两边的黑色部分里的点定为负类。试问能找到一个线性函数把两类正确分开么?不能,因为二维空间里的线性函数就是指直线,显然找不到符合条件的直线。但我们可以找到一条曲线,例如下面这一条:显然

16、通过点在这条曲线的上方还是下方就可以判断点所属的类别(你在横轴上随便找一点,算算这一点的函数值,会发现负类的点函数值一定比0大,而正类的一定比0小)。这条曲线就是我们熟知的二次曲线,它的函数表达式可以写为:问题只是它不是一个线性函数,但是,下面要注意看了,新建一个向量y和a:这样g(x)就可以转化为f(y)=,你可以把y和a分别回带一下,看看等不等于原来的g(x)。用内积的形式写你可能看不太清楚,实际上f(y)的形式就是:g(x)=f(y)=ay在任意维度的空间中,这种形式的函数都是一个线性函数(只不过其中的a和y都是多维向量罢了),因为自变量y的

17、次数不大于1。看出妙在哪了么?原来在二维空间中一个线性不可分的问题,映射到四维空间后,变成了线性可分的!因此这也形成了我们最初想解决线性不可分问题的基本思路——向高维空间转化,使其变得线性可分。而转化最关键的部分就在于找到x到y的映射方法。遗憾的是,如何找到这个映射,没有系统性的方法(也就是说,纯靠猜和凑)。具体到我们的文本分类问题,文本被表示为上千维的向量,即使维数已经如此之高,也常常是线性不可分的,还要向更高的空间转化。其中的难度可想而知。小Tips:为什么说f(y)=ay是四维空间里的函数?大家可能一时没看明白。回想一下我们二维空间里的函数定义g(x)

18、=ax+b变量x是一维的,为什么说它是二维空间里的函数呢?因为还有一个变量我们没写出来,它的完整形式其实是y=g(x)=ax+b即y=ax+b看看,有几个变量?两个,二维。再看看f(y)=ay里面的y是三维的变量,再加上f(y)成为四维的了。用一个具体文本分类的例子来看看这种向高维空间映射从而分类的方法如何运作,想象一下,我们文本分类问题的原始空间是1000维的(即每个要被分类的文档被表示为一个1000维的向量),在这个维度上问题是线性不可分的。现在我们有一个2000维空间里的线性函数f(x’)=+b注意向量的右上角有个’哦。它能够将原问题变得

19、可分。式中的w’和x’都是2000维的向量,只不过w’是定值,而x’是变量(好吧,严格说来这个函数是2001维的,哈哈),现在我们的输入呢,是一个1000维的向量x,分类的过程是先把x变换为2000维的向量x’,然后求这个变换后的向量x’与向量w’的内积,再把这个内积的值和b相加,就得到了结果,看结果大于阈值还是小于阈值就得到了分类结果。你发现了什么?我们其实只关心那个高维空间里内积的值,那个值算出来了,分类结果就算出来了。而从理论上说,x’是经由x变换来的,因此广义上可以把它叫做x的函数(有一个x,就确定了一个x’,对吧,确定不出第二个),而w’是常量,它

20、是一个低维空间里的常量w经过变换得到的,所以给了一个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。