统计学习的基本元素.doc

统计学习的基本元素.doc

ID:59135208

大小:15.50 KB

页数:4页

时间:2020-09-12

统计学习的基本元素.doc_第1页
统计学习的基本元素.doc_第2页
统计学习的基本元素.doc_第3页
统计学习的基本元素.doc_第4页
资源描述:

《统计学习的基本元素.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、统计学习的基本元素统计学习的基本元素包含三要素分别为模型、策略及算法。第一模型  所要学习的条件概率分布或决策函数,模型的假设空间包含所有可能的条件概率分布或决策函数。   F={ f 

2、 Y=f(X) }, F={ f 

3、 Y=fθ(X),θ∈Rn }  条件概率  F={ P 

4、 P(Y 

5、 X) },F={ P 

6、 Pθ(Y 

7、 X),θ∈Rn }第二策略  为了从假设空间中选取最优模型,需要引用一些手段来评估模型。1)损失函数  损失函数度量模型一次预测的好坏,常用的损失函数有:  1.0-1损失函数(0-1lossfunction)    L(Y, f(x))={ 1

8、, Y≠f(x)  0, Y=f(x) }  2.平方损失函数(quadraticlossfunction)    L(Y, f(x))=(Y − f(x))2  3.绝对损失函数(absolutelossfunction)    L(Y, f(x))=

9、Y − f(x)

10、  4.对数损失函数(logarithmiclossfunction)或对数似然损失函数(log-likelihoodlossfunction)    L(Y, f(x))=−logP(Y 

11、 x)2)风险函数  损失函数值越小,模型就越好。由于模型的输入,输出(X, Y)是随机变量,遵循联合分布P(X, Y

12、),所以损失函数的期望是    Rexp(f)=Ep[L(Y, f(X))]=∫x×yL(y, f(x))P(x, y)dxdy  这是理论上模型f(x)关于联合分布P(X, Y)的平均意义下的损失,称为风险函数(riskfunction)或期望损失(expectedloss)。学习的目标就是选择期望风险最小的模型,由于联合分布P(Y 

13、 X)是未知的,Rexp(f)不能直接计算。  模型f(x)关于训练数据集的平均损失称为经验风险(empiricalrisk)或经验损失(empiricalloss),记作Remp:    Remp(f)=1N∑i=1nL(yi, f(xi))

14、  期望风险Rexp(f)是模型关于联合分布的期望损失,经验风险Remp(f)是模型关于训练样本集的平均损失。根据大数定律,当样本容量N趋于无穷时,经验风险Rempf(x)趋于期望风险Rexpf(x),所以一个很自然的想法是用经验风险估计期望风险。但是,由于现实中训练样本数目有限甚至很小,所以用经验风险估计期望风险常常并不理想,要对经验风险进行一定的矫正,这就关系到监督学习的两个基本策略:经验风险最小化和结构风险最小化。 3)经验风险最小化  在假设空间,损失函数以及训练数据集确定的情况下,经验风险函数式就可以确定,经验风险最小化(empiricalriskminimizati

15、ion,ERM)的策略认为,经验风险最小的模型是最优模型。   minf∈F1N∑i=1nL(yi, f(xi))  当样本容量是够大时,经验风险最小化能保证有很好的学习效果,在现实中被广泛应用,比如,极大似然估计(maximumlikelihoodestimation)就是经验风险最小化的一个例子,当模型是条件概率分布,损失函数是对数损失函数时,经验风险最小化就等价于极大似然估计。  但是,当样本容量很小时,经验风险最小化学习的效果就未必很好,会产生“过拟合(over-fitting)”现象。4)结构化风险最小化  结构化风险最小化(structuralriskminimiz

16、ation,SRM)是为了防止过拟合而提出来的策略。结构风险在经验风险上加上表示模型复杂度的正则化项(regularizer)或罚项(penaltyterm)。在假设空间,损失函数以及训练数据集确定的情况下,结构风险的定义是:    Rsrm(f)=1N∑i=1nL(yi, f(xi)) + λJ(f)  其中J(f)为模型的复杂度,是定义在假设空间F上的泛函,模型f越复杂,复杂度J(f)就越大;反之,模型f越简单,复杂度J(f)就越小,也就是说,复杂度表示了对复杂模型的惩罚,λ≥0是系数,用以权衡经验风险和模型复杂度,结构风险小需要经验风险与模型复杂度同时小,结构风险小的模型

17、往往对训练数据以及未知的测试数据都有较好的预测。  结构风险最小化的策略认为结构风险最小的模型是最优的模型:    minf∈F1N∑i=1nL(yi, f(xi)) + λJ(f)第三算法  算法是指学习模型的具体计算方法,统计学习基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后需要考虑用什么样的计算方式求解最优模型。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。