统计学习的基本元素.doc

ID：59135208

大小：15.50 KB

页数：4页

时间：2020-09-12

资源描述：

《统计学习的基本元素.doc》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、统计学习的基本元素统计学习的基本元素包含三要素分别为模型、策略及算法。第一模型所要学习的条件概率分布或决策函数，模型的假设空间包含所有可能的条件概率分布或决策函数。 F={ f

2、 Y=f(X) }, F={ f

3、 Y=fθ(X),θ∈Rn } 条件概率 F={ P

4、 P(Y

5、 X) },F={ P

6、 Pθ(Y

7、 X),θ∈Rn }第二策略为了从假设空间中选取最优模型，需要引用一些手段来评估模型。1）损失函数损失函数度量模型一次预测的好坏，常用的损失函数有： 1.0-1损失函数（0-1lossfunction） L(Y, f(x))={ 1

8、, Y≠f(x) 0, Y=f(x) } 2.平方损失函数（quadraticlossfunction） L(Y, f(x))=(Y − f(x))2 3.绝对损失函数（absolutelossfunction） L(Y, f(x))=

9、Y − f(x)

10、 4.对数损失函数（logarithmiclossfunction）或对数似然损失函数（log-likelihoodlossfunction） L(Y, f(x))=−logP(Y

11、 x)2）风险函数损失函数值越小，模型就越好。由于模型的输入，输出(X, Y)是随机变量，遵循联合分布P(X, Y

12、)，所以损失函数的期望是 Rexp(f)=Ep[L(Y, f(X))]=∫x×yL(y, f(x))P(x, y)dxdy 这是理论上模型f(x)关于联合分布P(X, Y)的平均意义下的损失，称为风险函数（riskfunction）或期望损失（expectedloss）。学习的目标就是选择期望风险最小的模型，由于联合分布P(Y

13、 X)是未知的，Rexp(f)不能直接计算。模型f(x)关于训练数据集的平均损失称为经验风险（empiricalrisk）或经验损失（empiricalloss），记作Remp： Remp(f)=1N∑i=1nL(yi, f(xi))

14、期望风险Rexp(f)是模型关于联合分布的期望损失，经验风险Remp(f)是模型关于训练样本集的平均损失。根据大数定律，当样本容量N趋于无穷时，经验风险Rempf(x)趋于期望风险Rexpf(x)，所以一个很自然的想法是用经验风险估计期望风险。但是，由于现实中训练样本数目有限甚至很小，所以用经验风险估计期望风险常常并不理想，要对经验风险进行一定的矫正，这就关系到监督学习的两个基本策略：经验风险最小化和结构风险最小化。 3）经验风险最小化在假设空间，损失函数以及训练数据集确定的情况下，经验风险函数式就可以确定，经验风险最小化（empiricalriskminimizati

15、ion,ERM）的策略认为，经验风险最小的模型是最优模型。 minf∈F1N∑i=1nL(yi, f(xi)) 当样本容量是够大时，经验风险最小化能保证有很好的学习效果，在现实中被广泛应用，比如，极大似然估计（maximumlikelihoodestimation）就是经验风险最小化的一个例子，当模型是条件概率分布，损失函数是对数损失函数时，经验风险最小化就等价于极大似然估计。但是，当样本容量很小时，经验风险最小化学习的效果就未必很好，会产生“过拟合（over-fitting）”现象。4）结构化风险最小化结构化风险最小化（structuralriskminimiz

16、ation,SRM）是为了防止过拟合而提出来的策略。结构风险在经验风险上加上表示模型复杂度的正则化项（regularizer）或罚项（penaltyterm）。在假设空间，损失函数以及训练数据集确定的情况下，结构风险的定义是： Rsrm(f)=1N∑i=1nL(yi, f(xi)) + λJ(f) 其中J(f)为模型的复杂度，是定义在假设空间F上的泛函，模型f越复杂，复杂度J(f)就越大；反之，模型f越简单，复杂度J(f)就越小，也就是说，复杂度表示了对复杂模型的惩罚，λ≥0是系数，用以权衡经验风险和模型复杂度，结构风险小需要经验风险与模型复杂度同时小，结构风险小的模型

17、往往对训练数据以及未知的测试数据都有较好的预测。结构风险最小化的策略认为结构风险最小的模型是最优的模型： minf∈F1N∑i=1nL(yi, f(xi)) + λJ(f)第三算法算法是指学习模型的具体计算方法，统计学习基于训练数据集，根据学习策略，从假设空间中选择最优模型，最后需要考虑用什么样的计算方式求解最优模型。

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

统计学习的基本元素.doc

统计学习的基本元素.doc

相关文章

相关标签