分散度量模型中的变量选择

分散度量模型中的变量选择

ID:33157971

大小:3.10 MB

页数:115页

时间:2019-02-21

分散度量模型中的变量选择_第1页
分散度量模型中的变量选择_第2页
分散度量模型中的变量选择_第3页
分散度量模型中的变量选择_第4页
分散度量模型中的变量选择_第5页
资源描述:

《分散度量模型中的变量选择》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、北京工业大学博士学位论文分散度量模型中的变量选择姓名:王大荣申请学位级别:博士专业:概率论与数理统计指导教师:张忠占20090301摘要摘要建模过程中的一个重要问题是如何从众多解释变量当中选取重要变量,即变量选择问题.已有大量文献从不同的角度研究了线性模型和广义线性模型中的变量选择问题.随着科学技术的深入发展,人们面临着越来越复杂的数据和模型结构,多重回归模型是其中重要的一类,它可以更好的解释数据变化的原因和规律.然而,当前文献大多集中于均值回归模型的变量选择,对分散度量参数赋予一个模型结构后,关于

2、均值一分散度量参数联合建模结构下的变量选择问题却鲜有研究.我们的研究发现,如果把适用于均值模型的方法直接套用到联合建模结构中有可能会引起一些问题或做出错误的推断,因此有必要针对这样的复杂模型结构展开相关变量选择问题的研究.本文研究了均值和分散度量参数联合建模结构下的变量选择问题,以及变量选择思想方法的应用问题,主要取得了以下三点成果.针对异方差回归模型,我们研究了均值和方差联合建模结构下的同时变量选择问题.当均值模型中参数个数相对样本量较大时,方差模型中参数的极大似然估计通常是有偏的,使用这样的估计

3、值进行变量选择将会增加模型的风险。从修正偏差的角度出发,我们采用了调整的profile似然函数作为损失函数,并基于信息论的理论基础,提出了一个新的变量选择准则PICa.与经典方法不同的是,该准则同时考虑了均值模型和方差模型中的信息,并对不同模型中的变量施以恰当的惩罚力度,达到了同时选择变量的效果.我们证明了,在一定的K_贝JJ条件下,该准则具有如下渐近优良性:对均值模型,PICa准则具有模型选择的相合性;对方差模型,当样本量足够大时,由PICa准则选出的模型出现拟合不足现象的概·-——I·—-—北京

4、工业大学理学博士学位论文率趋于零.MontoCarlo模拟研究显示,在许多常见情况下,新的准则优于传统方针对双重广义线性模型,一方面,我们针对经典的变量选择方法,利用扩展拟似然函数,推广了经典的AIC准则,并通过模拟和实例分析验证了该准则的有效性.另一方面,我们还研究了高维数据中的变量选择问题.当变量个数较大,而数据量不够大时,传统的子集选择法很难区分众多的可能模型,同时因其计算量太大而难以实施.对双重广义线性模型,不仅要估计均值模型中的参数,还要估计散度模型中的参数,计算将更加繁重.我们提出了一类

5、非凹惩罚扩展拟似然方法,证明了所得估计具有Oracle性质,并提出了一种快速的新算法.同时,考虑到估计的优良性质依赖于罚函数中调谐参数的选择,我们从模型选择的相合性角度出发,改进了罚函数中调谐参数的选取方法.“变量选择"的思想方法作为建模的主要组成部分,对于衡量数据与模型拟合的程度具有本质的反映,因此,也可以用于建模的其他问题.我们针对回归分析中异常数据和变量变换相互影响的问题,从变量选择角度,结合模型选择的广义信息准则与构造变量方法,提出了一类数据变换与异常点的同时诊断方法.该方法同时考虑由是否存

6、在异常点以及是否需要变换所组成的四种备选模型,在某些情况下,既可以减轻异常点对数据变换的强影响,又避免了变换数据对于异常点的掩盖效应.文章通过模拟与实例验证了该方法的有效性,并与文献中的方法进行了比较.关键词:变量选择;双重广义线性模型;异方差回归模型;Profile似然函数;扩展拟似然函数;AIC准则;BIC准则;惩罚函数;SCAD;异常点一II—AbstractVariableselectionisfundamentaltostatisticalmodeling.Alargenumberofre

7、searchershavebeendevotingintothevariableselectionproblems.Withthedevelopmentofmodemtechnology,moreandmorecomplicateddataandmodelshaveemerged.HierarchicalregressionmodelswhichC021analyzedatabetteraretheimportantpartofthem.However,manyreferencesareconcer

8、nedwiththevariableselectionofthemeanregressionmodel,andtherearefewmethodspro-posedforthemeananddispersionjointmodeling.Accordingtoourresearch,wefindthatthemethodsofvariableselectionwhichareadequateformeanmodelsmayfailtobedirectlyextende

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。