数据处理、描述性统计、多元回归分析、回归诊断

数据处理、描述性统计、多元回归分析、回归诊断

ID:44421320

大小:32.00 KB

页数:4页

时间:2019-10-21

数据处理、描述性统计、多元回归分析、回归诊断_第1页
数据处理、描述性统计、多元回归分析、回归诊断_第2页
数据处理、描述性统计、多元回归分析、回归诊断_第3页
数据处理、描述性统计、多元回归分析、回归诊断_第4页
资源描述:

《数据处理、描述性统计、多元回归分析、回归诊断》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据处理、描述性统计、多元回归分析、回归诊断一、数据描述及数据处理因变量:年度票房因电影票房收入差距过大,为尽量消除异方差的影响,对因变量y做取10为底的对数处理自变量:1、档期:0,1变量,分类:贺岁档,暑期档,黄金周档,平日档。设定虚拟变量,将对应类型赋值为1,不是则为0。设定贺岁档,暑期档,黄金周档这3个虚拟变量2、技术效果:0,1变量,分类:3D,IMAX,2Do设定虚拟变量,将对应类型赋值为1,不是则为0。设定3D,IMAX这2个虚拟变量3、电影类型:0,1变量,分类:动作片、爱情片、喜剧片、

2、科幻片、惊悚片、动画片,英他片。设定虚拟变量,将对应类型赋值为1,不是则为0。设定动作片、爱情片、喜剧片、科幻片、惊悚片、动画片这6个虚拟变量4、电影评分:0・10分5、CPI:2011年~2016年各年的城镇居民人均可支配收入6、CPI增幅7、电影产地:0,1变量,国内(包括港澳台地区)取1,其他取0二、描述性统计使用条形图、直方图、箱线图等对数据进行表示二、多元线性回归分析1、最小二乘估计(OLS)并求出R方,复相关系数R,得出回归方程对原有数据的拟合程度并进行回归方程显著性检验F检验并进行回归系数

3、显著性检验T检验2、多重共线性检验画出相关系数矩阵并对其进行显著性检验3、逐步回归(挑选出对因变量有显著影响的自变量)变量选择,避免多重共线性,注意引入自变量的显著性水平小于剔除自变量的显著性水平进行F检验和T检验,看逐步回归后的模型是否整体通过F检验,每个被选入的自变量通过T检验计算出选出的模型的R方,看拟合程度是否足够高4、主成分分析和因子分析解决多重共线性(1)主成分分析计算各主成分的方差贡献率和累计方差贡献率,特征根和特征向量画出主成分分析的载荷矩阵和碎石图获取主成分得分选择标准:主成分累计方差

4、贡献率达到80%以上的前几个主成分特征根小于1,不再选作主成分(2)因子分析画出协方差阵和相关系数矩阵画出因子分析的载荷矩阵和碎石图采用斜交旋转提取因子绘制正交、斜交图形得到因子得分三、回归诊断1、异方差检验(在逐步回归的过程屮画残差图,观察是否存在异方差,如果存在,消除异方差)因数据为截面数据,很容易出现异方差性采用方法为残差图分析法当回归模型满足所有假定,残差图上的点为随机的修正方法:加权最小二乘法权重的取值(残差绝对值的倒数)2、自相关性检验(随机扰动项存在序列相关检验)自相关指随机误差项之间存在

5、自相关现象,指一个变量前后期数值之间的相关关系采用方法为DW检验法:检验随机扰动项具冇一阶自回归的序列,若DW值在2左右时,不存在自相关修正方法:box-cox变换或迭代法3、异常值的诊断分析(1)因变量异常计算删除学生化残差,若绝对值大于3,则判定为异常值(2)自变量异常计算库克距离和中心化杠杆值库克距离<0・5,不是异常点;库克距离>l,认为是异常点若中心化杠杆值大于二倍的中心化杠杆值平均值,则认为异常点4、残差正态性检验绘制加权后的P-P图和Q・Q图绘制加权后的残差直方图

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。