实验13-回归分析(2012080076)2.0分.pdf

实验13-回归分析(2012080076)2.0分.pdf

ID:50836345

大小:645.44 KB

页数:15页

时间:2020-03-08

实验13-回归分析(2012080076)2.0分.pdf_第1页
实验13-回归分析(2012080076)2.0分.pdf_第2页
实验13-回归分析(2012080076)2.0分.pdf_第3页
实验13-回归分析(2012080076)2.0分.pdf_第4页
实验13-回归分析(2012080076)2.0分.pdf_第5页
资源描述:

《实验13-回归分析(2012080076)2.0分.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实验13回归分析化学工程系化22班朱燚豪2012080076实验目的:1.了解回归分析的基本原理,掌握MATLAB的实现方法;2.练习用回归分析方法解决实际问题。实验内容:问题1:问题陈述:社会学家认为犯罪与收入低、失业及人口规模有关,对20个城市的犯罪率y(每10万人中犯罪的人数)与年收入低于5000美元家庭的百分比x1、失业率x2和人口总数x3(千人)进行了调查,结果如表13.26。表13.26序号yx1x2x3序号yx1x2x3111.216.56.25871114.518.16.07895213.420.56.46431226.923.17.4762340.726.39.

2、36351315.719.15.8279345.316.55.36921436.224.78.6741524.819.27.312481518.118.66.5625612.716.55.96431628.924.98.3854720.920.26.419641714.917.96.7716835.721.37.615311825.822.48.692198.717.24.97131921.720.28.4595109.614.36.47492025.716.96.733531)若x1~x3中至多只许选择2个变量,最好的模型是什么?2)包含3个自变量的模型比上面的模型好吗?确定最

3、终模型。3)对最终模型观察残差,有无异常点,若有,剔除后如何。问题分析及其求解:我们可以由表格中的数据得到犯罪率y分别关于年收入低于5000美元家庭百分比x1、失业率x2及总人口数x3的散点图如下所示。MATLAB程序如下:clc,clearally=[11.2,13.4,40.7,5.3,24.8,12.7,20.9,35.7,8.7,9.6,14.5,26.9.....15.7,36.2,18.1,28.9,14.9,25.8,21.7,25.7];%犯罪率x1=[16.5,20.5,26.3,16.5,19.2,16.5,20.2,21.3,17.2,14.3,18.1..

4、...23.1,19.1,24.7,18.6,24.9,17.9,22.4,20.2,16.9];%年收入低于5000美元家庭百分比x2=[6.2,6.4,9.3,5.3,7.3,5.9,6.4,7.6,4.9,6.4,6.0,7.4......5.8,8.6,6.5,8.3,6.7,8.6,8.4,6.7];%失业率x3=[587,643,635,692,1248,643,1964,1531,713,749,7895......762,2793,741,625,854,716,921,595,3353];%总人口数(千人)subplot(1,3,1),plot(x1,y,'+'

5、);%画散点图y-x1subplot(1,3,2),plot(x2,y,'+');%同上y-x2subplot(1,3,3),plot(x3,y,'+');%同上y-x3散点图;45454540404035353530303025252520202015151510101055510152025304681002000400060008000分析,有上述散点图可以看出,犯罪率y与低收入家庭的百分比x1、失业率x2以及总人口数x3均大致呈线性关系,对比三图可以发现y-x3与y-x1,y-x2的关系略有不同,其散点图近似于平行于y轴,说明对总人口数相近的的城市而言,其犯罪率可以相差很

6、大,可以初步推断,犯罪率与总人口数关系不大。因此,总人口数x3对犯罪率的贡献率要远很远小于低收入家庭的百分比x1和失业率x2.这样在x1、x2、x3中选择x1和x2两个变量建立模型,采取逐步回归的方法对变量组合x1、x2、x1.^2、x2.^2以及x1.*x2进行筛选。MATLAB程序如下:x=[x1',x2',x1'.^2,x2'.^2,(x1.*x2)'];stepwise(x,y',[1,2])%逐步回归输出结果:CoefficientswithErrorBarsCoeff.t-statp-valX11.223932.15400.0459X24.398942.88230.0

7、103X3-0.0198118-0.18990.8518X4-0.701967-0.90250.3802X5-0.116527-0.34500.7346-202468ModelHistory65RMSE431有上述逐步回顾结果可知,当剩余标准差最小时,模型中只含有变量x1和x2,此时剩余标准差(RMSE)s=4.64848,结果列表如下:回归系数回归系数估计值回归系数置信区间0-34.0725------------------11.22393[0.025124,2.4227

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。