实验13 回归分析

实验13 回归分析

ID:15405408

大小:275.79 KB

页数:15页

时间:2018-08-03

实验13   回归分析_第1页
实验13   回归分析_第2页
实验13   回归分析_第3页
实验13   回归分析_第4页
实验13   回归分析_第5页
资源描述:

《实验13 回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数学实验(回归分析)郭明钊化212012011880一、犯罪率问题1、问题分析:这是一个变量选择的问题。与犯罪率有关的变量可能有低收入百分比,失业率和人口总数。那么为了找到更好的模型,将对因变量影响显著的变量都选入模型,使得剩余方差s2的值最小,就要进行变量的选择。选择变量用matlab中的逐步回归来实现。首先为了能有一个比较直观的认识,我们因素的可以先分别作出犯罪率y与各个因素的散点图,根据其走势估计各因素的影响大小,然后再逐步回归选择变量。2、Matlab实现:首先在matlab中输入以下内容y=[11.213.440.75.324.812.720.935.78.79

2、.614.526.9...15.736.218.128.914.925.821.725.7];x1=[16.520.526.316.519.216.520.221.317.214.318.1...23.119.124.718.624.917.922.420.216.9];x2=[6.26.49.35.37.35.96.47.64.96.46.07.45.88.6...6.58.36.78.68.46.7];x3=[58764363569212486431964153171374978957622793...7416258547169215953353];plot(x1,y

3、,'+');pauseplot(x2,y,'+');pauseplot(x3,y,'+');x=[x1',x2',x3'];stepwise(x,y')%进行逐步回归pausen=20;x=[ones(n,1)x1'x2'];%由前面的逐步回归可以得到包含2个变量x1,x2时s最小[b,bi,r,ri,s]=regress(y',x);s2=sum(r.^2)/(n-3);b,bi,s,s2rcoplot(r,ri)%残差分析运行结果如下:Øy与各个因素的散点图犯罪率与低收入家庭百分比的散点图犯罪率与失业率的散点图犯罪率与人口总数的散点图通过散点图可以看出前两图的线性程度

4、比较好,而第三个图的线性程度比较差,从这个角度来看当只允许选择2个变量时,应该选择x1和x2.Ø接下来的逐步回归步骤中在窗口图形中点击AllSteps得此时s最小为4.64848,此时包含变量x1,x2经过引入和剔除变量可以得出:只包含变量x2,x3时s为5.04083;只包含变量x1,x3时s为5.62245;只包含变量x1,x2时s为4.64848由此可以得出,当只包含两个变量时,应该是x1和x2.Ø接下来regress命令实现线性回归得到结果为Ø残差分析所得结果可以看出应该剔除第8个和第20个点1、(1)对于第一问,可以通过以上的结果得到,当只包含2个自变量的时候,

5、包含x1与x2的模型最好,得到的最好模型为(2)对于第二问,如果将将3个变量同时包含进去,在逐步回归的图形窗口中,将三个圆点全部点击为蓝色得到RMSE=4.58978,要大于只包含x1和x2时的RMSE值。具体的显示如下:而且通过右边的显示得知在包含3个变量时,x3前面的系数为0.000762937,很小实际可以忽略。由此可以得知,包含三个变量时没有上面的模型好,所以最终的模型为(3)对于第三问,通过上面的残差图分析,应该将第8个和第20个点剔除,所以在在上面的matlab程序中剔除第8组和第20组的数据,重新运行再重复上面的讨论。剔除后的残差及置信区间为Regress命

6、令得到的结果为可知剔除后的R²,F值和s²都有所改进Stepwise命令得到的结果为于是可以得到剔除后最终的模型为1、问题小结:从最终的结果来看,影响犯罪率的因素是失业率与低收入。本题训练了逐步回归命令stepwise来分析多自变量情况下的变量选择问题。而且得到最优的模型还不够,还要分析残差,剔除不符的数据之后再次计算才能得到最终的模型。二、人寿保险模型1、问题分析:本问题是研究35岁到44岁经理的年平均收入与风险偏好度和人寿保险额之间的关系。研究者预计经理的年收入与人寿保险额之间存在二次关系,并且有把握地认为风险偏好度对人寿保险额有线性效应,但是对于风险偏好度对人寿保险

7、额是否有二次效应以及两个变量是否对人寿保险有交互作用没有把握。而最终模型是使得剩余方差达到最小值,可以先把风险偏好度的二次效应和两个变量的交互作用都考虑进去,然后再进行变量的选择与逐步回归,最终使得剩余方差s²达到最小。2、模型的建立和matlab实现:首先进行变量的选择和逐步回归,将确定为候选变量集合。令输入数据矩阵x=[],然后用matlab命令stepwise进行逐步回归。输入内容如下:y=[19663252841261449492664910598771456245133133];x1=[66.29040.96472.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。