统计学原理 李洁明 第七章 相关与回归分析.ppt

统计学原理 李洁明 第七章 相关与回归分析.ppt

ID:51499172

大小:726.00 KB

页数:34页

时间:2020-03-25

统计学原理 李洁明 第七章 相关与回归分析.ppt_第1页
统计学原理 李洁明 第七章 相关与回归分析.ppt_第2页
统计学原理 李洁明 第七章 相关与回归分析.ppt_第3页
统计学原理 李洁明 第七章 相关与回归分析.ppt_第4页
统计学原理 李洁明 第七章 相关与回归分析.ppt_第5页
资源描述:

《统计学原理 李洁明 第七章 相关与回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第七章相关与回归分析问题:1、某研究人员调查了杭州在校大学生的每周平均自习时间,并收集了相应的期末考试成绩,他想知道研究自习时间与学习成绩是否有关系,如何判断这种关系的表现形式,关系的密切程度以及它们之间如何作用?2、某企业想做广告来宣传某产品,如何了解和判断广告费用与销售之间的关系,以选择一个适当的广告投入?相关与回归分析概述简单线性相关分析线性回归分析非线性回归分析第一节概述概念现象之间的关系表现为:函数关系:一种确定性、严格的依存关系,可以用数学表达式准确表示出来。相关关系:现象之间存在一定的数量依存关系,但不是固定的。现象之间客观存在数量上的

2、依存关系。这种依存关系不是确定的从某种角度说,函数关系是相关关系的特例。相关关系种类因素多少单相关:两个因素复相关:三个以上因素相关形态直线相关(线性相关):表现近似直线曲线相关:表现近似曲线。正相关:同向变化负相关:反向变化相关程度完全相关:实质就是确定性的函数关系不完全相关:这个是要研究的相关分析。无相关:因素之间完全没有关系。平均意义上的相关回归分析的主要内容1、确定现象之间的相关性以及其相关关系的表现形式;2、确定相关关系的密切程度;3、选择适当的数学模型;4、测定估计值的可靠程度。5、检验相关关系的显著性。相关回归分析是为了消除偶然因素影响

3、,以找出现象之间的依存关系和程度以及变动规律。主要内容如下:相关分析:研究变量之间关系的密切程度回归分析:研究变量变动之间的因果关系第二节简单线性相关分析散点图(scatterplot)两种相关分析方法:定性分析(图表法)和定量分析(相关系数)。定性分析一般只适用于两个变量。·············支出收入散点图相关系数的计算和应用相关系数定量说明现象之间的密切程度。积差法相关系数:用无量纲的系数形式表示变量之间的相关程度。协方差:用来表示变量关联程度的绝对指标。显然受标志大小的影响。简捷计算方法(三个简捷公式)已知平均值时,可采用:已知平均值和标

4、准差时,可采用:相关系数的特点和相关程度的判断标准特点判断标准:一般地产量(公斤)生产费用(万元)20042204.52504.72704.82805.2合计122023.2例某企业生产调查,资料如下:计算产量和生产费用的相关系数。19365763667612960.40960.01960.00360.02560.31360.772452028.163.360.364.1620.1656.2积差法:简捷法:产量(公斤)生产费用(万元)20042204.52504.72704.82805.2合计122023.21620.2522.0923.0427.0

5、44000048400625007290078400302200108.428009901175129614565717第三节线性回归分析概述概念对具有相关关系的变量之间的数量变化的一般关系进行测定,确定一个相关的数学表达式,以进行估计或预测的统计方法。分类直线回归(线性回归)曲线回归(非线性回归)简单直线回归(一元线性回归)多元线性回归回归分析要先确定因变量(结果),自变量(原因)。相关系数则不需要确定因果变量。简单直线回归(一元线性回归)确定自变量x和因变量y。一般根据问题的性质、相关理论和常识确定。如果不能确定,或者两个变量互为根据,则存在x为

6、自变量,y为因变量(y倚x)的回归方程和y为自变量,x为因变量(x倚y)的回归方程。建立一元一次数学模型这里采用第一个模型。a称为截距,b称为斜率或回归系数。a的经济含义一般不作解释,b的经济含义是自变量变动一个单位,因变量平均变动b个单位。计算a和b参数a和b,是根据实际的观测值(已知)计算出的。就是在模型中,x和y是已知的,a和b是未知的。一般采用最小平方法(最小二乘法)计算。推导如下:根据最小平方法原理,参数要使得理论值与实际值的离差平方和最小。假设Q是连续可微,最小值的必要条件是一阶偏导数等于0,即:将带入Q,分别求一阶偏导得:移项等到二元一

7、次方程:从中可以解出:这样就得到了直线回归方程。··········回归系数b还可以写成:判定系数R2用来测度回归直线对实际值的拟合程度,或者说是回归直线对实际值变动的解释程度。总偏差剩余偏差(未被解释)回归偏差(被解释)即判断系数反映了因变量变动中由自变量所解释的程度。例根据上例中的资料,配合生产费用倚产量的直线回归方程,说明斜率的经济含义,并预测当产量为300公斤时的生产费用。产量(公斤)生产费用(万元)20042204.52504.72704.82805.2合计122023.21620.2522.0923.0427.04400004840062

8、5007290078400302200108.425717800990117512961456这样得出生产费

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。