人教版·选修1-2§1.1.1回归分析

人教版·选修1-2§1.1.1回归分析

ID:39163859

大小:771.50 KB

页数:20页

时间:2019-06-26

人教版·选修1-2§1.1.1回归分析_第1页
人教版·选修1-2§1.1.1回归分析_第2页
人教版·选修1-2§1.1.1回归分析_第3页
人教版·选修1-2§1.1.1回归分析_第4页
人教版·选修1-2§1.1.1回归分析_第5页
资源描述:

《人教版·选修1-2§1.1.1回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、§1.1.1回归分析人教版·选修1-21、两个变量的关系相关关系函数关系线性相关非线性相关问题1:现实生活中两个变量间的关系有哪些呢?相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。思考1:相关关系与函数关系有 怎样的不同?1.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.2.函数关系是一种理想的关系模型;相关关系在现实生活中大量存在,是更一般的情况.练习:下面各组两变量间具相关关系的是()①正方体的体积与棱长,②某农田的水稻产量与施肥量,③家庭的支出与收入,④某户家庭的用电量与电价。A②③B③④C

2、②③④D①②③④A思考2:如何判断两个变量之间是否 存在线性相关关系?问题3:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?问题2:什么是回归分析:由数据画散点图求回归方程预报、决策散点图只是形象地描述点的分布情况,它的“线性”是否明显只能通过观察,要想把握其特征,必须进行定量的研究.1.求相关系数r如果0.75<

3、r

4、<1,可以认为有较强的线性相关关系。相关系数1.计算公式2.相关系数的性质(1)

5、r

6、≤1.(2)

7、

8、r

9、越接近于1,相关程度越强;

10、r

11、越接近于0,相关程度越弱.注:b与r同号问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?建构数学相关系数r>0正相关;r<0负相关.通常,r∈[-1,-0.75]--负相关很强;r∈[0.75,1]—正相关很强;r∈[-0.75,-0.3]--负相关一般;r∈[0.3,0.75]—正相关一般;r∈[-0.25,0.25]--相关性较弱;相关系数r的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?对r进行显著性检验相关关系的测度(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全

12、正相关负相关程度增加r正相关程度增加①.求相关系数r的步骤:(1)计算平均数(2)计算与的积,求(3)计算(4)将上述有关结果代入公式,求r②练习2:已知变量X,Y满足下表,求相关系数rx123y138XiYiXi2yi2问题4:对于线性相关的两个变量用什么方法来刻划之间的关系呢?2、最小二乘估计①最小二乘估计下的线性回归方程:②.求线性回归方程的步骤:(1)计算平均数(2)计算与的积,求(3)计算(4)将上述有关结果代入公式,求b、a,写出回归直线方程.3、线性回归模型其中a+bx是确定性函数,是随机误差注:产生的主要原因:(1)所用确定性函数不恰当;(2)

13、忽略了某些因素的影响;(3)观测误差。例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。案例1:女大学生的身高与体重解:1、选取身高为自变量x,体重为因变量y,作散点图:2、由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。3、从散点图还看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一

14、次函数y=bx+a描述它们关系。随机误差e的来源(可以推广到一般):1、其它因素的影响:影响身高y的因素不只是体重x,可能还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高y的观测误差。我们可以用下面的线性回归模型来表示:y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差。思考P3产生随机误差项e的原因是什么?函数模型与回归模型之间的差别函数模型:回归模型:可以提供选择模型的准则计算可得r=0.798,所以可以线性相关求回归方程。函数模型与回归模型之间的差别线性回归模型y=bx+a+e增加了随机误差项e,因变量

15、y的值由自变量x和随机误差项e共同确定,即自变量x只能解析部分y的变化。在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。∵回归直线恒过点,故称为样本点的中心。例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。案例1:女大学生的身高与体重根据最小二乘法估计和就是未知参数a和b的最好估计,制表xi2xiyiyixi78合计65432

16、1i所以回

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。