欢迎来到天天文库
浏览记录
ID:20617065
大小:636.50 KB
页数:23页
时间:2018-10-14
《11.相关性分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、六西格玛绿带培训教材相关性分析10-1结束对本章节的学习后,学员将可以:◆解释什么是相关分析◆进行相关分析●散点图●相关系数●常见错误学习目的定义:回归是确定一个响应变量(或输出)与一个或多个因变量(或输入)之间的统计关系的方法。Y=f(x1,x2,…xn)回归分析其中:Y是响应变量X1到xn是因变量10-2定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。也代表了两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变量间的联系强度,在这里-1≤R≤1。按照惯例,R表示真实的系数
2、,R表示我们的最佳估算。相关^回归与相关10-3回归分析回归分析建立关于因变量与响应变量之间关系的估计方程式(公式)。相关分析量化两个变量之间的线性关系的程度,即等式的适合性如何?VS散点图以图形方式展示每个样本的两个特性,每个坐标轴表示一个特性值:X轴-因变量Y轴-响应变量散点图的目的是直观地说明两个变量之间的关系与关联程度。散点图-图形展示关系10-4用Minitab做散点图在Minitab中,可通过下列方式做散点图:a)图形>散点图b)统计>回归>拟合线图例1某黑带想了解一化学蒸馏过程中氧气
3、的纯度(Y)与冷凝器中的炭氢化合物的%之间的关系。◆数据在Oxygenpurity.mtw◆请做出散点图Oxygenpurity(Y)vsHydrocarbon%(x)10-5例1Minitab:图形→散点图(oxygenpurity.mtw)例110-6相关系数:R10-7属性◆R值取范围从-1.0到+1.0,即-1≤R≤1。◆R<0意味着一个负线性相关,即是Y随着X的增加而减少。◆R>0意味和一个正线性相关,即是Y随着X的增加而增加。◆R=-1意味着一个完全负线性关系。◆R=1意味着一个完全正
4、线性关系。◆R=0意味着无线性关系。相关系数(R)有时又称为皮尔森成果,用来测定两个变量之间的关系强度。R=0◆R=0意味着无线性关系。◆R=0并不意味着无关系。相关系数按照惯例p表示总体的相关系数。r表示样本的相关系数。◆在Minitab中,两个或多个变量间的相关系数(R)及其统计显著性◆可以通过下列方法得到:统计>基本统计量>相关10-8例2◆从文件Oxygenpurity.mtv中,测定出OxygenpurityHydrocarbon%(X)的相关系数。例2:Minitab的对话窗口结论是什
5、么?H0:p=0(无相关性)Ha:p≠0(有相关性)Correlations:Oxygenpurity%,Hydrocarbon%PearsoncorrelationofOxygenpurity%andHydrocarbon%=0.937P-Value=0.000相关分析的常见错误◆收集数据范围过窄◆外推法◆因果归属◆掩饰真正的相关或创造虚假的相关◆过多的集中在相关系数上10-10错误1:数据覆盖范围过窄收集的数据覆盖范围过窄X的范围越宽就会产生更佳的估算回归线。错误II:外推法在数据范围以外对相
6、关性进行外推数据范围内的关系在其他区域内不一定适用。10-11错误III:因果归属相关并不意味着因果,仅仅是两个变量间存在的关系。错误IV:曲解数据10-12掩饰真实的相关或者创造虚假的相关数据实际上是来自不同的数据来源。错误V:过多的集中于R过多的集中于相关系数上图有相关系数R≈0.7错误V(续)10-13通常,人们过于把R(或R2)值作为一个“好”的相关的依据。前面的图形说明了将数据图表化是多么重要。但是当图表(和接下来的诊断)展示一个合法的线性关系或数学模型时,我们可以做出如下结论:◆R2>
7、0.4:相关性明确存在(n>25时)◆R2>0.7:我们可以使用该关系,但必须慎重(n>9时)◆R2>0.9:可使用的关系存在◆R2>0.95:关系良好注意:这些“规则”是基于经验的主观判断。
此文档下载收益归作者所有