欢迎来到天天文库
浏览记录
ID:48751556
大小:827.61 KB
页数:65页
时间:2020-01-21
《统计基础十一:相关关系与回归分析.pptx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、相关关系与回归分析(Correlation&Regression)您将如何处理下述情况?您的公司生产高级冰淇淋。您们正着手减少装料量不足的纸盒数量。装料机有一个称重单元,可跟踪流过桶的冰淇淋量。如果计算机控制器测定到装量过低,它将向送料螺杆马达发出一个命令,以增加送料螺杆每分钟转数(rpm)。如果装量过高,计算机将发出命令降低送料螺杆的每分钟转速(rpm)。您怀疑计算机控制器没有合适地指定装量指标,它是纸盒装料量不足的原因。如果您可以找到送料螺杆转速和已装料的纸盒重量之间的关系,您就可以用它来更改控制器程序并减少装料量不足的纸盒数量。1.您
2、需要什么数据?2.您应怎样显示它?3.您怎样使用显示出的曲线来预测装料纸盒的重量?X(输入)Y(输出)请回忆前面学习的基础课程:散点图显示输出(Y)是如何随输入(X)变化的。如果X与Y没有关系,这些点将随机分布在图上。散点图:显示X和Y之间的关系目的:练习识别输入和输出变量并练习使用散点图。时间:2分钟要求:填写图中的标签,完成表格,并回答有关冰淇淋数据的问题。练习:识别X和Y202530260270280290300X=Y=样本送料螺杆纸盒重量(每分钟转数)(克)......232829024202592526280练习:答案问题1:特性
3、问题2:每分钟27转时的重量大约285克。回归:量化X和Y之间的关系01234567891012345678X(输入)Y(输出)回归分析生成一条直线,量化X和Y之间的关系。回归中X或Y的合适数据数据类型Minitab格式离散序数秩1,2,...,5数字离散计数或百分比缺陷数缺陷率%数字连续数量周期数字量化关系的好处预测方程式代入X值可用于预测未来的Y控制如果X可控制,您可操纵过程情况以避免不理想的结果并/或产生理想的结果小心!超出数据范围的外推是危险的203040250300350送料螺杆转速(rpm)纸盒重量(克)?????X>30时X和
4、Y之间是什么关系?数据范围外推法示例一位教授要他的学生解释回归线上标记为“星号”的点。下面是最好的答案:“很明显,您不能在一段为负数的时间内砍伐一棵树。”“树太小了,它可能在您砍它之前两秒钟就已倒下。”“这种尺寸的树,您用脚就可以踢倒它。”正确答案是什么呢?树的直径(英寸)用链锯砍伐树木的时间(秒)051015051015XY残差2残差7观测的Y(实际的Y)预测的Y(拟合的或预计的Y—位于直线上)使直线贴近数据:残差如何确定回归方程式最小二乘法(最小平方法)要确定回归方程式,应使所有点到直线的距离的平方总和最小。找到一条直线,使每个数据
5、点到该直线的垂直距离的平方尽可能小(“最小”)。换言之…使所有残差的平方最小。回归使用最小二乘法来确定最佳直线:使用数据(X和Y两种值)来求b0和b1值。b0和b1值建立方程式。使用Minitab。最小二乘法1.测量点到直线的垂直距离2.取这些数字的平方3.将平方距离相加4.查找总和最小的直线关于术语的一点注释下列术语可经常交换使用:回归方程式*回归线预测方程式预测线拟合直线或拟合*模型练习1:绘制一个含回归线的图目的:练习使用Minitab绘制一个含回归线的图,并解释结果。时间:10分钟数据:打开文件[FoilSeal.mtw]背景:您的
6、公司在8盎司塑料杯中装满果汁,计划在自动贩卖机中销售。您负责密封过程。一条比杯子直径稍宽的金属薄片被拉过杯子。下侧涂有热敏粘合剂。装有热压盘的压力机下落,使粘合剂生效,并与杯子边缘接触。杯子边缘多余的薄片被剪掉。练习1:绘制一个含回归线的图(续)您试图减少有缺陷的密封数目;并且想知道密封强度与压盘温度是否有关。当前的操作规格允许压盘温度在华氏200到300度(°F)之间变化。对这种高产量的过程每半小时记录一次测量值。每天12小时一班(从上午6点到下午6点),从周一到周五。您获得了过去两周内每30分钟时间间隔的密封强度(g/cm2)和压盘温度
7、(°F)数据(n=240):练习1:绘制一个含回归线的图(续)要求:回答下列问题:1.X是什么,它是什么类型的数据?它是否可控制?2.Y是什么,它是什么类型的数据?3.使用Minitab绘制一个含回归线的散点图:Stat>Regression>FittedLinePlot练习1:绘制一个含回归线的图(续)4.截距是多少?斜率是多少?该斜率表示什么含义?5.当压盘温度为250°F时,您预期可达到多大的密封强度?6.如果理想的密封强度是205g/cm2,您应保持压盘加热的温度是多少?7.R-sq值是多少?练习1:答案1:X=温度(°F);连续数
8、据;它是可控制的2:Y=密封强度(g/cm2);连续数据3:Minitab输出:200250300175185195205215225温度(F)密封强度(g/cm2)Y=101.
此文档下载收益归作者所有