《样本特征数》PPT课件.ppt

《样本特征数》PPT课件.ppt

ID:51993411

大小:206.00 KB

页数:25页

时间:2020-03-27

《样本特征数》PPT课件.ppt_第1页
《样本特征数》PPT课件.ppt_第2页
《样本特征数》PPT课件.ppt_第3页
《样本特征数》PPT课件.ppt_第4页
《样本特征数》PPT课件.ppt_第5页
资源描述:

《《样本特征数》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章样本特征数第一节集中位置量数一、定义:集中位置量数:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。二、集中位置量数的种类(一)众数一组数据中出现频数最多的变量值,称为众数mode,Mo表示。众数主要用于测度分类数据的集中趋势,一般情况下载数据量较大的情况下,众数才有意义。例:计算“饮料品牌”的众数Excel数据五种不同可乐的比例.xls。(二)中位数和分位数1、中位数(1)定义:一组数据排序后处于中间位置上的变量值,称为中位数(median),用Me表示。(2)作用:主要用于

2、测度顺序数据或数值型数据的集中趋势。(1)计算方法中位数位置=(n+1)/2若n为奇数时正好是位于正中间的那个变量值;n为偶数时则是正中间那两个变量值得平均值。例:对于数值型数据60.263.563.866.268.168.869.9则,第四个数66.2为中位数。对于数值型数据10.210.3510.8410.6810.9211.0511.2111.38则中位数=(10.68+10.92)/2=10.82、四分位数(1)定义:一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分位点

3、。(2)计算方法:设下四分位数为QL,上四分位数为QU,根据四分位数的定义有:QL位置=n/4QU位置=3n/4例4.1.1:在某城市随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:元)计算人均月收入的四分位数。数据如下:1500;750;780;1080;850;960;2000;1250;1630首先进行排序:750;780;850;960;1080;1250;1500;1630;2000解:QL位置=n/4=2.25,即QL在第二个数值(780)和第三个数(850)之间0.2

4、5的位置上,因此QL=780+(850-780)×0.25=797.5QU=3n/4=3×9/4=6.75,即在第六个数值(1250)和第七个数(1500)之间0.75的位置上,因此QL=1250+(1500-1250)×0.75=1437.5(3)作用在排序数据中,至少有25%的数据将小于QL,至少有75%的数据将小于QU,而至少有25%将大于QU,大约有一半的数据在QL与QU之间。通过四分位数我们可以对数据的分布有一个大概的了解。..Excel数据计算四分位数数据.xls(三)平均数(m

5、ean)(1)定义:一组数据相加后除以数据的个数而得到的结果,称为平均数,也称均值。意义:平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,只适用于数值型数据。(2)种类ⅰ简单的平均数(simplemean).Excel数据100名学生1500米成绩.xlsⅱ加权平均数(weightedmean)根据分组数据计算平均数。设原始数据被分成k组,各组的组中值分别用M1,M2,…Mk表示,各组变量出现的频数分别用f1,f2,…fk表示,∑fi为样本容量,则加权平均数的计算公式为:例:..

6、Excel数据加权平均数的计算.xlsⅲ几何平均数(geometricmean)①计算公式:②作用几何平均数主要用于比率的计算,在实际应用中,几何平均数主要用于计算平均增长率。例4.1.2:某水泥厂生产企业1999年水泥为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年比2001年相比增长率为20%。求各年的年平均增长率。解:由公式可得114.91-100%=14.91%第二节离中位置量数◆集中趋势是数据分布的一个特征,它所反映的是各变量

7、向其中心值的聚集程度。而各变量之间差异程度如何,则需要考察数据的分散程度。◆数据的分散程度是数据分布的另一个重要特征,它所反映的是各变量值远离其中心值得程度,因此也称离中趋势。一、分类数据:异众比率◆定义:非众数组的频数占总频数的比率,称异众比率(variationratio)。用Vr表示。◆异众比的计算公式:Vr=(∑fi-fm)/∑fi=1-fm/∑fi∑fi表示变量值的总频数,fm表示众数组的频数。◆例4.2.1:五种不同饮料的异众比。分类数据的整理.xlsVr=(50-15)50=0.7

8、=70%说明在调查的50人中购买其他品牌饮料的人数占70%,异众比较大,因此,用“可口可乐”来代表消费者购买饮料品牌的状况,其代表性不是很好。二、顺序数据:四分位差◆定义:上四分位数与下四分位之差,称为四分位差(quartiledeviation)。用Qd表示。◆计算公式:Qd=Qu-QL◆例4.2.2:利用上述公式计算第一节中家庭人均月收入的四分位差。根据例4.1.1:QL=797.5,Qu=1437.5四分位差为:Qd=1437.5-797.5=640◆意义:四分位差反映了中间50%数据的离

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。