2.2.1 用样本的频率分布估计总体分布

2.2.1 用样本的频率分布估计总体分布

ID:21528128

大小:3.71 MB

页数:44页

时间:2018-10-19

上传者:U-2517
2.2.1 用样本的频率分布估计总体分布_第1页
2.2.1 用样本的频率分布估计总体分布_第2页
2.2.1 用样本的频率分布估计总体分布_第3页
2.2.1 用样本的频率分布估计总体分布_第4页
2.2.1 用样本的频率分布估计总体分布_第5页
资源描述:

《2.2.1 用样本的频率分布估计总体分布》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

2.2用样本估计总体2.2.1用样本的频率分布估计总体分布 我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 为了节约生活用水,某市政府计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费.(1)如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?(2)为了较合理地确定这个标准,你认为需要做哪些工作? 3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2这些数字告诉我们什么信息?假设通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表: 很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t,其他在0.2t~4.3t之间.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布情况. 1.通过实例体会分布的意义和作用.2.会列频率分布表,画频率分布直方图、频率分布折线图和茎叶图.(重点)3.通过实例体会频率分布直方图、频率分布折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.(难点) 频率分布表和频率分布直方图(1)求极差(一组数据中的最大值与最小值的差).例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1t.(2)决定组距与组数.设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1.1 为方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差÷组距=4.1÷0.5=8.2,因此可以将数据分为9组,这个组数是比较合适的,于是取组距为0.5,组数为9. (4)列频率分布表.计算各小组的频率,作出下面的频率分布表.(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)(3)将数据分组.以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5]. 列频率分布表:分组频数累计频数频率[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计48152225146420.040.080.150.220.250.140.060.041001.00频率=样本容量频数注意:频数的合计应是样本容量,频率合计应是1.0.02频率/组距0.080.160.300.440.500.280.120.080.04频率分布表一般分“分组”,“频数累计”(可省),“频数”,“频率”,“频率/组距”五列,最后一行是合计 (5)画频率分布直方图.根据频率分布表可以得到如图所示的频率分布直方图:月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234注意横坐标与纵坐标 注意(2)纵坐标为频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图来反映样本的频率分布. 【总结提升】频率分布直方图画法:第一步:画平面直角坐标系.第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形. 宽度:组距高度:频率组距月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?各小长方形的面积之和是否为定值?各组的频率在图中哪里显示出来?频率组距各小长方形的面积=组距=频率.各小长方形的面积之和为1. 考点一频率分布直方图 1 宽度:组距高度:频率组距月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?各小长方形的面积之和是否为定值?各组的频率在图中哪里显示出来?频率组距各小长方形的面积=组距=频率.各小长方形的面积之和为1. (2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性.频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.(1)居民月均用水量的分布是呈“山峰”状的,而且是“单峰”的; 【即时练习】 考点一 如果市政府希望85%以上的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民月用水量在3t以下,标准可定为3t.在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?在实际中,对统计结论是需要进行评价的.2统计评价 有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?【即时训练】 【解析】(1)组距为3分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027 频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.070(2)18.521.524.527.530.533.5(3)56% 频率分布直方图如下:月均用水量/t0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.o频率/组距 利用样本频率分布对总体分布进行相应估计:(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?(2)样本容量越大,这种估计越精确.(3)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线——总体密度曲线. 总体密度曲线月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比).o频率/组距 总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总体分布的工具.用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的百分比. 茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39. 茎叶图甲乙01234525541616794908463683891叶就是从茎的旁边生长出来的数,表示得分的个位数字茎是指中间的一列数,表示得分的十位数字 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定. 茎叶图的优、缺点:在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长. 某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.60成绩/分【即时训练】 【解析】选B.由频率分布直方图,计算出低于60分的人数的频率(前两个小矩形的面积)P=20×0.005+20×0.01=0.3,则总人数为15÷0.3=50,故选B. 1.将样本容量为100的数据按从大到小的顺序分为8组如下表:912131514141310频数87654321组号则第三组的频率为()A.0.14B.1/14C.0.03D.3/14A B D 5.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示.则甲、乙两班的最高成绩分别是______,______.从图中看______班的平均成绩较高.9692乙 6.某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表.(2)画出频率分布直方图.(3)估计年龄在32岁~52岁的知识分子所占的比例约是多少. 【解析】(1)极差为67-28=39,取组距为5,分为8组.分组频数频率[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67]30.06合计501.00样本频率分布表: (2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32岁~52岁的知识分子约占70%.频率/组距 总体分布数据较多时数据较少时样本的频率分布估计频率分布表频率分布直方图茎叶图 即使一次次的跌倒,我们依然成长.跌倒只是我们成长道路上的一个小小的插曲.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭