数据处理ppt课件.ppt

数据处理ppt课件.ppt

ID:50567371

大小:2.33 MB

页数:56页

时间:2020-03-14

数据处理ppt课件.ppt_第1页
数据处理ppt课件.ppt_第2页
数据处理ppt课件.ppt_第3页
数据处理ppt课件.ppt_第4页
数据处理ppt课件.ppt_第5页
资源描述:

《数据处理ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据处理1数据处理测量结果的统计检验在测量中,由于多种因素影响,使得一组测定值内各个测定值之间,或一组测定值与另一组测定值之间存在差异。这种差异是由测定过程中的随机因素影响造成的,还是由于固定因素的作用结果,实验者可借助统计检验进行区分、判断。显著性水平、置信度和置信区间统计检验是由样本测定值来推断总体的特征。统计检验的可靠程度用显著性水平和置信度P表示,P=1。如有一系列等精度测定值,从中任意抽取一数据,该数据的值落在1.96区间区间的概率为95%。2在数理统计中,这个区间称为置信区间,概率95%称为置信度,而显著性水平为5%,即(100-95)%。现在,一般采用置信度为9

2、5%~99%,显著性水平为5%~1%,即落在置信区间,来表示测量结果。(1.96)~(3)为了对有限次数测量结果的平均值作出估计,英国化学家和统计学家W.S.Gosset提出用统计量t来进行检验,t的定义为此时随机误差不服从正态分布而服从t分布,t值不仅随概率而异,还与自由度f(f=n-1)有关。3在有限次测定中,只能得到和,即只能用和分别估计、,这样会引入附加的不确定性。表示置信区间的前的系数(置信系数)1.96和3等必须改用t分布表中的临界值(t分布置信系数)。用代表置信系数后,测定结果可用下列通式表示。已知自由度f=n-1和(一般取=0.05),由t分布表查得t值(

3、见实验教材),再计算出,最后表示出如以上通式的测量结果。4在一组测定值中,常发现其中某个测定值明显地比其余的测定值大得多或小得多。对于这个测定值首先必须设法探寻其出现的原因。在判明其是否合理之前,既不能轻意保留,亦不能随意舍弃,必要时需做重复实验。由于各种原因(如粗心大意等),若不能找出这个测定值的确切来源,可借助统计检验来决定取舍。异常数据的剔除5●“4”检验6●3准则根据概率理论,如果仅由随机因素引起误差(误差服从正态分布)大于的测定值,其出现的概率小于0.3%。一般进行少数几次测定中出现偏差大于的测定值的可能性极小。若竟然出现了,它很大可能是不正确的,自然就不能将其看成是由于随机因

4、素的作用引起的。实验者就有理由将该测定值视为异常数据,将其舍弃,或作进一步研究。大于的测量值肯定含有过失误差,应剔除。3337合理误差范围的选择:因为误差服从正态分布,所以大误差出现的概率小,小误差出现的概率大。从这一点出发,我们可以定出一个概率的最小范围,凡误差出现的概率超出这个范围的,就可以认为它不属于随机误差。目前大部分选择3作为合理的误差范围。从下述积分可知8随机误差的绝对值≤3的概率为99.73%,而>3的概率仅为0.27%。这相当于在370次测量中,误差>3的机会(可能性)只有一次。平时试验中,测量次数一般不会超过20次,因此误差>3的机会可以忽略不计。于是,凡观测值误差>3时

5、,可以推断,这种误差已不属于随机误差,很可能有系统误差或过失误差在起作用。因此,凡是真误差(或残差)其绝对值>3的xi均应舍弃。9并以作为新的标准,再检查是否有某个测量值含有粗差,剩余误差大于3者应剔除。310试验得到15个观测值为(按由小到大次序):-1.40,-0.44,-0.30,-0.24,-0.22,-0.13,-0.05,0.06,0.10,0.18,0.20,0.39,0.48,0.63,1.01。试判断x1=-1.40和x15=1.01是否为异常数据。示例:解:计算计算

6、x1-

7、=

8、-1.40-0.018

9、=1.418,

10、x15-

11、=

12、1.01-0.018

13、=0.992;计

14、算3=3×0.551=1.653;④判断:因为1.418和0.992均小于3=1.653,所以x1和x15均应保留,它们不是异常数据。11注意3准则较简单,但当测量次数n10时,即使存在过失误差也可能判别不出来,因此当测量次数叫少时,几乎不适用,当n30时较为适宜。12●Grubbs方法Grubbs方法的理论推导严密,是国家标准GB4883-85推荐的较好的判别过失误差的准则。13示例:14●t检验t检验法用于测定平均值和标准值相比较,或用于不同实验者、不同实验方法测定的平均值之间的比较。从统计观点看,同一总体中抽出的样本,由有限次测定值组成一组数据,每组数据的平均值,尽管在数值上并不

15、一定相等,但彼此之间的差异在给定的显著性水平下,应该是不显著的。15对于一组测量结果的平均值与标准值(或其他文献报道的公认值)的比较,如果t检验得出的计算统计量t大于相应自由度和显著性水平的临界值t(f),这表明在自由度f下没有满足平均值属于同一总体时P[

16、t

17、>t(f)]

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。