粗大误差四种判别准则的比较.pdf

粗大误差四种判别准则的比较.pdf

ID:57585240

大小:205.22 KB

页数:4页

时间:2020-08-27

粗大误差四种判别准则的比较.pdf_第1页
粗大误差四种判别准则的比较.pdf_第2页
粗大误差四种判别准则的比较.pdf_第3页
粗大误差四种判别准则的比较.pdf_第4页
资源描述:

《粗大误差四种判别准则的比较.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、精品文档粗大误差四种判别准则的比较粗大误差是指在测量过程中,偶尔产生的某些不应有的反常因素造成的测量数值超出正常测量误差范围的小概率误差。含有粗大误差的数据会干扰对实验结果的分析,甚至歪曲实验结果。若不按统计的原理剔除异常值,而把一些包含较大正常误差但不属于异常值的数据舍弃或保留一些包含较小粗大误差的异常值,就会错估了仪器的精确等级。因此,系统检验测量数据是否含有粗大误差是保证原始数据的可靠及其有关计算的准确的前提。排除异常数据有四种较常用的准则,分别是拉伊达准则、格拉布斯准则、肖维勒准则和狄克逊准则。每种判别准则都

2、有其处理方法,导致用不同准则对异常值判别的结果有时会不一致。目前异常值的剔除还没有统一的准则,本文综合判别粗大误差四种方法的特点,系统归纳各种准则的应用,以便更好地发现和判别含有粗大误差的数据。1.四种判别粗大误差准则的特点1.1拉伊达准则拉伊达准则[4]是以三倍测量列的标准偏差为极限取舍标准,其给定的置信概率为99.73%,该准则适用于测量次数n>10或预先经大量重复测量已统计出其标准误差σ的情况。Xi为服从正态分布的等精度测量值,可先求得它们的算术平均值X、残差vi和标准偏差σ。若

3、Xi-X

4、>3σ,则可疑值Xi

5、含有粗大误差,应舍弃;若

6、Xi-X

7、≤3σ,则可疑值Xi为正常值,应保留。把可疑值舍弃后再重新算出除去这个值的其他测量值的平均值和标准偏差,然后继续使用判别依据判断,依此类推。1.2格拉布斯准则格拉布斯准则适用于测量次数较少的情况(n<100),通常取置信概率为95%,对样本中仅混入一个异常值的情况判别效率最高。其判别方法如下:先将呈正态分布的等精度多次测量的样本按从小到大排列,统计临界系数G(a,n)的值为G0,然后分别计算出G1、Gn:G1=(X-X1)/σ,Gn=(Xn-X)/σ(1)若G1≥Gn且G1>G0,

8、则X1应予以剔除;若Gn≥G1且Gn>G0,则Xn应予以剔除;若G1

9、Xi-X

10、>Zcσ}的前提下的(其中m是绝对值大于Ecσ的误差出现次数,P是置信概率)。设等精度且呈正态分布的测量值为Xi,若其残差vi≥Zcσ则Xi可视为含有粗大误差,此时把读数Xi应舍弃。把可疑值舍弃后再重新计算和继续使用判别依据判断,依此类推。

11、1.4狄克逊准则狄克逊准则是一种用极差比双侧检验来判别粗大误差的准则。它从测量数据的最值入手,一般取显著性水平a为0.01.此准则的特点是把测量数据划分为四个组,每个组都有相应的极端异常值统计量R1、R2的计算方法,再根据测量次数n和所对应的统计临界系数D(a,n)按照以下方法来判别:若R1>R2,R1>D(a,n),则判别X1为异常值,应舍弃;1欢迎下载。精品文档若R2>R1,R2>D(a,n),则应舍弃Xn;若R1

12、差准则的归纳实际上教学实验中的测量样本大多比较小,四种准则所要求的正态分布前提不容易满足,标准偏差会由于偏离正态分布而不准确。若不考虑具体的临界系数与置信水平,这四种准则的思维方法都可归纳为:首先计算某组测量值X1,X2,X3……Xn的平均值x、残差vi和标准偏差σ。对于第i次测量值,如果vi>kσ(2)则可判别为含有粗大误差,其中k为统计临界系数。狄克逊准则是用极差比来检测异常值的,它的统计临界系数与其他准则不具有可比性。除狄克逊准则外,作拉伊达准则、格拉布斯准则和肖维勒准则在测量次数3≤n≤250的曲线关系,见图

13、1。2.2四种判别粗大误差准则的比较讨论拉伊达准则、格拉布斯准则和肖维勒准则的对比曲线可以看出:对应于相同的测量次数,各判别准则的统计临界系数各不相同,以拉伊达准则的统计临界系数3为线索,当n=25时,格拉布斯准则(a=0.01)的统计临界系数刚好到达3以上,而当n=185时,肖维勒准则的统计临界系数刚好也到达3。因此可把总范围分为以下三个小范围。(1)在3≤n<25这个范围内,建议用狄克逊准则或格拉布斯准则(a=0.01)来判别可疑数据。在少量样品时,拉伊达准则的统计临界系数相对比较大,不易及时发现异常数据,使用它

14、会比较苛刻。而肖维勒准则的统计临界系数太小,容易剔除仅含有较大正常误差的测量值。因此用可一次性剔除多个异常值且无需求出样本平均值X、残差vi和标准偏差σ的狄克逊准则或格拉布斯准则(a=0.01)来判别可疑数据是合适的。(2)在25≤n≤185的范围内,建议用格拉布斯准则(a=0.05)或肖维勒准则来判别可疑数据。统计临界系数最大的是格拉布斯准则

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。