北大应用多元统计分析课件第五章.ppt

北大应用多元统计分析课件第五章.ppt

ID:58821897

大小:1.04 MB

页数:90页

时间:2020-10-01

北大应用多元统计分析课件第五章.ppt_第1页
北大应用多元统计分析课件第五章.ppt_第2页
北大应用多元统计分析课件第五章.ppt_第3页
北大应用多元统计分析课件第五章.ppt_第4页
北大应用多元统计分析课件第五章.ppt_第5页
资源描述:

《北大应用多元统计分析课件第五章.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、应用多元统计分析第五章判别分析1第五章判别分析目录§5.1距离判别§5.2Bayes(贝叶斯)判别法及广义平方距离判别法§5.3Fisher(费歇)判别2第五章判别分析什么是判别分析判别分析是用于判断样品所属类型的一种统计分析方法.在生产、科研和日常生活中经常遇到如何根据观测到的数据资料对所研究的对象进行判别归类的问题.例如:在医学诊断中,一个病人肺部有阴影,医生要判断他是肺结核、肺部良性肿瘤还是肺癌.这里肺结核病人、良性瘤病人、肺癌病人组成三个总体,病人来源于这三个总体之一,判别分析的目的是通过测得病人的指标(阴影的大小,

2、边缘是否光滑,体温多少……)来判断他应该属哪个总体(即判断他生什么病).3第五章判别分析什么是判别分析在气象学中,由气象资料判断明天是阴天还是晴天,是有雨还是无雨.在市场预测中,由调查资料判断下季度(或下个月)产品是畅销、平常或滞销.股票持有者根据某种股票近期的变化情况判断此种股票价格下一周是上升还是下跌.在环境科学中,由气象条件,污染浓度等判断该地区是属严重污染,一般污染还是无污染.在地质勘探中,由岩石标本的多种特征判断地层的地质年代,是有矿还是无矿,是富矿还是贫矿.在体育运动中,由运动员的多项运动指标来判定游泳运动员的"苗子"是适

3、合练蛙泳,仰泳还是自由泳等4第五章判别分析什么是判别分析判别分析是应用性很强的一种多元统计方法,已渗透到各个领域.但不管是哪个领域,判别分析问题都可以这样描述:设有k个m维总体G1,G2,…,Gk,其分布特征已知(如已知分布函数分别为F1(x),F2(x),…,Fk(x),或知道来自各个总体的训练样本).对给定的一个新样品X,我们要判断它来自哪个总体.在进行判别归类时,由假设的前提,判别的依据及处理的手法不同,可得出不同判别方法.如距离判别,Bayes判别,Fisher判别或典型判别,逐步判别,序贯判别等.本章介绍几个常用的判别方法

4、.5第五章§5.1距离判别法距离判别的基本思想是:样品和哪个总体距离最近,就判它属哪个总体.距离判别也称为直观判别法.我们在具体讨论距离判别法之前,应给出合理的距离的定义.6第五章§5.1距离判别法马氏距离已知有两个类G1和G2,比如G1是设备A生产的产品,G2是设备B生产的同类产品.设备A的产品质量高(如考察指标为耐磨度X),其平均耐磨度μ1=80,反映设备精度的方差σ2(1)=0.25;设备B的产品质量稍差,其平均耐磨度μ2=75,反映设备精度的方差σ2(2)=4.今有一产品X0,测得耐磨度x0=78,试判断该产品是哪一台设

5、备生产的?直观地看,x0与μ1(设备A)的绝对距离近些,按距离最近的原则是否应把该产品X0判断为设备A生产的?7第五章§5.1距离判别法马氏距离考虑一种相对于分散性的距离.记X0与G1,G2的相对平方距离为d21(x0)或d22(x0),则:d21(x0)===16=42d22(x0)===2.25=1.52因为d2(x0)=1.5<4=d1(x0),按这种距离准则应判X0为设备B生产的.(x0-μ1)2σ2(1)(78-80)20.25(x0-μ2)2σ2(2)(78-75)248第五章§5.1距离判别法马氏距离设备B生产

6、的产品质量较分散,出现x0为78的可能性仍较大;而设备A生产的产品质量较集中,出现x0为78的可能性较小.判X0为设备B的产品更合理.这种相对于分散性的距离就是本节介绍的马氏距离.9第五章§5.1距离判别法马氏距离一般地,我们假设G1的分布为N(μ(1),σ21),G2的分布为N(μ(2),σ22),则利用相对距离的定义,可以找出分界点μ*(不妨设μ(2)<μ(1)),当μ(2)

7、总体判别归类令:(μ*=79为到两总体相对距离相等的分界点)x0=78<μ*=79判x0∈G2.11第五章§5.1距离判别法马氏距离定义5.1.1(马氏距离)设总体G为m维总体(考察m个指标),均值向量为μ=(μ1,μ2,…,μm)′,协方差阵为Σ=(σij),则样品X=(x1,x2,…,xm)′与总体G的马氏距离定义为12第五章§5.1距离判别法多总体样本特征量设有k个总体Gi(i=1,…,k),已知来自Gi(i=1,..,k)的训练样本为:其中ni是取自Gi的样品个数,则均值向量μi的估计量为13第五章§5.1距离判别法多总

8、体样本特征量总体Gi的协方差阵Σi的估计Si为并称St为组内协差阵.称为组内离差阵,14第五章§5.1距离判别法多总体样本特征量当假定Σ1=…=Σk=Σ时,反映分散性的协方差阵Σ的估计S为并称S

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。