模式识别——用身高和或体重数据进行性别分类.doc

模式识别——用身高和或体重数据进行性别分类.doc

ID:56709727

大小:415.00 KB

页数:12页

时间:2020-07-05

模式识别——用身高和或体重数据进行性别分类.doc_第1页
模式识别——用身高和或体重数据进行性别分类.doc_第2页
模式识别——用身高和或体重数据进行性别分类.doc_第3页
模式识别——用身高和或体重数据进行性别分类.doc_第4页
模式识别——用身高和或体重数据进行性别分类.doc_第5页
资源描述:

《模式识别——用身高和或体重数据进行性别分类.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、用身高和/或体重数据进行性别分类1、【实验目的】(1)掌握最小错误率Bayes分类器的决策规则(2)掌握Parzen窗法(3)掌握Fisher线性判别方法(4)熟练运用matlab的相关知识。2、【实验原理】(1)、最小错误率Bayes分类器的决策规则如果在特征空间中观察到某一个(随机)向量x=(x1,x2,…,xd)T,已知类别状态的先验概率为:和类别的条件概率密度为,根据Bayes公式得到状态的后验概率有:基本决策规则:如果,则,将x归属后验概率最大的类别。(2)、掌握Parzen窗法对于被估计点X:其估计概率密度

2、的基本公式,设区域RN是以hN为棱长的d维超立方体,则立方体的体积为;选择一个窗函数,落入该立方体的样本数为,点x的概率密度:其中核函数:,满足的条件:;。(3)、Fisher线性判别方法Fisher线性判别分析的基本思想:通过寻找一个投影方向(线性变换,线性组合),将高维问题降低到一维问题来解决,并且要求变换后的一维数据具有如下性质:同类样本尽可能聚集在一起,不同类的样本尽可能地远。Fisher线性判别分析,就是通过给定的训练数据,确定投影方向W和阈值y0,即确定线性判别函数,然后根据这个线性判别函数,对测试数据进行

3、测试,得到测试数据的类别。线性判别函数的一般形式可表示成  ,其中根据Fisher选择投影方向W的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,用以评价投影方向W的函数为:    上面的公式是使用Fisher准则求最佳法线向量的解,该式比较重要。另外,该式这种形式的运算,我们称为线性变换,其中式一个向量,是的逆矩阵,如是d维,和都是d×d维,得到的也是一个d维的向量。  向量就是使Fisher准则函数达极大值的解,也就是按Fisher准则将d维X空间投影到一维Y空间的最佳投

4、影方向,该向量的各分量值是对原d维特征向量求加权和的权值。以上讨论了线性判别函数加权向量W的确定方法,并讨论了使Fisher准则函数极大的d维向量的计算方法,但是判别函数中的另一项尚未确定,一般可采用以下几种方法确定如   或者     或当与已知时可用 当W0确定之后,则可按以下规则分类:   3、【实验内容及要求】(1)、实验对象Datasetf1.TXT女生的身高、体重数据Datasetm1.TXT男生的身高、体重数据-----训练样本集Dataset1.txt328个同学的身高、体重、性别数据Dataset2.

5、txt124个同学的身高、体重、性别数据-----测试样本集(2)基本要求:(1)用Datasetf1.TXT和Datasetm1.TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。(试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分离器进行比较)(2)试验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。4、【实验结果与分析】(1)、Bayes分类器的实验结果与分析A、对

6、于Dataset1.txt328个同学的身高、体重、性别数据的测试样本集:A1、当先验概率为:男0.5,女0.5时:身高分类错误个数:15身高分类错误率为:12.10%体重分类错误个数:15体重分类错误率为:12.10%【实验结果:】A2、当先验概率为:男0.75,女0.25时:身高分类错误个数:19身高分类错误率为:15.32%体重分类错误个数:14体重分类错误率为:11.29%B、对于Dataset2.txt124个同学的身高、体重、性别数据的测试样本集:B1、当先验概率为:男0.5,女0.5时:身高分类错误个数:

7、16身高分类错误率为:12.90%体重分类错误个数:21体重分类错误率为:16.94%【实验结果:】B2、当先验概率为:男0.75,女0.25时:身高分类错误个数:31身高分类错误率为:25.00%体重分类错误个数:35体重分类错误率为:28.23%【结果分析:】Dataset1.txt样本数据集中,男女先验概率为(0.71vs0.29);Dataset2.txt样本数据集中,男女先验概率为(0.66vs0.34)。对比实验结果,可以发现身高的分类错误率都小于体重的分类错误率,样本集越大,各个特征对应的分类错误率就越小

8、。假设先验概率为(0.5vs0.5)的分类错误率小于假设先验概率为(0.75vs0.25)的分类集,就算假设的先验概率与实际的很相近,可是结果不准确。程序框图Bayes分类器源程序实验代码:clearall;loaddatasetf1.txt;loaddatasetm1.txt;%样本的分析figure;fori=1:250if(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。