iris数据集的贝叶斯分类.doc

iris数据集的贝叶斯分类.doc

ID:53246086

大小:169.00 KB

页数:9页

时间:2020-04-02

iris数据集的贝叶斯分类.doc_第1页
iris数据集的贝叶斯分类.doc_第2页
iris数据集的贝叶斯分类.doc_第3页
iris数据集的贝叶斯分类.doc_第4页
iris数据集的贝叶斯分类.doc_第5页
资源描述:

《iris数据集的贝叶斯分类.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、IRIS数据集的Bayes分类实验一、实验原理1)概述模式识别中的分类问题是根据对象特征的观察值将对象分到某个类别中去。统计决策理论是处理模式分类问题的基本理论之一,它对模式分析和分类器的设计有着实际的指导意义。贝叶斯(Bayes)决策理论方法是统计模式识别的一个基本方法,用这个方法进行分类时需要具备以下条件:Ø各类别总体的分布情况是已知的。Ø要决策分类的类别数是一定的。其基本思想是:以Bayes公式为基础,利用测量到的对象特征配合必要的先验信息,求出各种可能决策情况(分类情况)的后验概率,选取后验概率最大的,或者决策风险最小的决策方式(分类方式)作为决策(分类)的结果。也就是说选取最有可能使

2、得对象具有现在所测得特性的那种假设,作为判别的结果。常用的Bayes判别决策准则有最大后验概率准则(MAP),极大似然比准则(ML),最小风险Bayes准则,Neyman-Pearson准则(N-P)等。2)分类器的设计对于一个一般的c类分类问题,其分类空间:表特性的向量为:其判别函数有以下几种等价形式:a),b)c)d)3)IRIS数据分类实验的设计ØIRIS数据集:一共具有三组数据,每一组都是一个单独的类别,每组有50个数据,每个数据都是一个四维向量。其分类空间为:表特性的向量为:Ø实验目的:利用Bayes判别准则对三组数据进行分类,希望能够尽量准确的判断出从IRIS数据集中选取的样本所属

3、的类别。Ø实验设计思路:将每个数据看作是一个具有4维特征的观察样本假设每类数据的每维都的分别服从正态分布即并且两两独立。由数理统计理论可知,样本均值和修正方差分别为和的无偏估计量,故可近似为求得和为:贝叶斯决策规则选取:由于不同维度数据两两独立,故其中:另让门限值:其中:和为所选待分类样本j类数据和i类的个数,属于先验知识。比较与门限值的大小判断样本所属类别最后计算分类的正确率Ø一、实验过程1)求取每类数据的每个分量的均值和修正方差数代码如下:sum=zeros(3,4);sd=zeros(3,4);forj=1:1:4fori=1:1:50$$fori=1:1:20$$sum(1,j)=su

4、m(1,j)+sample1(i,j);sum(2,j)=sum(2,j)+sample2(i,j);sum(3,j)=sum(3,j)+sample3(i,j);endendsum=sum/50;$$sum=sum/20;$$forj=1:1:4fori=1:1:50sd(1,j)=sd(1,j)+(sample1(i,j)-sum(1,j))^2;sd(2,j)=sd(2,j)+(sample2(i,j)-sum(2,j))^2;sd(3,j)=sd(3,j)+(sample3(i,j)-sum(3,j))^2;endendsd=sd/49;$$sd=sd/19;$$其中每类数据都有4组均

5、值和修正方差,3类数据总共12组,分别存放在sum和sd这两个3×4的矩阵中。2)用一个函数来实现分类器的功能,代码如下function[clfresult,accuracyrate]=bayesclassifier(samples,dimen,sum,sd,mode1,mode2)clfresult=zeros(dimen,2);if((mode1(1,1)~=0)&&(mode1(1,2)~=0)&&(mode1(1,3)==0))compare=[1,2];endif((mode1(1,1)~=0)&&(mode1(1,2)==0)&&(mode1(1,3)~=0))compare=[1

6、,3];endif((mode1(1,1)==0)&&(mode1(1,2)~=0)&&(mode1(1,3)~=0))compare=[2,3];endcompare1=compare(1,1);compare2=compare(1,2);class=zeros(1,3);la=zeros(1,4);lb=zeros(1,4);fori=1:1:dimenifsamples(i,5)==1class(1,1)=class(1,1)+1;endifsamples(i,5)==2class(1,2)=class(1,2)+1;endifsamples(i,5)==3class(1,3)=clas

7、s(1,3)+1;endendn=class(1,compare2)/class(1,compare1)fori=1:1:dimenla(1,1)=1/sqrt(sd(compare1,1))*exp(-(samples(i,1)-sum(compare1,1))^2/(2*sd(compare1,1)));la(1,2)=1/sqrt(sd(compare1,2))*exp(-(samples(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。