基于改进加权贝叶斯分类算法在空间数据中应用

基于改进加权贝叶斯分类算法在空间数据中应用

ID:32748188

大小:60.46 KB

页数:10页

时间:2019-02-15

基于改进加权贝叶斯分类算法在空间数据中应用_第1页
基于改进加权贝叶斯分类算法在空间数据中应用_第2页
基于改进加权贝叶斯分类算法在空间数据中应用_第3页
基于改进加权贝叶斯分类算法在空间数据中应用_第4页
基于改进加权贝叶斯分类算法在空间数据中应用_第5页
资源描述:

《基于改进加权贝叶斯分类算法在空间数据中应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于改进加权贝叶斯分类算法在空间数据中应用摘要:朴素贝叶斯算法是一种简单而高效的分类算法,但它的属性独立性假设,影响了它的分类性能。针对这个问题,提出一种基于属性约简的PLS加权朴素贝叶斯分类算法。该算法首先分析属性之间的相关性,通过属性约简选择一组近似独立的属性约简子集,提出改进的偏最小二乘回归加权朴素贝叶斯分类算法,实验结果表明,改进算法具有较高的分类准确度。并将改进的算法应用于边坡识别问题中。Abstract:Naivebayesianalgorithmisasimpleandeffectiveclassificationalgorithm,butitsattributeindepend

2、encehypothesis,influenceitsclassificationperformance.Accordingtothisproblem,thepaperproposesakindofattributereductionbasedonPLSweightedsimplebayesianclassificationalgorithm.Thisalgorithmfirstlyanalyzestherelationshipbetweenattribute,throughattributereductionchooseasetofapproximateindependentattribut

3、ereductionsubset,putforwardtheimprovementofthepartialleast-squaresregressionweightedsimplebayesianclassificationalgorithm,experimentalresuItsshowthattheimprovedalgorithmhashigherclassificationaccuracy・Andtheimprovedalgorithmisappliedtoslopidentification.关键词:加权朴素贝叶斯分类;属性约简;偏最小二乘回归;边坡识别Keywords:Weight

4、edNaiveBayes;attributereduction;partialleastsquares;slopeidentification中图分类号:TP391文献标识码:A文章编号:1006-4311(2012)36-0201-030引言朴素贝叶斯分类器(NaiveBayesianClassifier,NBC)是一种简单而有效的概率分类方法,由于其计算高效、精确度高,并具有坚定的理论基础得到了广泛应用。然而,朴素贝叶斯分类方法基于条件独立性假设,即假设一个属性对给定类的影响独立于其他属性,而这在现实问题中往往并不成立。文献[1]给出了基于偏最小二乘回归(PLS)的属性求解算法。该算法用回

5、归系数度量了条件属性与决策属性之间的相关程度。但忽略了冗余属性对回归分析的影响,为此,本文在分析属性相关性度量的基础上,通过属性约简的方法找出一组最近似独立的属性约简子集,从而删除冗余属性和无关属性,弱化了朴素贝叶斯分类器的独立性假设条件的限制。在约简的数据集上,在条件属性与决策属性之间建立基于属性约简的偏最小二乘回归方程,以回归系数作为条件属性的权值,进一步改进朴素贝叶斯的分类测试能力。并通过实验与朴素贝叶斯分类器进行比较。1朴素贝叶斯分类及加权贝叶斯分类模型1.1朴素贝叶斯分类算法贝叶斯分类是一种基于统计方法的分类模型,贝叶斯定理是贝叶斯学习方法的理论基础。朴素贝叶斯分类模型在贝叶斯定理的

6、基础上,通过条件独立性假设,降低计算开销,预测未知数据样本属于最高后验概率的类。设每个数据样本用一个n维特征向量X={xl,x2,…,xn}表示,分别描述对n个属性Al,A2,…人“样本的n个度量。假定有m个类Cl,C2,•••,Cm,给定一个未知的数据样本X,分类法将预测X属于具有最高后验概率的类。即朴素贝叶斯分类将未知的样本分配给类Ci,当且仅当P(Ci

7、X)>P(Cj

8、X),1?燮j?燮m,jHi,这样,最大化P(Ci

9、X)o其中P(Cj

10、X)最大的类Ci称为最大后验假定。根据贝叶斯定理得:P(Ci

11、X)=・。由于P(X)为常数,只需P(X

12、Ci)P(Ci)最大即可。给定具有许多属性的数

13、据集,计算P(X

14、Ci)的开销可能非常大。为降低计算P(X

15、Ci)的开销,可以做类条件独立的朴素假设。给定样本的类标号,假设属性值相互条件独立,即在属性间,不存在依赖关系。这样,P(X

16、Ci)=HP(xk

17、Ci),概率P(xl

18、Ci),P(x2

19、Ci),…,P(xn

20、Ci)可以由训练样本估值。为对未知样本X分类,对每个类Ci,计算P(X

21、Ci)P(Ci)o样本X被指派到类Ci,当且仅当P(X

22、Ci

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。