欢迎来到天天文库
浏览记录
ID:25834903
大小:61.00 KB
页数:7页
时间:2018-11-23
《朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、朴素贝叶斯分类算法的改进研究ResearchonNaiveBayesianClassifierAlgorithm-->朴素贝叶斯分类算法的改进研究ResearchonNaiveBayesianClassifierAlgorithm摘要NBC模型具有计算简单,分类性能优越等特点,而受到各类科学工的青睐,成为目前应用最广泛的分类器之一关于其应用和研究也成为一个热点。然而,在实际应用中,条件独立性的假设难以得到满足,削弱NBC模型的分类效果。本文针对不同的数据类型分别从特征变量的提取和特征变量的筛选的角度提出了朴素贝叶斯分类器的两种改进模型:基于费希尔
2、判别的朴素贝叶斯分类模型和基于R型聚类的朴素贝叶斯分类模型。基于费希尔判别的朴素贝叶斯分类模型FI-NBC,利用费希尔判别提取独立特征的性质,对原来的属性集做费希尔判别,萃取判别式,构建近似满足独立性假设的新属性集,使用NBC模型对新的属性集进行分类。通过UCI数据集上的对照实验,结果表明:FI-NBC分类模型相对于NBC模型而言具有较好的分类效果。基于相关性测度和R型聚类的朴素贝叶斯分类模型RC-NBC,首先利用本文定义的相关性测度作为属性间的相似系数对R型聚类做了改进,利用改进的R型聚类方法将原属性集划分为若干子集,从每个子集中挑选典型属性构
3、建新的属性集,用NBC模型对新的数据集进行分类,实验结果表明提高了分类准确率。关键词:数据挖掘;朴素贝叶斯分类;费希尔判别;R型聚类;互信息[Abstract]NaïveBayesianclassifierptionofconditionattributesindependentofeachother,plestructure,highclassificationaccuracy,littleconsumptionofrunningtimeandstoragespaceandsolidtheoreticalfoundationofmat
4、hematics,isoneoftheefficientclassifiers.Therefore,theresearchandapplicationofnaiveBayesianclassifierispopularnoanypracticalcases,theperformanceofnaïvebayesianclassifierisaffectedfortheviolationoftheassumptionofconditionalindependence.Tprovedclassifiers,naivebayesianclass
5、ifierbasedonfisherdiscriminantanalysisandnaivebayesianclassifierbasedonmutualinformationandR-typeclusteringanalysesareproposedfromtheperspectiveoffeatureselectionfordatasetsofdifferenttypes.NaïveBayesianclassifierbasedonfisherdiscriminantanalysis,FI-NBC,constructsnetheor
6、iginalpropertysetusingfisherdiscriminantanalysis.Naivebayesianclassifierisbuiltontheneeetstheassumptionofconditionalindependenceapproximately.TheexperimentalresultsonUCIdatasetsshoanceofFI-NBCisbetterthannaivebayesianclassifieronthefeasibledataset.Naïvebayesianclassifier
7、basedonmutualinformationandR-typeclusteringanalyses,RC-NBC,changestheR-typeclusteringbymeasuresthecorrelationofpropertiesthroughmutualinformation.TheoriginattributesetisclassifiedintosomeindependentattributesubsetsbythchangedR-typeclustering.Selectonetypicalattributesfromeach
8、sub-constructtoformaneentsonUCIdatasetsshoanceofRC-NBCimprovessignif
此文档下载收益归作者所有