朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm

朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm

ID:25834903

大小:61.00 KB

页数:7页

时间:2018-11-23

朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm_第1页
朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm_第2页
朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm_第3页
朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm_第4页
朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm_第5页
资源描述:

《朴素贝叶斯分类算法的改进研究research onnaive bayesian classifieralgorithm》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、朴素贝叶斯分类算法的改进研究ResearchonNaiveBayesianClassifierAlgorithm-->朴素贝叶斯分类算法的改进研究ResearchonNaiveBayesianClassifierAlgorithm摘要NBC模型具有计算简单,分类性能优越等特点,而受到各类科学工的青睐,成为目前应用最广泛的分类器之一关于其应用和研究也成为一个热点。然而,在实际应用中,条件独立性的假设难以得到满足,削弱NBC模型的分类效果。本文针对不同的数据类型分别从特征变量的提取和特征变量的筛选的角度提出了朴素贝叶斯分类器的两种改进模型:基于费希尔

2、判别的朴素贝叶斯分类模型和基于R型聚类的朴素贝叶斯分类模型。基于费希尔判别的朴素贝叶斯分类模型FI-NBC,利用费希尔判别提取独立特征的性质,对原来的属性集做费希尔判别,萃取判别式,构建近似满足独立性假设的新属性集,使用NBC模型对新的属性集进行分类。通过UCI数据集上的对照实验,结果表明:FI-NBC分类模型相对于NBC模型而言具有较好的分类效果。基于相关性测度和R型聚类的朴素贝叶斯分类模型RC-NBC,首先利用本文定义的相关性测度作为属性间的相似系数对R型聚类做了改进,利用改进的R型聚类方法将原属性集划分为若干子集,从每个子集中挑选典型属性构

3、建新的属性集,用NBC模型对新的数据集进行分类,实验结果表明提高了分类准确率。关键词:数据挖掘;朴素贝叶斯分类;费希尔判别;R型聚类;互信息[Abstract]NaïveBayesianclassifierptionofconditionattributesindependentofeachother,plestructure,highclassificationaccuracy,littleconsumptionofrunningtimeandstoragespaceandsolidtheoreticalfoundationofmat

4、hematics,isoneoftheefficientclassifiers.Therefore,theresearchandapplicationofnaiveBayesianclassifierispopularnoanypracticalcases,theperformanceofnaïvebayesianclassifierisaffectedfortheviolationoftheassumptionofconditionalindependence.Tprovedclassifiers,naivebayesianclass

5、ifierbasedonfisherdiscriminantanalysisandnaivebayesianclassifierbasedonmutualinformationandR-typeclusteringanalysesareproposedfromtheperspectiveoffeatureselectionfordatasetsofdifferenttypes.NaïveBayesianclassifierbasedonfisherdiscriminantanalysis,FI-NBC,constructsnetheor

6、iginalpropertysetusingfisherdiscriminantanalysis.Naivebayesianclassifierisbuiltontheneeetstheassumptionofconditionalindependenceapproximately.TheexperimentalresultsonUCIdatasetsshoanceofFI-NBCisbetterthannaivebayesianclassifieronthefeasibledataset.Naïvebayesianclassifier

7、basedonmutualinformationandR-typeclusteringanalyses,RC-NBC,changestheR-typeclusteringbymeasuresthecorrelationofpropertiesthroughmutualinformation.TheoriginattributesetisclassifiedintosomeindependentattributesubsetsbythchangedR-typeclustering.Selectonetypicalattributesfromeach

8、sub-constructtoformaneentsonUCIdatasetsshoanceofRC-NBCimprovessignif

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。