基于k近邻的分类算法研究

基于k近邻的分类算法研究

ID:22915681

大小:190.50 KB

页数:23页

时间:2018-11-01

基于k近邻的分类算法研究_第1页
基于k近邻的分类算法研究_第2页
基于k近邻的分类算法研究_第3页
基于k近邻的分类算法研究_第4页
基于k近邻的分类算法研究_第5页
资源描述:

《基于k近邻的分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、沈阳航空航天大学ShenyangAerospaceUniversity算法分析题目:基于K-近邻分类算法的研究院系计算机学院专业计算机技术姓名学号指导教师2015年1刀数据挖掘是机器学A)领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要。K近邻算法(KNN)是基于统计的分类方法,是数据挖掘分类算法中比较常用的一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术的理论和应用研宄方法之一。本文主要研宂了K近邻分类算法。首先简要地

2、介绍了数据挖掘中的各种分类算法,详细地阐述了K近邻算法的基本原理和应用领域,其次指出了K近邻算法的计算速度慢、分类准确度不高的原因,提出了两种新的改进方法。针对K近邻算法的计算量大的缺陷,构建了聚类算法与K近邻算法相结合的一种方法。将聚类中的K-均值和分类中的K近邻算法有机结合。有效地提高了分类算法的速度。针对分类准确度的问题,提出了一种新的距离权重设定方法。传统的KNN算法一般采用欧式距离公式度量W样本间的距离。由于在实际样本数据集合中每一个属性对样本的贡献作用是不尽相同的,通常采用加权欧式距离公式。本文提出一种新的计算权重的方法。实验表明,本文提出的算法有效

3、地提高了分类准确度。最后,在总结全文的基础上,指出了有待进一步研宂的方向。关键词.•K近邻,聚类算法,权重,复杂度,准确度ABSTRACTDataminingisawidelyfieldofmachinelearning,anditintegratestheartificialintelligencetechnologyanddatabasetechnology.Ithelpspeopleextractvaluableknowledgefromalargedataintelligentlyandautomaticallytomeetdifferentpeople

4、applications.KNNisausedmethodindataminingbasedonStatistic.Thealgorithmhasbecomeoneofthewaysindataminingtheoryandapplicationbecauseofintuitive,withoutprioristatisticalknowledge,andnostudyfeatures.Themainworksofthisthesisisknearestneighborclassificationalgorithm.First,itintroducesmainl

5、yclassificationalgorithmsofdatamininganddescriptstheoreticalbaseandapplication.Thispaperpointsoutthereasonsofslowandlowaccuracyandproposestwoimprovedways.InordertoovercomethedisadvantagesoftraditionalKNN,thispaperusetwoalgorithmsofclassificationandclusteringtoproposeanimprovedKNNclas

6、sificationalgorithm.Experimentsshowthatthisalgorithmcanspeedupwhenithasafeweffectsinaccuracy.Accordingtotheproblemofclassificationaccuracy,thepaperproposesanewcalculationofweight.KNNthetraditionalmethodgenerallyusedContinentaldistanceformulameasurethedistancebetweenthetwosamples.Asth

7、eactualsampledatacollectionineveryattributeofasampleofthecontributionisnotthesame,oftenusingtheweightedContinentaldistanceformula.Thispaperpresentsacalculationofweight,thatisweightedbasedonthecharacteristicsofKNNalgorithm.AccordingtothisExperimentsonartificialdatasetsshowthatthisalgo

8、rithmcanimpr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。