基于Ripper的增强分类方法及其应用研究

基于Ripper的增强分类方法及其应用研究

ID:37084249

大小:5.25 MB

页数:66页

时间:2019-05-17

基于Ripper的增强分类方法及其应用研究_第1页
基于Ripper的增强分类方法及其应用研究_第2页
基于Ripper的增强分类方法及其应用研究_第3页
基于Ripper的增强分类方法及其应用研究_第4页
基于Ripper的增强分类方法及其应用研究_第5页
资源描述:

《基于Ripper的增强分类方法及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代号10532学号S1510W0619分类号TP391密级HUNANUNIVERSITY工程硕士学位论文基于Rier的增强分类方法及其应用pp研究学位申请人姓名赵寒椒培养单位湖南大学信息科学与工程学院导师姓名及职称陈佐助理教授黄伟庆研究员学科专业计算机技术研究方向数据挖掘论文提交日期2018年5月8日学校代号:10532学号:S1510W0619密级:湖南大学工程硕士学位论文基于Ripper的增强分类方法及其应用研究学位申请人姓名:赵寒枫导师姓名及职

2、称:陈佐助理教授黄伟庆研究员培养单位:湖南太学信息科学与工稈学院专业名称:计算机技术论立提交日期:2018年5月8日论立答辩日期:2018年5月18日答辩委员会主席:秦拯The-ApplicationResearchonRipperBasedEnhancedClassificationMetiiodbyZHAOHanfengB.E.XiantanUniversit2015(gy)Athesissubmitedinartialsatisfactionofpthe

3、reuirementsforthedereeofqgMasterofEngineeringinComputerTechnologyintheGraduateschoolofHunanUniversitySupervisorAssistantProfessorCHENZuoResearcherHUANGWeiin,qgApril,2018工程硕士学位论文湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果,餘了文中特别加以标注

4、引用的内容外,本论文不包含任何其饱个人或<=对本文的研究做出重要贡献_个人和集体,均集体已经发表或撰写的成果作品已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名於日期:年r月zr日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文0本学位论文属于1、保密CL在年

5、解密后适用本授权书。72、不保密Q。“w(请在以上相应方框内打V)作者签名:^日期年V月X日’导师签名日期:2^年<月》;日I基于Ripper的增强分类方法及其应用研宄摘要随着大数据与人工智能时代的到来,数据与智能在我们的生活与工作中扮演着举足一轻重角色。条技术分支数据挖掘作为大数据与人工智能应用最为广泛的,其中的数据挖掘算法的性能将直接影响数据挖掘结果。而众多数据挖掘算法中,分类算法能够在金融、医疗、营销和交通等各行各业中解决出现最多的分类问题。作为数据挖掘中最为核心内容,去提升和改进其分类算法的性能,有

6、着重要的研究意义。一对于数据挖掘技术来讲,方面大量数据中存在很多冗余、脏乱差的数据,对于这些属性的处理一,现有的些特征选取方法,并不能很好地贴合分类器的特性来进行属性筛选一。另方面,对于传统分类器,也存在着分类准确率有待提升、训练数据不平衡、过拟合等问题。一在算法运行效率方面,本文以Ripper算法为基础,提出了种贴合分类器特性的特征选取算法。统计Ripper分类器得到的输出规则结果,对于每个特征属性出现的次数进行权重累加,并设置相应的过滤阈值。当某特征属性权重低于阈值时,过滤删除此属性,循环迭代此算法已达到筛选属性的目的。一

7、在提高算法分类准确率方面,本文提出了种基于Ripper算法的增强分类算法。结合Adaboost算法框架,使用Ripper作为弱分类器。将训练集的样本按照迭代次数平均一划分一份数,对于第份数据进行直接训练得到其相关的弱分类器。之后每次使用其中一个弱分类器分错样本的扩充数据据加上上,进行训练。扩充数据样本重复,即对错误50%。抽样,达到与新样本之间的数据比例各占直到到达某个之前设置的分类错误率,或到达先前指定的最大迭代次数,则训练停止。最后,将训练后的多个弱分类器权重求er-ADB和相加,构成最后的增强分类器Ripp。采用本文提出的特征选

8、取算法,很大程度上减少了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。