分类中基于粗糙集理论的决策树算法研究

分类中基于粗糙集理论的决策树算法研究

ID:33157972

大小:469.00 KB

页数:68页

时间:2019-02-21

分类中基于粗糙集理论的决策树算法研究_第1页
分类中基于粗糙集理论的决策树算法研究_第2页
分类中基于粗糙集理论的决策树算法研究_第3页
分类中基于粗糙集理论的决策树算法研究_第4页
分类中基于粗糙集理论的决策树算法研究_第5页
资源描述:

《分类中基于粗糙集理论的决策树算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工学硕士学位论文分类中基于粗糙集理论的决策树算法研究秦燕芬燕山大学2010年12月万方数据国内图书分类号:TP311.131国际图书分类号:621.3工学硕士学位论文分类中基于粗糙集理论的决策树算法研究硕士研究生:秦燕芬导师:何海涛教授申请学位级别:工学硕士学科、专业:计算机软件与理论所在单位:信息科学与工程学院授予学位单位:燕山大学万方数据ClassifiedIndex:TP311.131U.D.C.:621.3DissertationfortheMasterDegreeinEngineeringRESEARCHON

2、DECISIONTREEBASEDONROUGHSETTHEORYINCLASSIFICATIONCandidate:QinYanfenSupervisor:Prof.HeHaitaoAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerSoftwareandTheoryUniversity:YanshanUniversity万方数据燕山大学硕士学位论文原创性声明本人郑重声明:此处所提交的硕士学位论文《分类中基于粗糙集理论的决策树算法研究》,是本人

3、在导师指导下,在燕山大学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文的研究工作做出重要贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签字日期:年月日燕山大学硕士学位论文使用授权书《分类中基于粗糙集理论的决策树算法研究》系本人在燕山大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归燕山大学所有,本人如需发表将署名燕山大学为第一完成单位及相关人员。本人完全了解燕山大学关于保存、使用学位论文的规

4、定,同意学校保留并向有关部门送交论文的复印件和电子版本,允许论文被查阅和借阅。本人授权燕山大学,可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。保密□,在年解密后适用本授权书。本学位论文属于不保密□。(请在以上相应方框内打“√”)作者签名:日期:年月日导师签名:日期:年月日万方数据摘要决策树方法是一种广泛使用的用于分类的方法,它通过一组无次序,无规则的实例推理出决策树表示形式的分类规则,从而找到一些有价值的、潜在的信息。本文通过对数据集和决策树算法的处理和改进来提高预测分类精度和降低时间复杂度。

5、首先,对连续属性离散化算法进行了比较,提出了一种序列区间拆分算法(SISA),该算法先根据决策属性值相同而条件属性值不同划分成不同的区间,然后再将候选断点插入到这些区间,最后在区间范围内的值用不同的离散值表示出来,通过实例可以得出该算法处理过程简单并易于实现。其次,为了除去分类数据中冗余的属性,本文提出了一种基于简化差别矩阵的属性约简算法(SDMAR)。该算法在属性约简之前,先对数据进行了化简,得到简化决策表。根据简化决策表构造差别矩阵,通过计算差别矩阵中属性出现次数达到对决策表属性约简的目的。通过算法及实例分析得到属

6、性约简过程的时间复杂度有所减小。最后,本文提出了一种基于协同进化的决策树分类算法,引入了遗传学中的二进制编码,这样使得交叉、变异等操作便于实现;用一种新的方法去计算适应度。训练数据集二进制编码后,根据特征划分成不同的子集,每个子集分别使用协同进化方法,协同进化过程一直进行下去,直到找到满意的决策树。本文使用C语言对上述算法进行实现,实验表明,本文所提出的算法在解决各自的问题上是有效的,在时间上低于同类算法,预测精度上得到了提高,实现了预期的研究目标。关键词决策树;离散化;属性约简;差别矩阵;协同进化;二进制编码万方数据

7、AbstractDecisiontreeiswidelyusedinclassification.Classificationruleswhicharerepresentedbydecisiontreearedeductedthroughagroupofdisorderedandirregularinstants.Wemaygetvaluable、potentialinformation.Inthepaper,datasetsanddecisiontreealgorithm,whichareprocessedandim

8、proved,areusedtoimprovepredictionaccuracyofclassificationandreducetimecomplexity.Firstly,bycomparingwiththediscretizationalgorithmofcontinuousvariables,analgorithmSIS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。