基于决策树算法的多关系数据分类研究

基于决策树算法的多关系数据分类研究

ID:32966225

大小:2.14 MB

页数:56页

时间:2019-02-18

基于决策树算法的多关系数据分类研究_第1页
基于决策树算法的多关系数据分类研究_第2页
基于决策树算法的多关系数据分类研究_第3页
基于决策树算法的多关系数据分类研究_第4页
基于决策树算法的多关系数据分类研究_第5页
资源描述:

《基于决策树算法的多关系数据分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、劣妻未交硕士学位论文j8I69‘5瘪乞和一基于决策树算法的多关系数据分类研究Multi-relationalClassificationBasedonDecisionTreeAlgorithm作者:黄昆导师:林友芳北京交通大学2010年6月学位论文版权使用授权书IUIIIIIIIIIIIIIIIIIIIlY1780481本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复

2、印件和磁盘。(保密的学位论文在解密后适用本授权说明)篇沈驷厉一“.氰年签加者加作:文.期沦日位字学签中图分类号:TPl82UDC:004.8学校代码:10004密级:公开北京交通大学硕士·学位论文基于决策树算法的多关系数据分类研究Multi—relationalClassificationBasedonDecisionTreeAlgorithm作者姓名:黄昆导师姓名:林友芳学位类别:工学学号:06120528职称:副教授学位级别:硕士学科专业:计算机应用技术研究方向:数据与知识工程北京交通大学2010年6月rk卜-lL◆的适应关系数据库中多关系的数据组织,很好的完

3、成挖掘任务。因此本文以多关系数据挖掘算法作为研究对象。对于多关系数据挖掘算法而言,高效性和可扩展性一直是该领域的研究重点。因为多关系数据挖掘任务的复杂性对算法性能提出了更高的要求,同时,由于在多关系模式下,算法的搜索空间比单一关系模式下变得更大,更复杂。对于每个优化假设的评价也更为复杂。针对多关系数据挖掘算法存在的这些问题,本文的研究重点放在了提高多关系数据挖掘算法的效率上。制约多关系数据挖掘算法的瓶颈在于搜索空间的大小,因此提高效率的关键在于减少搜索空间的大小。本文以多关系数据分类算法为切入点,用决策树算法建立多关系分类模型实现多关系数据分类的目标。在提高算法效

4、率上面,本文主要做了以下的工作:在多关系决策树算法中加入充分表,减少了对每个假设模式评价过程中,所需连接数据表的数量。同时,引入目标元组ID传播技术,使得每个假设模式评价过程的连接都不浪费,即使该模式不是最优的,也会进行目标元组ID的传播,从而保留该连接信息。使得算法模式评价的效率有所提高。使用PKDD’99中的Financial数据集对改进的多关系决策树算法进行了实验,通过十次交叉迭代验证法证实了充分表结构和目标元组Ⅲ传播技术对提高多关系决策树分类算法运行效率是有帮助的。本文的最后,提出继续对多关系决策树算法效率的改进的一些展望,可以在状态空间的搜索算法以及利用

5、数据集背景知识等方面继续做出改进。关键词:关系学习;多关系数据挖掘;决策树分类;多关系决策树算法;目标元组ID传播分类号:TPl820『rIPABSTRACTABSTRACT:Multi-relationaldataminingisoneoftherapidlydevelopingsubfieldsofdatamining.Theclassicaldataminingapproachescanonlylookforpatternsinsinglerelation,anditiSdifficulttolookforcomplexrelationalpatternsw

6、hichinvolvedinmulti·relationaldatabases.Butinrealworld,theorganizationsofdatausuallyusethemulti—relationalmodelsinrelationaldatabases.Sotheclassicaldataminingapproachesa.renotsuitforthissituation.Thatiswhythispaperchoosesamulti—relationaldataminingalgorithmasourresearchobject.Efficien

7、cyandscalabilityhavealwaysbeenimportantconcernsinthefieldofdatamining.Thecomplicationofmulti—relationaldatamininghasmadehigherdemands,becauseofthelargerhypothesisspacesandthemorecomplexevaluationmethods.Sowefocusontheimprovingofefficiencyandscalabilityofthemulti—relationaldataminingal

8、gorit

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。