基于大型数据库的数据挖掘理论研究及应用

基于大型数据库的数据挖掘理论研究及应用

ID:33412755

大小:2.89 MB

页数:77页

时间:2019-02-25

基于大型数据库的数据挖掘理论研究及应用_第1页
基于大型数据库的数据挖掘理论研究及应用_第2页
基于大型数据库的数据挖掘理论研究及应用_第3页
基于大型数据库的数据挖掘理论研究及应用_第4页
基于大型数据库的数据挖掘理论研究及应用_第5页
资源描述:

《基于大型数据库的数据挖掘理论研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、天津大学硕士学位论文基于大型数据库的数据挖掘理论研究及应用姓名:王君圣申请学位级别:硕士专业:管理科学与工程指导教师:李敏强1999.12.1摘要近十年中,各行业数据急剧增长,迫切要求智能性的数据挖掘方法分析这些海量数据,从而转化为知识。数据挖掘在许多现实问题中展现了其独特的魅力.同时也看到存在许多问题尚未解决。由r现实问题的多样性,数据本身的多样性造成了数据挖掘、知U!慷现的多样性J本文在』一泛查阅国内外文献的基础上,对数据挖掘算法做了系统分析和研究,t要内容包括:(1)回顾了数据挖掘的皮展历史及其特点,归纳总结了数据挖掘的理论研究现状和实际戍用研究情况.分析了当前存在

2、的问题。(2)基于从数据中提取关联规则的思想,结合数据仓库、OLAP、和概念层次关系,将关联规则扩展到多维多概念层次的提取。(3)基于粗集的数据挖掘方法中,生成的决策规则集约简的算法往往只考虑到了决策规则的最少,忽视了所得到的规则的成本,本文通过引入多目标决策(MOD)的方法,较好地解决效用最大且决策规则最少问题,从而使粗集的决策能力更完善和实用。(4)将贝叶斯网络(BayesianNetworks)的方法用于不确定性知识的性现,其中包括对数据完全和数据不完全情况F的变量概率分布和网络结构的构建,利用专家知识和现实存在的大量数据库信息来构造贝叶斯网络。由于网络结构的复杂度

3、随论域中结点个数的增加早指数上升,如何寻找最佳贝叶斯网络是NP—Hard难题。本文提出了利用遗传算法(GA)解决构造最佳贝叶斯网络的思想,并给出了具体的算法。(5)基于动态遗传算法的贝叶斯网络知识瞻现,开唆了知识现系统GB~KDD(Geneticalgorithms—basedBayesiannetworkforKnowledgeDiscoveryinDatabase)。系统州于对现实的大型数据库建模,以及对不确定性信息进行定性和定量的分析,取得了满意效果。关键词:数据挖掘,关联规则,粗集。贝叶斯网络,遗传算法本学位论文的研究得到以下基金课题的支持:(1)遗传算法与知识获

4、取,国家自然科学基金(项目批准号:79400013)(2)遗传规划及其应用研究,国家自然科学基金(项目批准号:69574022)ABSTRACTDuringthelastdecade,wehaveseenanexplosivegrowthindatasizeAdvancesindatacollectionandwidespreaduseofbarcodesformostcommercialproductsgeneratedanurgentneedfornewtechniquesandtoolsthatcanintelligentlyandautomaticallyassi

5、stusintransformingdataintousefulknowledgeThisthesisstudiesandputforthsomenewtechniquesindataminingThemaincontentsinclude:1.ThedefinitionoftheKDDprocessandbasicdataminingmethodsisfirstintroduced.andtheapplicationandcurrentchallengesfacingpractitionersinthefieldisthenproceededThreemainmetho

6、dsforknowledgeacquisitionarediscussedindetail.2.Basedonextractionofassociationrulein出tabase.weextendassociationrulesfromonedimensiontomultipledimensionsbycombiningdatawarehouseandOLAP3.Astothedeficiencythat也edeductionofdecisionrulesofRotIghSetsonlytakesaccountintothenumberofrulesandnotthe

7、costinCUrl"edbyacquiringthem,weadvanceanewmethodbyusingmultipleobjectivedecision-maktag(MOD),whichreconcileconflictsofthecostandtheutilityofdecisionrules4.Bayesiannetworksisusedtosolvetheuncertaintyinreal.worldproblemsTwomaintasksareinvoIvedinthelearningBayesiannetw

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。