基于粗糙集理论的数据挖掘方法研究

基于粗糙集理论的数据挖掘方法研究

ID:33756648

大小:1.83 MB

页数:59页

时间:2019-02-28

基于粗糙集理论的数据挖掘方法研究_第1页
基于粗糙集理论的数据挖掘方法研究_第2页
基于粗糙集理论的数据挖掘方法研究_第3页
基于粗糙集理论的数据挖掘方法研究_第4页
基于粗糙集理论的数据挖掘方法研究_第5页
资源描述:

《基于粗糙集理论的数据挖掘方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学硕士学位论文基于粗糙集理论的数据挖掘方法研究姓名:丛丹申请学位级别:硕士专业:模式识别与智能系统指导教师:王俊普20030501摘要本文遥过在褪糙集懿倍惠表示翁蘩醚上,由鼗糙集蕊代数表示窝信息表示瓣~致性,旋出了一种基于信息量的糯糙集属性约简算法,该冀法的基本愚想蹙通过属性塑髅性的发量求出粗糙集的核,然后在核的基础上,继矮依据属性重疆性魏度量,隧约篱鹁信息鳖裙愿莛性焱舍懿蕊惫量棚等这一准刘柬逐芎j二鬓牲约麓,算法篱荦,效率离。通过研究传统数据挖掘方法的知识评估标准缀小支持度葶口娥小嚣信艘,发现有些知识可能被忽略,提出新增的知识评估标准——支持度最小膨胀艘和支持度楚,{

2、、颈{ll{

3、臻,稳溪这舔令王l}麴魏知识译估标灌,练合爨毒支蒋凌窝最小置信发柩准,对数据库述行分部挖掘,可以褥出更加深屡次的有趣的知识。并举例浇磷了这一对新增标准的可行性。传绞数键笼攘方法一般是以寥务数据露惫直接静挖掇对象,这裁遮藏了必矮在挖掘过穗中对于宠大的事务鼗舔瘁送行多次翁扫箍来提取甄鼋鞋,效率比较低。数据挖掇怒为了完成知濒挖掘这⋯任务,知识是~耪频繁出现黝属性焚合,它实际上是一种频繁出现的属性的关联。在此基础上,本文提出了~种伴随2.频繁集赘鼗摇存豫缝穆,挥隽事务数据瘁鹣醛jii;。存入嚣孛靛是事务数据库中频繁出瑗(超过一种比最小支持艘小的支持艘滚僮的一静度鲞标准)2元关系

4、酶集合。将数据挖掘建立在伴随2“频繁集数据的基础上,悬⋯H军十很好的想法。由于伴随2.频繁集数糍库本痨是一罩串超出一个确定润篷的2.元璃毪集会,这群,攫多对予挖菰无蔫豹数据将不菠考懋,两显它本隽是对事务数獾抟一种泛纯,数羹乡。以伴随2一频繁蕊数据库干挈为数据挖掘瞧对象,可阻避免对于事务数搅库的频繁扫描,很大程度上提高了挖掘的效率。本文聚螽~帮分缀会以上三个方疆:疆馋夔2.频繁集为数攒挖撼对象,别矮基予信息爨瓣糯麓集凰注约篱算法,懿鼹标准加上新增翡知识评估标准速行知识挖掘。这种数据挖掘方法和结构,饿得算法简单,挖掘效率商,挖掘的知识中除了传统的数提挖掘方法中珂}丑褥到的那部分之外,包含

5、蓑一些更加有趣的信息。霆蓝吴煮缀嵩弱实际瘟鼷徐篷。除此之外,本文还提出了一种黼散的关联规则的挖掘算法。关键词数据挖掘;最小支持度;鬣小置信度;粮糙集;信息鬟;属性的重甏矬:伴随2。频繁黧:最小澎涨度;最小预测馕AbstractBasedonthecoherenceofinformationexpressandalgebraicexpressofRoughset,thispaperpresentsakindofattributereductionalgorithmwithroughsetbasedoninformationquantlty.7themainideaofthisalgor

6、ithmistofindtheCoreofattributesetaccordingtotheimportanceofattributes,thentoreduceattributesaccordingtothemeasurementoftheimportanceofattributes,andtheinformationquantityofreductionmustbeequaltooriginattributeset.Thisalgorithmisveryeasy,andcanattainhighefficiency.Undertheevaluationstandards(min

7、imumsupportandminimumconfidence)oftraditionalDMmethods,someknowledgewillbeignored.Thisthesispresentsasetofnewknowledgeevaluationstandards(minimumexpandabilityandminimumforecast).Byusingthispairofappendedevaluationstandards,minimumsupportandminimumconfidence,tominethedatabasepartafterpart,wecang

8、etmoreinterestingknowledgeindeeplayer.TraditionalDMmethods,generally,usedatabasedirectly,andscanthedatabasemanytimesduringDM.Theefficiencyisverylow.ThepurposeofDMistofindknowledgebeinghidedindatabase,andknowledgeisa蛾ofsomeattribut

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。