基于粗糙集理论的数据挖掘模型.pdf

基于粗糙集理论的数据挖掘模型.pdf

ID:58314277

大小:315.01 KB

页数:5页

时间:2020-09-06

基于粗糙集理论的数据挖掘模型.pdf_第1页
基于粗糙集理论的数据挖掘模型.pdf_第2页
基于粗糙集理论的数据挖掘模型.pdf_第3页
基于粗糙集理论的数据挖掘模型.pdf_第4页
基于粗糙集理论的数据挖掘模型.pdf_第5页
资源描述:

《基于粗糙集理论的数据挖掘模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ISSN100020054清华大学学报(自然科学版)1999年第39卷第1期29ö33CN1122223öNJTsinghuaUniv(Sci&Tech),1999,Vol.39,No.1110~1133基于粗糙集理论的数据挖掘模型李永敏,朱善君,陈湘晖,张岱崎,韩曾晋清华大学自动化系,北京100084文摘提出了一种基于粗糙集理论的数据挖掘模型,以利潜在价值的、以及最终的可理解的模式的非常规的于信息不完备情况下的推理和决策问题的解决和研究。该模过程。知识发现的过程包括数据准备、模式搜索、知型从已知数据的初始决策

2、系统出发,建立一系列的不同简化识评估以及知识提炼等许多步骤,而这些步骤构成层次的子系统,然后推导出各个子系统的规则集,其中每条一个多重循环的过程。一般认为,数据挖掘是组成知规则都有相应的置信度。在应用模型进行推理和决策分析识发现过程的一个环节,它是在某种可接受的约束时,用给定对象的信息与模型中相应节点的规则进行匹配,条件下,应用数据分析和数据发现算法,从数据中获然后选用某种评判算法得出结论。给出了一个简单的例子来说明如何建立和应用这种数据挖掘模型。这样的模型可以很取某些特定模式的过程。方便地根据给定的信息,在最

3、符合的子系统上得出尽可能好知识发现和数据挖掘的研究方法包括:分类、的结论。回归、聚类、归纳等等。但是,目前研究也碰到一些关键词粗糙集;知识发现;数据挖掘;决策系统问题和挑战,如大数据量和维数灾难问题、过度匹配分类号TP18问题、数据及其结构的改变对知识发现的影响、如何[2,3]有效地利用操作者的先验知识的问题等。粗糙集理论的特点是不需要预先给定某些特征知识发现和数据挖掘的研究融合了许多领域的或属性的数量描述,如统计学中的概率分布、模糊集研究成果,如模式识别、神经网络、机器学习、数据理论中的隶属度或隶属函数等,而

4、是直接从给定问库、分类与聚类、最优化技术、高性能并行计算、知识题的描述集合出发,通过不可分辨关系和不可分辨建模、可视化等。类确定给定问题的近似域,从而找出该问题中的内2粗糙集[1]在规律。粗糙集理论的出发点是,根据目前已有的对给近年来,粗糙集理论和应用的研究取得了很快定问题的知识将问题的论域进行划分,然后对划分发展,其涉及的领域很广,包括模式识别、机器学习、后的每一个组成部分确定其对某一概念的支持程决策分析和决策支持、知识获取、知识发现等。粗糙度:即肯定支持此概念、肯定不支持此概念和可能集理论同模糊集、神经网络

5、、证据理论等其它理论一支持此概念。在粗糙集理论中,以上三种情况分别用起,成为不确定性计算的一个重要分支。三个近似集合来表示为正域、负域和边界。为描述方本文提出了一种基于粗糙集理论的数据挖掘模便,可以采用文[1]提出的知识表示系统和决策系统型,这种模型能够将问题定义为一系列不同简化层对问题进行描述,这样,粗糙集的方法和模型就可以次上的子问题,从而在许多数据不完备的情况下也[4]建立在一种非常直观的二维表的基础上。能够迅速地给出相对满意的输出。2.1知识表示系统和决策系统1知识发现和数据挖掘定义1称S=(U,A,{

6、Va},a)为知识表示系知识发现是指从数据中识别合法的、新颖的、有统,其中,U为非空有限集,称论域;A为非空有限集,称属性集合;Va为属性a∈A的值域;a:U→Va收稿日期:1998205213第一作者:男,1967年生,讲师为一单射,使论域U中任一元素取属性a在Va中3基金项目:国家自然科学基金项目,69784005的某一唯一值。如果A由条件属性集合C和结论属李永敏,等:基于粗糙集理论的数据挖掘模型111性集合D组成,C,D满足C∪D=A,C∩D=5,这样,通过一组相对简约,可以得到决策系统[5]则称S为决策

7、系统。S=(U,C∪{d})中最简单的规则集,其中,每个相为了表示简单,有时用(U,C∪{d})表示决策系对简约就是一条规则的前件。统,即结论属性集合只包含一个元素。3基于粗糙集理论的数据挖掘模型定义2对决策系统S=(U,C∪{d}),BAC数据挖掘的目的在于从大量数据中发现那些令是条件属性集合的一个子集,称二元关系ind(B,人感兴趣的规则,一般地讲,这些规则在表现形式上{d})={(x,y)∈U×U:d(x)=d(y)或者Pa∈B,应比较简洁,并且具有一定程度的概括性。同时,在a(x)=a(y)}为S的不可

8、分辨关系,其中,x,y为U实际问题中,待处理的数据常有某种程度的不完备,[5]中的元素。这表现在知识表示系统或决策系统中即某些属性没2.2粗糙集有赋值。造成这种情况的原因可能有以下几种:1)定义3对于知识表示系统S=(U,A),设B有些信息无法获取;2)获取这些信息的代价较大;AA,XAU,定义集合XB={x∈Uû[x]ind(B)A3)实时性能要求较高,即要求在得到这些信息之前X},

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。