rough集在知识发现中应用

rough集在知识发现中应用

ID:5929475

大小:31.00 KB

页数:8页

时间:2017-12-29

rough集在知识发现中应用_第1页
rough集在知识发现中应用_第2页
rough集在知识发现中应用_第3页
rough集在知识发现中应用_第4页
rough集在知识发现中应用_第5页
资源描述:

《rough集在知识发现中应用》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、Rough集在知识发现中应用  摘要:Rough集理论作为一种处理不精确、不一致、不完整等各种不完备信息的有效工具,一方面得益于它的数学基础成熟且不需要先验知识;另一方面在于它的易用性。由于Rough集理论创建的目的和研究的出发点就是直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,因此它是一种天然的知识发现或数据挖掘方法。本文对Rough集的基本概念和它在知识发现中的应用作了简单的介绍。Abstract:Roughsettheoryastheeffectivetoolforimprecisetreatment,inconsistent,incomp

2、lete,andotherincompleteinformations,ontheonehanditthankstoitssophisticatedmathematicalbasisandnoneedforpriorknowledge;ontheotherhanditiseaseforuse.SincethepurposeofcreatingRoughsettheoryandthestartingpointofresearchistodirectlyconductanalysisandreasoningonthedata,findhiddenknowledgea

3、ndrevealthepotentialofthelaw,soitisanaturalknowledgediscoveryordataminingmethod.Inthispaper,thebasicconceptofRoughsetssnditsapplicationinknowledge8discoveryareintroducedbriefly.关键词:Rough集;知识发现;决策Keywords:Roughsets;knowledgediscovery;decision中图分类号:TP392文献标识码:A文章编号:1006-4311(2013)26-01

4、88-030引言Rough集理论是一种数据分析理论,是由波兰数学家Z.Pawlak等一批科学家提出的,是对不完整数据及不精确知识进行表达、学习、归纳的一种方法。现在,Rough集理论主要应用在知识发现、机器学习、决策分析、医院诊断、数据挖掘等领域。它的优点是不需要先验知识便可从数据或经验中获得知识,生成决策规则。1Rough集的基本概念现实生活中的信息一般都用二维表来表示,行代表不同的个体,列代表对应个体的属性。信息表中的数据可以从各行各业的业务数据中收集。8以表1为例介绍Rough集的概念。对于p1,p2,p3这三个实例,其头疼和肌肉疼的属性值都是“是”,因此

5、,从条件属性头疼和肌肉疼的角度看,这三个实例是不可分辨的。同样,p4,p6在这两个属性上也是不可分辨的。所以由头疼和肌肉疼这两个条件属性构成的不分明集{p1,p2,p3},{p4,p6},{p5}被称为基本集。定义1令X?哿U,当X能用属性子集B确切地描述时,称X是B可定义的,否则称X是B不可定义的。B可定义集也称作B精确集,B不可定义集也称为B非精确集或BRough集(在不发生混淆的情况下也简称Rough集)。例1在表1所示的决策表中,集合{p1,p2,p4,p5}就是条件属性子集B={头疼,肌肉疼}不可定义的,是BRough集。因为根据条件属性子集B,样例p

6、3和p1,p2是不可分辨的,p6和p4是不可分辨的。我们不能根据条件属性子集B来对所有实例是否属于集合{p1,p2,p4,p5}作精确判定。但是,如果样例的属性取值头疼为“否”,肌肉疼为“否”,则我们可以确定地说该样例属于集合{p1,p2,p4,p5}。由此可见,对于一个样例子集,也称为一个概念,根据一个条件属性子集所确定的不分明关系,我们有可能能够准确地判定某些样例是否属于该概念,也有可能不能够判定某些样例是否属于该概念。为了描述这个问题,Rough集理论采用了上近似、下近似的概念。定义2给定知识表达系统S=,对于每个子集X?哿U和不分明关系B,X的上近似集和

7、下近似集分别可以由B的基本集定义如下:下近似集:B-(X)=∪{Yi

8、(Yi∈U

9、IND(B)∧Yi=X)};8上近似集:B-(X)=∪{Yi

10、(Yi∈U

11、IND(B)∧Yi∩X≠?覫)};边界域BNB(x)=B-(X)\B-(X);正域POSB(X)=B-(X);例2在表1所示的决策表中,对于属性子集B={头疼,肌肉疼},集合X={p3,p4,p5}是一个BRough集,下面分别计算集合X的上近似集、下近似集、正域、边界域。首先计算论域U的所有B基本集,U

12、IND(B)={{p1,p2,p3},{p4,p6},{p5}},令B1={p1,p2,p3},B2={

13、p4,p6},B3={p

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。