第七章 决策表属性约简

第七章 决策表属性约简

ID:46577473

大小:379.01 KB

页数:23页

时间:2019-11-25

第七章  决策表属性约简_第1页
第七章  决策表属性约简_第2页
第七章  决策表属性约简_第3页
第七章  决策表属性约简_第4页
第七章  决策表属性约简_第5页
资源描述:

《第七章 决策表属性约简》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第七章信息表属性约简基于Rough集理论的知识获取,主要是通过对原始决策表的约简,在保持决策表决策属性和条件属性之间的依赖关系不发生变化的前提下对决策表进行约简(简化),包括属性约简和值约简。本章将对决策表的属性约简从代数集合观点和信息论的信息熵观点进行系统分析,并介绍几种有效的属性约简算法。7.1决策表属性约简概述一个决策表就是一个决策信息系统,表中包含了大量领域样本(实例)的信息。在第四章中,我们曾经对决策规则进行了讨论,决策表中的一个样本就代表一条基本决策规则,如果我们把所有这样的决策规则罗列出来,就可

2、以得到一个决策规则集合,但是,这样的决策规则集合是没有什么用处的,因为其中的基本决策规则没有适应性,只是机械地记录了一个样本的情况,不能适应新的、其他的情况。为了从决策表中抽取得到适应度大的规则,我们需要对决策表进行约简,使得经过约简处理的决策表中的一个记录就代表一类具有相同规律特性的样本,这样得到的决策规则就具有较高的适应性。根据定义2.1-1,我们可以进一步讨论决策表中属性的必要性和相应的约简算法。定义7.1-1设U是一个论域,P是定义在U上的一个等价关系簇,RÎP。如果IND(P-{R})=IND(P)

3、,则称关系R在P中是绝对不必要的(多余的);否则,称R在P中是绝对必要的。绝对不必要的关系在知识库中是多余的,如果将它们从知识库中去掉,不会改变该知识库的分类能力。相反,若知识库中去掉一个绝对必要的关系,则一定改变知识库的分类能力。定义7.1-2设U为一个论域,P为定义在U上的一个等价关系簇,RÎP。如果每个关系RÎP在P中都是绝对必要的,则称关系簇P是独立的;否则,称P是相互依赖的。对于相互依赖的关系簇来说,其中包含有冗余关系,可以对其约简;而对于独立的关系簇,去掉其中任何一个关系都将破坏知识库的分类能力。

4、122定义7.1-3设U为一个论域,P为定义在U上的一个等价关系簇,P中所有绝对必要关系组成的集合,称为关系簇P的绝对核,记作CORE(P)。定义7.1-4设U为一个论域,P、Q为定义在U上的两个等价关系簇,且QÍP。如果(1)IND(Q)=IND(P);(2)Q是独立的;则称Q是P的一个绝对约简。如果知识Q是知识P的绝对约简,那么,U中通过知识P可区分的对象,同样可以用知识Q来区分。在讨论决策表信息系统约简的时候,一个条件属性A就对应着一个等价关系(也称不分明关系或不可分辨关系),即在条件属性A上取值的相等

5、关系,它对论域U形成一个划分U/A。决策表的所有条件属性形成条件属性集合(P)对论域U的划分U/P,同时,决策属性集D={d}也对论域形成一个划分U/D。这两个划分形成了条件属性和决策属性在对论域样本分类上的知识。属性约简的目标就是要从条件属性集合中发现部分必要的条件属性,使得根据这部分条件属性形成的相对于决策属性的分类和所有条件属性所形成的相对于决策属性的分类一致,即和所有条件属性相对于决策属性D有相同的分类能力。这就是相对约简的概念。定义7.1-5设U为一个论域,P、Q为定义在U上的两个等价关系簇,Q的P

6、正域记为POSP(Q),定义为:。定义7.1-6设U为一个论域,P、Q为定义在U上的两个等价关系簇,若POSP(Q)=POS(P-{r})(Q),则称r为P中相对于Q可省略的(不必要的),简称P中Q可省略的;否则,称r为P中相对于Q不可省略的(必要的)。定义7.1-7设U为一个论域,P、Q为定义在U上的两个等价关系簇,若P中的每一r都是P中Q不可省略的,则称P为(相对于)Q独立的。定义7.1-8设U为一个论域,P、Q为定义在U上的两个等价关系簇,若P的Q独立子集S(SÌP)有POSs(Q)=POSP(Q),则

7、称S为P的Q约简。可以记P的所有Q约简关系簇为REDQ(P)。122定义7.1-9设U为一个论域,P、Q为定义在U上的两个等价关系簇,P的所有Q不可省略原始关系簇称为P的Q核,记为COREQ(P)。定义7.1-10设U为一个论域,P、Q为定义在U上的两个等价关系簇,如果POSP(Q)=U,则称论域U是P上相对于Q一致的。定理7.1-1设U为一个论域,P、Q为定义在U上的两个等价关系簇,REDQ(P)为P的所有Q约简关系簇,COREQ(P)为P的Q核,则COREQ(P)=ÇREDQ(P)。下面再给出在可变精度R

8、ough集模型相应的属性集之间依赖、独立,以及约简的定义(定义7.1-11至定义7.1-13)。定义7.1-11如果,则称属性a是属性集C中相对于决策属性D是依赖的;否则称属性a是属性集C中相对于决策属性D是独立的。定义7.1-12如果存在条件属性集B(BÍC)的真子集E,使得,则称B相对于决策属性D是依赖的;否则,称B相对于决策属性D是独立的。定义7.1-13决策表条件属性集合C的相对约简C’是条

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。