链表属性改进研究论文

链表属性改进研究论文

ID:44282480

大小:44.71 KB

页数:5页

时间:2019-10-20

链表属性改进研究论文_第1页
链表属性改进研究论文_第2页
链表属性改进研究论文_第3页
链表属性改进研究论文_第4页
链表属性改进研究论文_第5页
资源描述:

《链表属性改进研究论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、链表属性改进研究论文1引言粗糙集(RoughSet,RS)理论是Z.Pawlak提出的一种处理不一致、不完整数据和不精确知识表达等各种不完备信息的数学理论[1]。其中属性约简是粗糙集理论中核心内容之一,现已证明是典型的NP难题[2,3]。所谓属性约简是指在保证信息系统分类能力或决策能力不变的条件下,删除属性集中的冗余属性。属性约简在分类学习及分类数据挖掘中具有重要的作用,目前国内外学术界在属性约简方面已经做了大量研究,并得到了许多有效的算法[4~6]。文献[4]深入分析了算法低效性的根源,给出了高效的约简算法;文献[5]给出

2、了基于信息论的方法;文献[6]利用正区域的启发式信息给出了两种属性相对约简算法;其中应用较多的是基于华沙大学数学家Skowron提出差别矩阵[7]以及在此基础上的一些改进[9〜11],由于这种基于区分矩阵方法易于解释和计算核属性,同时也便于约简,该方法为属性约简算法提供了一种很好的思路。然而,基于区分矩阵的属性约简算法对对象数为n的区分矩阵大小为n(n-1)/2,不适用于大数据量的情况,所以木文给出了一种改进算法,将空间复杂度至少压缩到

3、U/R

4、*/2,该算法大大降低了算法的空间复杂度,适用于大数据量的情况。基本概念定义1[

5、2]:设U为一个有限的非空论域,R为U上的等价关系。等价关系R把集合U划分为多个互不相交的子集,每一个子集称为一个等价类,用WR表示,[x]R={yGU

6、xRy},其中xGU,xWy称为关于R的等价关系,论域U上的所有等价类的集合用U/R来表示。定义2[2]:令R为一族等价关系,rR,如果IND(R)=IND(R-{r}),则称r为R中不必要的;否则r为R中必要的[2],若R中任意一个等价关系r都是必要的,则称R是独立的,否则称R是依赖的。定义3[81:设,若Q是独立的,且IND(Q)=IND(P),则Q是等价关系族P的一个

7、约简。定义4[8]:设P和Q是论域U上的等价关系,Q的P正域记作POSP(Q),定义为:Q的P正域是U中所有根据U/P的信息准确分类到关系Q的等价关系中去的对象构成的集合。定义5[8]:设P和Q是论域U上的等价关系,RGP,若POSP(Q)二POS(P-{R})(Q)则称R为P中Q不必要的,否则称R为P中Q必要的。若P中任意一关系R都是Q必要的,则称P是Q独立的(相对于Q独立的)。定义6[2]:设SP,S为P的Q约简,当且仅当S是P的Q是独立的子集,且POSS(Q)=POSP(Q).P的Q约简称为相对约简。定义7:区分矩阵是

8、华沙大学数学家Skowron[7]提出的,对于系统S=(U,A),其中A=CUD,a(x)是x在属性a上的值,区分矩阵M为:同时分辨矩阵中的核就是组合数为1的属性。基于区分链表的属性约简改进算法区分矩阵的空间复杂度为n(n-l)/2,保存着论域中两两对象的可区分属性•在论域关于属性集划分屮,同一个等价类的对象两两在区分矩阵中的元素为空,而且与其他等价类的对象所构成的区分矩阵中的元素完全相同,因此从每一个等价类中只取一个对象构造的新的论域,其约简与原来的相同,而空间复杂度最多为

9、U/R

10、*/2.区分矩阵Matrix的某元素Ma

11、trix[i][j],是区分对象U[i]与U[j]的条件属性集,由于在合取吸取运算中,参数i、j并没有实际价值,因此改用区分链表List来取代区分矩阵。在构造区分链表前,先定义存储核属性的变量core,可区分两对象的条件属性集若只有一个属性Ri,则属性Ri是核属性,那么Ri存储到变量core,在接下来的区分链表的构造过程中,若区分属性集包括•已经提取出来的核属性,直接约去,不插入到区分链表中;否则,插入到区分链表的表尾。为减少区分链表的大小,可以在每产生一个核属性Rj,进入变量core后,化简区分链表List,若List中的

12、元索List[k]包含属性Rj则直接删除元素ListEk]。对应算法如下:for(p二U;p->next!二NULL;p二p->next)for(q=p->next;q!=NULL;q=q->next){x二对象p、q的可区分属性集;if则x进入核变量core;elseifList.Add(x);}在得到了核和区分链表后,首先,将核加入到候选约简中;然后,统计区分链表中各属性出现的次数,将出现次数最多的属性R加入到侯选约简中,删除区分链表中出现R的所有节点,依次循环,直到区分链表为空,此时侯选约简就是所求约简。对应算法如下:

13、C_reduce=core;While(l){if(List=Null)break;else遍历List,统计各条件属性出现的次数;选择出现次数最多的那个属性R;C_reduce=C_reduce{R};删除List中所有出现R的的节点;4实例分析设如下表1[12]给定的决策表,求所有约简

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。