二进制分辨矩阵在连续属性约简中的研究.pdf

二进制分辨矩阵在连续属性约简中的研究.pdf

ID:54590308

大小:252.96 KB

页数:3页

时间:2020-05-02

二进制分辨矩阵在连续属性约简中的研究.pdf_第1页
二进制分辨矩阵在连续属性约简中的研究.pdf_第2页
二进制分辨矩阵在连续属性约简中的研究.pdf_第3页
资源描述:

《二进制分辨矩阵在连续属性约简中的研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、总第267期计算机与数字工程Vo1.40No.12012年第1期Computer&DigitalEngineering19二进制分辨矩阵在连续属性约简中的研究杨云霞杨占勇(南京信息工程大学信息与控制学院南京210044)摘要针对二进制分辨矩阵无法处理连续型数据,提出一种基于邻域的改进二进制分辨矩阵及其属性约简方法。实验结果表明,与先数据离散化,后属性约简的方法相比,利用文中方法提取出的特征属性的分类能力更高。关键词粗糙集;分辨矩阵;连续属性约简;邻域中图分类号TP311BinaryDiscernibilityMatrixCont

2、inuousAttributeReductionResearchYANGYunxiaYANGZhanyong(CollegeofInformationandControl,NanjingUniversityofInformationScienceandTechnology,Nanjing210044)AbstractBinarydiscernibilitymatrixcannothandlecontinuousdata,SOaneighborhood-basedbinarydiscernibilitymatrixandattri

3、b—utereductionmethodshasbeenproposed.Experimentalresultsshowthat,comparewiththefirstdiscretedata,afterthettributereductionmethods,theatrrihuteswhichthismenthodselectedgethigherclassificationability.KeyWordsroughset,discerniblitymatrix,continuousattributereduction,nei

4、ghborhoodClassNumberTP311处理的关键内容,所谓知识简约就是指在保持决策表条件1引言属性和决策属性之间的依赖关系不发生变化的前提下删除粗糙集(RoughSet)理论是由波兰科学家Z.Pawlak于冗余的属性。1982年提出的l1],它是一种处理不确定和不精确性问题新定义1一个决策表可以由四元组DT=(U,A,V,厂)的数学工具,通过不可分辨关系确定给定问题的近似域,从来表示,其中U一{z,X,⋯,z}为对象的非空有限集合,而得到数据的内在规律。属性约简是粗糙集理论处理的核称为论域;A为属性集,A由两个部分组

5、成,A:CUD且C心问题之一。属性约简在智能信息和数据处理中占有十分nD一,C为条件属性集C一{a,a2,⋯,a},D为决策属重要的地位,一般来说,知识库中的属性并不是同等重要性集,一般情况下D中只含有一个属性D一{d};V为属性的,甚至其中有些属性是不重要的,或者说是冗余的。所谓的值域;f:UXA-,-V为信息函数,f(x,a)表示论域五与知识约简就是在保持知识库分类能力不变的条件下,删除其属性取值的对应映射关系。其中不必要的属性。基于二进制分辨矩阵的属性约简由于定义2对于决策表{U,CUD},U一{z,222,⋯,z},C其

6、算法的简洁性,而得到广泛的应用。文献[2~5]都对该一{a,az,⋯,a},D一{d),令二进制分辨矩阵BM={m方法进行了详细研究。但大量的文献只关注分辨矩阵在离(()K)),其中矩阵有列,每一列对应一个条件属性a;散型属性中的应用。事实上,在科学研究、工程应用、金融、矩阵的每一行对应一对样本(五,xj)U,满足f(x,d)≠f医学等领域需要处理大量的连续型数据,如何扩展分辨矩(xi,),<,当f(x,ak)=f(xi,m),m(()K)一O,f(z,阵的实际应用是本文的研究重点。a)≠厂(,,),m((ij)K)=1。文中在

7、传统二进制分辨矩阵的基础上,引入了邻域模传统的二进制分辨矩阵定义在经典的等价关系和等价型的概念,对二进制分辨矩阵重新定义,克服了二进制分辨类基础上,适合处理离散型数据,不能直接处理连续型数矩阵无法处理连续型数据的缺陷,从而避免了在处理连续据,因此,利用二进制分辨矩阵进行约简前必须对连续属性型数据前先进行数据离散化的做法。最后用五组数据进行进行离散化,这一过程将造成某种程度的信息损失,因为离实验对比,证明了该方法的有效性。散化后的属性值没有保留属性值在原有值上存在的差异。论文[5~6]引入了邻域模型的概念,该模型通过空间中的2二进

8、制分辨矩阵的改进点的邻域来粒化论域空间,将邻域理解为在空间上距离相决策表是一类特殊而重要的知识表达系统,它在决策近的粒子,能直接处理连续型数据从而避免了数据的离散。分析、智能控制、规则获取和数据挖掘等领域有着重要广泛定义3对于决策表信息系统DT=(u,A,V,厂

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。