多粒度粗糙集模型中属性子集序列的构造方法

多粒度粗糙集模型中属性子集序列的构造方法

ID:31357679

大小:109.50 KB

页数:6页

时间:2019-01-09

多粒度粗糙集模型中属性子集序列的构造方法_第1页
多粒度粗糙集模型中属性子集序列的构造方法_第2页
多粒度粗糙集模型中属性子集序列的构造方法_第3页
多粒度粗糙集模型中属性子集序列的构造方法_第4页
多粒度粗糙集模型中属性子集序列的构造方法_第5页
资源描述:

《多粒度粗糙集模型中属性子集序列的构造方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、多粒度粗糙集模型中属性子集序列的构造方法  摘要:针对多粒度粗糙集模型中属性子集序列的构造问题,提出一种基于属性间距离的构造方法。该方法首先引入信息系统中属性间距离的概念,并给出距离的定量计算公式;然后根据公式来计算出各个属性之间的距离;最后根据属性之间距离的远近,得到每个属性的邻域属性集,从而构造出一个属性子集序列。实验结果表明,与随机构造的属性子集序列相比,该方法构造的序列对于实验的每个对象类具有更高的近似精度。因此,采用所提方法构造出的属性子集序列,其对应的多粒度粗糙集模型具有更好的近似效果。  关键词:多粒度;属性子集序列;距离函数;近似精度  中图

2、分类号:TP18  文献标志码:A  文章编号:1001-9081(2016)11-2950-04  0引言  粗糙集理论[1]是由波兰学者Pawlak于1982年提出的一种能够有效处理不精确和不确定信息的数学工具,目前,由于它在神经网络、数据挖掘、决策分析、机器学习和知识发现等领域[2-6]有着广泛的运用,使得研究逐渐趋热。粗糙集理论是建立在分类机制的基础上,6通过等价关系将知识空间进行划分。其主要思想是保持分类能力不变的前提下,通过上、下近似去刻画知识不确定性程度,并且通过知识约简、规则提取去挖掘数据中潜在的信息,粗糙集理论最大的特点就是不需要数据集之外

3、的任何先验信息,因此对于不确定信息进行分析处理还是比较客观的。近年来,为了从多粒度、多层次的角度去处理和分析问题,Qian等[7-9]提出了多粒度粗糙集模型,其主要思想是将属性集构建成一组属性子集序列,通过这一系列属性子集来对论域进行划分,构成了多粒度的论域空间,然后在多粒度论域空间中对目标概念进行近似逼近。随后,一些学者在Qian等基础上对多粒度粗糙集做了许多扩展和改进[10-13]。但是在多粒度粗糙集模型的研究中,对于如何构建一个较好的属性子集序列,目前并没有给出一个很好的方法。  本文针对多粒度粗糙集模型中关于属性子集序列的构建问题,提出一种较好的构建

4、方法,其主要思想是引入统计学中关于变量间的相似系数来刻画属性间的距离[14-15],通过属性间距离的远近来对属性进行区分归类,进而构建一组属性子集序列。由于目前的多粒度粗糙集模型中分为基于等价关系的多粒度粗糙集模型和邻域多粒度粗糙集模型[12],因此本文分别定义了符号型属性间的距离和数值型属性间的距离。最后通过实验分析,验证了本文构建的属性子集序列具有更好的近似效果。  从定义8可以看出,本文构造的多粒度属性子集序列是将属性之间距离较小的属性归类成一组,由于数据集之间的差异,这里无法给出具体的邻域半径取值,但是通常可以取[0,0.5]。由于属性间的距离是根据

5、统计学中变量之间相似系数[14]得来,因此通过这种方法构造出的多粒度属性子集序列,其每个属性子集内的属性之间依赖程度较高,6这样更具一定的合理性。最终构建的属性子集序列形成的是属性全集上的一个覆盖。为了验证本文构造的属性子集序列更为优越,下面将通过实验来具体分析。  3实验分析  为了验证本文方法性能,这里从UCIMachineLearningRepository获取了4个数据集进行实验分析和评估。具体信息描述如表2所示。  在表2中,编号为1、3和4的数据集属性均为数值型属性,编号为2的数据集属性为符号型属性。根据定义7中属性间距离的定义方式,这里可以得出

6、4个数据集属性间的距离矩阵,其分别表示为:  对于数据集中的每个类,分别计算出它们在构造的属性子集序列下多粒度粗糙集模型中的近似精度。为了作对比,本实验另外随机构造了3个属性子集序列作为参照,并且计算出每个类在各个参照序列下的近似精度。最终每个数据集的实验结果如图1所示。  由于数据集1、3和4属性均为数值型,因此计算的为每个类在邻域多粒度粗糙集模型下的近似精度。  通过实验结果可以看出,对于数据集中每个类,本文方法构造出的属性子集序列(即实验序列)相对于随机生成的参照序列,其近似精度均更高一点,因此,本文方法构造出的属性子集序列在其多粒度粗糙集模型的近似方

7、面具有一定的优越性。  4结语  针对目前多粒度粗糙集模型中属性子集序列的构造问题,本文通过引入属性间距离函数的方法,定量地刻画了属性之间距离的远近,并将距离较近的属性归为一类,6从而构造出一组多粒度属性子集序列。通过实例分析可以看出,本文中构造出的属性子集序列在其近似对象的近似计算方面具有更高的精度。由于本文未给出属性邻域半径λ的选取方法,因此在接下来的工作中需要探索如何去选取合适的属性邻域半径。  参考文献:  [1]PAWLAKZ.Roughsets[J].InternationalJournalofComputer&InformationScienc

8、es,1982,11(5):341-356.  [2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。