基于rough集的不完备信息处理方法研究

基于rough集的不完备信息处理方法研究

ID:33909679

大小:4.94 MB

页数:117页

时间:2019-03-01

基于rough集的不完备信息处理方法研究_第1页
基于rough集的不完备信息处理方法研究_第2页
基于rough集的不完备信息处理方法研究_第3页
基于rough集的不完备信息处理方法研究_第4页
基于rough集的不完备信息处理方法研究_第5页
资源描述:

《基于rough集的不完备信息处理方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西南交通大学博士学位论文基于Rough集的不完备信息处理方法研究姓名:官礼和申请学位级别:博士专业:计算机应用技术指导教师:王国胤2012-05西南交通大学博士研究生学位论文第1页摘要随着计算机及网络技术的快速发展,各个领域的数据量急剧增加。不同领域的人们都期待着从这些大量的、杂乱无章的、强干扰的数据中获得自己想要的知识。这给人类的智能信息处理能力提出了新的挑战,已成为当前数据挖掘的重要研究课题之一。粗糙集理论与方法是数据挖掘诸多处理复杂系统方法中的一种有效方法,与概率论、模糊集和证据理论等其它处理不确定问题的理论和方法相比,它的优点是无需提供问题所需处理的数据集之外的

2、任何先验信息,对问题的描述和处理更具客观性。目前,它已被广泛应用在机器学习、知识获取和模式识别等领域。经典粗糙集理论是建立在不可分辨关系这一等价关系基础上的,仅能处理所有属性值均已知且确定的完备信息系统。然而,由于数据采集技术的限制、传输媒体的故障和一些人为因素的影响,导致大量的现实信息系统包含有模糊的、不精确的、不完备的数据。此时,经典粗糙集理论的应用受限。因此,研究粗糙集的各种扩展模型及其知识获取方法对进一步促进该理论的发展和实用化有着极其重要的理论和现实意义。本文以粗糙集理论为工具,以知识获取为目的,在含有未知属性值的不完备信息系统中对不可分辨关系的扩展、上近似和

3、下近似的扩展定义、知识约简方法等方面进行了较为深入的分析和研究,同时在学习样本不足的不完整决策表中讨论了面向领域用户需求的增量式正域约简更新方法,取得了如下研究成果:(1)研究了广义不可分辨关系下的上、下近似定义问题,得到了每一类广义不可分辨关系下合适的上、下近似定义,为不完备信息系统的知识获取奠定了理论基础。上、下近似的经典定义是以不可分辨关系这一等价关系为基础的,如何将其扩展到广义不可分辨关系下一直是一个重要的研究内容。本文将所有可能的广义不可分辨关系依据是否满足自反性、对称性和传递性分为8种类型,在此基础上,深入分析了已有12种不同形式的上、下近似基本定义之间的相

4、互关系,基于粗糙集近似原理,给出了每一类广义不可分辨关系下合适的上、下近似定义。由此,进一步对已有典型广义不可分辨关系下的上、下近似的性质进行了分析,发现对象子集的下近似会随着属性的减少而增大的规律。这些研究成果将有助于不完备决策表的知识约简方法设计。(第3章)(2)研究了量化容差关系中容差相似度的计算和阈值的选取问题,提出了一种数据驱动的量化容差关系模型,克服了已有典型广义不可分辨关系在对象分类性能上的不足。量化容差关系模型是经典粗糙集理论在不完备信息系统中的一种重要扩展模型。第1I页西南交通大学博士研究生学位论文但是,传统的容差相似度计算方法需预先知道不完备信息系统

5、中属性值的概率分布这一先验知识,且如何选取一个合适的阈值也是一个难点。为此,基于数据驱动的数据挖掘思想提出了一种数据驱动的量化容差关系模型。通过统计所有己知属性值出现的频率,综合考虑两个对象的属性值未知且相同的可能性和属性值已知且相同的属性所占的比重,得到一种更为客观和合理的容差相似度计算方法。为了避免人为设定阈值而影响模型分类的效果,提出了一种数据驱动的容差相似度阈值自主式获取方法。分类性能对比实验结果表明,本文提出的数据驱动的量化容差关系与已有典型广义不可分辨关系相比具有更加稳定和较高的分类能力。(第4章)(3)研究了含未知属性值的不完备决策表中基于广义不可分辨关系

6、的知识约简问题,提出了一个保持正域不减小的启发式属性约简算法和一个基于属性重要性的分层递阶值约简算法,为不完备决策表的决策规则获取提供了一种有效方法。针对广义不可分辨关系模型下不完备决策表的知识约简问题,依据正域会随着条件属性的减少而增大的规律,以获取更多确定性知识为目标,提出了保持分类能力不降低的知识约简策略,进而提出了一个保持正域不减小的启发式属性约简算法。通过模拟人脑分辨事物的分层递阶过程,提出了一个基于属性重要性的分层递阶值约简算法。实验结果表明,在各种广义不可分辨关系下,与以往保持正域不变的知识约简方法相比,采用本文提出的知识约简方法获取的决策规则集具有较高的

7、和稳定的正确识别率。这些研究成果将会进一步推动粗糙集理论在工业中的应用。(第5章)(4)研究了学习样本集未能覆盖整个问题空间的不完整决策表的正域约简问题,提出了一个属性序下的增量式正域约简更新算法,为不完整决策表的增量式知识获取奠定了基础。因各种原因使得知识获取所依赖的学习样本集仅是问题空间的一部分样本,对应的决策表系统被称为不完整决策表。本文就该类不完整决策表,考虑不同领域用户对知识获取有着不同的需求和兴趣,基于分辨矩阵元素集,提出了一个属性序下的增量式正域约简更新算法。实验结果表明,与非增量式正域约简算法相比,采用本文提出的基于属性序

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。