一种改进的多值属性模式聚类算法.pdf

一种改进的多值属性模式聚类算法.pdf

ID:52399774

大小:398.50 KB

页数:7页

时间:2020-03-27

一种改进的多值属性模式聚类算法.pdf_第1页
一种改进的多值属性模式聚类算法.pdf_第2页
一种改进的多值属性模式聚类算法.pdf_第3页
一种改进的多值属性模式聚类算法.pdf_第4页
一种改进的多值属性模式聚类算法.pdf_第5页
资源描述:

《一种改进的多值属性模式聚类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、电信息技术一种改进的多值属性模式聚类算法王珊珊梁同乐(1.广东轻工职业技术学院2.广东邮电职业技术学院)摘要:pCluster算法是面向多值属性数据的聚类算法,能识别出多值属性问的相似性。针对模式聚类算法pCluster效率低的问题,提出pCluster的改进算法。实验证明,该改进算法能更高效地获得预期聚类结果。关键词:关联规则;多值属性;模式聚类0引言分析。基于以上需求,模式聚类的概念逐渐在这些应用领域发挥优势,越来越多的学者开始关注应用模式实体属性的关联规则挖掘是数据挖掘研究的重聚类的概念进行子空间分群[12-14】。

2、要方向之一,其目的在于发现数据实体各属性间隐藏WangHaixun等在2002年提出了pCluster聚类算的聚类关系。这种关系具有切实的实践意义,广泛应法【1,不同于以往的聚类算法,其更加关注广泛意义用于医疗数据分析、商业信息推广和科学实验结果评上的属性子集相似模式,从而发现属性间的关联关系。价等领域。∞本文提出的pCluster优化算法,致力于提高pCluster实体的属性分为布尔型属性和多值属性。多数学聚类算法的收敛速度。者着重于布尔型属性关联规则算法的研究,而多值属性关联规则发掘的相关文献相对较少。多值属性关联1相

3、关研究介绍规则由SrikantR和AgrawalR等于1996年提出[1-2]。多数聚类算法是基于距离挖掘相似类别的成员,挖掘多值属性关联规则的算法,通常将每个属性值范即通过发现对象在子空间内距离的相近程度来度量。围映射为布尔型属性,然后用布尔型属性的挖掘算法然而,在某些特定的数据集中,相同的簇成员不体现进行关联规则发现,如Apriod算法。但这会出现2在对象间距离的相近,而是存在一种模式上的相似性。个问题:一是多值属性转化为布尔型属性时导致的数图1表示有3个对象10个属性的数据集。在这:3据量迅速膨胀;二是如何量化多值属

4、性的取值范围,个对象中并不存在明显的相似模式,但如果将其中部区间太窄可能造成对应的支持度过低,区间太宽则会分属性分离开,就可清晰地看到其中的相似性。例如出现可信度无法达到阈值的情况。目前,也有一些算查看属性集合

5、些相关研究探讨了高维子空间中群的发现¨J,然而这些聚类分群法大都是以物理距离作为相似度的计算基础,在某些情况下这种计算相似度的方式并不合适,例如基因序列中基因对反应的聚类,医疗数据中疾病属性值关联性的分析,这些数据往往需要在高图1原始数据集维数据空间中寻找具有相关联意义的部分,进而进行2015年第36卷第5期自动化与信息工程33当(D,对中任意2×2子矩阵均满足pScore(X)加∞如∞如加m0≤时,(D,n为一个6-pCluster。设c=(D,是一个6-pCluster,定义是C的最大维度集(maximumdimens

6、ionsets,MDS),当且仅当不存在任意T’3使得(D,7’’)也是一个6-pCluster。pCluster算法需对每2个对象及每对属性进行比较,产生MDS。这时将对象对产生的MDS称为o-pairMDS,属性对产生的MDS称为c-pakMDS。由数据集产生的所有MDS中,图2对象的属性子集相似模式包含了可能构成pCluster的全部信息。接下来对o-pairMDS和c-pairMDS进行相互剪ChengY.等在2000年提出了bicluster算法[161。设枝操作。MDS的剪枝过程是pCluster算法的重要组为

7、对象的集合,y为属性的集合,令I172且Jc】,’成部分。假设是对象和的MDS,Dd6是屙陛a则(』,)表示一个子矩阵A,J,残差的平方的平均值和b对应的MDS。对任意一个MDS中的属性a,州2(ao.一一+)’.计算Oab的MDS中包含,)的个数,当个数小于nc一1时(nc是pCluster要求的最小属性数),则将属性a其中:d=∑表示对象的属性平均值(行平从中去除,如果剪枝后的II

8、换为r(pCluster要求的最小均值);表示全部对象属性值的平对象数)。反复使用c-pairMDS与o-pairMDS相互均值(子矩阵平均值)。剪枝,直至没有任何MDS可被删除为止。当≤(>0)时,A上,称为一个6-bicluster。最后将余下的o-pairMDS插入一个以属性为路YangJiong

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。