比较空间群集合

比较空间群集合

ID:47535774

大小:314.00 KB

页数:11页

时间:2020-01-13

比较空间群集合_第1页
比较空间群集合_第2页
比较空间群集合_第3页
比较空间群集合_第4页
比较空间群集合_第5页
资源描述:

《比较空间群集合》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、比较空间群集合MichaelH.Coenmhcoen@cs.wisc.eduM.HidayathAnsariansari@cs.wisc.eduNathanaelFillmorenathanae@cs.wisc.eduUniversityofWisconsin-Madison,1300UniversityAve,Madison,WI53706USA摘要本文提出了一种比较群集合,同时用了划分与几何的新方法。我们的做法是出于以下观察:以前比较群集合技术绝大多数是完全划分的,也就是说,他们在设置检查点理论方面的

2、任务后,他们已分区。在这样做时,这些方法忽略了数据的空间布局,与事实相反的,这些信息在开始的时候是用于生成群集合。我们表示这导致了各种各样的失败模式。之前的比较技术往往不能区分被聚集在数据作出重大改变。我们制定一个比较新的措施,用最优化理论空间和划分的信息结合群集合到一个单一的措施。这样做消除了以前的办法病态的状态。它也同时删除一些常见的限制,例如每个集群必须有相同数量的群集或他们在相同的数据集。这种方法是稳定的,易于实现,具有较强的直观的吸引力。1.简介本文提出了一种比较群集合同时用了划分与几何的新方法

3、。我们呼吁我们的新的比较函数聚类距离或C距离。我们认为,这是第一个比较群集合根据其空间属性以及它们的群集成员分配原则的做法。我们认为,作为一个坐落在一个空间与距离相关的功能点集合划分聚类。这种看法是自然的,因为流行的聚类算法,如均值,谱聚类,亲和传播等,不仅作为输入一个将要聚集点的集合,而且对空间中的点在于距离的函数。这个距离函数可以指定含蓄,它可能是由一个内核改变,但它必须定义这种或那种方式,其性质是至关重要的一个聚类算法的输出。与此相反,几乎所有现有的集群技术比较忽略两点之间的距离,原子当作具体形式表

4、现出来的分区聚类。虽然这种做法在某些情况下具有一些优点,他好像是很大程度上的忽略了用来构建聚类的距离函数。这样做似乎摒弃了在某种意义上是最基本的信息。事实上,在第3节中,我们表现出了群集合有威不同的空间属性,但实质上是几乎所有以前的聚类技术比较难以区分数量。其中一个例子是在图1。只有一个现有的集群比较,我们发现可以区分最左边的参考集群及其两个修改到正确的技术,我们审查在第3节中有一个例外的弱点。本文的主要贡献是一个比较群集合,考虑到他们的空间属性需要的新技术。特别是,我们的技术回答了这个问题:如何做两井群

5、集合点“重叠“在一个特定的空间因此,我们的技术并不只评估作业点的分区,它也考虑到了每个点的位置?集群,该集群的形状和集群之间的空间关系。通过将空间信息,我们的方法提供了一些额外的好处。首先,我们可以比较无法被许多其他技术考虑群集合,具体而言,我们可以比较群集合:(1)不同位置的点;(2)不同数量的点;和(3)不同数量集群。我们不知道其他群集比较技术,允许这样的条件下都比较同步,特别是条件(1)及(2),大部分是在文献中得到解决。最后,相对于其他一些办法,我们的工作还扩展了一个简单的方法来软的(非划分的)聚

6、类。我们briey在回顾一些应用中,聚类距离是有益的。(1)由于集群是一种无监督学习技术,比较了聚类算法的输出是困难的。在某些情况下,有可能是一个黄金标准是我们希望我们的算法同意。测出的黄金标准聚类算法的输出提供了距离该算法是否是一个合适的定域的重要见解。(2)我们可以探索通过反复抽样DataSet和比对彼此的算法的结果的聚类算法的结果对数据集的稳定。(3)如果两个聚类算法的产出倾向于同意某些数据类型,我们可能更愿意用较低的计算复杂性算法比较算法,输出可以让我们这种决心。(4)最后,在合奏聚类,我们可以采

7、用的聚类算法,利用数学的data.Asking为不同属性,如果它们的输出都划分与几何兼容增加了一个额外的维数进行比较等。2.方法在本节中,我们描述新的聚类比较技术连同上计算其价值的群集合对算法。我们首先做一个精确的描述集群概念和一些需要制定我们的方法的先决条件。2.1.聚类A(hard)聚类A是一个集成集12K称为集群(这句实在是难以翻译)如下我们假设,因此1K,是一个度量空间(,)的有限子集。2.2.优化运输距离运输问题的最佳(Hillier&Lieberman,1995;Rachev&Ruschend

8、orf,1998)提出了什么是最便宜的方式将一个设置为从源汇的群众,谁是一段距离?这里的成本是指总质量科幻移动距离。例如,可以考虑作为源和汇的工厂作为仓库,使问题具体。我们假设的来源是航运多汇的质量完全一样的期待。从形式上看,在优化运输问题,我们得到的加权点集()和(),其中={1

9、A

10、}是一个度量空间有限子集(ΩΩ),=(1

11、A

12、)是一个相关的非负权重向量总结为一个,并举行类似的定义和。最佳的运输距离在()和()之间,定义为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。