管理决策模型与方法--聚类分析

管理决策模型与方法--聚类分析

ID:39891945

大小:650.51 KB

页数:147页

时间:2019-07-14

管理决策模型与方法--聚类分析_第1页
管理决策模型与方法--聚类分析_第2页
管理决策模型与方法--聚类分析_第3页
管理决策模型与方法--聚类分析_第4页
管理决策模型与方法--聚类分析_第5页
资源描述:

《管理决策模型与方法--聚类分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、管理决策模型与方法(聚类分析部分)(适用于信息管理与信息系统、工商管理专业30H)主讲教师:屈春艳工商管理学院信息管理教研室第三章聚类分析聚类分析,亦称群分析或点群分析,它是研究对样品或指标进行分类的一种多元统计分析方法(它是研究多要素事物分类问题的数量方法)。所谓的类通俗地说就是相似元素的集合。什么是分类?分类是将一个观测对象指定到某一类(组)。工商管理学院信息管理教研室分类的问题可以分成两种:一种是对当前所研究的问题已知它的类别数目,且知道各类的特征(如分布规律、或知道来自各类的训练样本),我们的目的是要将另一些未知类别的个体正确归属于其中某一类,这是判别分

2、析所要解决的问题。另一种是事先不知道研究问题应分成几类,更不知道观测的个体的具体分类情况,我们的目的正是需要通过对观测数据所进行的分析处理,选定一种度量个体接近程度的统计量、确定分类数目、建立一种分类方法,工商管理学院信息管理教研室并按亲近程度对观测对象给出合理的分类。这种问题在实际中大量存在,它正是聚类分析所要解决的问题。工商管理学院信息管理教研室第一节聚类分析的方法聚类分析的职能是建立一种分类方法,其基本原理是,根据样品(本)自身的属性,用数学方法按照某些相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。工商管理学院信息管

3、理教研室聚类分析的方法聚类分析的内容十分丰富,按其聚类的方法可分为以下几种:1、系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其它类的距离或相近性测度。这一过程一直继续直到所有对象归为一类为止。2、调优法(动态聚类法):首选对n个对象初步分类,然后根据分类的损失函数尽可能小的原则对分类进行调整,直到分类合理为止。工商管理学院信息管理教研室聚类分析的方法3、最优分割法(有序样品聚类法):开始将所有样品看成一类,然后根据某种最优准则将它们分割为二类、三类,一直分割到所需的k类为止。这种方法适用于有序样品的分类问题,也称为有序样品的

4、聚类法。4、模糊聚类法:利用模糊集理论来处理分类问题,它对经济领域中具有模糊特征的两态数据或多态数据具有明显的分类效果。工商管理学院信息管理教研室聚类分析的方法5、图论聚类法:利用图论中最小支撑树的概念来处理分类问题,创造了独具风格的方法。6、聚类预报法:利用聚类方法处理预报问题,在多元统计分析中,可用来做预报的方法很多,如回归分析和判断分析。但对一些异常数据,如气象中的灾害性天气的预报,回归或判断分析处理的效果都不好,而聚类预报弥补了这一不足,这是一个值得重视的方法。工商管理学院信息管理教研室R型聚类分析聚类分析根据分类对象的不同分为R型和Q型在大类。R型是对

5、变量(指标)进行分类处理,R型聚类分析的目的有以下方面:(1)可以了解变量间及变量组合间的亲疏关系;(2)对变量进行分类;(3)根据分类结果及它们之间的关系,在每一类中选择有代表性的变量作为重要变量,利用少数几个重要变量进一步作分析计算,如进行回归分析或Q型聚类分析等。工商管理学院信息管理教研室Q型聚类分析Q型是对样品进行分类处理。Q型聚类分析的目的主要是对样品进行分类。分类的结果是直观的,且比传统分类方法更细致、全面、合理。当然使用不同的分类方法通常会得到不同的分类结果。对任何观测数据都没有惟一“正确的”的分类方法。实际应用中,常采用不同的分类方法,对数据进行

6、分析计算,以便对分类提供意见,并由实际工作者决定所需要的分类数及分类情况。工商管理学院信息管理教研室第二节聚类要素的数据处理为了对样品(或变量)进行分类,就必须研究它们之间的关系。描述样品间亲疏相似程度的统计量很多,目前用得最多的是距离和相似系数,这两个统计量与变量的类型密切相关,为此我们首选分析一下变量的类型。工商管理学院信息管理教研室一、变量的类型根据变量取值的不同可将变量分为以下几种:1、名义变量:变量值是几个没有次序之分的不同状态,它给变量值赋予名称。例如,性别、汽车品牌、职业、血型、是否患病、喜爱的颜色等等都是名义变量。2、有序变量:变量值是严格有次序

7、的不同状态。例如产品按质量分为:不好、一般、好、很好。文化程度分为高、中、低等。工商管理学院信息管理教研室一、变量的类型3、区间变量(或间隔变量):区间变量是有顺序大小的数值变量,且数值间的差值是有意义的。例如考虑温度,40度比10度热30度,而40度和10度是相对于人们取定的0度而言的。这类变量对减法:两值之差是意义的;但对两值的比率是没有意义的。4、比率变量(比例变量):比率变量也是数值变量,不仅数值之差有意义,而且要求有绝对的零点,两数值的比率也是很重要。工商管理学院信息管理教研室上述四类变量中,名义变量和有序变量也称为属性变量(或定性变量),有时也称为离

8、散变量;而区间变量和比率

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。