聚类技术在车险业务分析中的应用研究

聚类技术在车险业务分析中的应用研究

ID:34003005

大小:2.47 MB

页数:85页

时间:2019-03-03

聚类技术在车险业务分析中的应用研究_第1页
聚类技术在车险业务分析中的应用研究_第2页
聚类技术在车险业务分析中的应用研究_第3页
聚类技术在车险业务分析中的应用研究_第4页
聚类技术在车险业务分析中的应用研究_第5页
资源描述:

《聚类技术在车险业务分析中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学硕士学位论文聚类技术在车险业务分析中的应用研究姓名:彭崇申请学位级别:硕士专业:计算机软件与理论指导教师:吴跃20070423摘要数据挖掘是近些年来发展起来的新技术,通过数据挖掘,人们可以发现数据背后隐藏的有价值的、潜在的知识,为科学地进行各种商业决策提供强有力的支持。当今,数据挖掘已发展成一门跨越多领域的学科,已经成为数据库、模式识别、神经网络、统计学、计算智能等领域的研究者关注的热点。本文首先介绍了数据挖掘研究的相关背景,对数据挖掘中的聚类分析的相关工作作一个简要的概述,并且结合车险业务中的挖掘主题,详细分析

2、了聚类技术在车险业务中的应用。其应用主题主要在三方面:客户细分,欺诈识别和客户投保行为分析。本文研究了现有的迭代优化聚类的初始化方法:即采样法,密度估计法以及距离优化法,分析了它们的优缺点,提出一种新的基于层次聚类算法的初始化方法。该方法能够找到较为自然的初始聚类中心,且对孤立点和噪声有较强的抑制,适用于大规模数据的聚类初始化。K-means算法是聚类算法中主要算法之一,它是一种基于划分的聚类算法。该算法随机选取K(K为聚类数)个点作为初始聚类中心,通过一个迭代过程完成聚类。如果初始聚类中心选取不合理,就会误导聚类过程,得到

3、一个不合理的聚类结果。本文用新的聚类初始化方法K-means算法中初值选取方法进行了改进,采用对数据集进行均匀采样,得到一个能在一定程度上代表原数据集特征的子集,在子集中采用层次聚类算法得到k个聚类中心,最后在原数据集上以这k个聚类中心最近的点作为初始聚类中心进行K-means算法聚类。由于层次聚类算法是在一个小数据集上运行的,计算量不会很大。在进行K-means算法聚类时,由于初始聚类中心接近真实值,可以大大提高聚类效果。K-means算法在运行过程中需要不断迭代,直到终止于局部最优解。这一过程反复计算比较,计算量较大时对

4、算法效率有较大影响。本文提出一种基于内积不等式的改进方法,内积不等式是基于数据点的模和向量内积的不等式,并且改写了K-means算法处理过程。通过实验验证了可行性。本文针对数据挖掘聚类算法在车险业务分析中的应用,结合实际应用设计并实施了一个车险CRM数据挖掘原型系统。本文从系统功能,模块划分和处理流程等方面进行详细分析与讨论,并展示了部分己实现的功能。摘要关键词:数据挖掘聚类分析K-means层次聚类IIABSTR^CTDataminingisanewtechnique,whichhasbecomeincreasinglyp

5、opularinrecentyears.Peoplecandiscovervaluablerolesbehindthedatathatcansupportthesciencedecision.Nowdatamininghasbecomeasubjcot,whichinvolveslotsofsciencedomainandtechnologysuchasdatabase,patternrecognition,neuralnetworkandcomputationalintelligenceetc.Firstly,thisdi

6、ssertationintroducesthebasicconcepts,tasks,functions,applicationsanddevelopmentwayofdatamining.Wemakeabriefsummaryabouttheclusteringanalysisofdatamining.Wecombinethedataminingsubjectsofthecarinsurancebusinesswiththeclusteringways,analyzinghowtheclusteringalgorithms

7、areappliedinthecarinsurancebusiness.Therearethreedataminingsubjectsforthisbusiness:customersegmentation,fraudrecognitionandcustomerbehavior.Thisdissertationstudiesseveralinitializationmethods,includingtherandomsampling,thedistanceoptimizationandthedensityestimation

8、.Anovelinitializationmethodbasedonthehierarchyclusteringalgorithmisproposed.Comparedwithpresentinitializationmethods,thismethodcouldfindthenatura

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。