数据挖掘技术在精准扶贫的应用.doc

数据挖掘技术在精准扶贫的应用.doc

ID:61819363

大小:24.50 KB

页数:2页

时间:2021-03-21

数据挖掘技术在精准扶贫的应用.doc_第1页
数据挖掘技术在精准扶贫的应用.doc_第2页
资源描述:

《数据挖掘技术在精准扶贫的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、学无止境数据挖掘技术在精准扶贫的应用1数据挖掘技术助力精准扶贫的现实意义与可行性从2013年11月___提出“精准扶贫”重要思想以来,各基层工作人员深入一线开展调查,已经积累了大量的、真实准确的数据,而数据挖掘技术也在近年来愈加成熟。因此,将数据挖掘技术引入“精准扶贫”的数据分析中,其可行性的毋庸置疑的。2精准扶贫统计数据的内容与特点精准的扶贫离不开精准的数据,4年来,在广大基层干部的不断摸索下,对于如何收集数据,收集什么数据等问题已经有了较为成熟的体系。以贵州遵义地区某乡镇为例,所采集的数据包括了户编号、人员编号、姓名、证件号码、人数、与户主关系、民族、文化程度、是否在校生、劳动

2、能力、务工状况、务工时间、是否参加大病医疗、贫困属性、主要致贫原因、是否危房户、饮水安全情况、人均纯收入等18项数据。目前在采集数据环节尚存在的问题有:一是主要采用人工采集,效率低、数据少。二是所填写的数据表各地不一致,内容差异性较大。三是各地区基层干部对数据采集的口径理解不一致。基于以上问题,目前所采集到数据仍存在一些混乱的情况,这给下一步的数据挖掘带来了不小困难,需要进行大量的数据清理工作。3可用于精准扶贫的数据挖掘技术分析2学无止境一般来说,数据挖掘过程有以下几个步骤:一是明确要解决的问题和搜集正确的数据,二是进行数据预处理,三是决定采用哪一种挖掘算法,四是进行结果解释和评估

3、。本文所采用的数据已进行了预处理,下面着重讨论一下数据挖掘可用于精准扶贫数据分析的技术:关联规则与聚类分析。3.1关联规则。数据关联是数据库中存在可被发现的知识。若两个或多个变量的取值存在某种规律性,就称为关联。关联分析是数据挖掘的本质,既然数据挖掘的目的是发术。聚类分析又分为划分层次、基于密度的方法、基于网格的方法等三类,这里主要讨论划分层次法和基于密度的方法。划分层次法:将整个数据集中的数据凝聚为以候选代表点为中心的一个个集合,并通过密度阈值筛选,去掉一些过稀疏的候选代表点,留下的代表点即为排除孤立点的中间层聚类结果[3]。例如,根据对贫困户人均年纯收入作为数据对象进行层次划分

4、,我们发现,对于贫困人口为5951人的乡镇,其人均年纯收入主要集中在了2000—5000元档次。基于密度法:例如我们选取了“年龄”和“人均年收入”作为关联对象,通过基于密度的方法绘制出下图。上图中每个圆点为一个数据对象,所谓基于密度的方法即通过划分各个数据对象之间的距离来划分簇,然后通过研究簇之间的关系来分析数据结果[4]。设D为数据对象集合,且

5、D

6、=n,设数据对象的圆心为O,以ξ为半径,半径ξ内的区域称为数据对象O的邻域,数据对象之间的距离为l。若存在一个对象链p1,p2,……,pn,且pn从p1出发,使得该对象链各对象之间的距离l4结语随着精准扶贫工作的深入开展,所采集的数据

7、日益庞大,借助数据挖掘技术进行有目的的分析研究势在必行,通过数据挖掘和精准扶贫的有机结合,将为扶贫工作提供科学的建议与方向,极大地提高了工作与资金利用的效率。【参考文献】[1]贠艳冰.大数据背景下精准扶贫的机遇和挑战[J].科技经济导刊,2017(15):256.[2]何月顺.关联规则挖掘技术的研究及应用[D].南京:南京航空航天大学,2010.[3]张艳.基于密度和层次的快速聚类算法在数据挖掘中的设计及实现[J].信息安全与技术,2013(08):59-61.[4]洪龙,陈燕俐,王建东,等.数据挖掘中基于密度的聚类结构及算法设计[J].南京邮电学院学报,2003(04):6-11

8、.[5]王茜,刘书志.基于密度的局部离群数据挖掘方法的改进[J].计算机应用研究,2014(06):1693-1701.2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。