数据挖掘小文章.docx

数据挖掘小文章.docx

ID:35973453

大小:22.51 KB

页数:3页

时间:2019-04-29

数据挖掘小文章.docx_第1页
数据挖掘小文章.docx_第2页
数据挖掘小文章.docx_第3页
资源描述:

《数据挖掘小文章.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘数据挖掘是指从大量的数据中提取有趣的模式或知识,包括知识发现、知识提取、数据/模式分析、数据考古、商务智能等。把数据挖掘分开来看,就是“数据”和“挖掘”,数据挖掘的地方有关系数据库、数据仓库、交易数据库、数据流和传感器数据、时间数据库、社交网络数据库、异构数据库、空间数据库、文本数据库等。这些是存放数据的地方,数据挖掘可以从这些地方挖。而数据挖掘,又不是仅仅只是把数据找出来,数据挖掘包括挖掘数据的特征化和区分(汇总目标类、目标类与对比类比较),关联和相关分析(频繁模式),分类和预测(有监督学习,预测类标号,预测未知数值,通过决策树、支持向量机等方法),

2、聚类学习(无监督学习,最大化类内部的相似性或者最小化类之间的相似性),离群点分析(噪声或异常),时序(序列模式、趋势和演变分析),网络分析(图挖掘、信息网络挖掘等)。我的研究生大的研究方向是人工智能,在这个方向上经常会听到数据挖掘这类的专业名词,仔细分析数据挖掘所用的一些技术,包括机器学习、模式识别、统计、数据可视化、数据库、高性能计算等等,这些都跟人工智能有关系,实际上,数据挖掘已经渗透到计算机的各个研究方向,也已经渗透到各行各业,金融、零售业、电信业、科学与工程、生物、多媒体等等,任何一个方向都需要以数据为前提的,现今特别火热的一个词就是大数据,而数据量的

3、庞大、复杂仅仅是一个前提,如何把这样大量的数据挖掘出来,找到自己有用的部分,才是最重要的。目前数据挖掘已经有新的概念,在现实世界中,针对客观存在的具有海量性、不确定性、不完全性的量的、质的、复杂形态的知识源,挖掘其中潜在的、先前未知的、用户感兴趣的、最终可被用户理解的模式的非平凡提取过程。数据挖掘研究的动态与趋向包括:以知识发现的任务描述、知识评价与知识表示为主线,有效的知识发现算法为中心。这是在相当长的一段时间内保持的主流与基调。(1)原有理论方法的深化与拓展;(2)复杂类型(系统)数据挖掘、网络信息挖掘成为热点;(3)新技术与方法的引入(其它学科领域的渗透

4、);(4)理论融合交叉性研究;(5)基础理论研究;(6)大数据处理成为当今重大研究热点。正如上文,我提到数据挖掘,就不得不提一句大数据。对于大数据目前有不同的定义。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据

5、比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和

6、金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。目前的大数据有八大热点问题:数据科学与大数据的学科边界,数据计算的基本模式与范式,大数据特性与数据态,大数据的变换与价值提炼,大数据安全和隐私问题,大数据对IT技术架构的挑战,大数据的应用及产业链,大数据的生态环境问题。2013年

7、大数据发展的十大趋势为:数据的资源化;大数据的隐私问题突出;大数据与云计算等深度融合;基于大数据的智能;大数据分析的革命性方法;大数据安全;数据科学兴起;数据共享联盟;大数据新职业;更大的数据。2015年大数据研究发展趋势为:首先结合智能计算,大数据与神经计算、深度学习、语义计算以及人工智能其他相关技术结合,成为大数据分析领域的热点;与多学科融合,数据科学作为一个与大数据相关的新兴学科出现,真正支撑大数据发展的学科跨越还没有出现;与行业数据结合,实现跨领域应用,跨学科领域交叉的数据融合分析与应用将成为今后大数据分析应用发展的重大趋势;与物联网、云计算、移动互联

8、、社会计算等热点技术领域相互交叉融合,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。