数据仓库与数据挖掘序论 ppt课件

数据仓库与数据挖掘序论 ppt课件

ID:19491333

大小:1.50 MB

页数:68页

时间:2018-10-02

数据仓库与数据挖掘序论 ppt课件_第1页
数据仓库与数据挖掘序论 ppt课件_第2页
数据仓库与数据挖掘序论 ppt课件_第3页
数据仓库与数据挖掘序论 ppt课件_第4页
数据仓库与数据挖掘序论 ppt课件_第5页
资源描述:

《数据仓库与数据挖掘序论 ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库与数据挖掘主讲教师:王浩畅E-mail:wanghch_angel@tom.comSchoolofComputer&InformationTechnologyofNEPU教科书和参考书教科书数据挖掘:概念与技术,JiaweiHan和MichelineKamber著,机械工业出版社(2008)参考书J.HanandM.Kamber.DataMining:ConceptsandTechniques.2nded.机械工业出版社2006P.-N.Tan,M.SteinbachandV.Kumar,IntroductiontoDataMining.人民邮电出版社2005I.H.

2、WittenandE.Frank,DataMining:PracticalMachineLearningToolsandTechniques2nded.机械工业出版社2005课堂要求必须在打预备铃前到教室,不得迟到、早退、旷课。迟到一次平时成绩扣5分,旷课一次平时成绩扣10分上课时必须关闭手机,严禁在上课时间打电话、短信聊天。对扰乱课堂纪律的学生将责令退出课堂,并以旷课论处。缺课超过1/3不能参加考试期末成绩=平时成绩占10%+实验成绩占10%+考试成绩占80%第1章引言1.1数据挖掘的发展动力1.2什么是数据挖掘1.3对何种数据进行数据挖掘1.4数据挖掘功能1.5所有模式都

3、是有趣的吗1.6数据挖掘系统的分类1.7数据挖掘技术和数据仓库技术的集成1.8数据挖掘的主要问题数据挖掘的发展动力(1)需要是发明之母数据爆炸问题自动数据收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库、数据仓库或其他信息库中以待分析。我们拥有丰富的数据,但却缺乏有用的信息解决方法:数据仓库技术和数据挖掘技术数据仓库(DataWarehouse)和在线分析处理(OLAP)数据挖掘:在大量的数据中挖掘感兴趣的知识(规则,规律,模式,约束)数据挖掘的发展动力(2)数据库技术的演化1960s和以前:文件系统1970s:层次数据库和网状数据库1980s早期:关系数据模型,

4、关系数据库管理系统(RDBMS)的实现数据挖掘的发展动力(3)1980s晚期:各种高级数据库系统(扩展的关系数据库,面向对象数据库等等.)面向应用的数据库系统(空间数据库,时序数据库,多媒体数据库等等)1990s:数据挖掘,数据仓库,多媒体数据库和网络数据库2000s流数据管理和挖掘基于各种应用的数据挖掘XML数据库和整合的信息系统第1章引言1.1数据挖掘的发展动力1.2什么是数据挖掘1.3对何种数据进行数据挖掘1.4数据挖掘功能1.5所有模式都是有趣的吗1.6数据挖掘系统的分类1.7数据挖掘技术和数据仓库技术的集成1.8数据挖掘的主要问题什么是数据挖掘?(1)数据挖掘(从数

5、据中发现知识)从大量的数据中挖掘哪些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识挖掘的不仅仅是数据(所以“数据挖掘”并非一个精确的用词)数据挖掘的替换词数据库中的知识挖掘(KDD)知识提炼、数据/模式分析数据考古数据捕捞、信息收获等等。并非所有东西都是“数据挖掘”查询处理.专家系统或是小型的数学计算/统计程序什么是数据挖掘?(2)数据挖掘的应用数据分析和决策支持市场分析和管理目标市场,客户关系管理(CRM),市场占有量分析,交叉销售,市场分割风险分析和管理风险预测,客户保持,保险业的改良,质量控制,竞争分析欺骗检测和异常模式的监测(孤立点)其他的应用文本挖掘

6、(新闻组,电子邮件,文档)和WEB挖掘流数据挖掘DNA和生物数据分析等等。什么是数据挖掘?(3)数据挖掘应用—市场分析和管理(1)数据从那里来?信用卡交易,会员卡,商家的优惠卷,消费者投诉电话,公众生活方式研究目标市场构建一系列的“客户群模型”,这些顾客具有相同特征:兴趣爱好,收入水平,消费习惯,等等确定顾客的购买模式交叉市场分析货物销售之间的相互联系和相关性,以及基于这种联系上的预测什么是数据挖掘?(4)数据挖掘应用—市场分析和管理(2)顾客分析哪类顾客购买那种商品(聚类分析或分类预测)客户需求分析确定适合不同顾客的最佳商品预测何种因素能够吸引新顾客提供概要信息多维度的综合

7、报告统计概要信息(数据的集中趋势和变化)什么是数据挖掘?(5)数据挖掘应用—公司分析和风险管理财务计划现金流转分析和预测交叉区域分析和时间序列分析(财务资金比率,趋势分析等等)资源计划总结和比较资源和花费竞争对竞争者和市场趋势的监控将顾客按等级分组和基于等级的定价过程将定价策略应用于竞争更激烈的市场中什么是数据挖掘?(6)数据挖掘应用—欺诈行为检测和异常模式的发现(1)方法:对欺骗行为进行聚类和建模,并进行孤立点分析应用:卫生保健、零售业、信用卡服务、电信等汽车保险:相撞事件的分析洗钱:发现可疑的货币交

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。