数据挖掘课设报告.doc

数据挖掘课设报告.doc

ID:12954918

大小:1.58 MB

页数:28页

时间:2018-07-19

数据挖掘课设报告.doc_第1页
数据挖掘课设报告.doc_第2页
数据挖掘课设报告.doc_第3页
数据挖掘课设报告.doc_第4页
数据挖掘课设报告.doc_第5页
资源描述:

《数据挖掘课设报告.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、XI`ANTECHNOLOGICALUNIVERSITY课程设计报告课程名称数据挖掘专业:信息管理与信息系统班级:130513姓名:贾丹丹学号:130513117指导教师:李刚成绩:2016年1月3日前言数据挖掘就是从大量的数据中挖掘出有用的信息。它是根据人们的特定要求,从浩如烟海的数据中找出所需的信息来,供人们的特定需求使用。据国外专家预测,随着数据量的日益积累和计算机的广泛应用,在今后的5—10年内,数据挖掘将在中国形成一个新型的产业。数据挖掘,在人工智能领域,习惯上又称为数据库中的知识发现(KnowledgeDiscov

2、eryinDatabase,KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下三个阶段组成:(1)数据准备(2)数据挖掘(3)结果表达和解释。数据挖掘可以与用户或知识库交互。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘中的分类反映同类事物共同性质的

3、特征型知识和不同事物之间的差异型特征知识。最为典型的分类方法是基于决策树的分类方法。它是从实例集中构造决策树,是一种有指导的学习方法。该方法先根据训练子集(又称为窗口)形成决策树。如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到窗口中,重复该过程一直到形成正确的决策集。最终结果是一棵树,其叶结点是类名,中间结点是带有分枝的属性,该分枝对应该属性的某一可能值。  目录1业务理解12数据理解12.1英文版数据说明12.2数据的读入22.3浏览数据内容22.4指定各个变量的作用32.5观察各变量的数据分布特征43数据准备

4、43.1对数据进行重新分类43.2对数据进行平衡处理64建立决策树模型64.1C5.0,CART,CHAID算法介绍74.2模型建立84.3模型计算结果144.4模型结果分析175模型评估186总结20附录1:zoo.date21附录2:zoo.names241业务理解动物园动物数量大,种类多,对动物园的动物根据它们的特征进行分类,以便于观察和分析动物的特征,进而更加合理的管理动物以及为未来查找动物信息提供参考。2数据理解该数据集是从UCI网站上获得的一份关于动物园的动物的数据。该数据是收集的动物园中99种动物的特征,包括ha

5、ir,feathers,eggs,milk,airborne,aquatic,Predator,toothed,backbone,breathes,venomous,fins,legs,tail,domestic,catsize。现需利用数据挖掘将这些动物进行分类,分成7种类型。2.1英文版数据说明Source:Creator: RichardForsyth Donor: RichardS.Forsyth 8GrosvenorAvenue MapperleyPark NottinghamNG35DX 0602-621676Da

6、taSetInformation:Asimpledatabasecontaining17Boolean-valuedattributes.The"type"attributeappearstobetheclassattribute.Hereisabreakdownofwhichanimalsareinwhichtype:(Ifinditunusualthatthereare2instancesof"frog"andoneof"girl"!) Class#--Setofanimals: 1--(41)aardvark,antel

7、ope,bear,boar,buffalo,calf,cavy,cheetah,deer,dolphin,elephant,fruitbat,giraffe,girl,goat,gorilla,hamster,hare,leopard,lion,lynx,mink,mole,mongoose,opossum,oryx,platypus,polecat,pony,porpoise,puma,pussycat,raccoon,reindeer,seal,sealion,squirrel,vampire,vole,wallaby,w

8、olf 2--(20)chicken,crow,dove,duck,flamingo,gull,hawk,kiwi,lark,ostrich,parakeet,penguin,pheasant,rhea,skimmer,skua,sparrow,swan,vulture,wr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。