商务智能实验报告

商务智能实验报告

ID:45584693

大小:495.76 KB

页数:11页

时间:2019-11-15

商务智能实验报告_第1页
商务智能实验报告_第2页
商务智能实验报告_第3页
商务智能实验报告_第4页
商务智能实验报告_第5页
资源描述:

《商务智能实验报告》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《商务智能》综合性、设计性实验成绩单开设时间:2014-2015学年第二学期班级学号姓名实验题目实验三数据挖掘实验成绩教师签名ABC评分标准DE比重%内容完成悄况□□□□□25%系统分析设计□□□□□30%系统设计水平□□□□□20%实验报告撰写□□□□□10%总结□□□□□5%其他(功能)□□□□□10%总评一、实验目的1.掌握数据挖掘的建模方法,理解数据挖掘的原理;2•学习使用SPSSCLEMENTINE11.1屮基木的数据挖掘建模匸具;3.了解数据挖掘建模的机制,实现数据挖掘的建模。二、实验内容1.以数据挖掘建模工具依据,在SPSSCLEMENTTN

2、E11.1环境下创建一个数据挖掘模型,在该模烈中实现数据挖掘的冃标邮件、预测、购物篮分析以及顺序分析和聚类分析其中的一个基木功能;2.在任选题目中选三个完成相关实验步骤并提交实验报告。三、实验步骤与结果题目1:欺诈屏蔽(异常检测/神经网络)1.目的:熟悉各种聚类分析方法,了解神经网络分析方法与过程。并掌握异常检测的方法。2.实验内容:(1)聚类分析。(2)神经网络建模。(3)异常检测。(4)此实验显示了Clementine在检测诈欺行为方而的应用。这一领域涉及农业发展财政补贴申请。冇两种财政补贴类型在考虑Z列:耕地开发财政补贴和退役出地财政补贴。3模型建立

3、与分析:在这次给出的题目屮,我们需要建立两个模型,进行进一步的分析。模型一:1.模型建立过程按照给岀的教程一步一步操作,可以得出以下模型一,过程比较简单,遇到的一个小问题是找不到黄色的anomaly,在基木操作中没冇指出黄色的anomaIy是运行后生成的,我们只在下面列表中选择查找,做了无用功。在询问同学后,才解决了这个简单的问题。2.结果分析如您所期望的那样,将标志出金额最髙的屮请。不过,还标志岀了许多其他金额的屮请,其中包括某些金额最低的申请。要弄清事情缘由,冇必要进一步观察数据$0-Anomaly0F■T模型二1.建立过程要继续分析诈欺数据,可以使用

4、勘察表来调杳数据。此操作可帮您设立对建模很有用的假设条件,根据教程给出的步骤建模,可得到以下模型:tablenameclaimdiffTable(generated)name2.结果分析在导出节点后再连接—个导出节点在公式中输入:(abs(farmincome)garmincome)*100),然后在节点后添加直方图节点。双击直方图图标,字段选择diff,颜色选择claimtype,点击执行牛成直方图,从图小可以看出大偏差都发在财政补贴。claimtypearable_devdeconunission_land添加神经网络节点并执行。一旦神经网络训练结束,

5、可以将已生成模型添加到流,然示绘制一涨预期申请金额与实际申请金额的比较图。可知道大多数案例的预期申请金额与实际申请金额都棊本相符600,0001111J::Q:刁too,000A■•HM°200,0000500,0001,000,0001,500,0002,000,000mmincropOmaize•potatoes•rapeseedOwheatestincone为了说明实际中请金额与预估巾请金额Z间的差界,谙使用claimdiff直方图。我们主要想了解屮请金额比预估金额(由神经网络判断)高的人。4总结1•木例演示了两种筛选潜在诈欺案例的方法-“异常检测”

6、和棊于“神经网络”的建模方法。1.使用“异常检测”进行预筛选示,您可以创建一个模型,将模型预测值与数据集中的现有值(关于出地收入字段)进行比较。从比较结果看出,偏差主要出现在某类财政补贴申请(耕地开发)小,然后选择和应记录进行进一步调查。通过训练神经网络模型,中请金额少田地大小、评佔收入、主要农作物等之间建立了关系。与网络模型预估金额相差较大(大于50%)的申请将检测出來并有待进一步调查。当然,有可能所有这些申请都是有效的,但他们与标准数据存在偏差的事实值得引起人们的注意。2.为了进行比较,将再次使用异常检测节点,但此次只针对“神经网络”分析屮包含的耕地开

7、发财政补贴使用该节点。除存在些微差别Z外,此方法得到的结果与“神经网络”方法儿乎相同。由于两种方法均为勘察方法,这也在情理Z中。题目7:预测产品分类销售情况(时间序列)1.背景:本实验的数据是来自于Clementine软件中自带的Catalog_seasfac.sav数据源。该数据是一个产品分类销售公司过去10年的销售数据,时间跨度是1990-1999年。2.实验冃的:根据这些数据预测其男装生产线的月销售情况。3.实验过程:实验步骤严格按照软件应用程序示例中所说的进行。按照示例中所说的进行过程中,一共建立了5个流,输岀图表5张。除了第一个流在表现上不同于后

8、4个流,其他的流在外表上没冇什么区别,如图所示:menE中耶冃*d

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。