数据挖掘实验报告--超市商品销售分析及数据挖掘.doc

数据挖掘实验报告--超市商品销售分析及数据挖掘.doc

ID:55411433

大小:131.00 KB

页数:9页

时间:2020-05-12

数据挖掘实验报告--超市商品销售分析及数据挖掘.doc_第1页
数据挖掘实验报告--超市商品销售分析及数据挖掘.doc_第2页
数据挖掘实验报告--超市商品销售分析及数据挖掘.doc_第3页
数据挖掘实验报告--超市商品销售分析及数据挖掘.doc_第4页
数据挖掘实验报告--超市商品销售分析及数据挖掘.doc_第5页
资源描述:

《数据挖掘实验报告--超市商品销售分析及数据挖掘.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、通信与信息工程学院课程设计说明书课程名称:数据仓库与数据挖掘课程设计题目:超市商品销售分析及数据挖掘专业/班级:电子商务(理)组长:学号:组员/学号:开始时间:2011年12月29日完成时间:2012年01月3日目录1.绪论11.1项目背景11.2提出问题12.数据仓库与数据集市的概念介绍12.1数据仓库介绍12.2数据集市介绍23.数据仓库33.1数据仓库的设计33.1.1数据仓库的概念模型设计43.1.2数据仓库的逻辑模型设计53.2数据仓库的建立53.2.1数据仓库数据集成53.2.2建立维表84.OLAP操作105

2、.数据预处理125.1描述性数据汇总125.2数据清理与变换136.数据挖掘操作136.1关联规则挖掘136.2分类和预测176.3决策树的建立186.4聚类分析227.总结258.任务分配26数据挖掘实验报告1.绪论1.1项目背景在商业领域中使用计算机科学与技术是当今商业的发展方向,而数据挖掘是商业领域与计算机领域的乔梁。在超市的经营中,应用数据挖掘技术分析顾客的购买习惯和不同商品之间的关联,并借由陈列的手法,和合适的促销手段将商品有魅力的展现在顾客的眼前,可以起到方便购买、节约空间、美化购物环境、激发顾客的购买欲等各种

3、重要作用。1.2提出问题那么超市应该对哪些销售信息进行挖掘?怎样挖掘?具体说,超市如何运用OLAP操作和关联规则了解顾客购买习惯和商品之间的关联,正确的摆放商品位置以及如何运用促销手段对商品进行销售呢?如何判断一个顾客的销售水平并进行推荐呢?本次实验为解决这一问题提出了解决方案。2.数据仓库与数据集市的概念介绍2.1数据仓库介绍数据仓库,英文名称为DataWarehouse,可简写为DW或DWH,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。........2.

4、2数据集市介绍数据集市,也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。.......3.数据仓库3.1数据仓库的设计3.1.1数据库的概念模型3.1.2数据仓库的模型数据仓库的模型主要包括数据仓库的星型模型图,我们创建了四个维表和一个事实表。四个维表为:item维表,time维表,branch维表,location维表。事实表为:sales事实表。其中,3.2数据仓库的建立3.2.1数据仓库数据集成我们小组粗略的统计了超市一年的销售记录,并建立了数据库。其....当然,这只是

5、最初的表,后面还要进行数据清理与转换,对其进一步改进,以便于数据挖掘。3.2.2建立维表item维表branch维表location维表sales事实表4.OLAP操作按时间上卷:切块:按片查询:整个数据立方体:5.数据预处理5.1描述性数据汇总【saleID】S*:销售号(笔数)【customerID】C*:顾客编号【productID】P*:购买的商品号【timeID】T*:时间号(月)5.2数据清理与变换数据清理:(1)初始表格在前面已经给出,每笔交易中购买的商品不止一....数据变换:对不同的数据类型做不同的变换。

6、比如男女分别用1,0表示;高中档商品用1,0表示;收入统一除以10000。6.数据挖掘操作6.1关联规则挖掘6.1.1频繁一项集筛选I1支持度的代码及结果为:输出结果为:24其他一项候选集同理6.1.2、频繁二项集筛选频繁二项集候选集为(I1,I18),(I1,I2),(I1,,I3),(I1,I4),(I1,I5),(I1,I7),(I18,I2),(I18,I3),(I18,I4),(I18,I5),(I18,I7),(I2,I3),(I2,I4),(I2,I5),(I2,I7),(I3,I4),(I3,I4),(I3

7、,I5),(I3,I7),(I4,I5),(I4,I7),(I5,I7)(I1,I18)的支持度代码和结果为:输出结果为:15I3和I18支持度的代码和结果为:输出结果为:14I1和I3支持度的代码和结果为:输出结果为:18同理可得:6.1.3、频繁三项集筛选频繁三项集候选集为:(I1,I3,I18)(I1,I3,I18)的支持度代码和结果为:输出结果为:13综上可得I1、I3和I18的支持度和置信度为:由上可知:1.顾客习惯一起购买商品I1,I3,I18,即牛奶面包和电视机2.所以超市可以将牛奶面包电视机摆放在一起6.2

8、分类和预测预测的结果可以用关联规则的结果和OLAP的结果来说明。预测结果如下:1.根据OLAP从日到月上卷操作,1月为销售旺季,商店可以在此期间加大供应量,以获得更大利润。2.顾客对牛奶的需求很大,且为蒙牛牛奶3.顾客对面包的需求也很大,且为安琪面包4.对步步高电视机的需求也很大。6.3决策树的建立:通

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。