3901130721-谭淇蔚-电子商务实验4

3901130721-谭淇蔚-电子商务实验4

ID:46864694

大小:194.00 KB

页数:38页

时间:2019-11-28

3901130721-谭淇蔚-电子商务实验4_第1页
3901130721-谭淇蔚-电子商务实验4_第2页
3901130721-谭淇蔚-电子商务实验4_第3页
3901130721-谭淇蔚-电子商务实验4_第4页
3901130721-谭淇蔚-电子商务实验4_第5页
资源描述:

《3901130721-谭淇蔚-电子商务实验4》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《电子商务应用》实验报告项目名称电子商务数据挖掘实验专'Ik班级软件工程1307班学号3901130721姓名谭淇蔚实验成绩:批阅教师:2015年11月25日实验4《电子商务数据挖掘实验》实验学时:2每组人数:]实验类型:2(1:基础性2:综合性3:设计性4:研究性)实验要求:1(1:必修2:选修3:其它)实验类别:3(1:基础2:专业基础3:专业4:其它)一、实验目的1.加深对数据挖掘概念和主要任务的理解。2•研究并学习几种常用的关联分析算法、分类算法、聚类算法和异常检测方法,了解它们的实现原理以及在电了商务中的应

2、用。3.研究并学习几种常用的个性化商品或信息推荐方法,并结合选题设计一个简单-的商詁或信息推荐模型。二、实验内容1.研究并学习两种常用的关联分析算法的实现原理并编程实现其中一种,编程语言不限。2.研究并学习两种常用的分类算法的实现原理并编程实现其中一种,编程语言不限。3.研究并学习两种常用的聚类算法的实现原理并编程实现其中一种,编程语言不限。4.研究并学习两种常用的异常检测方法的实现原理。5.研究并学习两种常用的个性化商品或信息推荐方法,了解其实现原理和特点。6.结合选题,设计一个简单的商品或信息推荐模型。【注意:模

3、型不一定要很复杂,关键是要能够说明其合理性,鼓励大家创新。以下两种商品推荐模型(信息推荐模型思路相似)基本思想供参考,也可在此基础上进行改进:①分析用户的购买记录,找出他经常购买的商品的类型,然后在该类型中找出购买量或者访问量最大但是该买家之前并未购买的商品,并将这些商品推荐给该用户。②找出与该用户具有相似购物习惯的其他用户,例如他们曾经购买过一些相同的商品,然后将其他用户购买过但是该用户未曾购买的商品推荐给他。】三、实验要求1.研究两种常'用的关联分析算法,填行相应的表格,表格必须填行完整,任选一种编程语言实现其中

4、的一种算法,要求提供详细源代码;2.研究两种常用的分类算法,填写相应的表格,表格必须填写完整,任选一种编程语言实现其中的一种算法,要求提供详细源代码;3.研究两种常用的聚类算法,填写相应的表格,表格必须填写完整,任选一种编程语言实现其中的一种算法,要求提供详细源代码;4.研究两种常用的异常检测方法,填写相应的表格,表格必须填写完整;5.研究两种常用的个性化商品或信息推荐方法,填写相应的表格,表格必须填写完整;6.结合选题,设计一个简单的商品或信息推荐模型,要求详细说明其实现过程,包括公式、流程等,但无需编程实现。U!

5、实验步龙1.通过使用搜索引擎并查阅相关资料,研究并整理两种常用的关联分析算法,填写相应的表格并选择一种编程实现;2.通过使用搜索引擎并查阅相关资料,研究并整理两种常用的分类算法,填写相应的表格并选择一种编程实现;3.通过使用搜索引擎并查阅相关资料,研究并整理两种常用的聚类算法,填写相应的表格并选择一种编程实现;4.通过使用搜索引擎并查阅相关资料,研究并整理两种常用的异常检测方法,填写相应的表格;5.通过使用搜索引擎并查阅相关资料,研究并整理两种常用的电子商务个性化商品或信息推荐方法,填写相应的表格;6.结合选题,设计

6、一个简单的商品或信息推荐模型。五、实验结果1.研究并整理两种常用的关联分析算法,编程实现其中一种,填写如下表格:关联分析算法名称实现原理关联分析算法名称:XXX算法〃核心实现代码解:关联分析算法名称实现原理1.第一个关联规则挖掘算法2.频繁项集的子集也一定是频繁的,如果{A,B}是频繁项集,则{A}和{B}也一定是频繁项集3.从1到k(k项集)递归查找频繁项集4.用得到的频繁项集生成关联规则Apriori算雀5.Apriori算法的两个输入参数分别是最小支持度和数据集。该算法首先会生成所有单个元素的项集列表。接着扫描

7、数据集来查看哪些项集满足最小支持度要求,那些不满足最小支持度的集合会被去掉。然后,对剩卜來的集合进行组合以生成包含两个元素的项集。接下來,再重新扫描交易记录,去掉不满足最小支持度的项集。该过程重复进行直到所有项集都被去掉。1.d个项,将产生2d个候选项集蜜力注2.总项集个数为2d3.关联规则的总个数为d-1d_k“》(:)匹CT)k=lj=l=3d-2d+1+14.当cl=6时,关联规则R的个数为6025.目标找出所有的频繁项集关联分析算法名称:Apriori算雀〃核心实现代码#-*-encoding:UTF-8・*

8、・#import#python代码实现#classApriori(object):def_init_(self,filename,min_support,item_start,item_end):self.filename=filenameself.min_support=min_support#最小支持度self.min_confidence

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。