大数据挖掘相关论文设计.doc

大数据挖掘相关论文设计.doc

ID:56523702

大小:89.50 KB

页数:12页

时间:2020-06-27

大数据挖掘相关论文设计.doc_第1页
大数据挖掘相关论文设计.doc_第2页
大数据挖掘相关论文设计.doc_第3页
大数据挖掘相关论文设计.doc_第4页
大数据挖掘相关论文设计.doc_第5页
资源描述:

《大数据挖掘相关论文设计.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘论文题目:数据挖掘技术在电子商务中的应用系别:计算机学院专业:11网络工程1班学生:黄坤学号:1110322111指导教师:江南2014年11月06日数据挖掘技术在电子商务中的应用一、研究原因电子商务在现代商务活动中的正变得日趋重要,随着大数据时代的到来,商务信息显得尤为重要,在电子商务中谁掌握了有利的市场信息,谁就能在这个竞争激烈电商行业中占据绝对的优势。而数据挖掘技术是获取信息的最有效的技术工具。本文讨论了数据挖掘的主要方法,具体阐述了数据挖掘技术在电子商务中的作用及应用。 在信息经济时代,对企业来说,谁对市场变化反应速度快,谁将在激烈的市场竞争中占据

2、有利的地位,竞争的结果最终将促使企业价值从市场竞争输家转移到赢家,这样就使企业面临一个问题:如何才能把大量的数据资源,转化成自身价值呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。因此,面对“人们被数据淹没,人们却饥饿于知识”的挑战,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。二、2.1国研究现状KDD(从数据库中发现知识)一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。迄今为止,由美国人工智能协会主办的KDD已经

3、召开了7次,规模由原来的专题讨论会发展到国际学术大会,人数由二三十人到七八百人,论文收录比例从2X1到6X1,研究重点也逐渐从发现方法转向系统应用,并且注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。其他容的专题会议也把数据挖掘和知识发现列为议题之一,成为当前计算机科学界的一大热点。此外,数据库、人工智能、信息处理、知识工程等领域的国际学术刊物也纷纷开辟了KDD专题或专刊。IEEE的KnowledgeandDataEngineering会刊领先在1993年出版了KDD技术专刊,所发表的5篇论文代表了当时KDD研究的最新成果和动态,较全面地论述了KDD系统

4、方法论、发现结果的评价、KDD系统设计的逻辑方法,集中讨论了鉴于数据库的动态性冗余、高噪声和不确定性、空值等问题,KDD系统与其它传统的机器学习、专家系统、人工神经网络、数理统计分析系统的联系和区别,以及相应的基本对策。6篇论文摘要展示了KDD在从建立分子模型到设计制造业的具体应用。不仅如此,由美国人工智能学会主办的KDD国际研讨会规模由原来的专题讨论会发展到国际学术大会,研究重点也逐渐从发现方向转向系统应用,注重多重发现策略和技术集成,以及多种学科之间的相互渗透,并且有很多学校和科研机构也正投入大量资金进行数据挖掘技术的进一步开发和深入研究。国对数据挖掘的研究稍

5、晚,没有形成整体力量。但是国的高校,例如清华大学、中科院计算机技术研究所等,都已开展了不同程度的知识发现的基础理论及其应用研究。其中,系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究。与国外相比,我国对数据挖掘领域的研究仍处于初级阶段,绝大多数工作集中于局部算法设计,进行综合的系统集成设计却寥寥无几。由于核心技术的欠缺,使得数据挖掘在国一些领域只是初步应用,如银行、金融、GIS等领域。所以研究数据挖掘技术,并将其应用到科研、经济、教育等领域的重要性是可见一斑的。电子商务(E-Commerce)是以指利用电子数据交换(ElectronicDataInte

6、rchange,EDI)、电子(E-mail)、电子资金转账(ElectronicFundsTransfer,EFT)和Internet等主要技术在个人、企业和国家之间进行无纸化的信息交换,包括商品信息及其订购信息、资金信息及其支付信息、安全及其认证信息等,即以现代信息技术为手段,以经济效益为中心的现代化商业运转模式。其最终目标是实现商务活动的网络化、自动化与智能化。随着Internet的迅速发展,电子商务的应用不断深入。在电子商务应用系统中,相关的用户数据日益增多,数据挖掘技术具有从大量复杂数据中发现特定规律的能力。商业电子化的趋势不仅为客户提供了便利的交易方式

7、和广泛的选择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。 2.2数据挖掘技术2.2.1统计技术统计技术对数据集进行挖掘的主要思想是:统计的方法对给定的数据集合假定了一个分步或者概率的模型(比如一个正态分布),然后根据模型采用相应的方法进行挖掘。2.2.2关联规则数据关联是数据库中存在的一类很重要的可以发现的知识。若两个或者多个变量的取值之间存在某种规律性,就成为关联。关联可分为简单关联,时序关联,因果关联。关联分析的目的是找出数据库中隐含的关联网,优势并不知道数据库中的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。2.2

8、.3基于历

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。