学年论文格式参考模板

学年论文格式参考模板

ID:10853127

大小:45.50 KB

页数:5页

时间:2018-07-08

学年论文格式参考模板_第1页
学年论文格式参考模板_第2页
学年论文格式参考模板_第3页
学年论文格式参考模板_第4页
学年论文格式参考模板_第5页
资源描述:

《学年论文格式参考模板》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学年论文浅谈数据挖掘姓名:龚城华班级:A05计算机导师:顾沈明计算机科学与技术专业浙江海洋学院学年论文浅谈数据挖掘一、前言对于数据挖掘这个名词,听起来好像只有少数专家才能了解的专业词汇,对于一般人,似乎有点望尘莫及,但其实,我们大多数人都和数据挖掘有很亲密的接触。相信很多人都用校内网吧,其中校内网中有一个功能:“你可能认识的人。”可以在你自己的网页上链接到这些人。它是怎么知道你认识这些人呢?这就是因为网站采用了新技术来推测你的人际关系。而这种新技术就是数据挖掘技术。不仅仅是校内网,就像我们经常购买书籍的亚马逊或当当网也一样

2、,在浏览这类网页的时候会看到类似这样的提示:“欢迎您,下面是我们给您推荐的新书。”然后就可以在网页的某个位置看到几本新书的链接。它也是通过数据挖掘技术来了解顾客的潜在需求的。比如:从顾客买书的清单中发现与张三买过的书有几本相同的,但是还有些书张三已经买了,该顾客却还没买,就可以据此认为与该顾客有相近的阅读偏好的张三买了几本该顾客还没买的书,该顾客也会对这些书感兴趣。从上面的例子可以看出,数据挖掘是用于大规模数据处理的一种新的思维方法和技术手段,它是在现实生活中各种数据量呈指数级不断增长,以及数据库技术为核心的信息技术逐渐成

3、熟的背景下产生的。随着信息技术的发展,特别是互联网的发展和信息量爆炸性增长,信息的重要性与日俱增。如何有效的获取有用的互联网信息与知识,是数据挖掘的目标所在;另一方面互联网为数据挖掘提供了良好的挖掘环境与挖掘对象,且其挖掘结果易于应用,获得直接的回报。在这种应用环境与应用需求的刺激下,数据挖掘越来越受到重视。目前尚无关于数据挖掘的精确学科划定,从广义上来讲,数据挖掘先从巨大的数据体系或数据库里提炼出我们感兴趣的东西,或者说,从庞大的观察数据集中提炼并分析出不能轻易觉察或断言的关系,最后给出一个有用的并可以理解的结论。简单的

4、说,数据挖掘就是在数据中发现模式、知识,或数据间的关系。这里来看一个数据挖掘最有名的例子,即“尿布与啤酒”的故事,并以此来说明数据挖掘的几个特征。“尿布与啤酒”的故事是一个广为人知的有趣范例。为了分析哪些商品顾客最有可能一起购买,全球最大的零售商沃尔玛公司利用数据挖掘方法,对数据库中的大量数据进行分析后意外发现,跟尿布一起购买最多的商品竟然包括啤酒。为什么两件风马牛不相及的商品会被人一起购买?经过分析发现:原来,太太们常叮嘱他们的丈夫,下班后为小孩买尿布,而丈夫们在买尿布后又随手带回几瓶啤酒。既然尿布与啤酒一起购买的机会比

5、较多,商店就将他们摆放在一起,结果尿布与啤酒的销售量双双增长。二、数据挖掘的技术支持1.决策树方法4浙江海洋学院学年论文决策树是用二叉树形图来表示处理逻辑的一种工具。可以直观、清晰地表达加工的逻辑要求。特别适合于判断因素比较少、逻辑组合关系不复杂的情况。决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如,在贷款申请中,要对申请的风险大小做出判断,图是为了解决这个问题而建立的一棵决策树,从中我们可以看到决策树的基本组成部分:决策节点、分支和叶子。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样

6、也可以用来作预测(就像上面的银行官员用他来预测贷款风险)。常用的算法有CHAID、CART、Quest和C5.0。2.人工神经网络方法一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入-输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出结果,这种学习分析的过程被称为“训练”。由大量处理单元互联组成的非线性、自适应

7、信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。3.模糊集合方法用来表达模糊性概念的集合。又称模糊集、模糊子集。普通的集合是指具有某种属性的对象的全体。这种属性所表达的概念应该是清晰的,界限分明的。因此每个对象对于集合的隶属关系也是明确的,非此即彼。但在人们的思维中还有着许多模糊的概念,例如年轻、很大、暖和、傍晚等,这些概念所描述的对象属性不能简单地用“是”或“否”来回答,模糊集合就是指具有某个模糊概念所描述的属性的对象的全体。由于概念本身不是清晰的、界限分

8、明的,因而对象对集合的隶属关系也不是明确的、非此即彼的。这一概念是美国加利福尼亚大学控制论专家L.A.扎德于1965年首先提出的。模糊集合这一概念的出现使得数学的思维和方法可以用于处理模糊性现象,从而构成了模糊集合论。4.遗传算法遗传算法(GeneticAlgorithm)是模拟达尔文的遗传选择和自然淘

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。