基于web挖掘的信息推荐算法的设计与实现

基于web挖掘的信息推荐算法的设计与实现

ID:32986734

大小:887.71 KB

页数:71页

时间:2019-02-18

基于web挖掘的信息推荐算法的设计与实现_第1页
基于web挖掘的信息推荐算法的设计与实现_第2页
基于web挖掘的信息推荐算法的设计与实现_第3页
基于web挖掘的信息推荐算法的设计与实现_第4页
基于web挖掘的信息推荐算法的设计与实现_第5页
资源描述:

《基于web挖掘的信息推荐算法的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、论文题目基于Web挖掘的信息推荐算法的设计与实现专业学位类别工程硕士学号200892343001作者姓名邸聪指导教师田玲博士万方数据分类号密级注1UDC学位论文基于Web挖掘的信息推荐算法研究的设计与研究(题名和副题名)邸聪(作者姓名)指导教师田玲博士电子科技大学成都董文和高工鞍钢自动化公司鞍山(姓名、职称、单位名称)申请学位级别硕士专业学位类别工程硕士工程领域名称软件工程提交论文日期2013.3.25论文答辩日期2013.5.4学位授予单位和日期电子科技大学2013年6月23日答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。万方数据STUDYANIMP

2、ROVEDALGORITHMOFTHEINFORMATIONRECOMMENDATIONBASEDONWEBMININGAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:SoftwareEngineeringAuthor:DiCongAdvisor:TianLingSchool:SchoolofInformationandSoftwareEngineering万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除

3、了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。作者签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名

4、:导师签名:日期:年月日万方数据摘要摘要随着互联网的快速发展,人们获取信息的能力越来越强,但如此巨大的信息量有时也会给搜索带来麻烦。因此,如何为用户提供方便快捷的服务成为电子商务网站的首要任务。解决问题的方法之一就是在Web中采用数据挖掘技术,利用其中的聚类分析来处理数据的集群归属,以实现对网页中无规则数据的研究,最终完成用户信息的提取与推荐工作。信息提取和个性化服务与推荐技术就是在这种情况下应运而生的,它服务于电子商务网站,是Web数据挖掘的一个重要分支,主要任务是用来支持用户决策。文中首先阐述了研究背景以及Web数据挖掘、信息提取与个性化服务的研究现状;其次,对数

5、据挖掘方法与技术,包括数据挖掘的定义、方法、Web挖掘等;再者是信息提取技术与个性化服务系统,主要介绍了网站信息的提取特点、个性化服务系统的功能、分类以及个性推荐方法的比较,最后,设计了一个个性化推荐系统,并进行了实验验证。本文的重点在于协同过滤算法的改进,前期工作涉及到分块信息的提取以及网页用户信息的聚类。针对Web页面信息提取中信息单元的划分,本文提出将整个页面划分为若干区块,采用一定的算法将较小区块设定为最小提取单元,并根据重要程度附于区块权值,以进行准确的提取。对于网站信息的预处理,因显式信息过少,容易造成用户评价矩阵稀疏,故采用离线聚类的方式,并加大对隐式数

6、据的处理,这样不仅可以节省在线处理问题的时间,也可以增加用户评价矩阵的稠密度,同时提高了协同过滤推荐的准确度。综上,本文在一定程度上很好地解决了传统协同过滤推荐算法中易出现的扩展性差、数据稀疏以及准确度低等问题,最后分别对算法的近邻搜索、聚类准确度、时间复杂度以及收敛性进行了分析,实验结果表明,经过改进后的ICF算法聚类效果和性能上都具备绝对优势,算法是高效可行的。关键词:Web数据挖掘,聚类,信息提取,个性化服务I万方数据ABSTRACTABSTRACTWiththerapiddevelopmentofInternet,theabilitythatpeoplegai

7、ninformationismoreandmorestrong,butsuchahugeamountofinformationsometimesalsobringstroubletothesearch.Therefore,howtoprovideuserswithconvenientandefficientservicebecomestheprimarytaskofelectroniccommercewebsite.OneofthesolutiontotheproblemisusingdataminingtechnologyintheWeb,usin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。