web日志挖掘技术研究

web日志挖掘技术研究

ID:33097549

大小:1.02 MB

页数:61页

时间:2019-02-20

web日志挖掘技术研究_第1页
web日志挖掘技术研究_第2页
web日志挖掘技术研究_第3页
web日志挖掘技术研究_第4页
web日志挖掘技术研究_第5页
资源描述:

《web日志挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京航空航天大学硕士学位论文Web日志挖掘技术研究姓名:李甲林申请学位级别:硕士专业:计算机应用技术指导教师:王建东20081201南京航空航天大学硕士学位论文摘要随着WWW网上可利用信息呈现爆炸性的增长,人们发现快速有效地访问相关信息正变得越来越困难。对于网站的设计者来说,如何适应用户的访问需求来调整网站的内容与结构,也是一个非常有挑战性的任务。正是在这种情况下,Web数据挖掘技术应运而生。Web日志挖掘是目前Web数据挖掘中非常重要的一个研究领域和研究方向。Web站点的服务器日志数据记录了浏览

2、用户对此Web站点访问时的大量路径。通过分析和发现Web日志记录中的规律,我们可以挖掘出Web用户潜在的使用规律和模式。这方面的研究成果可被广泛应用于发现电子商务中的潜在客户、提高Web服务的质量和效率以及优化企业信息门户性能等领域。本文从分析数据挖掘技术入手,着重研究如何利用Web日志挖掘技术分析日志得到用户对网站的访问模式。首先系统地介绍了数据挖掘和Web数据挖掘的基本概念和方法。然后针对Web日志挖掘,重点研究了Web日志数据预处理技术。关联规则挖掘是数据挖掘研究的一项重要内容。本文分析了W

3、eb日志中关联规则的经典挖掘算法Apriori算法及其不足之处,提出了基于矩阵约简技术的关联规则挖掘改进算法Apriori_BMR。新算法采用布尔矩阵来存储事务数据库,利用一定的约简规则来逐步约简事务数据矩阵,有效地解决了Apriori算法迭代产生频繁项集的瓶颈问题。实验表明,新算法比Apriori算法具有更高的效率和性能。关键词:Web日志;Web数据挖掘;关联规则;Web日志预处理IWeb日志挖掘技术研究AbstractWiththeexplosivegrowthofknowledgeavai

4、lableontheWorldWideWeb,itbecomesmuchmoredifficultforuserstoaccessrelevantinformationefficientlyanditalsopresentsachallegingtaskforwebdesignerstoorganizesitecontentstomeettheneedsofusers.Justinthiscase,Webdatamingingtechnologyarisesatthehistoricmement.

5、Recently,WeblogminingisaveryimportantdirectionanddomaininWebdataminingarea.TheWeblogfilerecordsmassivepathinformationofusers.WecoulddiseovertheruleandpatternofthepotentialWebusersthroughanalyzingandfindingouttherulesintheweblog.Researchinthisareacould

6、bewidelyusedindiseoveringthepotentialcustomersine-businessandimprovethequalityandefficiencyoftheenterpriseinformationportal.ThethesisbeginswithanalyzingthedataminingtechnolygyandfocusonhowtomakeuseoftheWeblogminingtechnologytogetthecustomer'saccesstot

7、hewebsitepattern.Firstly,wehaveintroducedthebasicconceptandmethodofdataminingandwebmining.Thenweanalysisthecharacteristicofweblogsandstudythoroughlythetechnologyofpreprocessofweblogs.Miningassociationrulesisoneofthemostimportanttopicsindatamining.Afte

8、rresearchingthealgorithmofminingassociationrulesanditsdeficienciesweproposedanewefficientassociationrulesminingalgorithmnamedApriori_BMRbasedonmatrix_reducing.Thisnewalorithmusesbooleanmatrixtostoretransactiondatabaseandreducestransactionmatri

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。