基于聚类划分的web日志关联规则增量式挖掘方法研究

基于聚类划分的web日志关联规则增量式挖掘方法研究

ID:33131821

大小:5.58 MB

页数:57页

时间:2019-02-21

基于聚类划分的web日志关联规则增量式挖掘方法研究_第1页
基于聚类划分的web日志关联规则增量式挖掘方法研究_第2页
基于聚类划分的web日志关联规则增量式挖掘方法研究_第3页
基于聚类划分的web日志关联规则增量式挖掘方法研究_第4页
基于聚类划分的web日志关联规则增量式挖掘方法研究_第5页
资源描述:

《基于聚类划分的web日志关联规则增量式挖掘方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得直昌太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名(手写):酋凌兰签字日期:矽侈年么月岁目学位论文版权使用授权书本学位论文作者完全了解南昌大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权南昌大学

2、可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。同时授权中国科学技术信息研究所和中国学术期刊(光盘版)电子杂志社将本学位论文收录到《中国学位论文全文数据库》和《中国优秀博硕士学位论文全文数据库》中全文发表,并通过网络向社会公众提供信息服务。(保密的学位论文在解密后适用本授权书)学位论文作者签名(手写):亥璃兰签字日期:力侈年多月多日导师签名(手写):口L传孑氖签字日期:沁I净g月罗日摘要万维网作为广泛分布,巨大的全球信息服务中心,包含了各种动态,庞大的访问和使用信息,发现信息背后的知识,对

3、于用户访问和个性化服务具有重要的意义。本文针对Web服务器日志的庞大,动态性丰富,高复杂度和局部信息有用的四大特点,以发现Web用户访问行为中潜在的规律和知识为目的,以Web日志关联规则增量式挖掘为手段,提出了一种基于聚类划分的Web日志关联规则增量式挖掘方法。首先,本文设计了一种基于聚类划分的Web日志关联规则挖掘方法。通过基于自组织神经网络(Self-organizingFeatureMap,简称SOM)的聚类技术,对数据集进行任意水平均分为K组的数据子集,组成K个SOM神经网络训练集合,利用常规的SOM优化策略,对各组Web用户行为特征进行粗聚

4、类划分:以每一类用户访问行为群为分析对象,由于每类用户访问行为特征相似,在这样数据集中的类中运用基于FP.growth(frequent.pattemgrowth)挖掘算法,既能有效的利用FP.growth无需产生候选项集的优势,又能减少FP树的分支,进而减少条件FP树的数量。然而一类用户的访问信息并不表示该类用户对没有访问到的页面不感兴趣,因此将每类用户访问群的频繁项集即局部频繁项集合并,重新评估得到全局频繁项集,进而挖掘Web用户访问行为的潜在知识和规律。其次,本文设计了一种基于聚类划分的Web日志关联规则增量式挖掘方法,该方法是基于上述的算法进

5、行改进的,通过对动态信息丰富的新增Web日志运用上述的算法,得到新增数据的频繁项集,利用旧频繁项目集和新增频繁项目集,依据频繁项目集的性质,更新频繁项目集。该算法大大减少了数据库扫描次数,无需产生候选项集,有效的减少了FP树的深度和宽度,尤其是在类似于Web日志这种数据量大,动态信息丰富的数据库中,该算法的优势更加明显。最后,采用C}}.net技术设计实现Web用户访问行为的关联模式挖掘模型,对预处理后的Web服务器日志数据进行实验分析,测试并评估该模型性能。实验结果表明,该算法能有效地处理大数据量下,动态丰富的Web日志数据挖掘,提高Web日志关联

6、规则增量式挖掘的准确度和适应性。关键词:关联规则;增量式挖掘;Web日志;自组织神经网络ABSTRACTTheW研ldWideWebiswidelydistributedandhugelyglobalinformationservicecenter,containingavarietyofdynamicandusageinformation,todiscoveravailableknowledgefromtheinformationandbemeaningfultoprovidepersonalizedservice.Webserveloghasfo

7、urcharacteristicsofhugeamount,dynamicrich,highcomplexityandlocalinformation.Toadaptthedata,Weblogassociationrulesincrementalminingbasedonclusteringpartitionisproposed,tofindpotentialrulesandknowledgefromtheWebuservisitbehavior.Firstly.thispaperdescribesamethoddesignofWeblogmini

8、ngassociationrulesbasedonclusteringpartition.Withthela

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。