(最新)基于web日志挖掘的自适应网站构建方法研究

(最新)基于web日志挖掘的自适应网站构建方法研究

ID:36680610

大小:38.51 KB

页数:14页

时间:2019-05-13

(最新)基于web日志挖掘的自适应网站构建方法研究_第1页
(最新)基于web日志挖掘的自适应网站构建方法研究_第2页
(最新)基于web日志挖掘的自适应网站构建方法研究_第3页
(最新)基于web日志挖掘的自适应网站构建方法研究_第4页
(最新)基于web日志挖掘的自适应网站构建方法研究_第5页
资源描述:

《(最新)基于web日志挖掘的自适应网站构建方法研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于Web日志挖掘的自适应网站构建方法研究2010年第3期计算饥与现代化JlSUANJIYUXIANDAItlUA总第175期文章编号:1006-2475(2010)03-0144-04基于Web日志挖掘的自适应网站构建方法研究母俐丽(兰州交通大学电子与信息工程学院,甘肃兰州730070)摘要:自适应网站能够提高网站对用户的服务质量.本文首先给出自适应网站的总体框架,对框架中主要模块做详细的分析,包括数据预处理,数据挖掘,页面推荐和站点调整.在数据挖掘模块给出一种有效的识别用户访问模式的算法,该

2、算法利用数据库查询简化频繁最大前向访问路径集的查找,并在此基础上形成频繁访问路径图,为页面推荐和站点调整做好准备.最后给出自适应网站的设计原则.关键词:自适应网站;频繁访问路径图;页面推荐;站点调整;数据挖掘;Web日志中图分类号:TP311文献标识码:Adoi:10.3969/j.issn.1006-2475.2010.03.041ApproachofAdaptiveWebSiteConstructionBasedonWebLOgsMiningMULi—li(InstituteofElectr

3、onicsandIrfformationEngineering,LanzhouJiaotongUniversity,Lanzhou730070,China)Abstract:AdaptiveWebsiteconstructionbasedonWebminingcouldimprovethesemdcequalityforusers.TheadaptiveWebsitegeneralframeworkisproposed.Adetmledanalysisismadeformainmodulesof

4、theframework,includingdatapre.process.ing,datamining,pagerecommendationandsiteadjustment.Aneffectivealgorithmofuseraccesspatternsidentificationispro'posedindataminingmodule.Thealgorithmutilizesdatabasequerytosimplifythefindofthemostfrequentacc(~sspat

5、hsset,andtitanformsafrequencyaccesspatternsmappreparingforpagerecommendationandsiteadjusUnent.Finally,theadapfiveWebsitedesignprinciplesaleproposed.Keywords:adaptiveWebsite;frequencyaccesspathsmap;pagerecommendation;siteadjustment;dataruing;Weblogs0引

6、言自适应网站作为Web数据挖掘的重要研究方向之一,日益受到关注,是未来网站的一个发展方向.其目的是通过分析用户的访问日志,利用数据挖掘的方法得到用户不同的访问兴趣,并将符合用户兴趣的页面以链接列表等形式推荐给用户,为用户提供智能化的服务.1总体框架一个实用的自适应网站,可以分为离线部分和在线部分,其总体框架如图1所示.(1)离线部分:进行数据的收集,预处理,完成发现关联规则,频繁项集等频繁访问模式的挖掘.分为数据预处理和数据挖掘两个模块.数据预处理模块图l自适应网站框架主要是对所收集的数据进行预

7、处理,预处理后的数据存入用户事务库,数据预处理的质量与挖掘的效率和收稿日期:2009-07-31作者简介:母俐丽(1980一),女,河北乐亭人,兰州交通大学电子与信息1二程学院硕士研究生,研究方向:Web数据挖掘,计算机网络.离线部分一布线部分2010年第3期母俐丽:基于Web日志挖掘的自适应网站枸建方法研究145结果紧密相关;数据挖掘模块主要是使用数据挖掘技术如统计分析,聚类分析,关联规则,序列模式等,来识别用户浏览模式,存入模式库.(2)在线部分:推荐引擎根据挖掘Ⅲ米的规则和前刚户访问操作计

8、算生成推荐集,然后在用户最新请求的页i可上添加推荐页面,再通过Web服务器传递到用户端的浏览器,为用户提供自适应的在线服务,同时将推荐结果送往网站管理中心,以便调整网站设计,优化刚站结构,提高网站效率.总之,在自适应网站中运用数据挖掘技术可以分为离线规则学习和在线模式应用两个阶段.在数据挖掘模块中,通过具体的挖掘算法对Web日志进行模式识别和模式分析,离线获取用户访问特征和规则,存人规则模式库.当用户访问网站时,用户访问信息也会传到推荐引擎,推荐引擎根据用户的标识,向挖掘模块提取相应的挖掘结果和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。