基于网页浏览日志的用户行为分析.pdf

基于网页浏览日志的用户行为分析.pdf

ID:55931412

大小:541.52 KB

页数:6页

时间:2020-06-16

基于网页浏览日志的用户行为分析.pdf_第1页
基于网页浏览日志的用户行为分析.pdf_第2页
基于网页浏览日志的用户行为分析.pdf_第3页
基于网页浏览日志的用户行为分析.pdf_第4页
基于网页浏览日志的用户行为分析.pdf_第5页
资源描述:

《基于网页浏览日志的用户行为分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第41卷第3期计算机科学Vo1.41No.32014年3月ComputerScienceMar2014基于网页浏览日志的用户行为分析郭俊霞高城许南山卢罡(北京化工大学信息科学与技术学院北京100029)摘要随着问答社区信息的长期积累,越来越多的过时信息充斥在其中并被搜索引擎检索,给信息需求者带来不便。用户的网页浏览日志中隐性地包含用户的行为习惯,通过分析得到这些信息对判断网页信息时效性有着重要意义。文中提出针对网页浏览日志的查询过程划分方法,并在划分的基础之上对大量真实用户的浏览行为习惯做了统计分析。结果显示,用户查询一次信息平均浏览8.O5个页面,用时6.28分钟,有将近1/3的查询在交替并

2、发中进行,另外用户对于网站站内搜索的依赖较高。从浏览日志数据集中选取了一个社区网站的浏览记录来进行初步的网页信息时效性分析,结果表明造成用户不满意的原因主要是查询相关度不高,而过时信息只是其中一小部分。关键词网页浏览日志,用户行为分析,网页时效性,问答社区中图法分类号TP391.】文献标识码AUserBehaviorAnalysisBasedOilWebBrowsingLogsGUOJun-xiaGAOChengXUNan-shanLUGang(CollegeofInformationScienceandTechnology,BeijingUniversityofChemica1Technol

3、ogy,Beijing100029,China)AbstractWiththelong-termaccumulationoftheQ&Acommunityinformation,thereismoreandmoreoutdatedin—formationindexedbysearchengines,bringinginconveniencetousers.Thelogofauser’sbrowsing-behaviorscontainstheuser’Sbehavioralintentionsandhabits,whichcanhelpanal~etimelinessoftheinformat

4、ion.Thispaperproposedaquery-process-divisionmethodforusers’browsinglogs.Basedonthismethod,alargenumberofrealusers’browsinghistoricalrecordswerestatisticallyanalyzed.Theresultsshowthatinaverage,8userbrowses8.05Webpagesin6.28minutesforonequery.Inaddition,nearly1/3oftotalqueriescarryoutconcurrentlyanda

5、lternately.Itisalsofoundthatusersrelyoninner-sitesearchingmore.Byanalyzingthebrowsinghistoricalrecordsofacommunitysite,wefoundthattheusersarenotsatisfiedwiththequeryresultsmainlybecauseofthenon-high-relatedresults.Ou>o~clateinformationisonlyasmallpartinthequeryresults.KeywordsWebbrowsinglogs,Userbeh

6、avioranalysis,Webpagetimeliness,CQA效的手段被广泛应用于各类信息分析的研究中,研究人员根1引言据用户的日志对用户行为、意图和使用习惯等做相应的判断,进入Web2.0时代,互联网信息出现井喷式增长,特别是为各种网络应用提供指导,以更好地满足用户的使用需求。以问答社区(CommunityQuestionAnswering,CQA)为代表网络用户日志主要分为服务器端收集的用户日志和客户端收的信息共享系统得到了广泛的应用。典型的社区如Yahoo!集的用户日志两大类,如搜索引擎的查询日志和网页浏览日Answers、百度知道和搜搜问问等都已经拥有上亿级别的信志分别是两类用

7、户日志的典型代表。与搜索引擎查询日志相息量,越来越多的Web用户通过各种途径从中获得信息。然比,网页浏览日志记录了用户浏览过程的每一个细节,包括在而,随着信息量的不断积累和时间的推移,其中一些“陈旧”信什么时间浏览了哪些网页。这些细节能更全面地反映用户的息的价值开始逐渐降低,搜索引擎反馈给用户的查询结果中使用情况,不受单一搜索引擎的限制,因为搜索引擎日志收集也经常会出现这些过时的信息,给用户的使用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。