基于移动互联网日志搜索引擎用户行为研究

基于移动互联网日志搜索引擎用户行为研究

ID:36627221

大小:386.00 KB

页数:9页

时间:2019-05-13

基于移动互联网日志搜索引擎用户行为研究_第1页
基于移动互联网日志搜索引擎用户行为研究_第2页
基于移动互联网日志搜索引擎用户行为研究_第3页
基于移动互联网日志搜索引擎用户行为研究_第4页
基于移动互联网日志搜索引擎用户行为研究_第5页
资源描述:

《基于移动互联网日志搜索引擎用户行为研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于移动互联网日志的搜索引擎用户行为研究摘要:随着移动互联网的迅速发展,移动搜索用户大规模增加,移动搜索引擎用户行为分析对改进搜索引擎性能,提高用户体验具有重要意义。该文选取某移动搜索引擎2011年6月第一周的日志,对移动互联网用户搜索行为进行分析和研究。我们从查询词分析、会话分析以及用户点击分析3个角度出发,对查询词长度和频度、问题式查询和网址查询比例、会话内查询个数、查询词修改方式以及用户点击位置进行研究,并与互联网搜索引擎相应指标进行对比。相关分析结论对于移动搜索引擎算法改进与系统优化具有一定参考意义。关键词:移动搜索引擎;搜索引擎日志;用户行为分析1引言随着

2、通信技术的进步、终端设备硬件水平的提升以及三网融合政策的逐步推进,移动互联网得到迅速发展,网络应用内容进一步增加,用户应用体验不断提高,我国由此进入移动互联网的大时代。据C N N IC第29次中国互联网络发展状况统计报告n]显示,截至2011年12月底,中国手机网民规模达到3.56亿,占整体网民比例的69.3,用户规模增速已超过宽带用户。鉴于如此大规模的用户,互联网应用提供商纷纷布局移动互联网,主流应用提供商均推出了相应的W A P版本或客户端,为客户提供移动互联网服务,以移动搜索为代表的信息获取已发展为移动互联网的主流应用。当前,移动搜索引擎用户数量众多,应用门

3、槛较低,适用范围较广。在未来竞争中,搜索结果的精确程度与个性化服务将会成为保持用户黏性的重要因素。为提高搜索准确性,移动搜索服务提供商需要挖掘用户特点和行为习惯,预测用户潜在需求,以应对市场竞争。移动互联网搜索服务提供商每天记录大量的用户搜索数据,比如访问者唯一标志符、检索词、点击页面、访问时间等,这些数据构成了搜索引擎日志。搜索引擎日志包含很多对服务商非常有用的信息,可以反映出用户的兴趣及其行为特点,是研究搜索引擎用户行为的重要载体。本文将通过对一周内中文移动搜索引擎日志的分析,研究真实环境下移动搜索引擎用户的行为特点。本文安排如下:第2节总结目前搜索引擎用户行为

4、的研究现状;第3节介绍本文使用的移动互联网搜索引擎日志数据;第4节根据上述日志数据进行实证分析,分别研究移动互联网环境下用户查询行为与用户点击行为;最后进行总结和展望。2相关工作概述目前,对互联网的大规模搜索引擎日志的用户行为分析已有一些研究成果,主要集中在搜索引擎用户独立查询、查询会话分析以及用户点击行为等方面,但基于移动互联网的用户行为分析相对极少。Si lverstein等(1998)对A ltaV ista用户检索行为进行分析,提出在一个查询会话中,用户只进行一次点击的大约占63.8,约有35.2的用户对于搜索词进行了完全的改变,12的用户增加或减少了搜索词

5、的数目[1 23。Soyeon P ark等(2005)选取韩国著名搜索引擎N A V E R一周内的日志数据,经过会话识别、查询分类、数据预处理等操作后,对用户检索行为进行分析,结果显示同一会话中用户输入的查询倾向于彻底更换查询内容,而不是增删检索词项或修改检索词项。L i w ei等(2011)统计了同一会话中检索词的个数,发现同一会话中只有一个检索词的会话占所有会话数的70.866 9,6。王继民等(2004)选取北大天网的用户日志,对用户访问时间、用户查询类型、用户查询长度、用户点击次数进行了统计分析,结论表明用户访问时间分布并不均等,多数用户只输入一个词项

6、查询。余慧佳等(2007)选取搜狗搜索引擎一个月内的查询日志,就用户查询长度、查询频度、查询会话内的查询数目、查询会话内的查询内容以及用户点击行为进行了分析,将相应特征同英文搜索引擎用户行为进行对比,发现中文搜索引擎用户使用高级检索的比例远远低于英文搜索引擎,查询重复率远高于英文搜索引擎。岑荣伟等(2OLO)在文献工作的基础上,对用户搜索需求进行区分,从查询集合中提取了导航集和色情集这两类特殊的查询集合,针对不同检索目的对上述统计特征进行分析。针对以上工作中用户查询会话分析的不足,王晓春等(2011)定义了8种查询修改,在查询会话基础上分析了查询修改动作、用户点击结

7、果数同查询修改次数之间的关系,发现查询修改动作和查询修改次数有关,而点击结果数量保持稳定。张磊等(2009)对于现有的网页搜索引擎查询日志中查询会话的划分方法进行了分析和总结,提出了可以使用时间作为划分会话的一种标准。马少平等(2011)基于搜狗搜索引擎2006年至·2011年的搜索日志,对用户查询行为与用户点击行为进行分析,分析总结了中文搜索引擎用户行为的演化规律。而移动搜索引擎同桌面搜索引擎存在一定的差异,如用户可以不受固定终端限制,随时随地搜索信息,具有很强的时效性;移动搜索可以同定位服务相结合,为用户提供更具针对性以及精确的服务;移动搜索屏幕有限,每页显

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。