面向用户任务的查询推荐研究_张晓娟

面向用户任务的查询推荐研究_张晓娟

ID:20614824

大小:457.71 KB

页数:7页

时间:2018-10-14

面向用户任务的查询推荐研究_张晓娟_第1页
面向用户任务的查询推荐研究_张晓娟_第2页
面向用户任务的查询推荐研究_张晓娟_第3页
面向用户任务的查询推荐研究_张晓娟_第4页
面向用户任务的查询推荐研究_张晓娟_第5页
资源描述:

《面向用户任务的查询推荐研究_张晓娟》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、知识组织与知识管理*面向用户任务的查询推荐研究张晓娟唐祥彬(武汉大学信息资源研究中心武汉430072)摘要:【目的】基于AOL查询日志数据集,从Session级别实现面向用户任务的查询推荐。【方法】从用户任务级别衡量查询间关系,再通过随机游走遍历图的思想为查询构建向量,以此实现候选查询推荐。【结果】本文方法的推荐效果优于基于查询共现来衡量查询间关系的推荐效果。【局限】未对拼写错误的候选查询进行拼写纠错;未从查询级别来实现面向用户任务的查询推荐;稀有查询和模糊性查询的推荐效果不佳。【结论】基于用户任务来衡量查询之间相关关系,能提高查询推荐的实验效果。

2、关键词:查询推荐用户任务查询日志分类号:G353.41引言务,用户任务是其从事搜索行为并且判断查询结果相关性的重要因素,是用户信息需求的原子,理解用户伴随着网络资源的不断增长,用户的检索兴趣已任务是理解用户信息需求的主要途径。本文拟从基于从与查询相关的文档过渡到与用户信息需求相关的文用户任务级别衡量查询之间相关关系,从而实现面向档。而在大多数情况下,用户所提交的有限关键词常用户任务的查询推荐。常不能正确地表达其信息需求,很难构造成功的查询,对搜索引擎来说,理解用户信息需求是一项比较困难2相关研究综述的任务。鉴于此,搜索引擎服务提供商如Google等

3、努查询推荐的主流方法是基于日志方法,该方法力尝试采用多种方法去探测用户的信息需求,并将生可分为以下两类子方法:直接的查询共现挖掘与查成查询推荐作为其重要的环节。其中,基于查询日志询构图方法。其中,基于查询共现挖掘的主要思想为,方法是当前查询推荐的主流方法,其主要思想为,从若某查询与原查询共现于同一Session的概率越大,Session级别或者查询级别分析候选查询与原查询的该查询是原查询的候选查询推荐的概率越大。相关研相关关系,利用相应推荐方法生成查询推荐,则查询[1]究有:Huang等提出利用Session中查询共现信息间相关关系的计算方法在很大

4、程度上影响着最终的查来构建原查询的上下文,以此实现推荐,且实验结果询推荐效果。当前相关研究大多基于查询共现信息来表明该方法从多方面优于基于文档的查询推荐方法;衡量查询之间关系,使得最终的推荐结果是与原查询Shi等[2]与Fonseca等[3]提出一种基于关联规则的模型相关而并非是与用户信息需求相关的查询,如某用户来挖掘Session中的相关查询;Jones等[4]根据Session输入查询“苹果手机”想获得苹果品牌的相关电子产中查询间的共现信息,利用互信息度量查询间相似品,其候选查询推荐“苹果沙拉”,偏离了用户初始的性,以此生成候选查询。基于查询共

5、现的推荐方法虽信息需求。能对共现查询进行较好推荐,但不能对一些具有间用户提交查询的主要目的是为了完成特定搜索任接联系的查询实现有效推荐,为了弥补此缺陷,学者收稿日期:2013-12-17收修改稿日期:2014-01-27*本文系武汉大学2012年博士生自主科研项目“网络检索用户查询意图分析与建模研究”(项目编号:2012104010201)的研究成果之一。34现代图书情报技术总第245期2014年第4期们尝试利用构图方法来实现查询推荐,其相关研究3衡量查询间关系的模型[5]有:Mei等基于查询的点击频次来构建二元图,利3.1衡量查询间关系的一般方法

6、用随机游走来遍历图,再以HittingTime方法实现查[6]查询推荐方法的一般思路为:通过相关模型来计询推荐;Boldi等构建了query-flow图模型,利用一算候选查询与原查询的关系权值,在此基础上,利用些特征来计算查询之间的转移概率,以此为候选查[7]相关推荐方法生成候选查询推荐。衡量查询间相关关询排序;Song等利用随机游走来实现查询推荐的两系的方法是查询推荐中的重要部分。计算原查询与候个主要特点:调节随机游走中的跳转参数以及在随选查询关系权值的一般方法,如下所示:机游走时将用户点击和跳转的URL结合起来;Song等[8]利用用户修改查询

7、行为如添加词﹑修改词﹑删r(q,q)=λθ(q,q)(1)(λ,θ)除词来构建图,并分别从主题和词级别来实现查询其中,r(q,q)表示查询q与原查询q之间的关[9]推荐;李亚楠等从Session中挖掘查询之间的间接系值。(q,q)表示利用函数计算查询q与原查询q联系建立查询关系图,并在图结构相似算法SimRank之间的相关关系,表示函数的权值。(q,q)的基础上提出了加权SimRank用于查询推荐;Cao(,)[10]等基于查询日志,先将用户查询转化为一系列概表示若有多个函数用于衡量q与q之间关系时,则各念序

8、列,并构建了这些概念序列的后缀树,以此来作函数之间需进行线性加权,各权值之和为1。在一般为原查询上下文,最后通过在后缀树

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。