垂直搜索主题词典构建文献

垂直搜索主题词典构建文献

ID:28600923

大小:86.50 KB

页数:8页

时间:2018-12-11

垂直搜索主题词典构建文献_第1页
垂直搜索主题词典构建文献_第2页
垂直搜索主题词典构建文献_第3页
垂直搜索主题词典构建文献_第4页
垂直搜索主题词典构建文献_第5页
资源描述:

《垂直搜索主题词典构建文献》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、.新疆农业大学专业文献综述题目:垂直搜索引擎主题词典构建方法的研究综述姓名:瑞玲学院:计算机与信息工程学院专业:计算机科学与技术班级:081班学号:084632114成绩:指导教师:白涛职称:讲师2011年11月13日新疆农业大学教务处制....垂直搜索引擎主题词典构建方法的研究综述瑞玲白涛摘要:为提升垂直搜索引擎的性能,文中叙述了垂直搜索引擎的工作原理,主要研究主题词典构建的方法对垂直搜索引擎在检索速度上的影响。简述了垂直搜索引擎的发展现状,概述了结合哈希函数和二分查找的SHSEG词典,展望垂直搜索引擎的未来发展趋势,最后进行了小结。关键词:垂直搜索引擎;中文分词;主题词典Verti

2、calsearchenginedictionaryofthebuildingmethodoftheresearchtopicswerereviewedRuiLingBaiTaoAbstract:Toenhancetheperformanceoftheverticalsearchengine,thepaperdescribestheworkingprincipleoftheverticalsearchengine,themainresearchtopicsofbuildingupthedictionarymethodofverticalsearchengineintheinfluence

3、oftheretrievalspeed.Brieflyverticalsearchenginedevelopmentpresentsituation,thispaperOutlinesthecombinedwithhashfunctionandbinarysearchSHSEGdictionary,lookingtothefutureoftheverticalsearchenginedevelopmenttrend,thesummary.Keywords:verticalsearchengine;TheChinesewordsegmentation;Themedictionary随着因

4、特网的快速发展,网络信息资源的数量迅速增加,传统的搜索引擎已经不足以满足用户的特定需求。而垂直搜索引擎的出现正是针对不同行业提供更加精确的行业服务模式。它不同于通用搜索引擎,是通过一种计算机程序对网页库中某类专门信息进行一次结构化数据的整合,定向分字段抽取出需要的数据,并将该数据进行组织和处理后为用户提供检索服务[1]。其基本特点是抓取的数据来源于它本身所关注的行业,且抓取的数据倾向于结构化数据与元数据,搜索行为也是基于结构化数据和元数据的结构化搜索。而主体词典的构建对垂直搜索引擎的分词效率和检索速度都有重要的影响。....因此如何构建主题词典自然而然的成为提高垂直搜索引擎性能的指标之

5、一。笔者认为用于提高主题词典构建的方法主要有基于关系数据库和纯文本方式的结合。此方法的构建对垂直搜索引擎检索速度有相对提高。1垂直搜索引擎的发展现状搜索引擎从上世纪90年代初发展到现在,从Archie到Excite、Yahoo、Google再到元搜索直到现在的智能检索的产生,垂直搜索引擎是搜索引擎领域发展过程中的一个链接,未来搜索引擎的发展趋势也有可能是垂直搜索引擎出现更加精确的细分。在搜索行业中,机器人搜索引擎适用于检索难以查找和模糊的信息,但返回的信息过多,必须进行筛选。目录式搜索引擎使用户可通过浏览目录中的分类来缩小搜索范围,提高检索的准确性,但人工方式限制其更新速度和容量。元搜

6、索引擎返回的结果信息量更大,更全,也就意味着需要作更多的筛选。智能化搜索引擎是结合多Agent机制设计的一个基于多Agent协作的智能搜索引擎系统[2]。而垂直搜索引擎是2006年后才逐步兴起的一类搜索引擎,主要专注于特定的搜索领域和搜索需求。相比通用搜索引擎的数千台检索服务器,垂直搜索引擎所需的硬件成本低、用户需求特定、查询方式多样。例如:企业库搜索、供求信息搜索、购物搜索、房产信息搜索、人才搜索、地图搜索;还涉及多媒体的搜索,如MP3搜索、视屏搜索等。现在国内比较有代表性的垂直搜索引擎有:搜商网、亨者电子商务搜索引擎、纺织搜索、一呼百应、去哪儿等。其中搜商网的信息搜索效率和准确率很

7、高。搜集整理的企业信息、供求信息、专业知识、商务知识、金融知识等信息比较全面,数据的更新频率也基本上能保持实时更新。初具第三代搜索引擎模式,有着非常高的商业价值。2垂直搜索引擎的工作原理垂直搜索引擎在工作原理上与通用搜索引擎基本相同,主要有网络蜘蛛模块、信息处理模块、信息索引与检索模块[3]。2.1垂直网络蜘蛛网络蜘蛛程序的功能是从信息源中抓取数据。通用搜索引擎的网络蜘蛛不会关注采集的信息是否满足用户的需求,它试图对Web....中整个拓扑图的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。