垂直搜索与站内搜索

垂直搜索与站内搜索

ID:10874392

大小:57.50 KB

页数:4页

时间:2018-07-08

垂直搜索与站内搜索_第1页
垂直搜索与站内搜索_第2页
垂直搜索与站内搜索_第3页
垂直搜索与站内搜索_第4页
资源描述:

《垂直搜索与站内搜索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、TRS垂直搜索垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。如:51job、  垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索

2、引再以搜索的方式满足用户的需求。  整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。   垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。   举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CP

3、U、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。  垂直搜索引擎大体上需要以下技术   1.Spider   2.网页结构化信息抽取技术或元数据采集技术   3.分词、索引   4.其他信息处理技术  垂直搜索引擎的技术评估应从以下几点来判断   1.全面性   2.更新性   3.准确性   4.功能性 垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有

4、技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。垂直搜索引擎的三个特点:(1)、垂直搜索引擎抓取的数据来源于垂直搜索引擎关注的行业站点:比如:找工作的搜索引擎www.deepdo.com的数据来源于:www.51job.com,www.zhaoping.com,www.chinahr.com等等;股票搜索引擎www.macd.cn的数据来源于:www.jrj.com.cn,www.gutx.com等

5、股票站点;(2)、垂直搜索引擎抓取的数据倾向于结构化数据和元数据:比如:我们找工作关注的:职位信息:软件工程师;公司名称,行业名称:软件公司,外包行业等;地点:北京,海淀;(3)、垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索:比如:找:海淀软件工程师的工作等。垂直搜索引擎站点的8条准则:1、选择一个好的垂直搜索方向。俗话说男怕选错行,这一点对于搜索引擎来说也是一样的,除了选择的这个行业有垂直搜索的大量需求外,这个行业的数据属性最好不要和Yahoo,Google等通用搜索的的抓取方向重叠。目前热门的垂直

6、搜索行业有:购物,旅游,汽车,工作,房产,交友等行业。搜索引擎对动态url数据不敏感也是众所周知的,这些可以作为垂直搜索引擎的切入点;2、评价所选垂直搜索行业的网站、垂直搜索内容、行业构成等情况:我们都知道垂直搜索引擎并不提供内容来源,它的数据依赖爬虫搜集,并做了深度加工而来的。因此考虑垂直搜索引擎的所处的大环境和定位至关重要。3、深入分析垂直搜索引擎的索引数据特点:垂直搜索引擎的索引数据过于结构化,那么进入的门槛比较低,行业竞争会形成一窝蜂的局面;如果搜索数据特点是非结构化的,抓取,分析这样的数据很困难,进入壁垒

7、太高,很可能出师未杰身先死。4、垂直搜索引擎的索引数据倾向于结构化数据和元数据,这个特点是区别于yahoo,google等通用搜索引擎的,这是垂直搜索引擎的立足点。而垂直搜索引擎是根植于某一个行业,因此行业知识,行业专家这些也是通用搜索引擎不具备的。也就是说进入垂直搜索是有门槛的。5、垂直搜索引擎的搜索结果要覆盖整个行业,搜索相关性要高于通用搜索引擎,贴近用户搜索意图,搜索结果要及时。6、垂直搜索引擎的web2.0需求:垂直搜索引擎的搜索数据由于带有结构化的天性,相对于通用搜索引擎的全文索引而言,更显的少而精。因此

8、,设计的时候要提供收集用户数据的接口,同时提供tag,积分等机制,使搜索结果更加“垂直”。7、垂直搜索引擎的目标是帮助用户解决问题,而不只是向通用搜索引擎一样发现信息:这一点是垂直搜索引擎的终极目标。在做垂直搜索引擎的时候你需要考虑:什么问题是这个行业内的特殊性问题,什么问题是一般性问题。keso多次提到google的目标是让用户尽快离开google,而垂直

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。