1、Sphinx 在 windows 下安装使用前一阵子尝试使用了一下 Sphinx ,一个能够被各种语言 (PHP/Python/Ruby/etc) 方便调用的全文检索系统。网上的资料大多是在 linux 环境下的安装使用,当然,作为生产环境很有必要部署在 *nix 环境下,作为学习测试,还是 windows 环境比较方便些。本文旨在提供一种便捷的方式让 Sphinx 在 windows 下安装配置以支持中文全文检索,配置部分在 linux 下通用。一、关于 SphinxSphinx 是一个在 GPLv2 下发布的一个全文检索引擎,
2、商业授权(例如 , 嵌入到其他程序中)需要联系作者( Sphinxsearch.com )以获得商业授权。一般而言, Sphinx 是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。 Sphinx 可以非常容易的与 SQL 数据库和脚本语言集成。当前系统内置 MySQL 和 PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的 XML 数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的 DBMS 的原生支持)。搜索 API 支持 PHP 、 Python 、
3、Perl 、 Rudy 和 Java ,并且也可以用作 MySQL 存储引擎。搜索 API 非常简单,可以在若干个小时之 内移植到新的语言上。Sphinx 特性:·高速的建立索引 ( 在当代 CPU 上,峰值性能可达到 10MB/ 秒 );·高性能的搜索 ( 在 2–4GB 的文本数据上,平均每次检索响应时间小于 0.1 秒 );·可处理海量数据 ( 目前已知可以处理超过 100GB 的文本数据 , 在单一 CPU 的系统上可处理 100M 文档 );·提供了优秀的相关度算法,基于短语相似度和统计( BM25 )的复合 Ranki