sphinx在windows下的安装使用

sphinx在windows下的安装使用

ID:34245280

大小:54.92 KB

页数:7页

时间:2019-03-04

sphinx在windows下的安装使用_第1页
sphinx在windows下的安装使用_第2页
sphinx在windows下的安装使用_第3页
sphinx在windows下的安装使用_第4页
sphinx在windows下的安装使用_第5页
资源描述:

《sphinx在windows下的安装使用》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、Sphinx 在 windows 下安装使用前一阵子尝试使用了一下 Sphinx ,一个能够被各种语言 (PHP/Python/Ruby/etc) 方便调用的全文检索系统。网上的资料大多是在 linux 环境下的安装使用,当然,作为生产环境很有必要部署在 *nix 环境下,作为学习测试,还是 windows 环境比较方便些。本文旨在提供一种便捷的方式让 Sphinx 在 windows 下安装配置以支持中文全文检索,配置部分在 linux 下通用。一、关于 SphinxSphinx 是一个在 GPLv2 下发布的一个全文检索引擎,

2、商业授权(例如 , 嵌入到其他程序中)需要联系作者( Sphinxsearch.com )以获得商业授权。一般而言, Sphinx 是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。 Sphinx 可以非常容易的与 SQL 数据库和脚本语言集成。当前系统内置 MySQL 和 PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的 XML 数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的 DBMS 的原生支持)。搜索 API 支持 PHP 、 Python 、 

3、Perl 、 Rudy 和 Java ,并且也可以用作 MySQL 存储引擎。搜索 API 非常简单,可以在若干个小时之 内移植到新的语言上。Sphinx 特性:·高速的建立索引 ( 在当代 CPU 上,峰值性能可达到 10MB/ 秒 );·高性能的搜索 ( 在 2–4GB 的文本数据上,平均每次检索响应时间小于 0.1 秒 );·可处理海量数据 ( 目前已知可以处理超过 100GB 的文本数据 , 在单一 CPU 的系统上可处理 100M 文档 );·提供了优秀的相关度算法,基于短语相似度和统计( BM25 )的复合 Ranki

4、ng 方法 ;·支持分布式搜索 ;·提供文件的摘录生成 ;·可作为 MySQL 的存储引擎提供搜索服务 ;·支持布尔、短语、词语相似度等多种检索模式 ;·文档支持多个全文检索字段 ( 最大不超过 32 个 );·文档支持多个额外的属性信息 ( 例如:分组信息,时间戳等 );·停止词查询 ;·支持单一字节编码和 UTF-8 编码 ;·原生的 MySQL 支持 ( 同时支持 MyISAM 和 InnoDB);·原生的 PostgreSQL 支持 .二、 Sphinx 在 windows 上的安装1. 直接在 http://www.sp

5、hinxsearch.com/downloads.html 找 到最新的 windows 版本,我这里下的是 Win32releasebinarieswithMySQLsupport ,下载后解压在 D:sphinx 目录下;2. 在 D:sphinx 下新建一个 data 目录用来存放索引文件, 一个 log 目录方日志文件,复制 D:sphinxsphinx.conf.in 到 D:sphinxbinsphinx.conf (注意修改文件 名);3. 修改 D:sphinxbinsphinx.conf ,

6、我这里 列出需要修改的几个:type           =mysql# 数据源,我这里是mysqlsql_host       =localhost# 数据库服务器sql_user       =root# 数据库用户名sql_pass       =''# 数据库密码sql_db         =test# 数据库sql_port       =3306# 数据库端口sql_query_pre      =SETNAMESutf8# 去掉此行前面的注释,如果你的数据库是uft8 编码的indextest1{# 放索引的目录 

7、 path      =D:/sphinx/data/# 编码  charset_type     =utf-8  #  指定utf-8 的编码表  charset_table     =0..9,A..Z->a..z,_,a..z,U+410..U+42F->U+430..U+44F,U+430..U+44F  # 简单分词,只支持0 和1 ,如果要搜索中文,请指定为1  ngram_len       =1# 需要分词的字符,如果要搜索中文,去掉前面的注释  ngram_chars      =U+3000..U+2FA1F}

8、# 搜索服务需要修改的部分searchd{  # 日志  log        =D:/sphinx/log/searchd.log#PIDfile,searchdprocessIDfilename  pid_file      =D:/sphin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。