欢迎来到天天文库
浏览记录
ID:9802109
大小:114.53 KB
页数:32页
时间:2018-05-10
《利用solr搭建企业搜索平台》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、利用SOLR搭建企业搜索平台目录利用SOLR搭建企业搜索平台1运行solr2中文分词3配置文件6MultiCore8solrj10solr查询参数说明15solr使用问题集16solr实现去掉重复的搜索结果19solr的查询语法24数据库数据导入到solr27中文分词之IK3032/32运行solr在网络上找了很多的关于solr的资料,发现非常的不全面,即使就是官方的wiki,也是如此! 基于现阶段正在研究的solr应用,陆续的会分享我的一些经验! 今天要说的是:怎么跑起来! 1》首先下载好sol
2、r,我用的是solr1.3,下载地址: windows版本 http://labs.xiaonei.com/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.zip linux版本 http://labs.xiaonei.com/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.tgz 2》准备运行容器,我用的是tomcat6.0.20.如果是玩的话,也可以不用准备专门的容易,你只需解压好sol
3、r的下载包,找到example文件夹,然后运行start.jar。具体指令:java-jarstart.jar做应用的时候,不建议采用该方式。该方式内部包含了jetty! 3》有关tomcat的使用,不是本文的重点,如果你有问题,请参见tomcat的使用。解压好tomcat,将solr包下面的dist文件夹中的apache-solr-1.3.0.war拷贝到tomcat的webapps,并且改名为solr.war。 4》新建一个solr-tomcat文件夹,我是把这个文件夹建立在C盘根目录,你可以采
4、用同样方式,也可以不这样,放哪由你决定。建立好该文件夹以后,在把它下面在建立一个solr文件夹,把solr包里面的examplesolr文件夹下面的所有文件放入到solr里面。 5》最后一步配置solr.home,可以有三种方式。 1)基于当前路径的方式 这种情况需要在c:solr-tomcat目录下去启动tomcat,Solr查找./solr,因此在启动时候需要切换到c:solr-tomcat 2)基于环境变量 windows在环境变量中建立solr.home,值为c:solr-tomcat
5、 linux在当前用户的环境变量中(.bash_profile)或在catalina.sh中添加如下环境变量 exportJAVA_OPTS="$JAVA_OPTS-Dsolr.solr.home=/opt/solr-tomcat/solr" 3)基于JNDI 在tomcat的conf文件夹建立Catalina文件夹,然后在Catalina文件夹中在建立localhost文件夹,在该文件夹下面建立solr.xml,其中内容: Xml代码 32/321236、c:tomcatwebappssolr.war" debug="0" crossContext="true" > 问题描述: 个人发现的一个问题,就是如果配置好JNDI的话,然后在tomcat的bin文件夹下面启动tomcat的话,会在tomcat的bin下面建立solr文
6、c:tomcatwebappssolr.war" debug="0" crossContext="true" >
7、件夹,这个文件夹中主要存放的索引文件。本来这些东西应该放入c:solr-tomcatsolr。如果你不想出现这种情况的话,请使用基于当前路径的方式。6》打开浏览器,请看看能否访问该服务。如果能够访问,恭喜您跑起来了。中文分词这篇文章,主要说的是怎么在solr中加入中文分词,参考了一些文章,但是还是花了不少时间才搞出的。可能是大侠们太牛了,所以很多细节东西都没有写出来!但是要指出的是很多文章都是抄来抄去的! 入正题: 在上面的一个文章中,已经使solr跑起来了,在上面的基础上,加入中文分词。我用的是p
8、aoding分词器! 1》请下好paoding分词器,下载地址: http://code.google.com/p/paoding/downloads/list,在这里要非常感谢paoding作者:qieqie 在使用paoding的时候要注意:paoding的dic位置,也就是字典的位置,有两种办法解决: 1)在系统环境变量中加入PAODING_DIC_HOME这个变量,值为paoding压
此文档下载收益归作者所有