EmbeddedSolrServer的使用与solor6.3.0的使用

1.    到solr官网下载对应版本的solr:

    https://lucene.apache.org/solr/

  我下载的是:6.3.0版本(需要JDK8),solr默认集成了jetty容器,而且在索引使用方面集成了zookeeper。解压后如下:

EmbeddedSolrServer的使用与solor6.3.0的使用

2.  启动solr--到bin目录下启动即可

PS G:solrsolr-6.3.0in> .solr.cmd start
Waiting up to 30 to see Solr running on port 8983
Started Solr server on port 8983. Happy searching!

停止服务的方法:

PS G:solrsolr-6.3.0in> .solr.cmd stop -p 8983
Stopping Solr process 21260 running on port 8983

可以通过web界面查看系统的一些属性。(当然也可以添加core的field与查看field)

访问     http://localhost:8983/

EmbeddedSolrServer的使用与solor6.3.0的使用

solrt自带的配置文件的位置:

EmbeddedSolrServer的使用与solor6.3.0的使用

EmbeddedSolrServer的使用与solor6.3.0的使用

3.创建一个core

 0.在solr-6.3.0serversolr下面创建一个collection1目录

 1.将solr-6.3.0serversolrconfigsetssample_techproducts_configs目录下的conf复制到上面新建的目录

EmbeddedSolrServer的使用与solor6.3.0的使用

2.   添加core

 解释:

  collection1:叫做一个Solr运行实例SolrCore,SolrCore名称不固定,一个solr运行实例对外单独提供索引和搜索接口。

  solrHome中可以创建多个solr运行实例SolrCore。

  一个solr的运行实例对应一个索引目录。

  conf是SolrCore的配置文件目录 。

  data目录存放索引文件需要创建

添加方法如下:

EmbeddedSolrServer的使用与solor6.3.0的使用

EmbeddedSolrServer的使用与solor6.3.0的使用

 然后在进入到collection1目录,此时会发现多了一个data文件夹和一个properties文件,如图

 EmbeddedSolrServer的使用与solor6.3.0的使用

   data目录,用于存储索引文件,core.properties文件用于存放core的配置信息

注意:在Solr5以后,schema.xml文件已经不是默认生成好的了,它被取了一个名字managed-schema,并且没有后缀。

EmbeddedSolrServer的使用与solor6.3.0的使用

solr使用schema.xml还是managed-schema?

solr6使用<schemaFactory/>来控制使用schema的方式,默认使用的是ManagedIndexSchemaFactory,但是在solrconfig.xml文件中,这个配置没有显示的指定出来,其实它相当于

<schemaFactory class="ManagedIndexSchemaFactory">
<bool name="mutable">true</bool>
<str name="managedSchemaResourceName">managed-schema</str>
</schemaFactory>

  mutable 是否改变Schema数据,设置为false可以防止他人更改Schema
  managedSchemaResourceName 可以指定Schema的名字,当然值不能是schema.xml
  如果你已经熟悉了之前的配置方式,可以使用ClassicIndexSchemaFactory,只需要在solrconfig.xml文件中添加这样的配置

  <schemaFactory class="ClassicIndexSchemaFactory"/>

  即可,当然这就需要你必须配置一个schema.xml文件。否则会初始化core失败错误。

4.    代码中使用EmbeddedSolrServer   (内嵌)   来使用solr索引--一般采用这种方式,只需要solr目录就可以在java中操作

pom.xml

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <groupId>cn.qlq</groupId>
    <artifactId>solr</artifactId>
    <version>0.0.1-SNAPSHOT</version>

    <dependencies>
        <dependency>
            <groupId>org.apache.solr</groupId>
            <artifactId>solr-core</artifactId>
            <version>6.3.0</version>
        </dependency>

    </dependencies>
    <build>
        <!-- 配置了很多插件 -->
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.5.1</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                    <encoding>UTF-8</encoding>
                </configuration>
            </plugin>
            <plugin>
                <groupId>org.springframework.boot</groupId>
                <artifactId>spring-boot-maven-plugin</artifactId>
            </plugin>
        </plugins>
    </build>
</project>

0.EmbeddedSolrServer的创建方式

        System.setProperty("solr.solr.home", "G:\solr\solr-6.3.0\server\solr"); // 这是slorhome目录,下面初始化CoreContainer默认读取这个环境变量
        CoreContainer coreContainer = new CoreContainer();
        coreContainer.load();
        EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");

或者

        CoreContainer coreContainer = new CoreContainer("G:\solr\solr-6.3.0\server\solr");
        coreContainer.load();
        EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");

1.添加索引

package solr;

import java.io.IOException;

import org.apache.solr.client.solrj.SolrServerException;
import org.apache.solr.client.solrj.embedded.EmbeddedSolrServer;
import org.apache.solr.common.SolrInputDocument;
import org.apache.solr.core.CoreContainer;

public class SolrIndexManager {

    public static void main(String[] args) throws SolrServerException, IOException {
        // CoreContainer coreContainer = new
        // CoreContainer("G:\solr\solr-6.3.0\server\solr\collection1");

        System.setProperty("solr.solr.home", "G:\solr\solr-6.3.0\server\solr"); // 这是slorhome目录
        CoreContainer coreContainer = new CoreContainer();
        coreContainer.load();
        EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");

        try {
            // 构造一篇文档
            SolrInputDocument document = new SolrInputDocument();
            // 往doc中添加字段,在客户端这边添加的字段必须在服务端中有过定义
            document.addField("id", "4");
            document.addField("name", "你好");
            document.addField("description", "前进的中国你好");
            solrServer.add(document);

            solrServer.commit();
        } finally {
            solrServer.close();
        }
    }

}

  需要注意:addField的时候field必须在上面的managed-schema或者schema.xml进行配置。也就是字段必须存在。而且ID字段必须存在。

添加之后会在data生成索引文件:

EmbeddedSolrServer的使用与solor6.3.0的使用

2.查询索引

package solr;

import java.io.IOException;

import org.apache.solr.client.solrj.SolrQuery;
import org.apache.solr.client.solrj.SolrServerException;
import org.apache.solr.client.solrj.embedded.EmbeddedSolrServer;
import org.apache.solr.client.solrj.response.QueryResponse;
import org.apache.solr.common.SolrDocument;
import org.apache.solr.common.SolrDocumentList;
import org.apache.solr.common.SolrInputDocument;
import org.apache.solr.core.CoreContainer;

public class SolrIndexManager {

    public static void main(String[] args) throws SolrServerException, IOException {
        CoreContainer coreContainer = new CoreContainer("G:\solr\solr-6.3.0\server\solr");
        coreContainer.load();
        EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");// queryIndex(solrServer);

    }

    /**
     * 查询索引
     * 
     * @param solrServer
     * @throws SolrServerException
     * @throws IOException
     */
    private static void queryIndex(EmbeddedSolrServer solrServer) throws SolrServerException, IOException {
        // 创建一个query对象
        SolrQuery query = new SolrQuery();
        // 设置查询条件
        query.setQuery("*:*");
        // 执行查询
        QueryResponse queryResponse = solrServer.query(query);
        // 取查询结果
        SolrDocumentList solrDocumentList = queryResponse.getResults();
        // 共查询到商品数量
        System.out.println("共查询数量:" + solrDocumentList.getNumFound());
        // 遍历查询的结果
        for (SolrDocument solrDocument : solrDocumentList) {
            System.out.println(solrDocument.get("id"));
            System.out.println(solrDocument.get("name"));
            System.out.println(solrDocument.get("description"));
        }

        // 必须关闭,否则线程不会停止
        solrServer.close();
    }

}

结果:

共查询数量:2
1
你好
前进的中国你好
2
你好
前进的中国你好

3.根据ID删除索引

        CoreContainer coreContainer = new CoreContainer("G:\solr\solr-6.3.0\server\solr");
        coreContainer.load();
        EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");

        // 根据id删除文档
        solrServer.deleteById("1");
        // 提交修改
        solrServer.commit();

5.solr以目录的形式进行迁移

将 solr-6.3.0serversolr 目录复制到F盘下,如下:

EmbeddedSolrServer的使用与solor6.3.0的使用

 代码测试:

package solr;

import java.io.IOException;

import org.apache.solr.client.solrj.SolrQuery;
import org.apache.solr.client.solrj.SolrServerException;
import org.apache.solr.client.solrj.embedded.EmbeddedSolrServer;
import org.apache.solr.client.solrj.response.QueryResponse;
import org.apache.solr.common.SolrDocument;
import org.apache.solr.common.SolrDocumentList;
import org.apache.solr.common.SolrInputDocument;
import org.apache.solr.core.CoreContainer;

public class SolrIndexManager {

    public static void main(String[] args) throws SolrServerException, IOException {
        CoreContainer coreContainer = new CoreContainer("F:\solr");
        coreContainer.load();
        EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");

         queryIndex(solrServer);

    }

    /**
     * 查询索引
     * 
     * @param solrServer
     * @throws SolrServerException
     * @throws IOException
     */
    private static void queryIndex(EmbeddedSolrServer solrServer) throws SolrServerException, IOException {
        // 创建一个query对象
        SolrQuery query = new SolrQuery();
        // 设置查询条件
        query.setQuery("*:*");
        // 执行查询
        QueryResponse queryResponse = solrServer.query(query);
        // 取查询结果
        SolrDocumentList solrDocumentList = queryResponse.getResults();
        // 共查询到商品数量
        System.out.println("共查询数量:" + solrDocumentList.getNumFound());
        // 遍历查询的结果
        for (SolrDocument solrDocument : solrDocumentList) {
            System.out.println(solrDocument.get("id"));
            System.out.println(solrDocument.get("name"));
            System.out.println(solrDocument.get("description"));
        }

        // 必须关闭,否则线程不会停止
        solrServer.close();
    }
}

结果:

F:solr
共查询数量:1
2
你好
前进的中国你好

补充:以目录的形式创建多个core:

(1)复制collection1.且命名为collection2

EmbeddedSolrServer的使用与solor6.3.0的使用

(2)并且修改collection2文件夹中配置文件core.properties中的名字为collection2即可

 EmbeddedSolrServer的使用与solor6.3.0的使用

6.  关于 solrconfig.xml中的solr.lock.type类型的配置--默认不能多个服务同时使用,如果在jetty中访问则程序不能操作

    <!-- LockFactory 

         This option specifies which Lucene LockFactory implementation
         to use.
      
         single = SingleInstanceLockFactory - suggested for a
                  read-only index or when there is no possibility of
                  another process trying to modify the index.
         native = NativeFSLockFactory - uses OS native file locking.
                  Do not use when multiple solr webapps in the same
                  JVM are attempting to share a single index.
         simple = SimpleFSLockFactory  - uses a plain file for locking

         Defaults: 'native' is default for Solr3.6 and later, otherwise
                   'simple' is the default

         More details on the nuances of each LockFactory...
         http://wiki.apache.org/lucene-java/AvailableLockFactories
    -->
    <lockType>${solr.lock.type:native}</lockType>

设置索引库的锁方式,主要有三种:

  1.single:适用于只读的索引库,即索引库是定死的,不会再更改

  2.native:使用本地操作系统的文件锁方式,不能用于多个solr服务共用同一个索引库。Solr3.6 及后期版本使用的默认锁机制。

  3.simple:使用简单的文件锁机制

  当一个solrserver访问某个core的时候在dataindex目录下会生成一个锁文件:

EmbeddedSolrServer的使用与solor6.3.0的使用

 总结:

  如果需要对文档或者数据库的内容进行增加索引操作,一种办法是使用dataimport插件进行批量导入索引。

  另一种则是手动操作(实际也是用的这种),如果对数据库数据进行索引,采用select *   查出来之后使用solr创建document(在solr称为document,在DB中称为行)并加到索引中,这个需要提前设计好需要索引的字段。(这种情况可能不实时,可以用定时任务去进行solr索引的维护操作)。    如果是对文档添加索引,可以用apache的io包读取文档内容添加索引,对文件名称等信息进行添加索引,也可以用定时任务维护solr索引。