Apache Solr - 术语

  • 简述

    在本章中,我们将尝试理解一些在使用 Solr 时经常使用的术语的真正含义。
  • 常用术语

    以下是在所有类型的 Solr 设置中使用的通用术语列表 -
    • Instance- 就像一个tomcat instance或一个jetty instance,这个术语是指应用程序服务器,它在 JVM 中运行。Solr 的主目录提供对这些 Solr 实例中的每一个实例的引用,其中可以配置一个或多个内核以在每个实例中运行。
    • Core− 在您的应用程序中运行多个索引时,您可以在每个实例中拥有多个核心,而不是多个实例每个拥有一个核心。
    • Home− 术语 $SOLR_HOME 是指主目录,其中包含有关内核及其索引、配置和依赖项的所有信息。
    • Shard− 在分布式环境中,数据在多个 Solr 实例之间进行分区,其中每个数据块都可以称为一个Shard. 它包含整个索引的一个子集。
  • SolrCloud 术语

    在前面的章节中,我们讨论了如何以独立模式安装 Apache Solr。请注意,我们还可以在分布式模式(云环境)中安装 Solr,其中 Solr 以主从模式安装。在分布式模式下,索引在主服务器上创建,并复制到一个或多个从服务器。
    与 Solr Cloud 相关的关键术语如下 -
    • Node− 在 Solr 云中,每个 Solr 实例都被视为一个node.
    • Cluster− 环境的所有节点组合在一起构成一个cluster.
    • Collection− 一个集群有一个逻辑索引,称为collection.
    • Shard− 分片是集合的一部分,具有索引的一个或多个副本。
    • Replica− 在 Solr Core 中,在节点中运行的分片副本称为replica.
    • Leader− 也是 shard 的一个副本,将 Solr Cloud 的请求分发给剩余的副本。
    • Zookeeper− 这是 Solr Cloud 用于集中配置和协调、管理集群和选举领导者的 Apache 项目。
  • 配置文件

    Apache Solr 中的主要配置文件如下:
    • Solr.xml− 它是$SOLR_HOME 目录中包含Solr Cloud 相关信息的文件。为了加载内核,Solr 引用此文件,这有助于识别它们。
    • Solrconfig.xml− 该文件包含与请求处理和响应格式相关的定义和特定于核心的配置,以及索引、配置、管理内存和提交。
    • Schema.xml− 此文件包含整个架构以及字段和字段类型。
    • Core.properties− 此文件包含特定于核心的配置。它被称为core discovery,因为它包含核心的名称和数据目录的路径。它可以在任何目录中使用,然后将其视为core directory.