Apache Solr - 搜索引擎基础

  • 简述

    搜索引擎是指一个巨大的互联网资源数据库,如网页、新闻组、程序、图像等。它有助于在万维网上查找信息。
    用户可以通过以关键字或短语的形式将查询传递到搜索引擎来搜索信息。然后搜索引擎在其数据库中搜索并将相关链接返回给用户。
    谷歌搜索
  • 搜索引擎组件

    通常,搜索引擎的三个基本组件如下所列 -
    • Web Crawler− 网络爬虫也称为spiders或者bots. 它是一个通过网络收集信息的软件组件。
    • Database− 网络上的所有信息都存储在数据库中。它们包含大量的网络资源。
    • Search Interfaces− 该组件是用户和数据库之间的接口。它帮助用户搜索数据库。
  • 搜索引擎如何工作?

    任何搜索应用程序都需要执行以下部分或全部操作。
    步骤 标题 描述
    1
    获取原始内容
    任何搜索应用程序的第一步都是收集要进行搜索的目标内容。
    2
    构建文档
    下一步是从搜索应用程序可以轻松理解和解释的原始内容构建文档。
    3
    分析文档
    在开始索引之前,要分析文档。
    4
    索引文档
    一旦构建和分析了文档,下一步就是对它们进行索引,以便可以根据某些键而不是文档的全部内容来检索该文档。
    索引类似于我们在书末的索引,其中常用单词及其页码显示,以便可以快速跟踪这些单词,而不是搜索整本书。
    5
    搜索用户界面
    一旦索引数据库准备就绪,应用程序就可以执行搜索操作。为了帮助用户进行搜索,应用程序必须提供一个用户界面,用户可以在其中输入文本并启动搜索过程
    6
    构建查询
    一旦用户发出搜索文本的请求,应用程序应该使用该文本准备一个查询对象,然后可以使用该查询对象查询索引数据库以获取相关详细信息。
    7
    搜索查询
    使用查询对象,检查索引数据库以获取相关详细信息和内容文档。
    8
    渲染结果
    一旦收到所需的结果,应用程序应决定如何使用其用户界面向用户显示结果。
    看看下面的插图。它显示了搜索引擎如何运作的整体视图。
    搜索引擎
    除了这些基本操作之外,搜索应用程序还可以提供管理用户界面,帮助管理员根据用户配置文件控制搜索级别。搜索结果分析是任何搜索应用程序的另一个重要和高级方面。