Lucene - Analyzer 类

  • 简述

    Analyzer 类负责分析文档并从要索引的文本中获取标记/单词。如果没有 analysis=,IndexWriter 无法创建索引。
  • 类声明

    以下是声明 org.apache.lucene.analysis.Analyzer 类 -
    
    public abstract class Analyzer
       extends Object
          implements Closeable
    
  • 类构造函数

    下表显示了一个类构造函数 -
    序号 构造函数和描述
    1
    protected Analyzer()
  • 类方法

    下表显示了不同的类方法 -
    序号 方法和说明
    1
    void close()
    释放分析器使用的持久资源。
    2
    int getOffsetGap(Fieldable field)
    这与 getPositionIncrementGap(java.lang.String) 类似,但令牌偏移除外。
    3
    int getPositionIncrementGap(String fieldName)
    这是在索引之前调用的 Fieldable 例如,如果术语已添加到该字段中。
    4
    protected Object getPreviousTokenStream()
    由实现可重用 TokenStream 的分析器使用,以检索以前保存的 TokenStreams 以供同一线程重用。
    5
    TokenStream reusableTokenStream(String fieldName, Reader reader)
    创建一个 TokenStream,允许在同一线程调用此方法的前一次重用。
    6
    protected void setPreviousTokenStream(Object obj)
    由实现 reusableTokenStream 的分析器使用,以保存 TokenStream 供同一线程稍后重用。
    7
    abstract TokenStream tokenStream(String fieldName, Reader reader)
    创建一个 TokenStream,它对提供的 Reader 中的所有文本进行标记。
  • 继承的方法

    这个类继承了以下类的方法 -
    • java.lang.Object
    该分析器根据空格拆分文档中的文本。