Hive 视图和索引

  • Hive 视图和索引

    本章介绍如何创建和管理视图。视图是根据用户要求生成的。您可以将任何结果集数据保存为视图。Hive中视图的用法与SQL中视图的用法相同。这是标准的RDBMS(关系型数据库系统)概念。我们可以在视图上执行所有DML操作。
  • 创建一个视图

    您可以在执行SELECT语句时创建视图。语法如下:
    
    CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment], ...) ]
    [COMMENT table_comment]
    AS SELECT ...
    
    - 让我们以一个例子为例。假设如下所示的雇员表,具有字段ID,名称,薪水,指定和部门。生成查询以检索薪水超过30000卢比的雇员详细信息。我们将结果存储在名为emp_30000的视图中。
    
    +------+--------------+-------------+-------------------+--------+
    | ID   | Name         | Salary      | Designation       | Dept   |
    +------+--------------+-------------+-------------------+--------+
    |1201  | Gopal        | 45000       | Technical manager | TP     |
    |1202  | Manisha      | 45000       | Proofreader       | PR     |
    |1203  | Masthanvali  | 40000       | Technical writer  | TP     |
    |1204  | Krian        | 40000       | Hr Admin          | HR     |
    |1205  | Kranthi      | 30000       | Op Admin          | Admin  |
    +------+--------------+-------------+-------------------+--------+
    
    以下查询使用上述场景检索员工详细信息:
    
    hive> CREATE VIEW emp_30000 AS
    SELECT * FROM employee
    WHERE salary>30000;
    
  • 删除视图

    使用以下语法删除视图:
    
    DROP VIEW view_name
    
    以下查询删除名为emp_30000的视图:
    
    hive> DROP VIEW emp_30000;
    
  • 创建索引

    索引不过是表的特定列上的指针。创建索引意味着在表的特定列上创建指针。其语法如下:
    
    CREATE INDEX index_name
    ON TABLE base_table_name (col_name, ...)
    AS 'index.handler.class.name'
    [WITH DEFERRED REBUILD]
    [IDXPROPERTIES (property_name=property_value, ...)]
    [IN TABLE index_table_name]
    [PARTITIONED BY (col_name, ...)]
    [
       [ ROW FORMAT ...] STORED AS ...
       | STORED BY ...
    ]
    [LOCATION hdfs_path]
    [TBLPROPERTIES (...)]
    
    - 让我们以索引为例。使用我们之前使用过的同一员工表以及ID,姓名,薪水,指定和部门字段。在员工表的薪水列上创建一个名为index_salary的索引。
    以下查询创建索引:
    
    hive> CREATE INDEX inedx_salary ON TABLE employee(salary) AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';
    
    它是指向薪金列的指针。如果修改了该列,则使用索引值存储更改。
  • 删除索引

    以下语法用于删除索引:
    
    DROP INDEX <index_name> ON >table_name>
    
    以下查询删除一个名为index_salary的索引:
    
    hive> DROP INDEX index_salary ON employee;