栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hive之DDL操作

Hive之DDL操作

DDL 数据定义 1. 创建数据库
  1. 创建一个数据库,数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db
     create database db_hive if not exists;
    
  2. 创建一个数据库,指定数据库在 HDFS 上存放的位置
     create database db_hive2 if not exists location '/db_hive2.db';
    
2. 查询数据库 2.1 显示数据库
  1. 显示数据库
    show databases;
    
  2. 过滤显示查询的数据库
     show databases like 'db_hive*';
    
2.2 查看数据库详情
  1. 显示数据库信息
    desc database db_hive;
    
  2. 显示数据库详细信息extended
     desc database extended db_hive;
    
  3. 切换当前数据库
    use db_hive;
    
3. 删除数据库
  1. 删除空数据库
    drop database db_hive2;
    
  2. 如果数据库不为空,可以采用 cascade 命令,强制删除
    drop database db_hive cascade;
    
4. 创建表
  1. 建表语法
    CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
    [(col_name data_type [COMMENT col_comment], ...)]
    [COMMENT table_comment]
    [PARTITIonED BY (col_name data_type [COMMENT col_comment], ...)]
    [CLUSTERED BY (col_name, col_name, ...)
    [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]
    [ROW FORMAT row_format]
    [STORED AS file_format]
    [LOCATION hdfs_path]
    [TBLPROPERTIES (property_name=property_value, ...)]
    [AS select_statement]
    
  2. 字段解释说明
    • CREATE TABLE 创建一个指定名字的表
    • EXTERNAL 关键字可以让用户创建一个外部表,在建表的同时可以指定一个指向实际数据的路径LOCATION,在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据
    • COMMENT 为表和列添加注释
    • PARTITIonED BY 创建分区表
    • CLUSTERED BY 创建分桶表
    • SORTED BY 不常用,对桶中的一个或多个列另外排序
    • ROW FORMAT DELIMITED [FIELDS TERMINATED BY char](列分割符) [COLLECTION ITEMS TERMINATED BY char] (集合分割符)
      [MAP KEYS TERMINATED BY char] (字典k-v分割符) [LINES TERMINATED BY char](行分割符)。Hive 通过此确定表的具体的列的数据
    • STORED AS 指定存储文件类型
    • LOCATION :指定表在 HDFS 上的存储位置
    • AS:后跟查询语句,根据查询结果创建表
    • LIKE 允许用户复制现有的表结构,但是不复制数据
4.1 案例实战

默认创建的表都是所谓的管理表,有时也被称为内部表。当我们删除一个管理表时,Hive 也会删除这个表中数据。管理表不适合和其他工具共享数据。

删除外部表并不会删除掉这份数据,不过描述表的元数据信息会被删除掉

  1. 普通创建表
    create table if not exists student(
        id int, 
        name string
    )
    row format delimited fields terminated by 't'
    stored as textfile
    location '/user/hive/warehouse/student';
    
  2. 根据查询结果创建表
    create table if not exists student2 as select id, name from student;
    
  3. 根据已经存在的表结构创建表
    create table if not exists student3 like student;
    
  4. 查询表的类型
    desc formatted student2;
    Table Type: MANAGED_TABLE
    
  5. 创建外部表
    create external table if not exists student4(
        id int, 
        name string
    )
    row format delimited fields terminated by 't'
    
  6. 修改内部表为外部表
    alter table student2 set tblproperties('EXTERNAL'='TRUE');
    
  7. 修改外部表为内部表
    alter table student2 set tblproperties('EXTERNAL'='FALSE');
    
5. 修改表 5.1 重命名表
alter table dept rename to dept_1;
5.2 增加/修改/替换列信息
// 添加列
alter table dept_1 add columns (deptdesc string, deptcol int);

// 更新列
alter table dept_1 change column deptdesc desc string;

// 替换列
alter table dept_1 replace columns (deptno string, dname string);

ADD 是代表新增一字段, 字段位置在所有列后面, partition 列前

REPLACE 则是表示替换表中所有字段

6. 删除表
drop table dept_1;
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/300496.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号