Hive - DDL（data define language）（库表得增删改）

DDL(data definition language)：

数据库定义语言，也就是对于Hive中的一些表、数据库进行增删改的操作

1 创建数据库

1）创建一个数据库，数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。

hive (default)> create database db_hive;

2）避免要创建的数据库已经存在错误，增加if not exists判断。（标准写法）

hive (default)> create database if not exists db_hive;

3）创建一个数据库，指定数据库在HDFS上存放的位置

hive (default)> create database db_hive2 location '/db_hive2.db';

2 修改数据库

用户可以使用ALTER DATAbase命令为某个数据库的DBPROPERTIES设置键-值对属性值，来描述这个数据库的属性信息。数据库的其他元数据信息都是不可更改的，包括数据库名和数据库所在的目录位置。

hive (default)> alter database db_hive set dbproperties('createtime'='20170830');

在mysql中查看修改结果

hive> desc database extended db_hive;

3 查询数据库 3.1 显示数据库

1）显示数据库

hive> show databases;

2）过滤显示查询的数据库

hive> show databases like 'db_hive*';

3.2 查看数据库详情

1）显示数据库信息

hive> desc database db_hive;

OK

db_hive		hdfs://hadoop102:8020/user/hive/warehouse/db_hive.db	atguiguUSER

2）显示数据库详细信息，extended

```css
hive> desc database extended db_hive;

OK

db_hive		hdfs://hadoop102:8020/user/hive/warehouse/db_hive.db	atguiguUSER

3.3 使用数据库

hive (default)> use db_hive;

4 删除数据库

1）删除空数据库

hive>drop database db_hive2;

2）如果删除的数据库不存在，最好采用 if exists判断数据库是否存在

hive> drop database if exists db_hive2;

3）如果数据库不为空，可以采用cascade命令，强制删除

hive> drop database db_hive cascade;

5 创建表 5.1 建表语法

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name 
[(col_name data_type [COMMENT col_comment], ...)] 
[COMMENT table_comment] 
[PARTITIonED BY (col_name data_type [COMMENT col_comment], ...)] 
[CLUSTERED BY (col_name, col_name, ...) 
[SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS] 
[ROW FORMAT row_format] 
[STORED AS file_format] 
[LOCATION hdfs_path]

5.2 字段解释说明

（1）CREATE TABLE：创建一个指定名字的表。如果相同名字的表已经存在，则抛出异常；用户可以用 IF NOT EXISTS 选项来忽略这个异常。

（2）**EXTERNAL：**关键字可以让用户创建一个外部表，在建表的同时指定一个指向实际数据的路径（LOCATION），Hive创建内部表时，会将数据移动到数据仓库指向的路径；若创建外部表，仅记录数据所在的路径，不对数据的位置做任何改变。在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。

（3）**COMMENT: ** 为表和列添加注释。

（4）PARTITIonED BY：创建分区表

（5）CLUSTERED BY: 创建分桶表

（6）SORTED BY: 不常用

（7）ROW FORMAT: 不常用

（8）**STORED AS:**指定存储文件类型，SEQUENCEFILE（二进制序列文件）、TEXTFILE（文本）、RCFILE（列式存储格式文件）；如果文件数据是纯文本，可以使用STORED AS TEXTFILE。如果数据需要压缩，使用 STORED AS SEQUENCEFILE。

（9）**LOCATION ：**指定表在HDFS上的存储位置。

（10）LIKE允许用户复制现有的表结构，但是不复制数据。

6 修改表 6.1 重命名表

（1）语法

ALTER TABLE table_name RENAME TO new_table_name

（2）实操案例

hive (default)> alter table dept_partition2 rename to dept_partition3;

6.2 增加、修改和删除表分区

分区表是独立得一块，这块难，具体可以看相关文档。

6.3 增加/修改/替换列信息

1）语法
更新列

ALTER TABLE table_name CHANGE [COLUMN] col_old_name col_new_name column_type [COMMENT col_comment] [FIRST|AFTER column_name]

增加和替换列

ALTER TABLE table_name ADD|REPLACE COLUMNS (col_name data_type [COMMENT col_comment], ...)

注：ADD是代表新增一字段，字段位置在所有列后面(partition列前)，REPLACE则是表示替换表中所有字段。
2）实操案例
（1）查询表结构

hive>desc dept_partition;

（2）添加列

hive (default)> alter table dept_partition add columns(deptdesc string);

（3）查询表结构

hive>desc dept_partition;

（4）更新列

hive (default)> alter table dept_partition change column deptdesc desc int;

（5）查询表结构

hive>desc dept_partition;

（6）替换列

hive (default)> alter table dept_partition replace columns(deptno string, dname string, loc string);

（7）查询表结构

hive>desc dept_partition;

7 删除表

hive (default)> drop table dept_partition;

Hive - DDL（data define language）（库表得增删改）

大数据系统相关栏目本月热门文章