一、介质准备
Gploader介质需从官方下载,下载地址:Download VMware Tanzu™ Greenplum® — VMware Tanzu Network
GreenPlum6.0及之后的版本loader与client合并在了一起,因此只需要根据操作系统下载client的相应介质:
在6.0之前的版本中client与loader是分开的,因此要分别下载client和loader的介质:
二、安装过程
gpload依赖于python2.7,因此首先要在环境中安装python2.7版本。
根据版本不同,介质安装方式不同:
6.0以下版本(以5.14.0版本为例):
1、准备介质
解压介质包
unzip greenplum-clients-5.14.0-rhel7-x86_64.zip #获得greenplum-clients-5.14.0-rhel7-x86_64.bin unzip greenplum-loaders-5.14.0-rhel7-x86_64.zip #获得greenplum-loaders-5.14.0-rhel7-x86_64.bin
2、安装(root用户或sudo方式安装)
chmod +x greenplum-clients-5.14.0-rhel7-x86_64.bin chmod +x greenplum-loaders-5.14.0-rhel7-x86_64.bin ./greenplum-clients-5.14.0-rhel7-x86_64.bin #安装过程中会提示确认安装目录,使用默认选项即可 ./greenplum-loaders-5.14.0-rhel7-x86_64.bin #安装过程中会提示确认安装目录,使用默认选项即可
3、设置环境变量
source /usr/local/greenplum-clients-5.14.0/greenplum_clients_path.sh #本次会话有效 source /usr/local/greenplum-loaders-5.14.0/greenplum_loaders_path.sh #本次会话有效
6.0及以上版本(以6.18.0为例):
1、准备介质
greenplum-db-clients-6.18.0-rhel7-x86_64.rpm #下载的介质即为rpm包
2、安装
yum install bzip2 libyaml libevent rpm -ivh greenplum-db-clients-6.18.0-rhel7-x86_64.rpm #默认
安装即可
3、设置环境变量
source /usr/local/greenplum-db-clients-6.18.0/greenplum_loaders_path.sh #本次会话有效
三、测试验证
1、编写控制文件test.yml
---
VERSION: 1.0.0.1
DATAbase: testdb
USER: test
HOST: 127.0.0.1
PORT: 5432
GPLOAD:
INPUT:
- SOURCE:
LOCAL_HOSTNAME:
- 127.0.0.1
PORT: 15444
FILE:
- /home/test/test.csv #数据文件路径
- COLUMNS:
- id: INT8
- MAX_LINE_LENGTH: 1000000
- FORMAT: csv
- DELIMITER: ','
- HEADER: true
OUTPUT:
- TABLE: public.t_test #测试表,表中包含字段id 类型为INT8
- MODE: insert
2、准备数据文件test.csv
id 1 2 3 4
3、执行gpload
gpload -f test.yml #成功导入数据则安装成功,否则根据具体提示处理



