- 安装
- 使用
- 数据库到文件
- 从teradata抽取数据到csv文件
- 数据库连接选项配置
- 依据某个字段分组,然后输出到不同的文件
整个软件是一个压缩包,解压即用,环境配置上只需配置JDK即可(1.6以上版本)。
windows下运行spoon.bat打开kettle图形界面
https://sourceforge.net/projects/pentaho/files/Pentaho%208.2/client-tools/
或者
http://www.kettle.be/
使用 数据库到文件 从teradata抽取数据到csv文件原表数据有1亿多,需要输出到文件,按某个字段分组存储。
数据库连接选项配置解决输出数据中文乱码问题
CHARSET=ASCII
TMODE=TERA
CLIENT_CHARSET=GBK
参考资料:
kettle循环导出数据到excel生成多个sheet页/不同excel
Kettle导出数据切分CSV说明
Pentaho Kettle将CSV拆分为多个记录
完整作业截图如下:
-
获取分组list的转换如下所示:
-
表输入
-
字段选择
-
复制记录到结果
-
-
将单个分组结果输出到文件的job如下所示:
- 获取变量
- 数据输出
- 获取变量



