1916290141 大数据一班 王多佳
抽取csv文件
创建一个转换csv_extract,并添加“CSV文件输入”控件和“表输出”控件以及Hop跳连接线,用于实现CSV文件数据的抽取功能,如下图所示
双击上图中的“CSV文件输入”控件,进入界面,如下图所示
单击“浏览”按钮,选择要抽取的文件csv_extract.csv,如下图所示
单击上图的“获取字段”按钮,Kettle自动检索CSV文件,并对文件中的字段类型等属性进行分析,如下图所示
单击上图中的“预览”按钮,查看文件的数据是否抽取到CSV文件输入流中,如下图所示
双击“表输出”控件,进入页面,如下图所示
单击上图中的”新建“按钮,配置数据库连接,配置完成后点击“确认”按钮,如下图所示
“表输出”控件配置的最终结果如下图所示
设置映射匹配,如下图所示
运行创建的转换,如下图所示
使用SQLyog工具,查看数据表中是否已插入100行数据,如下图所示
JSON文件的数据抽取
打开kettle工具,创建转换json_extract,并添加JSON input控件、“表输出”控件以及Hop跳连接线,如下图所示
配置JSON input控件,如下图所示
配置JSON input2控件,如下图所示
配置“表输出”控件,如下图所示
运行转换json_extract,如下图所示
使用SQLyog工具,查看数据表中是否已插入数据,如下图所示



