栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

KETTLE(三)--kettle连接MySQL转换到HDFS

KETTLE(三)--kettle连接MySQL转换到HDFS

前期准备

第一步

1.Hadoop地址:https://archive.apache.org/dist/hadoop/common/
2. 下载hadoop在windows环境下支持包hadoopwindows-master.
  https://github.com/sardetushar/hadooponwindows
我这里hadoop下载的版本是2.7.7版本最好在网上查好你要下载那个版本,不然会报错
第二步
配置环境变量,添加%HADOOP_HOME%,添加path

第三步
Hadoop的文件配置
添加文件夹“data”,文件夹内添加datanode,namenode
修改文件,文件位置:hadoop-3.0.0etchadoopXXX
1.配置core-site.xml


    
       fs.default.name
       hdfs://localhost:9000
   

2.配置hdfs-site.xml


      
    
        dfs.replication
        1
    
    
     dfs.permissions
     false
  
   
       dfs.namenode.name.dir
       /D:/Installed/hadoop-3.0.0/data/namenode
   
   
        fs.checkpoint.dir
        /D:/Installed/hadoop-3.0.0/data/snn
    
    
        fs.checkpoint.edits.dir
        /D:/Installed/hadoop-3.0.0/data/snn
    
       
       dfs.datanode.data.dir
       /D:/Installed/hadoop-3.0.0/data/datanode
   

3.配置mapred-site.xml


    
       mapreduce.framework.name
       yarn
   

4.配置yarn-site.xml


    
       yarn.nodemanager.aux-services
       mapreduce_shuffle
    
    
       yarn.nodemanager.aux-services.mapreduce.shuffle.class
       org.apache.hadoop.mapred.ShuffleHandler
    

初始化Hadoop

以管理员方式打开cmd,运行hadoop:

cd D:javahadoop-3.0.0bin
hadoop namenode –format


然后启动Hadoop,出现四个窗口启动成功!

命令:start-all.cmd

将上边四个文件替换调kettle中的Hadoop文件
 1.连接Hadoop
  
  
点击测试,连接
  
  
  
mysql连接

输出
通过excel输出 可以查看数据准确性

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/312752.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号