栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 其他

Hadoop伪分布部署

其他 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Hadoop伪分布部署

Hadoop伪分布部署

温馨提示:配置时候一定要细心!!!

1. 安装jdk、 Hadoop

安装jdk、Hadoop

2.伪分布部署

主要配置文件 :core-site.xml、mapred-site.xml、yarn-site.xml、hdfs-site.xml

文件名属性名属性值含义
core-site.xmlfs.defaultFShdfs://localhost:9000NameNode地址
hadoop.tmp.dir/home/hadoop01/hadoop/tmpHadoop临时工作目录
mapred-site.xmlmapreduce.framework.nameyarn指定mapreduce运行框架
yarn-site.xmlyarn.resourcemanager.hostnameipResourceManager的ip地址
yarn.nodemanager.aux-servicesmapreduce_shuffleNodeManager上运行的附属服务
hdfs-site.xmldfs.replication1副本数
  1. 修改主机名sudo vi /etc/hostname,保存后重启。(根据需要判断是否需要修改主机名)

  2. 映射ip地址及主机名

    sudo vi /etc/hosts添加 本机ip 主机名。

      不知道主机名终端输入hostname查看主机名。
    
  3. 免密登录

    • 检查系统是否安装openssh-client和openssh-server:sudo dpkg -l|grep ssh

    • 如果没有,进行安装:sudo apt-get install openssh-client、sudo apt-get install openssh-server(少哪个安装哪个)

    • 安装成功后进行重启ssh服务:sudo /etc/init.d/ssh restart

    • 配置ssh

      1. 生成密钥对:ssh-keygen -t rsa
      2. 追加公钥:ssh-copy-id -i ~/.ssh/id_rsa.pub 主机名
      3. 免密登录:ssh 主机名

    注意:在进行ssh登录时要区分root用户和普通用户

  4. 设置Hadoop配置文件

    etc/hadoop/core-site.xml:

    
        
            fs.defaultFS
            hdfs://localhost:9000
        
        
        
            hadoop.tmp.dir
      /home/hadoop01/hadoop/tmp
        
    
    

    etc/hadoop/hdfs-site.xml:

    
        
            dfs.replication
            1
        
    
    

    etc/hadoop/yarn-site.xml:

     
          
              yarn.nodemanager.aux-services
              mapreduce_shuffle
          
      
    

    etc/hadoop/mapred-site.xml:

    
        
            mapreduce.framework.name
            yarn
        
    
    
  5. 格式化NameNode:hdfs namenode -format

  6. 启动HDFS:start-dfs.sh,查看启动的Java进程:jps

  7. 启动YARN:start-yarn.sh,查看启动的Java进程:jps

3.通过Web访问Hadoop(注意2.x与3.x端口号不同)
  1. HDFS Web界面:浏览器中输入 http://localhost:9870

  2. YARN Web界面:浏览器中输入 http://localhost:8088

4.常用端口
端口名称Hadoop2.xHadoop3.x
NameNode内部通信端口8020/90008020/9000/9820
NameNode HTTP UI500709870
MapReduce查看执行任务端口80888088
历史服务器通信端口1988819888
5.问题
  • 1. openssh-server安装时,包之间的依赖关系出现问题。

    解决办法:将openssh-client 卸载再重新安装。

  • 2. Hadoop安装版本过高,配置文件时出错。

    解决办法:官网找相应配置:http://www.apache.org/

6.体会

发现好多知识是需要自己探索的。多看,多思考,多操作。操作的时候可能按步骤操作,但往往就是会出错,所以配置这个东西一定一定要细心!!!!如有错误,欢迎指正。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/279400.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号