栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop 伪集群搭建与使用

Hadoop 伪集群搭建与使用

1. 下载

下载地址, Index of /hadoop/common/stable

2. 解压
tar -zxvf hadoop-3.3.1.tar.gz
3. 配置

修改核心配置:

vi etc/hadoop/core-site.xml


    
        fs.defaultFS
        hdfs://localhost:9000
    


vi etc/hadoop/hdfs-site.xml


    
        dfs.replication
        1
    

配置 hadoop 环境变量

vi etc/hadoop/hadoop-env.sh

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
# 也可以在系统环境变量里配置
export JAVA_HOME=/usr/local/java/jdk1.8.0_261

配置 ssh 免密登陆:

  ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
  cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
  ssh localhost
4. 启动
  $ bin/hdfs namenode -format
  $ sbin/start-dfs.sh

启动过后,访问 http://ip: 9870

 5. 使用
bin/hdfs dfs -mkdir /user
bin/hdfs dfs -mkdir /user/root
# 相对路径 /user/root/input
bin/hdfs dfs -mkdir input
# 拷贝文件
bin/hdfs dfs -put etc/hadoop/*.xml input

# 使用自带的 mapreduce 处理文件
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar grep input output 'dfs[a-z.]+'

# 查看处理结果
bin/hdfs dfs -cat output/* 

可视化网页也能看到以上命令执行的结果:

查看分布式文件夹 output 下的处理结果:

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/278392.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号