栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

如何安装hadoop(阿里云 hadoop)

如何安装hadoop(阿里云 hadoop)

1.创建新用户

useradd heipilei

2.heipilei用户下创建所需文件夹

mkdir sourcecode software app log lib data tmp shell

3.将下载好的hadoop java 文件上传到 software下

software 目录下 rz

4.将hadoop java 解压到 用户app下

hadoop/

tar -xzvf hadoop-3.1.3.tar.gz -C ../app/

tar -xzvf jdk-8u212-linux-x64.tar.gz -C ../app/

etc/hadoop  下  vi hadoop-env.sh

export JAVA_HOME=/home/heipilei/app/java
export HADOOP_HOME=/home/heipilei/app/hadoop
export PATH=:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

配置局部变量(用户)

刷新文件     

source hadoop-env.sh

5.创建软连接

 ln -s hadoop-3.1.3/ hadoop

 ln -s jdk1.8.0_212/ java

创建软连接好处:版本切换无感知  (java版本跟hadoop版本需要适配)

cd hadoop

drwxr-xr-x 2 heipilei heipilei   4096 9月  12 2019 bin  可执行命令  hadoop hdfs 命令
drwxr-xr-x 3 heipilei heipilei   4096 9月  12 2019 etc  配置文件
drwxr-xr-x 2 heipilei heipilei   4096 9月  12 2019 include
drwxr-xr-x 3 heipilei heipilei   4096 9月  12 2019 lib
drwxr-xr-x 4 heipilei heipilei   4096 9月  12 2019 libexec
-rw-rw-r-- 1 heipilei heipilei 147145 9月   4 2019 LICENSE.txt
-rw-rw-r-- 1 heipilei heipilei  21867 9月   4 2019 NOTICE.txt
-rw-rw-r-- 1 heipilei heipilei   1366 9月   4 2019 README.txt
drwxr-xr-x 3 heipilei heipilei   4096 9月  12 2019 sbin   启停脚本
drwxr-xr-x 4 heipilei heipilei   4096 9月  12 2019 share


 

6.配置环境

vi core-site.xml   


        fs.defaultFS


        hdfs://heipilei:9000
    
    


        hadoop.tmp.dir
        /home/heipilei/tmp
    

 vi hdfs-site.xml

 
        dfs.replication


        1
    
     
        dfs.namenode.secondary.http-address
        heipilei:50090
    
    
        dfs.namenode.secondary.https-address
        heipilei:50091
    

vi workers

heipielei

vi /etc/hosts   ( hostnamectl set-hostname heipilei) 不需要重启 需要重启机器

7. 设置免登录 (检查您是否可以在没有密码的情况下 ssh 到 localhost)

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys

8.格式化文件系统

cd 回去

hdfs namenode -format

9.启动 NameNode 守护进程和 DataNode 守护进程

 sbin/start-dfs.sh

NameNode   名称节点 老大  存储的是文件目录树

SecondaryNameNode   第二名称节点  老二 每隔一小时备份一下老大 

DataNode  小弟  存放数据

10.创建执行 MapReduce 作业所需的 HDFS 目录

hdfs dfs -mkdir /user
hdfs dfs -mkdir /user/heipilei

11.将输入文件复制到分布式文件系统中

hdfs dfs -mkdir input
hdfs dfs -put etc/hadoop/*.xml input

LAST  跑官网例子

1  bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar grep input output 'dfs[az.]+'
2.hdfs dfs -get output output
3.cat output/*
4.stop-dfs.sh

12.YARN的设置

etc/hadoop/mapred-site.xml:


    
        mapreduce.framework.name
        yarn
    
    
        mapreduce.application.classpath
        $HADOOP_HOME/share/hadoop/mapreduce/*:$HADOOP_HOME/share/hadoop/mapreduce/lib/*
    

etc/hadoop/yarn-site.xml


    
        yarn.nodemanager.aux-services
        mapreduce_shuffle
    
    
        yarn.nodemanager.env-whitelist
        JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_HOME,PATH,LANG,TZ,HADOOP_MAPRED_HOME
    

运行和停止

 start-yarn.sh
 stop-yarn.sh

13 防止被挖矿 修改YARN web端口地址

  etc/hadoop/yarn-site.xml

    
        yarn.resourcemanager.webapp.address
        ${yarn.resourcemanager.hostname}:9527
    

14   /temp   除了已经配置的 dfs 文件放到  指定heipilei/temp 下  还需要将pid等文件 一样放置在该路径下

etc/hadoop  下  vi hadoop-env.sh

export HADOOP_SECURE_PID_DIR=/home/heipilei/tmp
export HADOOP_PID_DIR=/home/heipilei/tmp

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/772147.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号