栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 其他 > Hadoop

如何在CentOS上安装Apache Hadoop

Hadoop 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型在计算机集群上对大型数据集进行分布式处理。Apache™ Hadoop® 是可靠、可扩展、分布式计算的开源软件。

该项目包括以下模块:

Hadoop Common:支持其他 Hadoop 模块的常用工具。 Hadoop 分布式文件系统 (HDFS™):分布式文件系统,可提供对应用程序数据的高吞吐量访问支持。 Hadoop YARN:作业调度和集群资源管理框架。 Hadoop MapReduce:一个基于 YARN 的大型数据集并行处理系统。

本文将帮助你逐步在 CentOS 上安装 hadoop 并配置单节点 hadoop 集群。

安装 Java

在安装 hadoop 之前,请确保你的系统上安装了 Java。使用此命令检查已安装 Java 的版本。

  1. java -version java version "1.7.0_75" 
  2. Java(TM) SE Runtime Environment (build 1.7.0_75-b13) Java HotSpot(TM) 64-Bit Server VM (build 24.75-b04, mixed mode) 

要安装或更新 Java,请参考下面逐步的说明。

***步是从 Oracle 官方网站下载***版本的 java。

  1. cd /opt/ wget --no-cookies --no-check-certificate --header "cookie: gpw_e24=http%3A%2F%2Fwww.oracle.com%2F; oraclelicense=accept-securebackup-cookie" "http://download.oracle.com/otn-pub/java/jdk/7u79-b15/jdk-7u79-linux-x64.tar.gz" 
  2. tar xzf jdk-7u79-linux-x64.tar.gz 

需要设置使用更新版本的 Java 作为替代。使用以下命令来执行此操作。

  1. cd /opt/jdk1.7.0_79/ alternatives --install /usr/bin/java java /opt/jdk1.7.0_79/bin/java 2 
  2. alternatives --config java  
  1. There are 3 programs which provide 'java'.   Selection    Command 
  2. ----------------------------------------------- *  1           /opt/jdk1.7.0_60/bin/java 
  3.  + 2           /opt/jdk1.7.0_72/bin/java    3           /opt/jdk1.7.0_79/bin/java 
  4. Enter to keep the current selection[+], or type selection number: 3 [Press Enter] 

现在你可能还需要使用 alternatives 命令设置 javac 和 jar 命令路径。

  1. alternatives --install /usr/bin/jar jar /opt/jdk1.7.0_79/bin/jar 2 alternatives --install /usr/bin/javac javac /opt/jdk1.7.0_79/bin/javac 2 
  2. alternatives --set jar /opt/jdk1.7.0_79/bin/jar alternatives --set javac /opt/jdk1.7.0_79/bin/javac 

下一步是配置环境变量。使用以下命令正确设置这些变量。

设置 JAVA_HOME 变量:

  1. export JAVA_HOME=/opt/jdk1.7.0_79 

设置 JRE_HOME 变量:

  1. export JRE_HOME=/opt/jdk1.7.0_79/jre 

设置 PATH 变量:

  1. export PATH=$PATH:/opt/jdk1.7.0_79/bin:/opt/jdk1.7.0_79/jre/bin 

安装 Apache Hadoop

设置好 java 环境后。开始安装 Apache Hadoop。

***步是创建用于 hadoop 安装的系统用户帐户。

  1. useradd hadoop passwd hadoop 

现在你需要配置用户 hadoop 的 ssh 密钥。使用以下命令启用无需密码的 ssh 登录。

  1. su - hadoop ssh-keygen -t rsa 
  2. cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys chmod 0600 ~/.ssh/authorized_keys 
  3. exit 

现在从官方网站 hadoop.apache.org 下载 hadoop ***的可用版本。

  1. cd ~ wget http://apache.claz.org/hadoop/common/hadoop-2.6.0/hadoop-2.6.0.tar.gz 
  2. tar xzf hadoop-2.6.0.tar.gz mv hadoop-2.6.0 hadoop 

下一步是设置 hadoop 使用的环境变量。

编辑 ~/.bashrc,并在文件末尾添加以下这些值。

  1. export HADOOP_HOME=/home/hadoop/hadoop export HADOOP_INSTALL=$HADOOP_HOME 
  2. export HADOOP_MAPRED_HOME=$HADOOP_HOME export HADOOP_COMMON_HOME=$HADOOP_HOME 
  3. export HADOOP_HDFS_HOME=$HADOOP_HOME export YARN_HOME=$HADOOP_HOME 
  4. export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin 

在当前运行环境中应用更改。

  1. source ~/.bashrc 

编辑 $HADOOP_HOME/etc/hadoop/hadoop-env.sh 并设置 JAVA_HOME 环境变量。

  1. export JAVA_HOME=/opt/jdk1.7.0_79/ 

现在,先从配置基本的 hadoop 单节点集群开始。

首先编辑 hadoop 配置文件并进行以下更改。

  1. cd /home/hadoop/hadoop/etc/hadoop 

让我们编辑 core-site.xml。

  1.   
  2.   fs.default.name     hdfs://localhost:9000 
  3.   

接着编辑 hdfs-site.xml:

  1.   
  2.  dfs.replication  1 
  3.   
  4.   dfs.name.dir     file:///home/hadoop/hadoopdata/hdfs/namenode 
  5.   
  6.   dfs.data.dir     file:///home/hadoop/hadoopdata/hdfs/datanode 
  7.   

并编辑 mapred-site.xml:

  1.    
  2.   mapreduce.framework.name    yarn 
  3.    

***编辑 yarn-site.xml:

  1.    
  2.   yarn.nodemanager.aux-services     mapreduce_shuffle 
  3.    

现在使用以下命令格式化 namenode:

  1. hdfs namenode -format 

要启动所有 hadoop 服务,请使用以下命令:

  1. cd /home/hadoop/hadoop/sbin/start-dfs.shstart-yarn.sh 

要检查所有服务是否正常启动,请使用 jps 命令:

  1. jps 

你应该看到这样的输出。

  1. 26049 SecondaryNameNode 25929 DataNode 
  2. 26399 Jps 26129 JobTracker 
  3. 26249 TaskTracker 25807 NameNode 

现在,你可以在浏览器中访问 Hadoop 服务:http://your-ip-address:8088/ 。



 

hadoop

谢谢阅读!!!

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/796297.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号