hadoop搭建_大数据系统

hadoop搭建

文章目录

前言一、Hadoop简介二、Hadoop集群模式安装总结

前言

弹性 MapReduce 结合云技术和 Hadoop、Hive、Spark、Storm 等社区开源技术，是一个安全可靠、可弹性伸缩的云端 Hadoop 服务。运用弹性MapReduce，需要先从Hadoop开始。

狭义上Hadoop用java语言实现的开源软件，允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理

一、Hadoop简介

1、Hadoop核心组件

Hadoop HDFS（分布式文件存储系统）：解决海量数据存储

Hadoop YARN（集群资源管理和任务调度框架）：解决资源任务调度

Hadoop MapReduce（分布式计算框架）：解决海量数据计

2、Hadoop现状

（1）HDFS作为分布式文件存储系统，处在生态圈的底层与核心地位；
（2）YARN作为分布式通用的集群资源管理系统和任务调度平台，支撑各种计算引擎运行，保证了Hadoop地位；
（3）MapReduce作为大数据生态圈第一代分布式计算引擎，由于自身设计的模型所产生的弊端，导致企业一线几乎不再直接使用MapReduce进行编程处理，但是很多软件的底层依然在使用MapReduce引擎来处理数据。

3、Hadoop集群简介

逻辑上分离：两个集群互相之间没有依赖、互不影响
物理上在一起：某些角色进程往往部署在同一台物理服务器上

二、Hadoop集群模式安装

1、集群角色规划
（1）角色规划的准则
根据软件工作特性和服务器硬件资源情况合理分配
（2）角色规划注意事项
资源上有抢夺冲突的，尽量不要部署在一起工作上需要互相配合的。尽量部署在一起

2、服务器基础环境准备（3台服务器）
设置主机名、修改hosts映射、关闭防火墙、配置ssh免密登录、配置时间同步服务、
3、安装Hadoop服务
创建统一工作目录并安装java环境，并上传Hadoop安装包解压后，修改配置文件。
（1）vim hadoop-env.sh

 export JAVA_HOME=/export/server/jdk1.8.0_241
 export HDFS_NAMENODE_USER=root export HDFS_DATANODE_USER=root
 export HDFS_SECONDARYNAMENODE_USER=root
 export YARN_RESOURCEMANAGER_USER=root export YARN_NODEMANAGER_USER=root

（2）vim core-site.xml



fs.defaultFS
hdfs://node1:8020





hadoop.tmp.dir
/export/data/hadoop-3.3.0




hadoop.http.staticuser.user
root





hadoop.proxyuser.root.hosts
*



hadoop.proxyuser.root.groups
*





fs.trash.interval
1440

（3）vim hdfs-site.xml


dfs.namenode.secondary.http-address
node2:9868

（4）vim mapred-site.xml



mapreduce.framework.name
yarn






mapreduce.jobhistory.address
node1:10020





mapreduce.jobhistory.webapp.address
node1:19888



yarn.app.mapreduce.am.env
HADOOP_MAPRED_HOME=${HADOOP_HOME}



mapreduce.map.env
HADOOP_MAPRED_HOME=${HADOOP_HOME}



mapreduce.reduce.env
HADOOP_MAPRED_HOME=${HADOOP_HOME}

（5）vim yarn-site.xml



yarn.resourcemanager.hostname
node1



yarn.nodemanager.aux-services
mapreduce_shuffle





yarn.nodemanager.pmem-check-enabled
false




yarn.nodemanager.vmem-check-enabled
false





yarn.log-aggregation-enable
true





yarn.log.server.url
http://node1:19888/jobhistory/logs





yarn.log-aggregation.retain-seconds
604800

（6）vim workers

node1.itcast.cn
node2.itcast.cn
node3.itcast.cn

（7）在node1机器上将Hadoop安装包scp同步到其他机器

scp -r hadoop-3.3.0 root@node2:$PWD
scp -r hadoop-3.3.0 root@node3:$PWD

（8）配置Hadoop环境变量，在node1上配置

vim /etc/profile

export HADOOP_HOME=/export/server/hadoop-3.3.0
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

将修改后的环境变量同步其他至其他机器

scp /etc/profile root@node2:/etc/ scp /etc/profile root@node3:/etc/

重新加载环境变量验证是否生效（3台机器）

source /etc/profile

验证环境变量是否生效

总结

简单的Hadoop集群已搭建完成！

hadoop搭建

大数据系统相关栏目本月热门文章