栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop3.x入门

Hadoop3.x入门

版本3.x

开始时间2021年11月6日18:09:08

环境搭建       

踩坑:虚拟机网络配置完后,windows能ping通,远程登录拒绝。关闭虚拟机后仍然可以ping通,发现虚拟机设置的是windows中已经存在的ip,修改虚拟机ip后重试登录成功

  

Hadoop目录

(1)bin目录:存放对Hadoop相关服务(hdfs,yarn,mapred)进行操作的脚本

(2)etc目录:Hadoop的配置文件目录,存放Hadoop的配置文件

(3)lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)

(4)sbin目录:存放启动或停止Hadoop相关服务的脚本

(5)share目录:存放Hadoop的依赖jar包、文档、和官方案例

 

Hadoop3.x组成

MapReduce计算

        1.Map阶段并行处理数据输入

        2.Reduce阶段对Map阶段结果进行汇总

Yarn资源调度

 

HDFS数据存储

        1.NameNode 存储文件的元数据,如文件名、目录结构、文件属性,以及每个文件的块列表和所在块的DataNode等。

        2.DataNode 存储文件块数据,块数据的校验和。

        3.Secondary NameNode(2nn) 每隔一段时间对NameNode元数据进行备份。

Common辅助工具

HDFS、YARN、MapReduce三者关系

 

集群配置

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/439158.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号