栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop 和 MapReduce的优点

Hadoop 和 MapReduce的优点

Hadoop

  1. hadoop中的3个分布式

   HDFS       分布式文件存储系统

   Mapreduce  分布式计算框架

   YARN       分布式资源调度器

  1. 大数据 云计算 hadoop 关系

  大数据是云计算的产物,底层是hadoop

  1. 云计算3S

   iaas 基础设施及服务

   paas平台及服务

   Saas 软件及服务

  1. HDFS中的3个Node

nameNode    名字节点(系统快照FSImage 编辑日志editLog)

secondaryNameNode  editLog.new

dataNode    数据节点   

5.2个机制

   副本机制:每个dataNode的数据默认有2个备份

   心跳机制:nameNode定期向dataNode发送数据包,如果超过时长不返回再开一台

  1. 如果存储数据

   切成块 block 默认1.x 64MB  2.x 128MB

  1. 如何访问HDFS

   http://ip:50070   /http://master:50070

  1. Shell命令行操作hdfs

   Put  -》hadoop fs -put 文件名 /路径

   Cat  -》hadoop fs -cat 文件名

   Rm -r  -》hadoop fs -rm -r 文件名

   Mkdir  -> hadoop fs -mkdir -p  /aa/bb

MR(MapReduce)
  1. 概念 分而治之,map(映射) reduce(归并)
  2. 执行流程图.

  1. 两个组件 Combinner

合成器 作用类似于Reduce 提前一步归并

Partitioner

    分区  :将相同key 放到不同的reduce中

  1. 特点:

数据量   大

运算速度 慢

文件存储 HDFS

扩展性   强

适用于海量数据离线计算机

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/722753.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号