栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

基于Docker的Hadoop全体系架构入门指南

基于Docker的Hadoop全体系架构入门指南

基于Docker的Hadoop全体系架构入门指南
  • 前言
    • 目录
    • 涉及软件及其版本(下载)


前言

开个大坑。

大数据架构涉及到很多软件的安装和配置,单机的配置和安装比较简单,但往往还要学习伪分布式/分布式。如果用VMware或者VituralBox之类创建虚拟机,不仅太占用计算机资源,而且维护也麻烦。但Docker基于LXC的轻量级虚拟化,相比之下启动快,且资源占用小,更适合用来模拟大数据的架构。

还有就是目前网络上很难找到成体系的环境搭建流程,有时候可能照着这个教材搭好了HadoopHA,想配置Hive的时候,找到的新教材又和上一个有冲突。或者是因为搭建Zookeeper多次失败,把整个Linux环境搞烂了,想重装系统又不想重新配置Hadoop。

在这个专栏中,我会尽量避免出现这些问题,把自己以往的搭建流程和环境都记录下来。


目录
  • 示例
    • 已完成——占坑
    • 未完成
  • Docker准备工作
    • Linux下安装Docker
    • Windows下安装Docker
    • 制作base镜像
    • 节点互联
    • 更简易的节点控制
  • Hadoop安装
    • 离线/伪分布式/分布式
    • Hadoop HA

涉及软件及其版本(下载)

各家软件的新版本有时会删除旧版本的接口,导致新版本的该软件和其他软件的旧版本不匹配,所以往往需要指定版本,防止出现不兼容的情况。

NameVersionDownload
Hadoop2.7.5
jdk1.8 (JDK8)
zookeeper3.5.7
flume1.8.0
hive2.3.3
hbase1.2.6
kafka2.11

这些是我目前测试过的,还有一些没测试过但听说版本兼容的,大家可以自己试试

NameVersionDownload
sqoop1.4.6
tomcat7.0.73
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/350081.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号