- 前言
- 目录
- 涉及软件及其版本(下载)
前言
开个大坑。
大数据架构涉及到很多软件的安装和配置,单机的配置和安装比较简单,但往往还要学习伪分布式/分布式。如果用VMware或者VituralBox之类创建虚拟机,不仅太占用计算机资源,而且维护也麻烦。但Docker基于LXC的轻量级虚拟化,相比之下启动快,且资源占用小,更适合用来模拟大数据的架构。
还有就是目前网络上很难找到成体系的环境搭建流程,有时候可能照着这个教材搭好了HadoopHA,想配置Hive的时候,找到的新教材又和上一个有冲突。或者是因为搭建Zookeeper多次失败,把整个Linux环境搞烂了,想重装系统又不想重新配置Hadoop。
在这个专栏中,我会尽量避免出现这些问题,把自己以往的搭建流程和环境都记录下来。
目录
- 示例
- 已完成——占坑
- 未完成
- Docker准备工作
- Linux下安装Docker
- Windows下安装Docker
- 制作base镜像
- 节点互联
- 更简易的节点控制
- Hadoop安装
- 离线/伪分布式/分布式
- Hadoop HA
涉及软件及其版本(下载)
各家软件的新版本有时会删除旧版本的接口,导致新版本的该软件和其他软件的旧版本不匹配,所以往往需要指定版本,防止出现不兼容的情况。
| Name | Version | Download |
|---|---|---|
| Hadoop | 2.7.5 | |
| jdk | 1.8 (JDK8) | |
| zookeeper | 3.5.7 | |
| flume | 1.8.0 | |
| hive | 2.3.3 | |
| hbase | 1.2.6 | |
| kafka | 2.11 |
这些是我目前测试过的,还有一些没测试过但听说版本兼容的,大家可以自己试试
| Name | Version | Download |
|---|---|---|
| sqoop | 1.4.6 | |
| tomcat | 7.0.73 |



