为想学习数据仓库、大数据相关的同学提供一个虚拟机平台,平台以VMware Station Pro 12 搭建,环境内安装几个生态组件:zookeeper/Kafka/Hadoop/Hive/Spark/Scala
包括3台主机,由于是比较早安装的,版本比较低,但不影响对于基础知识的学习,相关组件版本如下:
Hadoop 2.7.3
Zookeeper 3.4.12
Hive 2.2.0 (当时已经将执行引擎修改为Tez 0.9.2)
kafka_2.11-2.4.0 (同步安装有Scala 2.11.8)
spark-2.4.3
做些简单的介绍,不打算写怎么详细操作了:
1、建议你的操作系统是Win7/8/10 64位操作系统,建设内存至少在8G以上,分配每台虚拟机2G或以上(我的环境是这样,虚拟内内存尝试过调整为各1G,同样可以跑,但慢一点);
2、VMware12设置为NAT网络,虚拟机网段设置为192.168.128;
3、下载解压后有3台虚拟机文件,是一个整体的集群环境;
4、超级用户root和普通用户hadoop,密码都是123456
5、百度盘提取码:uVz3
下载地址https://pan.baidu.com/s/1TRT7KOnLr-23sgQrga7bJw
相关截图:



