一、本地运行模式
1.1 官方Grep案例1.2 官方WordCount案例 二、伪分布式运行模式
2.1 配置2.2 运行MapReduce程序2.3 为什么不能一直格式化NameNode2.4 配置历史服务器2.5 配置日志聚集 三、完全分布式运行模式
3.1 集群部署规划3.2 配置集群3.3 集群单点启动3.4 群启集群3.5 集群时间同步3.6 集群监控地址 一、本地运行模式 1.1 官方Grep案例
① 创建在hadoop-2.7.2文件下面创建一个input文件夹
[root@hadoop103 hadoop-2.7.2]# mkdir input
② 将Hadoop的xml配置文件复制到input
[root@hadoop103 hadoop-2.7.2]# cp etc/hadoop10 * * * * /usr/sbin/ntpdate hadoop1003.6 集群监控地址
HDFS文件系统:http://hadoop100:50070/dfshealth.html#tab-overview
SecondaryNameNode信息:http://hadoop102:50090/status.html
YARN信息:http://hadoop101:8088/cluster
查看JobHistory:http://hadoop101:19888/jobhistory



