实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop：MapReduce进行文件单词量的统计，将结果输出

大数据系统更新时间：2026-04-07 23:31:42 发布时间：1640天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

实验四 MapReduce编程

1 实验目的
使用Hadoop的分布式存储HDFS系统存储数据；
使用MapReduce进行编程；
通过YARN资源管理框架运行MapReduce，验证结果。

2 实验内容
启动Hadoop集群，使用命令行方式往文件系统中添加数据，是MapReduce进行文件单词量的统计，将结果输出。

包括在Windows中实现和在Linux的Hadoop集群中实现。

3 实验知识点
Hadoop；
Java；
HDFS；
MapReduce编程；
Windows下MapReduce运行分析；
Linux下MapReduce运行分析。

4 实验时长
8学时。

5 实验环境
Linux；
Hadoop；
Java

6 实验过程
1.创建Java项目testmr

2.在项目下新建lib文件夹，将jar包拷贝进入

3.在java bulid path中引入lib文件夹中所有的jar包

4 编写 map、reduce、job代码

map类：

reduce类：

job类：

5.运行job

6.查看D盘文件夹中的运行结果

7.修改在linux上执行的代码

8.使用eclipse的export功能导出jar包

9.在linux集群中启动hdfs、yarn。

使用start-dfs.sh和start-yarn.sh命令，启动hdfs和yarn

10.将jar上传到linux中，并.使用 hadoop jar WordCountDriver.jar 运行程序

11.在hdfs中查看运行结果。

输入命令hdfs dfs -cat /dd/output.txt/part-r-00000查看运行结果。

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/303068.html

上一篇鉴权必须了解的5个知识点：cookie，session，token，jwt，单点登录

下一篇钱诚10.7黄金价格涨跌趋势分析,美原油纸白银行情策略多空解套

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号