栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

在 lustre上运行 mapreduce

在 lustre上运行 mapreduce

文章目录

1、现有集群状况2、集群调整3、测试4、问题

1、现有集群状况
主机名角色
node1MGS MGT MDS MDT
node2OSS OST
node3OSS OST
node5NameNode、 ResoucerManager、Client(lustre)
node6DataNode、 NodeManager、 SecondaryNameNode
node7DataNode、 NodeManager
2、集群调整

将 Lustre 挂载到 Hadoop 集群的每个节点上,挂载目录相同。(也就是,将 Hadoop 集群的每个节点都作为 Lustre 的一个客户端节点。)

方法参考:https://github.com/ZGG2016/knowledgesystem/blob/master/26%20Lustre/%E7%8E%AF%E5%A2%83%E6%90%AD%E5%BB%BA.md

[root@node5 lustre]# pwd
/mnt/lustre

[root@node6 lustre]# pwd
/mnt/lustre

[root@node7 lustre]# pwd
/mnt/lustre

调整 Hadoop 的配置文件

[root@node5 hadoop]# cat core-site.xml

    
          fs.defaultFS
          file:///mnt/lustre
    
    
         hadoop.tmp.dir
         /mnt/lustre/mr/tmp/
     


[root@node5 hadoop]# cat mapred-site.xml

    
        mapreduce.framework.name
        yarn
    
    
        mapreduce.cluster.local.dir
        /mnt/lustre/mr/interfile/
    
    
        yarn.app.mapreduce.am.staging-dir
        /mnt/lustre/mr/hadoop-yarn/staging/
    


[root@node5 hadoop]# cat yarn-site.xml

	...
    
        yarn.nodemanager.local-dirs  
        /mnt/lustre/mr/interfile/  
    
    ...

同步到 node6 和 node7 节点。

3、测试
hadoop jar /opt/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /mnt/lustre/wc/wc.txt /mnt/lustre/wc/out

[root@node5 out]# pwd
/mnt/lustre/wc/out

[root@node5 out]# ls
part-r-00000  _SUCCESS

[root@node5 out]# cat part-r-00000
aa      3
bb      2

[root@node5 out]# lfs getstripe part-r-00000
part-r-00000
lmm_stripe_count:  1
lmm_stripe_size:   1048576
lmm_pattern:       raid0
lmm_layout_gen:    0
lmm_stripe_offset: 1
        obdidx           objid           objid           group
             1              70           0x46                0
4、问题

执行任务出现 File file:/tmp/hadoop-yarn/staging/root/.staging/job_1622686375131_0001/job.splitmetainfo does not exist java.io.FileNotFoundException: File file:/tmp/hadoop-yarn/staging/root/.staging/job_1622686375131_0001/job.splitmetainfo does not exist。

因为 node6 和 node7 节点没有此目录,而 node5 有。

所以在 mapred-site.xml 中,将属性 yarn.app.mapreduce.am.staging-dir 设置到挂载目录下,这样这三个节点都能访问到此目录。


    yarn.app.mapreduce.am.staging-dir
    /mnt/lustre/mr/hadoop-yarn/staging/

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/758837.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号