栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

hadoop分区

hadoop分区

package demo04.flow;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;


public class FlowPartion extends Partitioner {

    @Override
    public int getPartition(Text text, FlowNum flowNum, int i) {
        String line = text.toString();
        if (line.startsWith("135")) {
            return 0;
        }else if(line.startsWith("135")){
            return 1;
        }else if(line.startsWith("135")){
            return 2;
        }else if(line.startsWith("135")){
            return 3;
        }else if(line.startsWith("135")){
            return 4;
        }else{
            return 5;
        }
    }
}

主程序里run方法里加入

//分区,分区个数,分区个数最好与上面方法的分区个数相等,多了冗余,少了一个reduce处理多份工作
job.setPartitionerClass(FlowPartion.class);
job.setNumReduceTasks(6);
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/601811.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号