1、hive code2 增大资源配置
set hive.exec.dynamic.partition=true; set hive.exec.dynamic.partition.mode=nonstrict; set hive.exec.max.dynamic.partitions=80000; set hive.exec.max.dynamic.partitions.pernode=10000; set mapreduce.map.memory.mb=8192; set mapreduce.reduce.memory.mb=8192; set mapred.max.split.size=536870912; set hive.exec.reducers.bytes.per.reducer=536870912; set hive.exec.parallel=true; set hive.exec.parallel.thread.number=4; set hive.exec.max.created.files=655350;
2、Stage一直停留在map = 0%, reduce = 0%阶段
原因:分配map数量少,一个map处理的数据多,处理速度慢
解决:增加map的数据
方法:
set mapred.max.split.size=64000000;
参数 mapred.max.split.size 用于配置map处理文件的大小,默认是256000000;减少map处理文件的大小,即可增加map的数量



