window产生数据倾斜指的是数据在不同的窗口内堆积的数据量相差过多。本质上产生这种情况的原因是数据源头发送的数据量速度不同导致的。出现这种情况一般通过以下方式解决:
1、在数据进入窗口前做预聚合
2、重新设计窗口聚合的key
3、使用再平衡算子rebalance等

window产生数据倾斜指的是数据在不同的窗口内堆积的数据量相差过多。本质上产生这种情况的原因是数据源头发送的数据量速度不同导致的。出现这种情况一般通过以下方式解决:
1、在数据进入窗口前做预聚合
2、重新设计窗口聚合的key
3、使用再平衡算子rebalance等