一、场景描述:XXLJOB每隔三小时定时处理一批数据,这批数据可达到几千万以上,这是kafka监听消息的截图。
这种设计存在很大的一个问题,定时任务触发的时候,都是一个很大的峰值,这个时候对服务器资源消耗最大,而且存在很多空闲的时间是没有任务处理的状态。争对这个问题,进行了分析和思考。
方案1:使用延时队列,每个处理的请求都放到延时队列里面,时间到了在做消费,这种情况不需要使用定时任务,就可以合理的分摊系统资源,提升调度能力,但是kafka天生不支持延时队列的场景,不像其他MQ中间件可以配置。于是这种方案放弃。
方案2:借鉴滑动时间窗口的思想,将定时任务时间调短,调成半小时执行一次,每次执行的时候,执行三小时前半个小时时间段的数据。
例子: 10:00:00 触发定时任务,执行7:00:00 -- 7:30:00时间段的数据;
10:30:00 触发定时任务,执行7:30:00 -- 8:00:00时间段的数据;
这里还可以设计的更加灵活,可以将执行几个小时前和执行的时间段提取到nacos中,在结合xxjjob也可以动态调整时间,以达到整个调度时间是可以自由控制的。实现的时候要注意时间段重合的问题。



