IN多条件查询类比如下场景1:
1. EXPLAIN SELECt * FROM test WHERe client_id in (0,1,2,3); 2. EXPLAIN SELECt * FROM test WHERe client_id in (0); 3. EXPLAIN SELECt * FROM test WHERe client_id in (1);
其中全表数据150w,client_id=0数据50w,其他条件数据均为1条,EXPLAIN结果如下:
- 场景1sql, 扫描全表,耗时较长;
- 场景2sql, 走索引,耗时短;
- 场景3sql, 走索引,耗时短。
解决方案: IN条件究竟是否走索引呢?
- 通常场景,IN条件查询走索引;
- 当IN多条件查询时,如果数据量大于总数据量30%,就会走全表扫描(暂未找到官方结论,但在Mysql版本为8.0.18中,本人验证基本符合上述结论);
- 当IN是单条件,数据量大于总数据30%时,依然走索引。
最后的解决方案是对IN条件查询进行了优化处理,单独查询一次client_id=0对数据,进行Es同步;
优化了JVM内存分配,适当扩大新生代内存大小,让垃圾数据尽量控制在新生代回收。



