【Redis 源码分析专题】从本质分析你写入 Redis 中的数据为什么不见了？

Redis 数据库介绍

Redis 作为一个成熟的数据存储中间件，它提供了完善的数据管理功能，比如之前我们提到过的数据过期和今天我们要讲的数据淘汰(evict)策略。

数据的局部性原理

贯穿计算机学科的原理局部性原理，这里可以明确告诉你，局部性原理在缓存场景有这样两种现象，

最新的数据下次被访问的概率越高。
被访问次数越多的数据下次被访问的概率越高。这里我们可以简单认为被访问的概率越高价值越大。

基于上述两种现象，我们可以指定出两种策略

淘汰掉最早未被访问的数据，LRU(Least Recently Used)。
淘汰掉访被访问频次最低的数据，LFU(Least Frequently Used)。

除了 LRU 和 LFU 之外，还可以随机淘汰。这就是将数据一视同仁，随机选取一部分淘汰。实际上 Redis 实现了以上 3 中策略，你使用时可以根据具体的数据配置某个淘汰策略。

除了上述三种策略外，Redis 还为由过期时间的数据提供了按 TTL 淘汰的策略，其实就是淘汰剩余 TTL 中最小的数据。另外需要注意的是 Redis 的淘汰策略可以配置在全局或者是有过期时间的数据上。

Redis 的问题背景

我们有时候会遇到这样的事情，当想 redis 写入一些数据后，再次查询发现数据不见了，这是怎么回事呢？数据明明过期了，怎么还占用着内存？

知道 Redis 主要是基于内存来进行高性能、高并发的读写操作的。
然而内存是有限的，比如 redis 就只能用 10G，你要是往里面写了 20G 的数据，会咋办？当然会干掉 10G 的数据，然后就保留 10G 的数据了。那干掉哪些数据？保留哪些数据？这就要根据设置的 redis 的淘汰机制来选择了。数据明明过期了，竟然还占用这内存，这些都是由 redis 的过期策略来决定。

Redis 的过期策略

Redis 的过期策略包括两种，分别是定期删除和惰性删除：

定期删除：指的是 Redis 默认是每隔 100ms 就随机抽取一些设置了过期时间的 key，检查其是否过期，如果过期就删除。（不能完全删除）
惰性删除：直接查询数据的时候，redis 会先查看一些这个数据是否已经过期，如果过期，就进行删除。（不能完全删除数据）

Redis 的删除内存策略

定期删除和惰性删除都存在着一些问题，如果定期删除漏掉了很多过期 key，然后你也没及时去查，也就没走惰性删除，此时有可能导致大量过期 key 堆积在内存里，导致 redis 内存块耗尽了

Redis 内存淘汰机制

Redis 中数据淘汰实际上是指的在内存空间不足时，清理掉某些数据以节省内存空间。虽然 Redis 已经有了过期的策略，它可以清理掉有效期外的数据。

如果过期的数据被清理之后存储空间还是不够怎么办？是不是还可以再删除掉一部分数据？在缓存这种场景下这个问题的答案是可以，因为这个数据即便在 Redis 中找不到，也可以从被缓存的数据源中找到。

所以在某些特定的业务场景下，我们是可以丢弃掉 Redis 中部分旧数据来给新数据腾出空间。

内存淘汰机制包括以下几种方式：

众所周知，redis 是一个内存数据库，所有的键值对都是存储在内存中。当数据变多之后，由于内存有限就要淘汰一些键值对，使得内存有足够的空间来保存新的键值对。在 redis 中，通过设置 server.maxmemory 来限定内存的使用(server.maxmemory 为 0，不限制内存)，到达 server.maxmemory 就会触发淘汰机制。

noeviction: 当内存不足以容纳新写入数据时，新写入操作会报错，一般不用。
Allkeys-lru: 当内存不足以容纳新写入数据时，在键空间中，移除最近最少使用的 key（最常用）。
allkeys-random：当内存不足以容纳新写入数据时，在键空间中，随机移除某个 key（很少用）。
volatile-lru：当内存不足以容纳新写入数据时，在设置了过期时间的键空间中，移除最近最少使用的 key（很少用）。
volatile-random：当内存不足以容纳新写入数据时，在设置了过期时间的键空间中，随机移除某个 key。
volatile-ttl：当内存不足以容纳新写入数据时，在设置了过期时间的键空间中，有更早过期时间的 key 优先移除。

设置内存淘汰机制的方式：

在 redis.conf 中：

maxmemory 100mb 最大内存设置，如果 0 代表无限；
maxmemory-policy： Allkeys-lru

Redis 在每次执行客户端的命令的时候都会检查使用内存是否超过server.maxmemory，如果超过就进行淘汰数据。

int processCommand(client *c) {
    ……//server.maxmemory为0，表示对内存没有限制
        if (server.maxmemory) {
            //判断内存，进行内存淘汰
            int retval = freeMemoryIfNeeded();
            ……
        }
    ……
}

evict 何时执行

在 Redis 每次处理命令的时候，都会检查内存空间，并尝试去执行 evict，因为有些情况下不需要执行 evict，这个可以从 isSafeToPerformEvictions 中可以看出端倪。

static int isSafeToPerformEvictions(void) {
    
    if (server.lua_timedout || server.loading) return 0;
    
    
    if (server.masterhost && server.repl_slave_ignore_maxmemory) return 0;
    
    
    if (checkClientPauseTimeoutAndReturnIfPaused()) return 0;
    
    return 1;
}

执行回收驱逐操作

int performEvictions(void) {
    if (!isSafeToPerformEvictions()) return EVICT_OK;
    
    int keys_freed = 0;
    size_t mem_reported, mem_tofree;
    long long mem_freed; 
    mstime_t latency, eviction_latency;
    long long delta;
    int slaves = listLength(server.slaves);
    int result = EVICT_FAIL;
    
    if (getMaxmemoryState(&mem_reported,NULL,&mem_tofree,NULL) == C_OK)
        return EVICT_OK;
    
    if (server.maxmemory_policy == MAXMEMORY_NO_EVICTION)
        return EVICT_FAIL;  
    
    unsigned long eviction_time_limit_us = evictionTimeLimitUs();
    
    mem_freed = 0;
    
    latencyStartMonitor(latency);
    
    monotime evictionTimer;
    elapsedStart(&evictionTimer);
    
    while (mem_freed < (long long)mem_tofree) {
        int j, k, i;
        static unsigned int next_db = 0;
        sds bestkey = NULL;
        int bestdbid;
        redisDb *db;
        dict *dict;
        dictEntry *de;
        
        if (server.maxmemory_policy & (MAXMEMORY_FLAG_LRU|MAXMEMORY_FLAG_LFU) ||
            server.maxmemory_policy == MAXMEMORY_VOLATILE_TTL)
        {
            struct evictionPoolEntry *pool = EvictionPoolLRU;
            
            while(bestkey == NULL) {
                unsigned long total_keys = 0, keys;
                
                
                for (i = 0; i < server.dbnum; i++) {
                    db = server.db+i;
                    dict = (server.maxmemory_policy & MAXMEMORY_FLAG_ALLKEYS) ?
                        db->dict : db->expires;
                    if ((keys = dictSize(dict)) != 0) {
                        evictionPoolPopulate(i, dict, db->dict, pool);
                        total_keys += keys;
                    }
                }
                if (!total_keys) break; 
                
                
                for (k = EVPOOL_SIZE-1; k >= 0; k--) {
                    if (pool[k].key == NULL) continue;
                    bestdbid = pool[k].dbid;
                    
                    if (server.maxmemory_policy & MAXMEMORY_FLAG_ALLKEYS) {
                        de = dictFind(server.db[pool[k].dbid].dict,
                                      pool[k].key);
                    } else {
                        de = dictFind(server.db[pool[k].dbid].expires,
                                      pool[k].key);
                    }
                    
                    
                    if (pool[k].key != pool[k].cached)
                        sdsfree(pool[k].key);
                    pool[k].key = NULL;
                    pool[k].idle = 0;
                    
                    
                    if (de) {
                        bestkey = dictGetKey(de);
                        break;
                    } else {
                        
                    } 
                }
            }
        }
        
        
        else if (server.maxmemory_policy == MAXMEMORY_ALLKEYS_RANDOM ||
                 server.maxmemory_policy == MAXMEMORY_VOLATILE_RANDOM)
        {
            
            for (i = 0; i < server.dbnum; i++) {
                j = (++next_db) % server.dbnum;
                db = server.db+j;
                dict = (server.maxmemory_policy == MAXMEMORY_ALLKEYS_RANDOM) ?
                    db->dict : db->expires;
                if (dictSize(dict) != 0) {
                    de = dictGetRandomKey(dict);
                    bestkey = dictGetKey(de);
                    bestdbid = j;
                    break;
                }
            }
        }
        
        
        if (bestkey) {
            db = server.db+bestdbid;
            robj *keyobj = createStringObject(bestkey,sdslen(bestkey));
            propagateExpire(db,keyobj,server.lazyfree_lazy_eviction);
            
            delta = (long long) zmalloc_used_memory();
            latencyStartMonitor(eviction_latency);
            if (server.lazyfree_lazy_eviction)
                dbAsyncDelete(db,keyobj);
            else
                dbSyncDelete(db,keyobj);
            latencyEndMonitor(eviction_latency);
            latencyAddSampleIfNeeded("eviction-del",eviction_latency);
            delta -= (long long) zmalloc_used_memory();
            mem_freed += delta;
            server.stat_evictedkeys++;
            signalModifiedKey(NULL,db,keyobj);
            notifyKeyspaceEvent(NOTIFY_EVICTED, "evicted",
                keyobj, db->id);
            decrRefCount(keyobj);
            keys_freed++;
            if (keys_freed % 16 == 0) {
                
                if (slaves) flushSlavesOutputBuffers();
                
                
                if (server.lazyfree_lazy_eviction) {
                    if (getMaxmemoryState(NULL,NULL,NULL,NULL) == C_OK) {
                        break;
                    }
                }
                
                
                if (elapsedUs(evictionTimer) > eviction_time_limit_us) {
                    // We still need to free memory - start eviction timer proc
                    if (!isEvictionProcRunning) {
                        isEvictionProcRunning = 1;
                        aeCreateTimeEvent(server.el, 0,
                                evictionTimeProc, NULL, NULL);
                    }
                    break;
                }
            }
        } else {
            goto cant_free; 
        }
    }
    
    result = (isEvictionProcRunning) ? EVICT_RUNNING : EVICT_OK;
    
cant_free:
    if (result == EVICT_FAIL) {
        
        if (bioPendingJobsOfType(BIO_LAZY_FREE)) {
            usleep(eviction_time_limit_us);
            if (getMaxmemoryState(NULL,NULL,NULL,NULL) == C_OK) {
                result = EVICT_OK;
            }
        }
    }
    latencyEndMonitor(latency);
    latencyAddSampleIfNeeded("eviction-cycle",latency);
    return result;
}

释放资源如果在需要时候

int freeMemoryIfNeeded(void) {
    //获取redis内存使用
    mem_reported = zmalloc_used_memory();
    if (mem_reported <= server.maxmemory) return C_OK;
    mem_used = mem_reported;
    if (slaves) {
        listRewind(server.slaves,&li);
        //减去slaves的output缓冲区
        while((ln = listNext(&li))) {
            ……
        }
    }
    //aof的缓冲区的内存使用
    if (server.aof_state != AOF_OFF) {
        mem_used -= sdslen(server.aof_buf);
        mem_used -= aofRewriteBufferSize();
    }
    
    if (mem_used <= server.maxmemory) return C_OK;
    
    mem_tofree = mem_used - server.maxmemory;
    mem_freed = 0;
    if (server.maxmemory_policy == MAXMEMORY_NO_EVICTION)
        goto cant_free; 
    //进行数据驱逐
    while (mem_freed < mem_tofree) {
        ……
        sds bestkey = NULL;
          if (server.maxmemory_policy & (MAXMEMORY_FLAG_LRU|MAXMEMORY_FLAG_LFU) ||
              server.maxmemory_policy == MAXMEMORY_VOLATILE_TTL)
          {   //进行ttl或者lru淘汰机制
              struct evictionPoolEntry *pool = EvictionPoolLRU;
              while(bestkey == NULL) {
                  unsigned long total_keys = 0, keys;
                  for (i = 0; i < server.dbnum; i++) {
                      db = server.db+i;
                      dict = (server.maxmemory_policy & MAXMEMORY_FLAG_ALLKEYS) ?
                          db->dict : db->expires;
                      if ((keys = dictSize(dict)) != 0) {
                          evictionPoolPopulate(i, dict, db->dict, pool);
                          //pool根据机制构建的evictionPool
                      }
                  }
                  for (k = EVPOOL_SIZE-1; k >= 0; k--) {
                      if (pool[k].key == NULL) continue;
                      bestdbid = pool[k].dbid;
                      if (server.maxmemory_policy & MAXMEMORY_FLAG_ALLKEYS) {
                          de = dictFind(server.db[pool[k].dbid].dict,
                                        pool[k].key);
                      } else {
                          de = dictFind(server.db[pool[k].dbid].expires,
                                        pool[k].key);
                      }
                      …… 
                      if (de) {
                          bestkey = dictGetKey(de);
                          break;
                      } else {
                          
                      }
                  }
              }
          }
        else if (server.maxmemory_policy == MAXMEMORY_ALLKEYS_RANDOM ||
                 server.maxmemory_policy == MAXMEMORY_VOLATILE_RANDOM)
        {   
            for (i = 0; i < server.dbnum; i++) {
                j = (++next_db) % server.dbnum;
                db = server.db+j;
                dict = (server.maxmemory_policy == MAXMEMORY_ALLKEYS_RANDOM) ?
                        db->dict : db->expires;
                if (dictSize(dict) != 0) {
                    de = dictGetRandomKey(dict);
                    bestkey = dictGetKey(de);
                    bestdbid = j;
                    break;
                }
            } 
        }//驱逐选中的键值对
        if (bestkey) {
            db = server.db+bestdbid;
            robj *keyobj = createStringObject(bestkey,sdslen(bestkey));
            propagateExpire(db,keyobj,server.lazyfree_lazy_eviction);
            delta = (long long) zmalloc_used_memory();
            if (server.lazyfree_lazy_eviction)
                dbAsyncDelete(db,keyobj);
            else
                dbSyncDelete(db,keyobj);
            delta -= (long long) zmalloc_used_memory();
            mem_freed += delta;
            server.stat_evictedkeys++;
            decrRefCount(keyobj);
            keys_freed++;
            if (slaves) flushSlavesOutputBuffers();
        }
    }
    return C_OK;
cant_free://进行内存空间的惰性释放
    while(bioPendingJobsOfType(BIO_LAZY_FREE)) {
        if (((mem_reported - zmalloc_used_memory()) + mem_freed) >= mem_tofree)
            break;
        usleep(1000); 
    }
    return C_ERR;
}

根据淘汰机制从随机选取的键值对中选取键值对构建 evictionPool

1）LRU 数据淘汰机制：在数据集中随机选取几个键值对，选择 lru 最大的一部分键值对构建 evictionPool。

LRU 的本质是淘汰最久没被访问的数据，有种实现方式是用链表的方式实现，如果数据被访问了就把它移到链表头部，那么链尾一定是最久未访问的数据，但是单链表的查询时间复杂度是 O(n)，所以一般会用 hash 表来加快查询数据，比如 Java 中 linkedHashMap 就是这么实现的。但 Redis 并没有采用这种策略，Redis 就是单纯记录了每个 Key 最近一次的访问时间戳，通过时间戳排序的方式来选找出最早的数据，当然如果把所有的数据都排序一遍，未免也太慢了，所以 Redis 是每次选一批数据，然后从这批数据执行淘汰策略。这样的好处就是性能高，坏处就是不一定是全局最优，只是达到局部最优。

在 redisObject 中有个 24 位的 lru 字段，这 24 位保存了数据访问的时间戳(秒)，当然 24 位无法保存完整的 unix 时间戳，不到 200 天就会有一个轮回，当然这已经足够了。

robj *lookupKey(redisDb *db, robj *key, int flags) {
    dictEntry *de = dictFind(db->dict,key->ptr);
    if (de) {
        robj *val = dictGetVal(de);
        if (!hasActiveChildProcess() && !(flags & LOOKUP_NOTOUCH)){
            if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
                updateLFU(val);
            } else {
                val->lru = LRU_CLOCK();  // 这里更新LRU时间戳
            }
        }
        return val;
    } else {
        return NULL;
    }
}

2）LFU 数据淘汰机制：在数据集中随机选取几个键值对，选择 lfu 最小的一部分键值对构建 evictionPool。

lru 这个字段也会被 lfu 用到，所以你在上面 lookupkey 中可以看到在使用 lfu 策略是也会更新 lru。Redis 中 lfu 的出现稍晚一些，是在 Redis 4.0 才被引入的，所以这里复用了 lru 字段。 lru 的实现思路只有一种，就是记录下 key 被访问的次数。但实现 lru 有个问题需要考虑到，虽然 LFU 是按访问频次来淘汰数据，但在 Redis 中随时可能有新数据就来，本身老数据可能有更多次的访问，新数据当前被访问次数少，并不意味着未来被访问的次数会少，如果不考虑到这点，新数据可能一就来就会被淘汰掉，这显然是不合理的。

Redis 为了解决上述问题，将 24 位被分成了两部分，高 16 位的时间戳(分钟级)，低 8 位的计数器。每个新数据计数器初始有一定值，这样才能保证它能走出新手村，然后计数值会随着时间推移衰减，这样可以保证老的但当前不常用的数据才有机会被淘汰掉，我们来看下具体实现代码。

计数器只有 8 个二进制位，充其量数到 255，怎么会够? 当然 Redis 使用的不是精确计数，而是近似计数。具体实现就是 counter 概率性增长，counter 的值越大增长速度越慢，具体增长逻辑如下：

uint8_t LFULogIncr(uint8_t counter) {
    if (counter == 255) return 255;
    double r = (double)rand()/RAND_MAX;
    double baseval = counter - LFU_INIT_VAL; // LFU_INIT_VAL为5
    if (baseval < 0) baseval = 0;
    double p = 1.0/(baseval*server.lfu_log_factor+1);  // server.lfu_log_factor可配置，默认是10
    if (r < p) counter++;
    return counter;
}

LFU 计数器衰减：如果说 counter 一直增长，即便增长速度很慢也有一天会增长到最大值 255，最终导致无法做数据的筛选，所以要给它加一个衰减策略，思路就是 counter 随时间增长衰减，具体代码如下：

unsigned long LFUDecrAndReturn(robj *o) {
    unsigned long ldt = o->lru >> 8;
    unsigned long counter = o->lru & 255;
    unsigned long num_periods = server.lfu_decay_time ? LFUTimeElapsed(ldt) / server.lfu_decay_time : 0;
    if (num_periods)
        counter = (num_periods > counter) ? 0 : counter - num_periods;
    return counter;}

3）TTL 数据淘汰机制：从设置过期时间的数据集中随机选取几个键值对，选择 TTL 最大的一部分键值对构建 evictionPool。

void evictionPoolPopulate(int dbid, dict *sampledict, dict *keydict, struct evictionPoolEntry *pool) {
    int j, k, count;
    dictEntry *samples[server.maxmemory_samples];
    //从数据集sampledict随机选取键值对
    count = dictGetSomeKeys(sampledict,samples,server.maxmemory_samples);
    for (j = 0; j < count; j++) {
        de = samples[j];
        key = dictGetKey(de);
        if (server.maxmemory_policy != MAXMEMORY_VOLATILE_TTL) {
            if (sampledict != keydict) de = dictFind(keydict, key);
            o = dictGetVal(de);
        }
        if (server.maxmemory_policy & MAXMEMORY_FLAG_LRU) {
            idle = estimateObjectIdleTime(o);//LRU机制，计算lru值
        } else if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
            idle = 255-LFUDecrAndReturn(o);//LFU机制，计算lfu值
        } else if (server.maxmemory_policy == MAXMEMORY_VOLATILE_TTL) {
            idle = ULLONG_MAX - (long)dictGetVal(de);//TTL机制，计算ttl值
        } 
        k = 0;
        //根据idle从小到大将键值对插入到pool(插入排序的机制)，但只保留idle最大的EVPOOL_SIZE个
        while (k < EVPOOL_SIZE &&pool[k].key &&pool[k].idle < idle)
          k++;
        if (k == 0 && pool[EVPOOL_SIZE-1].key != NULL) {
            continue;
        } else if (k < EVPOOL_SIZE && pool[k].key == NULL) {
             
        } else {
            if (pool[EVPOOL_SIZE-1].key == NULL) {
                sds cached = pool[EVPOOL_SIZE-1].cached;
                memmove(pool+k+1,pool+k,sizeof(pool[0])*(EVPOOL_SIZE-k-1));
                pool[k].cached = cached;
            } else {
                k--;
                sds cached = pool[0].cached; 
                if (pool[0].key != pool[0].cached) sdsfree(pool[0].key);
                memmove(pool,pool+1,sizeof(pool[0])*k);
                pool[k].cached = cached;
            }
        }
        int klen = sdslen(key);
        if (klen > EVPOOL_CACHED_SDS_SIZE) {
            pool[k].key = sdsdup(key);
        } else {
            memcpy(pool[k].cached,key,klen+1);
            sdssetlen(pool[k].cached,klen);
            pool[k].key = pool[k].cached;
        }
        pool[k].idle = idle;
        pool[k].dbid = dbid;
    }
}

【Redis 源码分析专题】从本质分析你写入 Redis 中的数据为什么不见了？

Java相关栏目本月热门文章