Netty源码解析-IdleStateHandler

前言：

心跳机制广泛运用在我们的应用平台中。对于连接到应用服务的客户端，服务端有必要对长时间没有请求的客户端连接进行清理，以避免连接过多。这就需要服务端有空闲连接检测机制。

而针对客户端而言，如果长时间未请求数据，为避免被服务端清理连接，就需要间歇性的发送心跳请求。

在Netty中，针对以上需求，已经有现成的Handler可供使用，这就是本文要介绍的IdleStateHandler。

1.IdleStateHandler的使用 1.1 服务端检测长时间未请求的客户端

我们在服务端可以使用IdleStateHandler来检测长时间未发送请求的客户端，对其进行清理操作，简单示例如下：

// 还是使用HelloServer的示例，我们在ChannelInitializer中添加IdleStateHandler
.childHandler(new ChannelInitializer() {
  protected void initChannel(SocketChannel ch) throws Exception {
    ChannelPipeline pipeline = ch.pipeline();
    // 在这里添加IdleStateHandler，设置空闲检测时间为10秒
    pipeline.addLast("idle", new IdleStateHandler(10, 10, 10));
    // 针对空闲事件的处理（自定义），具体内容如下
    pipeline.addLast("idledeal", new IdleEventHandler());
    pipeline.addLast("decoder", new StringDecoder());
    pipeline.addLast("encoder", new StringEncoder());
    pipeline.addLast("handler", new HelloServerHandler());
}
});

// IdleEventHandler
public class IdleEventHandler extends ChannelDuplexHandler {

    @Override
    public void userEventTriggered(ChannelHandlerContext ctx, Object evt) throws Exception {
        if (evt instanceof IdleStateEvent) {
            evt = (IdleStateEvent) evt;

            // 若检测到长时间未读到请求事件，则清理客户端连接
            if (evt.equals(IdleStateEvent.READER_IDLE_STATE_EVENT)) {
                System.out.println("idle...");
                ctx.channel().close();
            }else {
                // 其他事件
                // TODO
            }
        }
    }
}

在本例中，我们设置了IdleStateHandler的读空闲检测时间为10s，则客户端连接10s没有发送任何请求过来时，则发送一个IdleStateEvent.READER_IDLE_STATE_EVENT事件到下游，IdleEventHandler处理该事件，直接关闭客户端连接。

1.2 客户端发送心跳请求

若客户端本身检测到长时间未发送请求，为避免被服务端清理，则可以主动发送一个心跳请求。简单示例如下

// 同样的使用HelloClient的代码，我们改造下ChannelInitializer
.handler(new ChannelInitializer() {
  protected void initChannel(SocketChannel ch) throws Exception {
    ChannelPipeline pipeline = ch.pipeline();
    ...
    // 在这里添加IdleStateHandler检测
    pipeline.addLast("idle", new IdleStateHandler(5, 5, 5));
    // 空闲事件处理Handler（自定义），具体内容如下
    pipeline.addLast("idledeal", new ClientIdleEventHandler());
    pipeline.addLast("handler", new HelloClientHandler());
}
});

// ClientIdleEventHandler
public class ClientIdleEventHandler extends ChannelDuplexHandler {
    @Override
    public void userEventTriggered(ChannelHandlerContext ctx, Object evt) throws Exception {
        if (evt instanceof IdleStateEvent) {
            evt = (IdleStateEvent) evt;

            // 若检测到长时间未发送请求事件，则主动发送心跳信息
            if (evt.equals(IdleStateEvent.WRITER_IDLE_STATE_EVENT)) {
                ctx.writeAndFlush("ping");
            }else {
                // 其他事件
                // TODO
            }
        }
    }
}

这样，当客户端发现已经5s没有发送过请求时，则主动发送一个ping心跳信息到服务端，避免被清理

2.IdleStateHandler的构造

我们首先来看下IdleStateHandler的相关构造方法和基本属性

public class IdleStateHandler extends ChannelDuplexHandler {
    
    // Not create a new ChannelFutureListener per write operation to reduce GC pressure.
    // write监听器
    private final ChannelFutureListener writeListener = new ChannelFutureListener() {
        @Override
        public void operationComplete(ChannelFuture future) throws Exception {
            lastWriteTime = ticksInNanos();
            firstWriterIdleEvent = firstAllIdleEvent = true;
        }
    };

    private final boolean observeOutput;
	// 三种类型的空闲时间设置
    private final long readerIdleTimeNanos;
    private final long writerIdleTimeNanos;
    private final long allIdleTimeNanos;

	// 读空闲检测定时任务
    private ScheduledFuture readerIdleTimeout;
	// 最近一次读事件
    private long lastReadTime;
	// 是否第一次读idleEvent触发
    private boolean firstReaderIdleEvent = true;

	// 以下与读设置类似
    private ScheduledFuture writerIdleTimeout;
    private long lastWriteTime;
    private boolean firstWriterIdleEvent = true;

    private ScheduledFuture allIdleTimeout;
    private boolean firstAllIdleEvent = true;

	// IdleStateHandler的状态，避免多次初始化
    private byte state; // 0 - none, 1 - initialized, 2 - destroyed
    private boolean reading;

    private long lastChangeCheckTimeStamp;
    private int lastMessageHashCode;
    private long lastPendingWriteBytes;
    private long lastFlushProgress;

	// 默认使用的构造器
	public IdleStateHandler(
            int readerIdleTimeSeconds,
            int writerIdleTimeSeconds,
            int allIdleTimeSeconds) {

        // 默认单位为秒
        this(readerIdleTimeSeconds, writerIdleTimeSeconds, allIdleTimeSeconds,
             TimeUnit.SECONDS);
    }

    public IdleStateHandler(
            long readerIdleTime, long writerIdleTime, long allIdleTime,
            TimeUnit unit) {
        this(false, readerIdleTime, writerIdleTime, allIdleTime, unit);
    }

	public IdleStateHandler(boolean observeOutput,
            long readerIdleTime, long writerIdleTime, long allIdleTime,
            TimeUnit unit) {
        ObjectUtil.checkNotNull(unit, "unit");

        this.observeOutput = observeOutput;

        // 以纳秒为单位重新设置超时时间
        if (readerIdleTime <= 0) {
            readerIdleTimeNanos = 0;
        } else {
            readerIdleTimeNanos = Math.max(unit.tonanos(readerIdleTime), MIN_TIMEOUT_NANOS);
        }
        if (writerIdleTime <= 0) {
            writerIdleTimeNanos = 0;
        } else {
            writerIdleTimeNanos = Math.max(unit.tonanos(writerIdleTime), MIN_TIMEOUT_NANOS);
        }
        if (allIdleTime <= 0) {
            allIdleTimeNanos = 0;
        } else {
            allIdleTimeNanos = Math.max(unit.tonanos(allIdleTime), MIN_TIMEOUT_NANOS);
        }
    }
}

IdleStateHandler继承了ChannelDuplexHandler，说明其可以处理inbound、outbound事件；

构造方法比较简单，我们比较常用的就是第一个构造方法，以秒为单位来设置读、写、all的空闲检测；

属性的话，我们通过具体方法来学习。

3.IdleStateHandler空闲检测

在handlerAdded、channelActive等方法中，都有一个initialize()方法，这个方法用来初始化检测器，我们先来看下

3.1 initialize() 初始化IdleStateHandler

public class IdleStateHandler extends ChannelDuplexHandler {
    private void initialize(ChannelHandlerContext ctx) {
        // 已经初始化过则不再重复初始化
        switch (state) {
            case 1:
            case 2:
                return;
        }

        // 设置状态为initialized
        state = 1;
        // TODO
        initOutputChanged(ctx);

        // 设置最新的readTime和writeTime为当前时间
        lastReadTime = lastWriteTime = ticksInNanos();
        if (readerIdleTimeNanos > 0) {
            // 创建一个读空闲检测定时任务，延后readerIdleTimeNanos执行，具体schedule方法见下面
            readerIdleTimeout = schedule(ctx, new ReaderIdleTimeoutTask(ctx),
                                         readerIdleTimeNanos, TimeUnit.NANOSECONDS);
        }
        if (writerIdleTimeNanos > 0) {
            // 创建一个写空闲检测定时任务，延后readerIdleTimeNanos执行
            writerIdleTimeout = schedule(ctx, new WriterIdleTimeoutTask(ctx),
                                         writerIdleTimeNanos, TimeUnit.NANOSECONDS);
        }
        if (allIdleTimeNanos > 0) {
            // 创建一个读、写空闲检测定时任务，延后readerIdleTimeNanos执行
            allIdleTimeout = schedule(ctx, new AllIdleTimeoutTask(ctx),
                                      allIdleTimeNanos, TimeUnit.NANOSECONDS);
        }
    }
    
    //  创建一个定时任务
    ScheduledFuture schedule(ChannelHandlerContext ctx, Runnable task, long delay, TimeUnit unit) {
        return ctx.executor().schedule(task, delay, unit);
    }
}

初始化方法，主要用于初始化三个定时任务，那么这三个定时任务ReaderIdleTimeoutTask、WriterIdleTimeoutTask、AllIdleTimeoutTask具体是怎么用的呢？我们先来看下读空闲检测是如何做的。

3.2 读空闲检测

public class IdleStateHandler extends ChannelDuplexHandler {
	@Override
    public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {
        // 当设置的readerIdleTimeNanos或allIdleTimeNanos大于0时，说明需要进行读空闲检测
        if (readerIdleTimeNanos > 0 || allIdleTimeNanos > 0) {
            // 设置reading 正在读数据的状态为true
            reading = true;
            // 设置两个状态为为true
            firstReaderIdleEvent = firstAllIdleEvent = true;
        }
        ctx.fireChannelRead(msg);
    }

    // 重点在这来，如果本次读已经结束，则需要重置时间和状态位
    @Override
    public void channelReadComplete(ChannelHandlerContext ctx) throws Exception {
        // 如果数据正在读状态
        if ((readerIdleTimeNanos > 0 || allIdleTimeNanos > 0) && reading) {
            // 则重新设置lastReadTime为当前时间
            lastReadTime = ticksInNanos();
            // 将正在读标志设置为false
            reading = false;
        }
        ctx.fireChannelReadComplete();
    }
}

通过上述两个方法可以看出，当发生读事件时，设置reading=true，当本次读结束时，则设置reading=false，lastReadTime（最近一次读时间）为当前时间。

那么这个是如何被检测到读超时的呢？我们可以回到initialize()方法，其中有一个ReaderIdleTimeoutTask的定时任务，延迟readerIdleTimeNanos执行，一起来看下这个task的具体内容

3.2.1 ReaderIdleTimeoutTask 读空闲检测定时任务

private final class ReaderIdleTimeoutTask extends AbstractIdleTask {

    // 将ChannelHandlerContext传入当前task
    ReaderIdleTimeoutTask(ChannelHandlerContext ctx) {
        super(ctx);
    }

    @Override
    protected void run(ChannelHandlerContext ctx) {
        long nextDelay = readerIdleTimeNanos;
        // 如果当前没有发生读事件，则reading为false
        if (!reading) {
            nextDelay -= ticksInNanos() - lastReadTime;
        }

        // 读空闲超时，需要发送READER_IDLE事件
        if (nextDelay <= 0) {
            // Reader is idle - set a new timeout and notify the callback.
            // 重启一个定时检测任务，延迟readerIdleTimeNanos执行
            readerIdleTimeout = schedule(ctx, this, readerIdleTimeNanos, TimeUnit.NANOSECONDS);

            boolean first = firstReaderIdleEvent;
            firstReaderIdleEvent = false;

            try {
                // 往下游发送一个READER_IDLE Event
                IdleStateEvent event = newIdleStateEvent(IdleState.READER_IDLE, first);
                channelIdle(ctx, event);
            } catch (Throwable t) {
                ctx.fireExceptionCaught(t);
            }
        } else {
            // 注意这里虽然也是重启一个定时任务，但是延迟时间与上面有所不同，这里的具体延迟时间为readerIdleTimeNanos - (ticksInNanos() - lastReadTime)
            readerIdleTimeout = schedule(ctx, this, nextDelay, TimeUnit.NANOSECONDS);
        }
    }
    
    protected void channelIdle(ChannelHandlerContext ctx, IdleStateEvent evt) throws Exception {
        ctx.fireUserEventTriggered(evt);
    }
}

这里比较有意思的是nextDelay值的设置，当读事件正在进行时（reading=true），则直接进行下一次循环；

当读事件未执行，若ticksInNanos（当前时间） - lastReadTime（最后一次读完成时间） > readerIdleTimeNanos（读空闲检测时间），说明读空闲超时，往下游发送一个READER_IDLE Event

reading=false的情况有两种：没有发生过读、读已经结束；当读数据正在进行时，则reading=true

总结：通过这种对lastReadTime的定时任务检测，就可以发现是否已经长时间未读，若是，则发送下游READER_IDLE事件，下游检测到该事件进行相应处理即可。

3.3 写空闲检测

分析过程与3.2 读空闲检测类似，我们先来看下重写后的write方法

public class IdleStateHandler extends ChannelDuplexHandler {
	@Override
    public void write(ChannelHandlerContext ctx, Object msg, ChannelPromise promise) throws Exception {
        // 如果writerIdleTimeNanos或allIdleTimeNanos大于0，说明需要进行写空闲检测
        if (writerIdleTimeNanos > 0 || allIdleTimeNanos > 0) {
            // 对write方法执行后的ChannelFuture添加监听器，writeListener内容如下
            ctx.write(msg, promise.unvoid()).addListener(writeListener);
        } else {
            ctx.write(msg, promise);
        }
    }
    
    private final ChannelFutureListener writeListener = new ChannelFutureListener() {
        @Override
        public void operationComplete(ChannelFuture future) throws Exception {
            // 当写方法完成时，设置最新一次写时间为当前时间
            lastWriteTime = ticksInNanos();
            firstWriterIdleEvent = firstAllIdleEvent = true;
        }
    };
}

方法并不复杂，主要就是对write方法添加一个监听器，用于监听wirte方法完成，完成后重置下lastWriteTime。下面来看下WriteTask所做的事情

3.3.1 WriterIdleTimeoutTask 写空闲检测

private final class WriterIdleTimeoutTask extends AbstractIdleTask {

    // 将ChannelHandlerContext传入当前task
    WriterIdleTimeoutTask(ChannelHandlerContext ctx) {
        super(ctx);
    }

    @Override
    protected void run(ChannelHandlerContext ctx) {
        long lastWriteTime = IdleStateHandler.this.lastWriteTime;
        // 同样的方式来计算nextDelay
        long nextDelay = writerIdleTimeNanos - (ticksInNanos() - lastWriteTime);
        // 已超时
        if (nextDelay <= 0) {
            // 先生成一个定时任务，用于下次写超时检测
            writerIdleTimeout = schedule(ctx, this, writerIdleTimeNanos, TimeUnit.NANOSECONDS);

            boolean first = firstWriterIdleEvent;
            firstWriterIdleEvent = false;

            try {
                // 这里比较有意思，我们具体在3.3.2 来看下
                if (hasOutputChanged(ctx, first)) {
                    return;
                }

                // 直接向下游传递一个WRITER_IDLE事件
                IdleStateEvent event = newIdleStateEvent(IdleState.WRITER_IDLE, first);
                channelIdle(ctx, event);
            } catch (Throwable t) {
                ctx.fireExceptionCaught(t);
            }
        } else {
            // 说明写未超时，重新生成一个定时任务，延迟nextDelay执行
            writerIdleTimeout = schedule(ctx, this, nextDelay, TimeUnit.NANOSECONDS);
        }
    }
}

3.3.2 hasOutputChanged() 判断Channeloutboundbuffer是否发生过变化

public class IdleStateHandler extends ChannelDuplexHandler {
	private boolean hasOutputChanged(ChannelHandlerContext ctx, boolean first) {
        // 默认observeOutput=false，不会进行下面的检测，需要主动开启
        if (observeOutput) {

            // 如果 lastChangeCheckTimeStamp 和 lastWriteTime 不一样，说明写操作进行过了，需要更新此值
            if (lastChangeCheckTimeStamp != lastWriteTime) {
                lastChangeCheckTimeStamp = lastWriteTime;

                // 非首次，则直接返回true
                // 这里的first，即firstWriterIdleEvent参数，默认为true，当写操作完成时也被置为true
                if (!first) {
                    return true;
                }
            }

            Channel channel = ctx.channel();
            Unsafe unsafe = channel.unsafe();
            ChannelOutboundBuffer buf = unsafe.outboundBuffer();

            if (buf != null) {
                int messageHashCode = System.identityHashCode(buf.current());
                long pendingWriteBytes = buf.totalPendingWriteBytes();

                // 这来主要判断ChannelOutboundBuffer中的值是否发生了变化
                // 如果有数据添加进来，则前后肯定不一致
                if (messageHashCode != lastMessageHashCode || pendingWriteBytes != lastPendingWriteBytes) {
                    lastMessageHashCode = messageHashCode;
                    lastPendingWriteBytes = pendingWriteBytes;

                    if (!first) {
                        return true;
                    }
                }

                long flushProgress = buf.currentProgress();
                if (flushProgress != lastFlushProgress) {
                    lastFlushProgress = flushProgress;

                    if (!first) {
                        return true;
                    }
                }
            }
        }

        return false;
    }
}

关于检测Channeloutboundbuffer变化的逻辑，在正常使用IdleStateHandler中是不会触发的，具体的细节分析可以参考下下文

Netty 心跳服务之 IdleStateHandler 源码分析 - 简书

总结：写空闲检测与读空闲检测基本类似，笔者不再赘述。

3.4 AllIdle检测

这个的检测与上述读写检测基本是一样的，大家可以自行阅读AllIdleTimeoutTask.java，笔者不再赘述

总结：

IdleStateHandler的代码不算复杂，在我们的应用探活中可以很好的发挥作用。

主要还是我们监听到Idle event后的自定义处理方案，这个才是关键。

Netty源码解析-IdleStateHandler

Java相关栏目本月热门文章