- 1. metaspace区是怎么发生OOM的
- 2. 什么情况会发生metaspace的OOM
- 3. 模拟 metaspace OOM
- 4. metaspace OOM 的定位及解决
在jvm中,用来控制metaspace区域内存大小的参数一般有两个:
- -XX:metaspaceSize:metaspace初始大小;
- -XX:MaxmetaspaceSize:metaspace最大大小;
也就是说,对应一个jvm来说,metaspace区域的大小是固定的,比如设置为:-XX:metaspaceSize=512M -XX:MaxmetaspaceSize=512M
那如果在应用执行的时候,不断的加载类,使得metaspace区域被很多类放满了,会发生什么情况呢?
我们前面说过,在发生 Full GC的时候,会带着一起回收metaspace区域的垃圾对象的;所以一旦metaspace区域满了,此时它也会触发 Full GC,然后尝试回收自己里面的垃圾对象。
这里就有一个问题,metaspace区域中的类(klass,class文件在jvm里的运行时数据结构),怎么判断它是否为垃圾对象呢?在这里它的判断条件要比Java堆中的实例对象严格很多:
- 该类的所有实例对象都已经被回收(Java堆中不存在它的任何实例);
- 加载该类的ClassLoader都已经被回收;
- 该类对应的 java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法;
所以当metaspace满了的时候,就算执行了Full GC,也未必能够回收掉很多它里面的类;当不能回收很多类的时候,jvm还在继续加载类到metaspace中,那它也没有地方来存这些类了,也就只有发生OOM了。
2. 什么情况会发生metaspace的OOM其实对于日常的项目运行情况来说,metaspace区域是很少发生OOM的;如果发生了OOM,一般都是以下两个原因:
- 在上线系统的时候,使用默认参数,没有指定metaspace区域的大小,导致metaspace区域只有默认的20M左右;这对于稍微大一点的系统,本身自己就有很多类,还有依赖的一些第三方框架等也有很多类,20M左右的metaspace很容易就被填满了;
- 这里再介绍一个查看jvm中默认参数大小的命令:java -XX:+PrintFlagsFinal -version | grep metaspaceSize
- 应对这种情况,正常的应用部署上线都需要设置metaspace大小;小一点的应用设置为 256M,大一点的应用设置为512M,一般都够用了;
- 在系统代码中用到了一些cglib等技术动态的生成了一些类,如果代码中没有控制好,导致生成的类过多,很容易就把metaspace填满;
- 应对这种情况,如果代码中有需要动态生成类,就需要好好检查代码了,注意生成的数量和回收;如果遇到了这种oom也需要再次回来检查代码;
这里先简略介绍一下动态生成类:
我们平常的类,都是自己写出来的后缀为“.java”的代码文件,里面包含了一些 静态变量、实例变量、方法和业务逻辑;
我们自己都能写出来这些类,那肯定也有办法在系统运行的时候,通过程序来动态生成一些这样的类;
一般生成这样的类有两种方式:
- 一是通过接口或者目标类,使用动态代理的方式生成代理类;(JDK动态代理、CGLIB动态代理)
- 二是通过操作字节码,直接动态生成类;(使用一些第三方框架,如:Groovy脚本、Aviator脚本、com.itranswarp.compiler包等)
具体的实现就不详细介绍了,需要的可以单独去学习这方面的知识。
这里就通过CGLIB动态代理技术来生成类,模拟 metaspace OOM的场景:
public class metaspaceOomDemo {
public static void main(String[] args) {
cglibCreate();
}
public static void cglibCreate() {
int count = 0;
while (true) {
Enhancer enhancer = new Enhancer();
enhancer.setSuperclass(Test.class);
// 这里有个缓存设置
enhancer.setUseCache(false);
enhancer.setCallback((MethodInterceptor)(o, method, objects, methodProxy) -> methodProxy.invokeSuper(o, objects));
Test testProxy = (Test)enhancer.create();
System.out.println("当前创建了 " + (++count) + "个代理类");
}
}
static class Test {
}
}
上面注释里面的jvm参数,重点就是设置metaspace的大小和 开启oom时打印堆dump的开关。
如果不了解CGLIB的话,就先把Enhancer当做一个实现动态生成代理类的API,这里我们有一个静态内部类Test;
enhancer.setSuperclass(Test.class);:通过 Enhancer生成的类是Test的子类;
Test testProxy = (Test)enhancer.create();:生成 Test的动态代理类;
又由于是在一个while(true)的死循环里面,一直生成Test的动态代理类,所以应该很快就会把metaspace区域填满。
执行代码:
果然看到控制台打印出了OOM,且是 metaspace区域的OOM;意思就是在创建了511个动态代理类之后,10M的metaspace区域被填满了,并且无法回收,再继续生成类的时候就会发生OOM。
4. metaspace OOM 的定位及解决这里是通过一段代码来模拟metaspace区域的OOM,其实跟线上环境出现的情况其实也差不多,那出现这种 metaspace区域的OOM了我们又该怎么解决呢。
在jvm参数中,我们打开了OOM时打印堆dump日志的开关,所以在发生OOM时,肯定会同时生成一份崩溃日志;
有了这个,那我们还是使用前面介绍过的MAT来分析问题:
- 首先还是查看 Overview中的 Leak Suspects,因为这里会给出泄漏疑点:
看到了一个叫 AppClassLoader的 classloader,占据了532.82 KB (39.01%);看见了这么大的这种classloader,有直觉的肯定都猜到了是动态生成类的时候导致的; - 再点上面的 Details进去看看:
这里又看到了AppClassLoader下面有一些 com.bgy.jvm.optimize.metaspaceOomDemo$Test$$EnhancerByCGLIB$$dc2f0932_434 类; - 为了确认,我们再看看dominator_tree中:
这下可以非常确认了,这里面有几百个 EnhancerByCGLIB$$dc2f0932_434 类;
再看见前面的熟悉的你的项目的包名,那你也应该知道了这个问题就是你项目代码导致的;剩下的事情,也就是去排除你项目中的代码问题了。



