Java反射性能优化（java反射性能好吗）

经验文章nimo972025-05-08 15:04:5011A⁺A^-

先来看看 java.lang.reflect.Method 里的 invoke 方法：

注意，MethodAccessor 接口有两个实现：

NativeMethodAccessorImpl，通过本地方法来实现反射调用
DelegatingMethodAccessorImpl，使用了委派模式

打印反射调用堆栈信息：

从堆栈信息可以看到，Method实例的第一次反射调用会生成一个委派实现，它所委派的具体实现是一个本地实现。

为什么反射调用要采取委派实现作为中间层？为什么不直接交给本地实现？

实际上，Java的反射调用机制还有一种动态生成字节码的实现（以下简称为动态实现），简单来说，就是直接使用invoke指令来调用目标方法。

之所以采用委派实现作为中间层，是为了能够在本地实现以及动态实现中切换。

动态实现的运行效率要优于本地实现，这是因为动态实现无需经过Java到C++再到Java的切换，但是由于生成字节码十分耗时，仅调用一次的话，反而是本地实现要快上3到4倍。

达到多少次才切换呢？

说明：

通过 sun.reflect.inflationThreshold 这个参数控制，默认值是15
切换成动态实现这个过程称为 Inflation，所以还可以通过设置 -Dsun.reflect.noInflation=true，在反射调用一开始便会直接生成动态实现
这个动态实现就是上图出现的 GeneratedMethodAccessor1

接下来我们借助 JMH 测试一下直接调用方法和反射调用方法的性能：

从上面的测试结果可以看到，直接调用方法的性能大概是反射调用方法的17倍。

注意，在调用目标方法时，传入的参数是66，如果超出 [-128,127] 这个范围（可以通过参数
java.lang.Integer.IntegerCache.high 或者 -XX:AutoBoxCacheMax 调整上限），将不会使用IntegerCache，而是每次调用新建一个Integer对象。

另外，java.lang.reflect.Method 的 invoke 方法接收的是变长参数，下边是相关字节码：

可以看到，每次调用都会生成一个长度为1的Object数组。

接下来，我们进一步优化，因为传入参数可以认为是固定不变的，所以我们提前创建好这个Object数组，然后直接传给 invoke 方法：

可以看到，直接调用方法的性能大概是这一轮优化后的反射调用的10倍。

再进一步，我们关闭反射调用的Inflation机制，直接使用动态实现：

结果如下：

可以看到，直接调用方法的性能大概是第二轮优化后的反射调用的9倍。

可是我们真实的使用场景往往没有这么理想和简单，我们很有可能对多个方法做反射调用，如下图所示：

在做benchmark测试前，对另外两个方法做了2000次反射调用，然后我们之前优化后的反射调用性能大幅降低。

为什么会这样呢？

只对target这一个方法做反射调用，方法内联情况如下图所示：

对target2和target3这两个方法做2000次反射调用后，再反射调用target方法，方法内联情况如下图所示：

简单来说，当我们榨干了反射调用的水分后，即时编译器中的方法内联将决定反射的性能。在关闭了Inflation的情况下，内联的瓶颈在于 Method.invoke 方法中对 MethodAccessor.invoke 方法的调用，如下图所示：

说明：

对于 invokevirtual 或者 invokeinterface，JVM会记录下调用者的具体类型，即类型Profile
上述调用点（CallSite）的类型Profile无法同时记录这么多个类（-XX:TypeProfileWidth 默认值为2），而在C2中，如果类型Profile是不完整的，即时编译器压根不会进行条件去虚化，而是直接使用内联缓存或者方法表，因此可能造成所测试的反射调用没有被内联的情况

综上所述，影响反射性能的主要原因有3个：

变长参数方法导致新建Object数组
基本类型的自动装箱和拆箱
方法内联

点击这里复制本文地址以上内容由nimo97整理呈现，请务必在转载分享时注明本文地址！如对内容有疑问，请联系我们，谢谢！

java提高

上一篇：1. Java性能优化:开启高效编程之旅

下一篇：Java程序性能优化全攻略:从菜鸟到高手

Java反射性能优化（java反射性能好吗）

相关文章