栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Java方法调用性能

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Java方法调用性能

TL; DR JIT编译器在第二种情况下有更多机会优化内部循环,因为堆栈替换发生​​在不同的位置。

我设法通过减少测试用例重现了问题。 不涉及I / O或字符串操作,仅涉及两个具有数组访问权限的嵌套循环。

public class NestedLoop {    private static final int ARRAY_SIZE = 5000;    private static final int ITERATIONS = 1000000;    private int[] width = new java.util.Random(0).ints(ARRAY_SIZE).toArray();    public long inline() {        long sum = 0;        for (int i = 0; i < ITERATIONS; i++) { int min = width[0]; for (int k = 1; k < ARRAY_SIZE; k++) {     if (min > width[k]) {         min = width[k];     } } sum += min;        }        return sum;    }    public long methodCall() {        long sum = 0;        for (int i = 0; i < ITERATIONS; i++) { int min = getMin(); sum += min;        }        return sum;    }    private int getMin() {        int min = width[0];        for (int k = 1; k < ARRAY_SIZE; k++) { if (min > width[k]) {     min = width[k]; }        }        return min;    }    public static void main(String[] args) {        long startTime = System.nanoTime();        long sum = new NestedLoop().inline();  // or .methodCall();        long endTime = System.nanoTime();        long ms = (endTime - startTime) / 1000000;        System.out.println("sum = " + sum + ", time = " + ms + " ms");    }}

inline
变体的确比慢3-4倍
methodCall


我使用以下JVM选项来确认两个基准测试均 在最高层上 进行 编译,
并且在两种情况下均成功进行了[OSR(堆栈上替换)](http://codingdict.com/questions/119224。

-XX:-TieredCompilation-XX:Compileonly=NestedLoop-XX:+UnlockDiagnosticVMOptions-XX:+PrintCompilation-XX:+TraceNMethodInstalls

“内联”编译日志:

    251   46 %NestedLoop::inline @ 21 (70 bytes)Installing osr method (4) NestedLoop.inline()J @ 21

‘methodCall’编译日志:

    271   46  NestedLoop::getMin (41 bytes)Installing method (4) NestedLoop.getMin()I     274   47 %NestedLoop::getMin @ 9 (41 bytes)Installing osr method (4) NestedLoop.getMin()I @ 9    314   48 %NestedLoop::methodCall @ 4 (30 bytes)Installing osr method (4) NestedLoop.methodCall()J @ 4

这意味着JIT可以完成其工作,但是生成的代码必须不同。
让我们用进行分析

-XX:+PrintAssembly


“内联”反汇编(最热的片段)

0x0000000002df4dd0: inc    %ebp    ; OopMap{r11=Derived_oop_rbx rbx=Oop off=114}  ;*goto  ; - NestedLoop::inline@53 (line 12)0x0000000002df4dd2: test   %eax,-0x1d64dd8(%rip)        # 0x0000000001090000  ;*iload  ; - NestedLoop::inline@21 (line 12)  ;   {poll}0x0000000002df4dd8: cmp    $0x1388,%ebp0x0000000002df4dde: jge    0x0000000002df4dfd  ;*if_icmpge  ; - NestedLoop::inline@26 (line 12)0x0000000002df4de0: test   %rbx,%rbx0x0000000002df4de3: je     0x0000000002df4e4c0x0000000002df4de5: mov    (%r11),%r10d       ;*getfield width  ; - NestedLoop::inline@32 (line 13)0x0000000002df4de8: mov    0xc(%r10),%r9d     ; implicit exception0x0000000002df4dec: cmp    %r9d,%ebp0x0000000002df4def: jae    0x0000000002df4e590x0000000002df4df1: mov    0x10(%r10,%rbp,4),%r8d  ;*iaload  ; - NestedLoop::inline@37 (line 13)0x0000000002df4df6: cmp    %r8d,%r13d0x0000000002df4df9: jg     0x0000000002df4dc6  ;*if_icmple  ; - NestedLoop::inline@38 (line 13)0x0000000002df4dfb: jmp    0x0000000002df4dd0

“ methodCall”反汇编(也是最热的部分)

0x0000000002da2af0: add    $0x8,%edx          ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2af3: cmp    $0x1381,%edx0x0000000002da2af9: jge    0x0000000002da2b70  ;*iload_1  ; - NestedLoop::getMin@16 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2afb: mov    0x10(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b00: cmp    %r11d,%ecx0x0000000002da2b03: jg     0x0000000002da2b6b  ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b05: mov    0x14(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b0a: cmp    %r11d,%ecx0x0000000002da2b0d: jg     0x0000000002da2b5c  ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b0f: mov    0x18(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b14: cmp    %r11d,%ecx0x0000000002da2b17: jg     0x0000000002da2b4d  ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b19: mov    0x1c(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b1e: cmp    %r11d,%ecx0x0000000002da2b21: jg     0x0000000002da2b66  ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b23: mov    0x20(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b28: cmp    %r11d,%ecx0x0000000002da2b2b: jg     0x0000000002da2b61  ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b2d: mov    0x24(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b32: cmp    %r11d,%ecx0x0000000002da2b35: jg     0x0000000002da2b52  ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b37: mov    0x28(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b3c: cmp    %r11d,%ecx0x0000000002da2b3f: jg     0x0000000002da2b57  ;*iinc  ; - NestedLoop::getMin@33 (line 36)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b41: mov    0x2c(%r9,%rdx,4),%r11d  ;*iaload  ; - NestedLoop::getMin@22 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b46: cmp    %r11d,%ecx0x0000000002da2b49: jg     0x0000000002da2ae6  ;*if_icmple  ; - NestedLoop::getMin@23 (line 37)  ; - NestedLoop::methodCall@11 (line 27)0x0000000002da2b4b: jmp    0x0000000002da2af0

编译后的代码完全不同。

methodCall
优化效果更好。

  • 循环有8个迭代展开;
  • 里面没有数组边界检查;
  • width
    字段被缓存在寄存器中。

相反,

inline
变体

  • 不进行循环展开;
  • width
    每次从内存中加载数组;
  • 在每次迭代中执行数组边界检查。

OSR编译的方法并非总是能很好地进行优化,因为它们必须在过渡点保持已解释堆栈帧的状态。这是相同问题的另一个示例。

堆栈上替换通常发生在向后分支(即循环的底部)。

inline
方法具有两个嵌套循环,OSR发生在内循环内部,而OSR发生
methodCall
一个外循环。OSR在外循环中的过渡更有利,因为JIT编译器具有更大的自由来优化内循环。而这正是您的情况。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/469871.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号