Java自动装箱性能

Java 的基本数据类型(int、double、 char)都不是对象。但由于很多Java代码需要处理的是对象(Object),Java给所有基本类型提供了包装类(Integer、Double、Character)。有了自动装箱,你可以写如下的代码

西乌珠穆沁网站制作公司哪家好,找创新互联!从网页设计、网站建设、微信开发、APP开发、成都响应式网站建设等网站项目制作,到程序开发,运营维护。创新互联成立于2013年到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联

 
 
  1. Character boxed = 'a';
  2. char unboxed = boxed;

编译器自动将它转换为

 
 
  1. Character boxed = Character.valueOf('a');
  2. char unboxed = boxed.charValue();

然而,Java虚拟机不是每次都能理解这类过程,因此要想得到好的系统性能,避免不必要的装箱很关键。这也是 OptionalInt 和 IntStream 等特殊类型存在的原因。在这篇文章中,我将概述JVM很难消除自动装箱的一个原因。

实例

例如,我们想要计算任意一类数据的编辑距离(Levenshtein距离),只要这些数据可以被看作一个序列:

 
 
  1. public class Levenshtein{
  2. private final Function> asList;
  3. public Levenshtein(Function> asList) {
  4. this.asList = asList;
  5. }
  6. public int distance(T a, T b) {
  7. // Wagner-Fischer algorithm, with two active rows
  8. List aList = asList.apply(a);
  9. List bList = asList.apply(b);
  10. int bSize = bList.size();
  11. int[] row0 = new int[bSize + 1];
  12. int[] row1 = new int[bSize + 1];
  13. for (int i = 0; i row0[i] = i;
  14. }
  15. for (int i = 0; i < bSize; ++i) {
  16. U ua = aList.get(i);
  17. row1[0] = row0[0] + 1;
  18. for (int j = 0; j < bSize; ++j) {
  19. U ub = bList.get(j);
  20. int subCost = row0[j] + (ua.equals(ub) ? 0 : 1);
  21. int delCost = row0[j + 1] + 1;
  22. int insCost = row1[j] + 1;
  23. row1[j + 1] = Math.min(subCost, Math.min(delCost, insCost));
  24. }
  25. int[] temp = row0;
  26. row0 = row1;
  27. row1 = temp;
  28. }
  29. return row0[bSize];
  30. }
  31. }

只要两个对象可以被看作List,这个类就可以计算它们的编辑距离。如果想计算String类型的距离,那么就需要把String转变为List类型:

 
 
  1. public class StringAsList extends AbstractList{
  2. private final String str;
  3. public StringAsList(String str) {
  4. this.str = str;
  5. }
  6. @Override
  7. public Character get(int index) {
  8. return str.charAt(index); // Autoboxing! }
  9. @Override
  10. public int size() {
  11. return str.length();
  12. }
  13. }
  14. ...
  15. Levenshteinlev = new Levenshtein<>(StringAsList::new);
  16. lev.distance("autoboxing is fast", "autoboxing is slow"); // 4

由于Java泛型的实现方式,不能有List类型,所以要提供List和装箱操作。(注:Java10中,这个限制也许会被取消。)

为了查看代码热路径(hot path)上的结果,JMH集成了Linux工具perf,可以查看最热代码块的JIT编译结果。(要想查看汇编代码,需要安装hsdis插件。我在 AUR上提供了下载,Arch用户可以直接获取。)在JMH命令行添加 -prof perfasm 命令,就可以看到结果:

为了测试 distance() 方法的性能,需要做基准测试。Java中微基准测试很难保证准确,但幸好OpenJDK提供了JMH(Java Microbenchmark Harness),它可以帮我们解决大部分难题。如果感兴趣的话,推荐大家阅读文档和实例;它会很吸引你。以下是基准测试:

 
 
  1. @State(Scope.Benchmark)
  2. public class MyBenchmark {
  3. private Levenshtein lev = new Levenshtein<>(StringAsList::new);
  4. @Benchmark
  5. @BenchmarkMode(Mode.AverageTime)
  6. @OutputTimeUnit(TimeUnit.NANOSECONDS)
  7. public int timeLevenshtein() {
  8. return lev.distance("autoboxing is fast", "autoboxing is slow");
  9. }
  10. }

(返回方法的结果,这样JMH就可以做一些操作让系统认为返回值会被使用到,防止冗余代码消除影响了结果。)

以下是结果:

 
 
  1. $ java -jar target/benchmarks.jar -f 1 -wi 8 -i 8
  2. # JMH 1.10.2 (released 3 days ago)
  3. # VM invoker: /usr/lib/jvm/java-8-openjdk/jre/bin/java
  4. # VM options:
  5. # Warmup: 8 iterations, 1 s each
  6. # Measurement: 8 iterations, 1 s each
  7. # Timeout: 10 min per iteration
  8. # Threads: 1 thread, will synchronize iterations
  9. # Benchmark mode: Average time, time/op
  10. # Benchmark: com.tavianator.boxperf.MyBenchmark.timeLevenshtein
  11. # Run progress: 0.00% complete, ETA 00:00:16
  12. # Fork: 1 of 1
  13. # Warmup Iteration 1: 1517.495 ns/op
  14. # Warmup Iteration 2: 1503.096 ns/op
  15. # Warmup Iteration 3: 1402.069 ns/op
  16. # Warmup Iteration 4: 1480.584 ns/op
  17. # Warmup Iteration 5: 1385.345 ns/op
  18. # Warmup Iteration 6: 1474.657 ns/op
  19. # Warmup Iteration 7: 1436.749 ns/op
  20. # Warmup Iteration 8: 1463.526 ns/op
  21. Iteration 1: 1446.033 ns/op
  22. Iteration 2: 1420.199 ns/op
  23. Iteration 3: 1383.017 ns/op
  24. Iteration 4: 1443.775 ns/op
  25. Iteration 5: 1393.142 ns/op
  26. Iteration 6: 1393.313 ns/op
  27. Iteration 7: 1459.974 ns/op
  28. Iteration 8: 1456.233 ns/op
  29. Result "timeLevenshtein":
  30. 1424.461 ±(99.9%) 59.574 ns/op [Average]
  31. (min, avg, max) = (1383.017, 1424.461, 1459.974), stdev = 31.158
  32. CI (99.9%): [1364.887, 1484.034] (assumes normal distribution)
  33. # Run complete. Total time: 00:00:16
  34. Benchmark Mode Cnt Score Error Units
  35. MyBenchmark.timeLevenshtein avgt 8 1424.461 ± 59.574 ns/op

分析

为了查看代码热路径(hot path)上的结果,JMH集成了Linux工具perf,可以查看最热代码块的JIT编译结果。(要想查看汇编代码,需要安装hsdis插件。我在 AUR上提供了下载,Arch用户可以直接获取。)在JMH命令行添加 -prof perfasm 命令,就可以看到结果:

 
 
  1. $ java -jar target/benchmarks.jar -f 1 -wi 8 -i 8 -prof perfasm
  2. ...
  3. cmp $0x7f,%eax
  4. jg 0x00007fde989a6148 ;*if_icmpgt
  5. ; - java.lang.Character::valueOf@3 (line 4570)
  6. ; - com.tavianator.boxperf.StringAsList::get@8 (line 14)
  7. ; - com.tavianator.boxperf.StringAsList::get@2; (line 5)
  8. ; - com.tavianator.boxperf.Levenshtein::distance@121 (line 32)
  9. cmp $0x80,%eax
  10. jae 0x00007fde989a6103 ;*aaload
  11. ; - java.lang.Character::valueOf @ 10 (line 4571)
  12. ; - com.tavianator.boxperf.StringAsList::get@8 (line 14)
  13. ; - com.tavianator.boxperf.StringAsList::get @ 2 (line 5)
  14. ; - com.tavianator.boxperf.Levenshtein::distance@121 (line 32)
  15. ...

输出内容很多,但上面的一点内容就说明装箱没有被优化。为什么要和0x7f/0×80的内容做比较呢?原因在于Character.valueOf()的取值来源:

 
 
  1. private static class CharacterCache {
  2. private CharacterCache(){}
  3. static final Character cache[] = new Character[127 + 1];
  4. static {
  5. for (int i = 0; i < cache.length; i++)
  6. cache[i] = new Character((char)i);
  7. }
  8. }
  9. public static Character valueOf(char c) {
  10. if (c return CharacterCache.cache[(int)c];
  11. }
  12. return new Character(c);
  13. }

可以看出,Java语法标准规定前127个char的Character对象放在缓冲池中,Character.valueOf()的结果在其中 时,直接返回缓冲池的对象。这样做的目的是减少内存分配和垃圾回收,但在我看来这是过早的优化。而且它妨碍了其他优化。JVM无法确定 Character.valueOf(c).charValue() == c,因为它不知道缓冲池的内容。所以JVM从缓冲池中取了一个Character对象并读取它的值,结果得到的就是和 c 一样的内容。

解决方法

解决方法很简单:

 
 
  1. @ @ -11,7 +11,7 @ @ public class StringAsList extends AbstractList {
  2. @Override
  3. public Character get(int index) {
  4. - return str.charAt(index); // Autoboxing!
  5. + return new Character(str.charAt(index));
  6. }

@Override

用显式的装箱代替自动装箱,就避免了调用Character.valueOf(),这样JVM就很容易理解代码:

 
 
  1. private final char value;
  2. public Character(char value) {
  3. this.value = value;
  4. }
  5. public char charValue() {
  6. return value;
  7. }

虽然代码中加了一个内存分配,但JVM能理解代码的意义,会直接从String中获取char字符。性能提升很明显:

 
 
  1. $ java -jar target/benchmarks.jar -f 1 -wi 8 -i 8
  2. ...
  3. # Run complete. Total time: 00:00:16
  4. Benchmark Mode Cnt Score Error Units
  5. MyBenchmark.timeLevenshtein avgt 8 1221.151 ± 58.878 ns/op

速度提升了14%。用 -prof perfasm 命令可以显示,改进以后是直接从String中拿到char值并在寄存器中比较的:

movzwl 0x10(%rsi,%rdx,2),%r11d ;*caload
; - java.lang.String::charAt@27 (line 648)
; - com.tavianator.boxperf.StringAsList::get@9 (line 14)
; - com.tavianator.boxperf.StringAsList::get @ 2 (line 5)
; - com.tavianator.boxperf.Levenshtein::distance@121 (line 32)
cmp %r11d,%r10d
je 0x00007faa8d404792 ;*if_icmpne
; - java.lang.Character::equals@18 (line 4621)
; - com.tavianator.boxperf.Levenshtein::distance@137 (line 33)

总结

装箱是HotSpot的一个弱项,希望它能做到越来越好。它应该多利用装箱类型的语义,消除装箱操作,这样以上的解决办法就没有必要了。

以上的基准测试代码都可以在GitHub上访问。

网站名称:Java自动装箱性能
本文链接:http://www.mswzjz.cn/qtweb/news39/308889.html

攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能