Java 表达式之谜:为什么 index 增加了两次?

Code Golf中的一位挑战者在比赛中写了下面这段代码:(译注:Code Golf是一个编程挑战比赛,提交的代码越短越好)

import java.util.*;
public class Main {
 public static void main(String[] args) {
   int size = 3;
   String[] array = new String[size];
   Arrays.fill(array, "");
   for(int i = 0; i <= 100; ) {
     array[i++%size] += i + " ";
   }
   for(String element: array) {
     System.out.println(element);
   }
 }
}

在Java 8中运行代码,得到结果如下:

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 
2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101
3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99

在Java 10中运行代码,得到结果如下:

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100

在Java 10中编号似乎完全失效了。这中间发生了什么?这是Java 10的bug吗?

来自评论区的讨论:

用Java 9或更高版本编译会出现问题(我们在Java 10中找到了问题)。在Java 8上编译这段代码,然后在Java 9或更高版本(包括Java 11 EA)中运行,可以得到预期结果。

虽然这种代码不标准,但符合Java规范。Kevin Cruijssen在一个Code Golf挑战中发现了这个问题,看起来结果很奇怪。

Didier L发现可以用更短、更容易理解的代码重现该问题:

class Main {
 public static void main(String[] args) {
   String[] array = { "" };
   array[test()] += "a";
 }
 static int test() {
   System.out.println("evaluated");
   return 0;
 }
}

用Java 8编译,运行结果:

evaluated

用Java 9和10编译,运行结果

evaluated
evaluated

问题似乎与字符串连接操作和赋值运算符(+=)有关,当作为左操作符时会出现副作用,例如array[test()]+="a"、array[ix++]+="a"、test()[index]+="a"或test().field+="a"。字符串连接要求至少有一边的对象类型为String。其他类型或结构无法复现该错误。

答案

这是JDK 9开始引入的一个javac bug(疑似在字符串拼接过程中进行了修改),已由javac团队确认,bug id  JDK-8204322。查看该行对应的字节码:

array[i++%size] += i + " ";

字节码:

  21: aload_2
 22: iload_3
 23: iinc          3, 1
 26: iload_1
 27: irem
 28: aload_2
 29: iload_3
 30: iinc          3, 1
 33: iload_1
 34: irem
 35: aaload
 36: iload_3
 37: invokedynamic #5,  0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;
 42: aastore

最后的aaload从数组中实际加载数据。但是,下面这段

  21: aload_2             // load 数组引用
 22: iload_3             // load 'i'function(){   //外汇跟单www.gendan5.com  23: iinc          3, 1  // 'i' 加1  (不影响已加载的数组值)
 26: iload_1             // load 'size'
 27: irem                // 计算余数

基本上能与array[i++%size]表达式对应(去掉实际的load和store),问题是这里出现了两次。按照jls-15.26.2规范中的描述,这是不正确的:

复合表达式E1 op= E2与E1 = (T) ((E1) op (E2))等价,其中T的类型是E1,除了E1应该只执行一次。

因此,表达式array[i++%size] += i + " ";中array[i++%size]应该只计算一次。但是这里会计算两次(load一次,store一次)。

可以确认,这是一个bug。

更新:

该bug已在JDK 11中修复,并且对应更新到JDK 10(但JDK 9不会修复,因为它不再进行public updates)。

Aleksey ShipilevJBS 页面上提到(@DidierL在此进行了评论):

解决方法:使用-XDstringConcat=inline编译。

这样会使用StringBuilder进行字符串连接,不会出现该bug。

原文地址:https://www.cnblogs.com/gendan5/p/11810461.html