用javap分析java编译器对string常量表达式的处置和优化
最近看了下javaeye上一篇关于string优化的文章,借此分析下string 原文地址http://skydream.iteye.com/blog/48351 先看看作者的问题分析: 首先把问题摆出来,先看这个代码 现在我们不管作者的分析是否正确,通过jdk的工具javap,看看class文件,如下: 0: ldc #16; //String ab 2: astore_1 3: ldc #16; //String ab 5: astore_2 6: getstatic #18; //Field java/lang/System.out:Ljava/io/PrintStream; 9: aload_1 10: aload_2 11: if_acmpne 18 14: iconst_1 15: goto 19 18: iconst_0 19: invokevirtual #24; //Method java/io/PrintStream.println:(Z)V 22: return 通过 0: ldc #16; //String ab和 3: ldc #16; //String ab ,知道该java文件通过编译器编译后都变为 String b = "ab"; 和作者分析的一样。 接着作者分析了下string+ 基本类型,看看作者的分析: 下面进一步探讨,什么样的string + 表达式会被编译器当成常量表达式? 事实的真假还是用javap看看: 0: ldc #16; //String a1 2: astore_1 3: ldc #16; //String a1 5: astore_2 6: getstatic #18; //Field java/lang/System.out:Ljava/io/PrintStream; 9: aload_1 10: aload_2 11: if_acmpne 18 14: iconst_1 15: goto 19 18: iconst_0 19: invokevirtual #24; //Method java/io/PrintStream.println:(Z)V 22: return 看看 0: ldc #16; //String a1和 0: ldc #16; //String a1,知道作者的分时正确的。 接着作者又分析了下 string+string对象,作者分析如下: String a = "ab"; 还是javap看看代码: 0: ldc #16; //String ab 2: astore_1 3: ldc #18; //String b 5: astore_2 6: new #20; //class java/lang/StringBuilder 9: dup 10: ldc #22; //String a 12: invokespecial #24; //Method java/lang/StringBuilder."<init>":(Ljava/lang/String;)V 15: aload_2 16: invokevirtual #27; //Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 19: invokevirtual #31; //Method java/lang/StringBuilder.toString:()Ljava/lang/String; 22: astore_3 23: getstatic #35; //Field java/lang/System.out:Ljava/io/PrintStream; 26: aload_1 27: aload_3 28: if_acmpne 35 31: iconst_1 32: goto 36 35: iconst_0 36: invokevirtual #41; //Method java/io/PrintStream.println:(Z)V 39: return 来看看 0: ldc #16; //String ab 说明 变量a直接从常量池中取出ab字符串,在看看 3: ldc #18; //String b 5: astore_2 6: new #20; //class java/lang/StringBuilder 9: dup 10: ldc #22; //String a 可以知道变量b是通过new出一个StringBuilder来赋值给变量b的。这进一步证明了作者的说法。 最后看看作者分析的最后一种情况,原文: 把bb作为常量变量: 先看看常量变量的javap的结果: 0: ldc #16; //String ab 2: astore_1 3: ldc #18; //String b 5: astore_2 6: ldc #16; //String ab 8: astore_3 9: getstatic #20; //Field java/lang/System.out:Ljava/io/PrintStream; 12: aload_1 13: aload_3 14: if_acmpne 21 17: iconst_1 18: goto 22 21: iconst_0 22: invokevirtual #26; //Method java/io/PrintStream.println:(Z)V 25: return 看看 0: ldc #16; //String ab 和 6: ldc #16; //String ab 通过优化后变量a,b是指向相同的常量空间。 再用javap分析下通过静态方法获得的: 0: ldc #16; //String ab 2: astore_1 3: invokestatic #18; //Method getBB:()Ljava/lang/String; 6: astore_2 7: new #22; //class java/lang/StringBuilder 10: dup 11: ldc #24; //String a 13: invokespecial #26; //Method java/lang/StringBuilder."<init>":(Ljava/lang/String;)V 16: aload_2 17: invokevirtual #29; //Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 20: invokevirtual #33; //Method java/lang/StringBuilder.toString:()Ljava/lang/String; 23: astore_3 24: getstatic #36; //Field java/lang/System.out:Ljava/io/PrintStream; 27: aload_1 28: aload_3 29: if_acmpne 36 32: iconst_1 33: goto 37 36: iconst_0 37: invokevirtual #42; //Method java/io/PrintStream.println:(Z)V 40: return 分析:0: ldc #16; //String ab 变量a的值直接指向常量池中的‘ab’, 通过下面的分析可知 变量2通过StringBuilder进行string操作。 7: new #22; //class java/lang/StringBuilder 10: dup 11: ldc #24; //String a 13: invokespecial #26; //Method java/lang/StringBuilder."<init>":(Ljava/lang/String;)V 16: aload_2 17: invokevirtual #29; //Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 20: invokevirtual #33; //Method java/lang/StringBuilder.toString:()Ljava/lang/String; 23: astore_3 通过javap分析大家应该更清楚string在java中的优化了。
String a = "ab";
String b = "a" + "b";
System.out.println((a == b));
打印结果会是什么?类似这样的问题,有人考过我,我也拿来考过别人(蛮好玩的,大家也可以拿来问人玩),一般答案会是以下几种:
1.true
"a" + "b" 的结果就是"ab",这样a,b都是"ab"了,内容一样所以"相等",结果true
一般java新人如是答。
2.false
"a" + "a"会生成新的对象"aa",但是这个对象和String a = "ab";不同,(a == b)是比较对象引用,因此不相等,结果false
对java的String有一定了解的通常这样回答。
3.true
String a = "ab";创建了新的对象"ab"; 再执行String b = "a" + "b";结果b="ab",这里没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true.
能回答出这个答案的,基本已经是高手了,对java中的string机制比较了解。
很遗憾,这个答案,是不够准确的。或者说,根本没有运行时计算b = "a" + "b";这个操作.实际上运行时只有String b = "ab";
3的观点适合解释以下情况:
String a = "ab";
String b = "ab";
System.out.println((a == b));
如果String b = "a" + "b";是在运行期执行,则3的观点是无法解释的。运行期的两个string相加,会产生新的对象的。(本文后面对此有解释)
4.true
下面是我的回答:编译优化+ 3的处理方式 = 最后的true
String b = "a" + "b";编译器将这个"a" + "b"作为常量表达式,在编译时进行优化,直接取结果"ab",这样这个问题退化
String a = "ab";
String b = "ab";
System.out.println((a == b));
然后根据3的解释,得到结果true
String b = "a" + "b";
这个String + String被正式是ok的,那么string + 基本类型呢?
String a = "a1";
String b = "a" + 1;
System.out.println((a == b)); //result = true
String a = "atrue";
String b = "a" + true;
System.out.println((a == b)); //result = true
String a = "a3.4";
String b = "a" + 3.4;
System.out.println((a == b)); //result = true
可见编译器对string + 基本类型是当成常量表达式直接求值来优化的。
String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = false
这个好理解,"a" + bb中的bb是变量,不能进行优化。这里很很好的解释了为什么3的观点不正确,如果String+String的操作是在运行时进行的,则会产生新的对象,而不是直接从jvm的string池中获取。
String a = "ab";
final String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = true
竟然又是true,编译器的优化好厉害啊,呵呵,考虑下面这种情况:
String a = "ab";
final String bb = getBB();
String b = "a" + bb;
System.out.println((a == b)); //result = false
private static String getBB() {
return "b";
}