字符串常量池理解-xss云之家

SpringBoot性能优化之HikariCP连接池

在JVM中，为了减少字符串对象的重复创建，维护了一块特殊的内存空间，这块内存就被称为字符串常量池。

在JDK1.6及之前，字符串常量池存放在方法区中。到JDK1.7之后，就从方法区中移除了，而存放在堆中。以下是《深入理解Java虚拟机》第二版原文:

对于HotSpot虚拟机，根据官方发布的路线图信息，现在也有放弃永久代并逐步改为采用Native Memory来实现方法区的规划了，在目前已经发布的JDK1.7 的HotSpot中，已经把原本放在永久代的字符串常量池移出。

我们知道字符串常量一般有两种创建方式：

使用字符串字面量定义

String s = "aa";

通过new创建字符串对象

String s = new String("aa");

那这两种方式有什么区别呢？

第一种方式通过字面量定义一个字符串时，JVM会先去字符串常量池中检查是否存在“aa”这个对象。如果不存在，则在字符串常量池中创建“aa”对象，并将引用返回给s，这样s的引用就指向字符串常量池中的“aa”对象。如果存在，则不创建任何对象，直接把常量池中“aa”对象的地址返回，赋值给s。

第二种方式通过new关键字创建一个字符串时，我们需要知道创建了几个对象，这也是面试中经常问到的。首先，会在字符串常量池中创建一个”aa”对象。然后执行new String时会在堆中创建一个“aa”的对象，然后把s的引用指向堆中的这个“aa”对象。

思考以下代码的打印结果：

public class StringTest {
    public static void main(String[] args) {
        //创建了两个对象，一份存在字符串常量池中，一份存在堆中
        String s = new String("aa");
        //检查常量池中是否存在字符串aa，此处存在则直接返回
        String s1 = s.intern();
        String s2 = "aa";

        System.out.println(s == s2);  //①
        System.out.println(s1 == s2); //②

        String s3 = new String("b") + new String("b");
        //常量池中没有bb，在jdk1.7之后会把堆中的引用放到常量池中，故引用地址相等
        String s4 = s3.intern();
        String s5 = "bb";

        System.out.println(s3 == s5 ); //③
        System.out.println(s4 == s5);  //④

    }
}

以上的①②③④四个地方应该输出true还是false呢？别着急，先看下，代码中用到了intern方法。这个方法的作用是，在运行期间可以把新的常量放入到字符串常量池中。

看下String源码中对intern方法的解释：

字符串常量池理解

字面意思就是，当调用这个方法时，会去检查字符串常量池中是否已经存在这个字符串，如果存在的话，就直接返回，如果不存在的话，就把这个字符串常量加入到字符串常量池中，然后再返回其引用。

但是，其实在JDK1.6和 JDK1.7的处理方式是有一些不同的。

在JDK1.6中，如果字符串常量池中已经存在该字符串对象，则直接返回池中此字符串对象的引用。否则，将此字符串的对象添加到字符串常量池中，然后返回该字符串对象的引用。

在JDK1.7中，如果字符串常量池中已经存在该字符串对象，则返回池中此字符串对象的引用。否则，如果堆中已经有这个字符串对象了，则把此字符串对象的引用添加到字符串常量池中并返回该引用，如果堆中没有此字符串对象，则先在堆中创建字符串对象，再返回其引用。（这也说明，此时字符串常量池中存储的是对象的引用，而对象本身存储于堆中）

于是代码中，String s = new String(“aa”);创建了两个“aa”对象，一个存在字符串常量池中，一个存在堆中。

并发队列之LinkedBlockingQueue

String s1 = s.intern(); 由于字符串常量池中已经存在“aa”对象，于是直接返回其引用，故s1指向字符串常量池中的对象。

String s2 = “aa”; 此时字符串常量池中已经存在“aa”对象，所以也直接返回，故 s2和 s1的地址相同。②返回true。

System.out.println(s == s2); 由于s的引用指向的是堆中的“aa”对象，s2指向的是常量池中的对象。故不相等，①返回false。

String s3 = new String(“b”) + new String(“b”); 先说明一下，这种形式的字符串拼接，等同于使用StringBuffer的append方法把两个“b”拼接，然后调用toString方法，new出“bb”对象，因此“bb”对象是在堆中生成的。所以，这段代码最终生成了两个对象，一个是“b”对象存在于字符串常量池中，一个是 “bb”对象，存在于堆中，但是此时字符串常量池中是没有“bb”对象的。 s3指向的是堆中的“bb”对象。

String s4 = s3.intern(); 调用了intern方法之后，在JDK1.6中，由于字符串常量池中没有“bb”对象，故创建一个“bb”对象，然后返回其引用。所以 s4 这个引用指向的是字符串常量池中新创建的“bb”对象。在JDK1.7中，则把堆中“bb”对象的引用添加到字符串常量池中，故s4和s3所指向的对象是同一个，都指向堆中的“bb”对象。

String s5 = “bb”; 在JDK1.6中，指向字符串常量池中的“bb”对象的引用，在JDK1.7中指向的是堆中“bb”对象的引用。

System.out.println(s3 == s5 ); 参照以上分析即可知道，在JDK1.6中③返回false（因为s3指向的是堆中的“bb”对象，s5指向的是字符串常量池中的“bb”对象），在JDK1.7中，③返回true（因为s3和s5指向的都是堆中的“bb”对象）。

System.out.println(s4 == s5); 在JDK1.6中，s4和s5指向的都是字符串常量池中创建的“bb”对象，在JDK1.7中，s4和s5指向的都是堆中的“bb”对象。故无论JDK版本如何，④都返回true。

综上，在JDK1.6中，返回的结果为：

false
true
false
true

在JDK1.7中，返回结果为：

false
true
true
true

以上，可以在JDK1.7和JDK1.6中分别验证。注意一下，最好搞两个项目然后分别设置不同的JDK，因为如果在一个项目中直接更改JDK版本，有可能高版本编译之后，低版本编译不通过。

原理搞懂了，我们再思考一下以下代码的结果：

public class InternTest {
    public static void main(String[] args) {
        String str1 = "xy";
        String str2 = "z";
        String str3 = "xyz";
        String str4 = str1 + str2;
        String str5 = str4.intern();
        String str6 = "xy" + "z";

        System.out.println(str3 == str4); //⑤
        System.out.println(str3 == str5); //⑥
        System.out.println(str3 == str6); //⑦
    }
}

我们分析一下。

str1、str2和str3都是简单的定义字符串，所有它们都是在字符串常量池中创建对象，然后引用指向字符串常量池中的对象。

String str4 = str1 + str2; 这段代码和之前的 String s3 = new String(“b”) + new String(“b”); 原理相同，因此在堆中创建了一个“xyz”对象，然后str4指向堆中的这个对象。故⑤处返回false。（str3指向的是字符串常量池中的“xyz”对象）

String str5 = str4.intern(); 由于字符串常量池中已经存在“xyz”对象，因此不论是JDK1.6还是JDK1.7，此处返回的都是字符串常量池中对象的引用。所以str5指向字符串常量池中的对象，故 ⑥返回true。

String str6 = “xy” + “z”; 这段代码需要说明一下，它不同于两个字符串的引用拼接（如str1 + str2）。JVM会对其优化处理，也就是在编译阶段会把“xy”和“z”进行拼接成为“xyz”，存放在字符串常量池。因此，str6指向的是字符串常量池的对象，故⑦返回true。