谈谈ThreadLocal

Java并发编程实战一书在介绍ThreadLocal类时（第3章），书中有这么两段话，在我初次阅读时不知道如何去理解。

ThreadLocal对象通常用于防止对可变的单实例变量（Singleton）或全局变量进行共享。

当某个频繁执行的操作需要一个临时变量，例如一个缓冲区，而同时又希望避免在每次执行时都重新分配该临时对象，就可以使用这项技术。例如，在Java 5.0之前，Integer.toString()方法使用ThreadLocal对象来保存一个12字节大小的缓冲区，用于对结果进行格式化，而不是使用共享的静态缓冲区（这需要锁机制）或者在每次调用时都分配一个新的缓冲区。

如果我们要在某种程度上理解这两句话，首先我们需要知道什么是ThreadLocal？更重要的是为什么要提出ThreadLocal这个概念？

我们知道，线程并不独立拥有用户空间，用户空间是归进程所有，为同一进程中的所有线程所共享的。所以，用户空间中的任何一个区域，只要有一个线程可以访问，那么同一进程中的所有其它的线程就都能访问。在这个意义上，整个用户空间都是（由同一进程中的）所有线程共享的，不存在只归一个线程使用的变量或数据结构。可是，一般而言，程序对变量或数据结构的访问都是按变量名访问的，经过编译/连接之后就是按地址访问，要是不知道一个变量的地址，实际上就无法正常和正确地加以访问。在这个意义上，则只归一个线程使用的变量或数据结构又是可能的。

注意ThreadLocal只是对全局量和静态变量才有意义。局部量存在于具体线程的堆栈上，而每个线程都有自己的堆栈，所以局部量本来就是“局部”于具体线程的。至于通过动态分配的缓冲区，则取决于保存着缓冲区指针的变量。如果缓冲区指针是全局量，那么同一进程中的所有线程都能访问这个缓冲区；而若是局部量，则别的线程自然就不得其门而入。

synchronized

在介绍ThreadLocal之前，我们先通过一段代码来理解synchronized是如何实现在同一时刻只允许单个线程访问同步代码块的。

public class SynchronizedTest {

    public synchronized void func1() {
    }

    public void func2() {
        synchronized (this) {
        }
    }   
  
}

将SynchronizedTest编译之后，SynchronizedTest中的两个同步方法的字节码（只截取需要的部分）如下。

  public synchronized void func1();
    flags: ACC_PUBLIC, ACC_SYNCHRONIZED
    Code:
      stack=0, locals=1, args_size=1
         0: return
      LineNumberTable:
        line 10: 0

  public void func2();
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=3, args_size=1
         0: aload_0
         1: dup
         2: astore_1
         3: monitorenter
         4: aload_1
         5: monitorexit
         6: goto          14
         9: astore_2
        10: aload_1
        11: monitorexit
        12: aload_2
        13: athrow
        14: return

synchronized关键字经过编译之后，会在同步代码块的前后分别形成monitorenter和monitorexit这两个字节码指令，例如func2方法对应的第3条和第5条字节码，这两个字节码都需要一个reference类型的参数来指明要锁定和解锁的对象。那这里提到的锁和对象之间的关系是什么？关于这个问题，可以参考我的另一篇文章 Java对象内存布局，在对象的Mark Word部分，存储着锁标志位，线程通过检查对象头的锁标志位，获知对象的锁状态，然后决定是获取锁还是进入阻塞状态。synchronized正是通过这个机制实现对共享资源的串行访问。

什么是ThreadLocal

关于ThreadLocal的概念，直接从ThreadLocal源码注释入手。

This class provides thread-local variables. These variables differ from their normal counterparts in that each thread that accesses one (via its get or set method) has its own, independently initialized copy of the variable. ThreadLocal instances are typically private static fields in classes that wish to associate state with a thread (e.g., a user ID or Transaction ID).

根据注释，我们认识到ThreadLocal可以为线程提供一个线程局部的值，既然该值是一个线程的局部变量，自然不存在线程同步的问题。但是注释又说到：ThreadLocal instances are typically private static fields in classes，这句话如何理解？如果一个变量是static的变量，那么它就是进程级别的全局变量，那不是意味着ThreadLocal是一个线程共享的变量吗？为了解决这个问题，我们需要阅读ThreadLocal的源码。

首先是ThreadLocal的set方法，set方法的作用是为当前线程设置一个ThreadLocal的值value，源码如下。

    public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
    }

    ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }

    void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocalMap(this, firstValue);
    }

我们可以看到，set方法首先调用getMap方法从当前线程获取类型为ThreadLocalMap的对象map，如果map还没有创建，就通过createMap方法创建一个。然后set方法以当前的ThreadLocal对象为键，value为值，存储到当前线程的ThreadLocalMap对象中。Thread类中ThreadLocalMap变量的声明如下。

    /* ThreadLocal values pertaining to this thread. This map is maintained
     * by the ThreadLocal class. */
    ThreadLocal.ThreadLocalMap threadLocals = null;

ThreadLocal的get方法用于获取与当前线程关联的ThreadLocal值，源码如下。

    public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null)
                return (T)e.value;
        }
        return setInitialValue();
    }

get方法首先通过getMap方法获取当前线程的ThreadLocalMap对象，然后以ThreadLocal对象为键获取与该ThreadLocal对象关联的值。

从这两个方法我们知道，ThreadLocal对象的确是线程共享的，但是当线程向ThreadLocal设置值时，实际上是给当前线程维护的ThreadLocalMap设置了值。因此线程设置的值为线程私有，但是ThreadLocal对象为线程共享。

为什么这么设计

如果我们要设置线程本地的变量，我们只需要在方法内声明局部变量即可，为什么要通过ThreadLocal来设置？对于ThreadLocal的设计理念，我们通过Linux/Unix的C程序库libc的全局变量errno来理解。当系统调用从内核空间返回用户空间时，如果系统调用出错，那么便设置errno的值为一个负值，这样就不需要每次在函数内部定义局部变量。但是当多线程的概念和技术被提出后，这套机制就不再适用了，可以使用局部变量，但是不太可能去更改已有的代码了，比较好的解决方案是让每个线程都有自己的errno。实际上，现在的C库函数不是把出错代码写入全局量errno，而是通过一个函数__errno_location()获取一个地址，再把出错代码写入该地址，其意图就是让不同的线程使用不同的出错代码存储地点，而errno，现在一般已经变成了一个宏定义。

#define errno (*__errno_location())

考虑另一个场景：我们现在需要设置一个线程局部变量，于是我们在方法内设置了一个局部变量，当我们需要把这个局部变量从一个方法传递到另一个方法，只需要将这个变量作为参数传递即可。假设funcA需要访问该变量，funcZ也需要访问该变量，但是funcA需要通过调用funcB，funcC...funcY才能调用funcZ，于是该变量需要被声明在所有的方法的签名中。为了避免这个麻烦，我们可以把这个变量设置为进程级别的全局变量，但是此时就需要我们控制线程同步了。于是，ThreadLocal就可以发挥作用了。

我们可以认为ThreadLocal存储了一个线程的上下文信息，线程通过访问ThreadLocal这个进程级别的变量实现了线程级别的访问。