Java并发包2--ThreadLocal的使用及原理浅析

ThreadLocal 是本地线程变量，是一个以ThreadLocal对象为key，任意对象为value的存储结构。

一、使用案例

1.定义线程类MyThread，代码如下：

 1 public class MyThread extends Thread{
 2 
 3     private User user;
 4 
 5     public MyThread(User user){
 6         this.user = user;
 7     }
 8 
 9     public void run() {
10         System.out.println("线程:"+Thread.currentThread().getName()+"设置ThreadLocal的user="+user.getUserName());
11         ThreadLocalTest.LOCAL.set(user);
12         try {
13             Thread.sleep(2000L);
14         } catch (InterruptedException e) {
15             e.printStackTrace();
16         }
17         User user =  ThreadLocalTest.LOCAL.get();
18        System.out.println("线程:"+Thread.currentThread().getName()+"从ThreadLocal获取的user="+user.getUserName());
19     }
20 }

2.测试方法Main方法

 1 public class ThreadLocalTest {
 2 
 3     //全局ThraedLocal变量
 4     public static ThreadLocal<User> LOCAL = new ThreadLocal<User>();
 5 
 6     public static void main(String[] args){
 7         User user1 = new User();
 8         user1.setUserName("Jack");
 9         User user2 = new User();
10         user2.setUserName("Bob");
11 
12         //定义两个线程变量
13         Thread t1 = new MyThread(user1);
14         Thread t2 = new MyThread(user2);
15         t1.start();
16         t2.start();
17 
18         //从ThreadLocal变量中获取数据
19         User user = LOCAL.get();
20         System.out.println(user==null);//当前线程为Main线程，而Main线程没有设置过TheadLocal的值，所以获取不到
21         LOCAL.set(user2);
22         System.out.println(LOCAL.get().getUserName());//从Main线程设置ThreadLocal，则可以获取
23     }
24 }

定义两个线程，线程的run方法执行了ThreadLocal变量的set操作，然后再执行get操作，可以获取到本线程设置的值

而直接从Main线程中执行ThreadLocal的get方法，返回的数据为null，只有在自己的线程中执行了set操作，才可以获取到值，

上例的执行结果如下：

1 true
2 Bob
3 线程:Thread-0设置ThreadLocal的user=Jack
4 线程:Thread-1设置ThreadLocal的user=Bob
5 线程:Thread-0从ThreadLocal获取的user=Jack
6 线程:Thread-1从ThreadLocal获取的user=Bob

二、源码解析

ThreadLocal主要有三个方法，

set (T value) 给ThreadLocal变量设置数据，ThreadLocal会存储当前线程存储的值

get ( ) 返回ThreadLocal当前线程设置的值

remove（）删除当前线程设置的ThreadLocal的值

2.1、set方法解析

源码如下：

 1 public void set(T value) {
 2         // 获取当前线程
 3         Thread t = Thread.currentThread();
 4         // 获取当前线程的ThreadLocalMap
 5         ThreadLocalMap map = getMap(t);
 6         if (map != null)
 7             // 如果当前线程的ThreadLocalMap存在，则直接将当前的value设置到map中，map的key就是当前的ThreadLocal对象
 8             map.set(this, value);
 9         else
10             // 如果当前线程的ThreadLocalMap不存在，则先创建ThreadLocalMap，则进行赋值
11             createMap(t, value);
12     }

首先是通过getMap (Thread t) 方法获取当前线程的ThreadLocalMap对象，代码如下：

1  ThreadLocalMap getMap(Thread t) {
2         return t.threadLocals;
3     }

每个线程Thread对象内部都有一个ThreadLocalMap对象threadLocals

1 ThreadLocal.ThreadLocalMap threadLocals = null; //Thread类中持有一个ThreadLocalMap对象

如果当前线程的ThreadLocalMap不存在，则只需createMap方法初始化，代码如下：

1 void createMap(Thread t, T firstValue) {
2         t.threadLocals = new ThreadLocalMap(this, firstValue);
3     }

直接初始化一个ThreadLocalMap，然后赋值给Thread的threadLocals对象

可以发现ThreadLocal的set方法逻辑其实很简单，就是获取一个ThreadLocalMap对象，然后将需要set的值保存在ThreadLocalMap中

ThreadLocalMap是ThreadLocal的一个内部类，如下：

static class ThreadLocalMap {
        static class Entry extends WeakReference<ThreadLocal<?>> {
           
            Object value;

            Entry(ThreadLocal<?> k, Object v) {
                super(k);
                value = v;
            }
        }

    }

ThreadLocal的set方法实际是执行了ThreadLocalMap的set方法

 1 private void set(ThreadLocal<?> key, Object value) {
 2 
 3             // We don't use a fast path as with get() because it is at
 4             // least as common to use set() to create new entries as
 5             // it is to replace existing ones, in which case, a fast
 6             // path would fail more often than not.
 7 
 8             Entry[] tab = table;
 9             int len = tab.length;
10             int i = key.threadLocalHashCode & (len-1);
11 
12             for (Entry e = tab[i];
13                  e != null;
14                  e = tab[i = nextIndex(i, len)]) {
15                 ThreadLocal<?> k = e.get();
16 
17                 if (k == key) {
18                     e.value = value;
19                     return;
20                 }
21 
22                 if (k == null) {
23                     replaceStaleEntry(key, value, i);
24                     return;
25                 }
26             }
27 
28             tab[i] = new Entry(key, value);
29             int sz = ++size;
30             if (!cleanSomeSlots(i, sz) && sz >= threshold)
31                 rehash();
32         }

可以发现是ThreadLocalMap是将当前的ThreadLocal当做一个key，需要存储的对象为value，存储在ThreadLocalMap内部的Entry数组中。

ThreadLocalMap也会存储hash冲突的问题，只是解决冲突的方式比较简单，指定尝试获取下一个位置用于存放，直到能够放入位置（ThreadLocal不建议一个线程有太多ThreadLocal，所以没必要花费大力气解决冲突问题）

同理既然ThreadLocal的set方法是执行了ThreadLocalMap的set方法，那么可以猜想ThreadLocal的get方法也是执行了ThreadLocalMap的get方法。

如下：

 1 public T get() {
 2         Thread t = Thread.currentThread();
 3         ThreadLocalMap map = getMap(t);
 4         if (map != null) {
 5             ThreadLocalMap.Entry e = map.getEntry(this);
 6             if (e != null) {
 7                 @SuppressWarnings("unchecked")
 8                 T result = (T)e.value;
 9                 return result;
10             }
11         }
12         return setInitialValue();
13     }

ThreadLocalMap的getEntry方法如下：

1  private Entry getEntry(ThreadLocal<?> key) {
2             int i = key.threadLocalHashCode & (table.length - 1);
3             Entry e = table[i];
4             if (e != null && e.get() == key)
5                 return e;
6             else
7                 return getEntryAfterMiss(key, i, e);
8         }

为什么ThreadLocalMap是采用数组存储的呢？因为ThreadLocalMap是和Thread绑定的，一个Thread只有一个ThreadLocalMap对象，但是每个Thread可以存储多个ThreadLocal对象

所以ThreadLocalMap中的数组就是存储了多个ThreadLocal对象，数组的下标是通过 threadLocal对象的hashCode和数组长度进行取模算法得到的数组下标值。

分析到这里可以总结出ThreadLocal的原理：

每个线程Thread 内部有一个 ThreadLocalMap对象，每个ThreadLocalMap 存储了多个以 ThreadLocal对象为key，存储的数据为value的值。ThreadLocalMap内部采用数组存储ThreadLocal的值

通过ThreadLocal的hashCode和数组长度进行取模算法得到数组的下标位置，在指定的位置存储ThreadLocal的值。

分析到这里涉及到的对象包含了 Thread、ThreadLocal 和 ThreadLocalMap，这三者的关系为：

Thread 内部有一个 ThreadLocalMap对象实例

ThreadLocalMap 是 ThreadLocal的一个内部类

ThreadLocalMap 存储的是以 ThreadLocal 为key，ThreadLocal的值为value 的结构

光靠文字不好理解，使用图形的话很更直观，以上面的代码为例，三者关系如下图示：

每个Thread中的ThreadLocalMap可以存储多个ThreadLocal的值，但是同一个ThreadLocal变量在同一个Thread中只能保存一个值，后面set的值会把前面set的值覆盖。

如果需要保存多个值就需要使用多个ThreadLocal来存储

三、ThreadLocal内存泄露浅析

ThreadLocal很好的解决了线程之间数据隔离，但是大量的ThreadLocal在大量的线程中就有了空间的问题，内存中存储的ThreadLocal值的个数等于 ThreadLocal变量个数 * 线程个数，显然随着线程的变多，ThreadLocal占据的空间也是不容小觑的。

所以使用ThreadLocal的时候就需要做到不用对时候及时回收，防止没有被回收导致内存泄露问题。如下图示：

栈中有一个ThreadLocal的变量和一个Thread的变量分别强引用堆中对应的实例，堆中的ThreadLocalMap实例也是被Thread变量引用

ThreadLocalMap又持有 Entry实例的强引用，而Entry分别持有key的弱引用，value的强引用，key是 ThreadLocal实例，value是实际存的数据

上图中实现表示强引用，虚线表示弱引用。

当ThreadLocal 不用的时候，ThreadLocal变量会被回收，此时ThreadLocal 变量和ThreadLocal实例的强引用断开，但是此时ThreadLocal实例还不能够被回收，引用还有 Entry的key对ThreadLocal实例持有着弱引用

所以当下一次执行GC的时候，ThreadLocal实例就会被回收，因为GC的时候会直接回收弱引用实例。此时Entry的key已经被回收了，所以Entry就变成了<null, value >的结构，这就会导致这个value是无法被获取了。

如果这个Thread 一直活跃，那么Thread 强引用 ThreadLocalMap；ThreadLocalMap强引用Entry，Entry强引用value就都不能被回收，所以一旦ThreadLocal被回收，而Thread还继续工作的话，就会导致value无法被访问，

从而就造成了内存泄露问题。

既然Entry的 key是弱引用，那么为什么value不是弱引用呢？

如果value是弱引用的话，那么在GC的时候就会被回收，而ThreadLocal除了有弱引用，还有一个强引用，所以在GC的时候ThreadLocal并不会被强制回收，而value会被回收，就会出现通过 key无法获取到数据的情况，

如果GC频繁，那么ThreadLocal的get方法就会频繁获取不到数据，那么这样的ThreadLocal还有什么意义呢？

所以ThreadLocalMap的实现仅仅将key作为了弱引用，value不会出现弱引用，这样虽然有内存泄露问题，但是至少可以保证只要 ThreadLocal 还在存活状态，就可以获取到value，显然是高可用的。

那么既然有内存泄露问题，ThreadLocal就不管了么？显然不可能！

ThreadLocal的get方法、set方法、remove方法的内部都做了判断，如果存储key=null都情况，就将value设置为null，一旦value设置为null之后，那么就将value和实际的数据之前的强引用断开了，那么数据在GC的时候就会被回收

但是这样的设计就导致ThreadLocal 如果再也不会执行get、set 或 remove方法了，那么还是会存在内存泄露问题，所以在使用的时候需要养成好习惯，当不用ThreadLocal的时候，手动执行remove方法回收数据。