这里回头再总结下ThreadLocal实现原理,并归纳学习工作中看到的ThreadLocal相关的应用场景(框架源码中很常见)。
目录:
-
ThreadLocal
- SuppliedThreadLocal
- ThreadLocalMap
- ThreadLocal如何借助弱引用解决内存泄漏问题
- ThreadLocal使用注意事项
-
InheritableThreadLocal
-
ThreadLocal在源码中的应用
-
JDK
- ThreadLocalRandom并发高性能随机数生成器
-
spring-tx +
-
Netty
- FastThreadLocal (还改进了)
-
日志
- 链路追踪
-
...
-
-
工作中的使用
-
拓展传参
-
Web会话共享
-
使用ThreadLocal解决SimpleDateFormat线程安全问题
-
关于ThreadLocal的官方描述:
ThreadLocal instances are typically private static fields in classes that wish to associate state with a thread (e.g., a user ID or Transaction ID).
即:ThreadLocal实例通常是希望将状态与线程相关联(例如,用户ID或事务ID)的类中的私有静态字段。
结合后面的原理,基本就已经说明了ThreadLocal应该怎么使用(代码怎么写)?如:
//参考SimplestExample.java public class TLHolder { //TLHolder可能不是单独一个类而是跟业务放在一起 //私有静态字段(为何定义成私有静态主要取决于应用场景,但不是强制) private static final ThreadLocal<Integer> tc = ThreadLocal.withInitial(() -> 0); ...定义public的读写清除等方法... }包括后面各种框架源码中的基本都是这么用的。TODO
核心原理:
Thread对象内部维持了一个ThreadLocalMap(是个哈希桶[数组]),key是TLHolder.tc实例(即代码中声明的ThreadLocal对象),通过它的哈希码&桶容量求得的索引(TLHolder.tc相当于一个门面,绑定到线程内部的ThreadLocalMap),value是线程独享的变量(存储在ThreadLocalMap.Entry类型的value字段)。向ThreadLocal中存取数据时接口方法会隐式获取当前线程实例,再获取当前线程实例的ThreadLocalMap,再结合门面的hashcode&桶容量求的索引值进而获取当前线程中与门面绑定的要操作的独享变量对应引用,最终进行读写。
//Thread.java
ThreadLocal.ThreadLocalMap threadLocals = null;
void createMap(Thread t, T firstValue) {
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
//ThreadLocal.java
class Entry extends WeakReference<ThreadLocal<?>>
核心原理很简单,但是还有一些重要细节:
比如:
-
怎么解决hash冲突的?
和HashMap不同(拉链法),ThreadLocal用的线性探测(又叫开放地址法)的方法。
-
为何Thread的threadLocalHashCode计算时的增量是0x61c88647?
private final int threadLocalHashCode = nextHashCode(); private static int nextHashCode() { return nextHashCode.getAndAdd(HASH_INCREMENT); } private static AtomicInteger nextHashCode = new AtomicInteger(); private static final int HASH_INCREMENT = 0x61c88647;
有资料说这个值和斐波那契散列有关(这是一种乘数散列法,只不过这个乘数比较特殊,是32位整型上限2^32-1乘以黄金分割比例0.618…的值2654435769,用有符号整型表示就是-1640531527,去掉符号后16进制表示为0x61c88647),其主要目的就是为了让哈希码能均匀的分布在2的n次方的数组里, 也就是Entry[] table中,这样做可以尽量避免hash冲突。
什么数学原理?
-
Entry为何定义为弱引用?
见后文分析。
覆写了initialValue()方法,通过函数式对象Supplier初始化初始值。
是一个哈希桶,初始容量是16。
Entry是ThreadLocal类型的弱引用(下次GC时会被回收)。
static class ThreadLocalMap {
static class Entry extends WeakReference<ThreadLocal<?>> {
/** The value associated with this ThreadLocal. */
Object value;
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
}
private static final int INITIAL_CAPACITY = 16;
private Entry[] table;
...
}
先看下ThreadLocal.remove()方法。先获取当前线程实例,然后获取threadLocal对应到线程内部ThreadLocalMap的位置,如下
//ThreadLocalMap.java
private void remove(ThreadLocal<?> key) {
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1); //初始索引
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) { //线性探测寻址
if (e.get() == key) { //比较key,e.get()获取的是软引用内部的referent
e.clear(); //将弱引用中的强引用释放
expungeStaleEntry(i); //后面的元素往前移,把刚空出的位置再填上
return;
}
}
}
//Reference.java 将弱引用中的强引用对象释放
public void clear() {
this.referent = null;
}
这里的内存泄露问题是指,ThreadLocal使用完后不手动 remove(),ThreadLocalMap Entry 会内存泄露(包括Key Value),每次使用完都调用 remove() 是不会内存泄露的。
!!!所以下面都是以不手动remove()为前提讨论为何ThreadLocal会内存泄露。
首先说下引用链:
ThreadRef -> Thread -> ThreadLocalMap -> Entry -> (Key / Value)。
这是一条强引用链。
ThreadLocal 为何会内存泄露?
先不考虑Entry Key 是软引用类型和 get() set() 的对象回收操作。
线上一般都是使用线程池管理线程,如果线程是核心线程的话,ThreadRef 会一直存在,进而 上面这条强引用链子会一直存在。即使业务代码中将 ThreadLocal 对象的强引用释放,因为这条强引用链的存在,依然不会回收任何对象;
为什么Entry中Key使用弱引用?
前面说了Key为强引用,只要线程还在 ThreadLocalMap Entry 的 Key Value 都不会被回收,通过设置 Key 为弱引用类型可以保证当业务代码中将 ThreadLocal 对象的强引用释放后,这里只剩弱引用对象,那么下次GC就会回收 ThreadLocal 对象;
即使用弱引用类型是保证当用户业务代码中没有ThreadLocal 的强引用后可以回收 ThreadLocalMap Entry 的 Key (ThreadLocal对象);
另外 ThreadLocal 中实现了调用 get() set() 方法会自动清除 ThreadLocalMap 中所有 Key 为 null 的数据,即读写时可以顺便回收过期的对象,缓解内存泄露对内存的占用。
remove() 则不管Key是否为 null 都会清除。
-
线程的ThreadLocal本地变量不用后都手动remove()下
尽管有软引用的存在下并不会出现什么大问题,但是万一建了很多ThreadLocal,只是释放了引用没调remove(),且后面也没有remove()等操作,这部分内存还是会一直占着空间。
-
小心线程复用(线程池)
使用ThreadLocal的业务处理需要在一个任务中执行完毕,不可以跨线程。
InheritableThreadLocal 支持在线程切换时传递父线程的上下文到子线程中。不能反向传递、一旦传递完成不再受到父线程修改影响,但是注意传递的过程不是线程安全的,具体参考ThreadLocalMap(ThreadLocalMap parentMap)
的源码,并没有并发控制。
InheritableThreadLocal 和 ThreadLocal 的主要区别是一个用的Thread的 inheritableThreadLocals,一个用的 threadLocals。主要就是多了个继承传递的操作,是在Thread中实现的,线程初始化时拷贝父线程inheritableThreadLocals,线程退出时清除。
private void init(ThreadGroup g, Runnable target, String name,
long stackSize, AccessControlContext acc,
boolean inheritThreadLocals) {
...
if (inheritThreadLocals && parent.inheritableThreadLocals != null)
//遍历父线程inheritableThreadLocals的值拷贝到自己的inheritableThreadLocals
this.inheritableThreadLocals =
ThreadLocal.createInheritedMap(parent.inheritableThreadLocals);
...
}
private void exit() {
...
inheritableThreadLocals = null;
...
}
InheritableThreadLocal传递时非线程安全。
比如线程 B C 分别先后继承线程A, 而A的InheritableThreadLocal值在期间不断变化,这就会导致B C 继承的值不同。
而 InheritableThreadLocal 使用场景一般应该保证这个传递的值是不可变的。
InheritableThreadLocal的一个经典的使用场景是链路追踪。
- FastThreadLocal (还改进了)
比如 SecurityContextHolder 中使用 ThreadLocal 保存以及传递认证信息。
- 链路追踪
-
线程级别实现Web会话共享
-
请求拓展传参
请求里面临时需要传递额外特殊的参数,但是不想改既有的参数类。
-
使用ThreadLocal解决SimpleDateFormat线程安全问题