一尘不染

Java为什么创建线程据说很昂贵?

java

创建线程很昂贵。但是为什么价格昂贵呢?当创建Java线程使创建过程变得昂贵时,究竟发生了什么?我认为该说法是正确的,但是我只是对JVM中的线程创建机制感兴趣。

线程生命周期开销。线程创建和拆除不是免费的。实际开销因平台而异,但是线程创建会花费时间,从而在请求处理中引入延迟,并且需要JVM和OS进行某些处理活动。如果请求是频繁且轻量的(如在大多数服务器应用程序中一样),则为每个请求创建一个新线程可能会消耗大量计算资源。


阅读 932

收藏
2020-03-02

共1个答案

一尘不染

Java线程的创建非常昂贵,因为其中涉及大量工作:

  • 必须为线程堆栈分配并初始化一大块内存。
  • 需要进行系统调用以在主机OS中创建/注册本机线程。
  • 需要创建,初始化描述符并将其添加到JVM内部数据结构中。
    从某种意义上说,只要线程处于活动状态,它就束缚资源,这也很昂贵;例如线程堆栈,可从堆栈访问的任何对象,JVM线程描述符,OS本机线程描述符。

所有这些东西的成本是特定于平台的,但是在我遇到过的任何Java平台上,它们都不便宜。

谷歌搜索发现我有一个旧的基准,该基准报告说,在运行2002老式Linux的2002老式双处理器Xeon上,在Sun Java 1.4.1上线程创建速率约为4000每秒。一个更现代的平台将提供更多的数据……而我无法评论该方法论……但至少,它为可能创建线程的成本提供了保证。

彼得·劳瑞(Peter Lawrey)的基准测试表明,从绝对意义上讲,如今的线程创建速度显着提高,但尚不清楚其中有多少是由于Java和/或操作系统的改进或更高的处理器速度所致。但是,如果你使用线程池,而不是每次都创建/启动一个新线程,那么他的数据仍然表明改进了150倍以上。(他指出这都是相对的…)

(以上假定“本地线程”而不是“绿色线程”,但是现代JVM出于性能原因都使用本地线程。绿色线程创建起来可能更便宜,但你可以在其他方面为此付出代价。)

我做了一些挖掘工作,以了解如何真正分配Java线程的堆栈。对于Linux上的OpenJDK 6,线程堆栈是通过调用分配给pthread_create创建本地线程的。(JVM不会传递pthread_create预分配的堆栈。)

然后,在pthread_create栈内通过调用分配mmap如下:

mmap(0, attr.__stacksize, 
     PROT_READ|PROT_WRITE|PROT_EXEC, 
     MAP_PRIVATE|MAP_ANONYMOUS, -1, 0)

|
根据man mmap,该MAP_ANONYMOUS标志使内存初始化为零。

因此,即使并非必须(根据JVM规范)将新的Java线程栈置零,但实际上(至少对于Linux上的OpenJDK 6)将它们置零。

2020-03-02