Linux NPTL线程栈与TLS原理探索

18 浏览量更新于2024-08-28 收藏 273KB PDF 举报

"Linux线程的线程栈与TLS详解" 在Linux系统中，线程的实现依赖于内核的支持，特别是在Linux NPTL (Native POSIX Thread Library) 中，线程被视为轻量级进程（LWP）。这篇描述主要关注的是线程栈和线程本地存储（TLS）的概念，这两个是每个线程独有的地址空间。线程栈：线程栈是每个线程执行时用于存放函数调用上下文的地方，包括局部变量、函数参数和返回地址。对于主线程或进程，它的栈是在创建进程（通过`fork`系统调用）时生成的。当父进程创建子进程时，子进程的栈是父进程栈的一个副本，使用写时拷贝（COW, Copy-On-Write）策略，并且可以动态增长。这意味着如果子进程试图修改其栈上的数据，操作系统才会为其分配独立的物理内存。这种增长是由内核中的`do_page_fault`处理程序完成的，它检查页表项的`VM_GROWSDOWN`标志来决定是否扩展栈的大小。然而，对于通过`pthread_create`等函数创建的子线程，它们的栈不是动态增长的。在NPTL中，子线程的栈是通过`mmap`系统调用预先分配的，且不具有`VM_GROWSDOWN`标志。这意味着子线程的栈大小在创建时就需要确定，无法像主线程那样动态扩展。线程本地存储（TLS）：线程本地存储是一种机制，允许每个线程拥有自己的、与其他线程隔离的数据存储区域。在Linux中，TLS通常用于存放线程特定的数据，如线程ID、信号屏蔽字等，确保这些数据不会被其他线程访问。在NPTL中，TLS是通过在每个线程的内核结构（`task_struct`）中维护一个TLS段来实现的。这个段在创建线程时分配，并通过特定的寻址方式（如x86架构中的`gs`段寄存器）进行访问。在glibc的实现中，TLS分配和初始化发生在`nptl/allocatestack.c`的`allocate_thread`函数中。每个线程的TLS区域包含了分配给线程的变量，这些变量仅对当前线程可见，即使在多线程环境中也能保持数据的隔离性。总结来说，Linux线程的线程栈和TLS是实现线程并行执行的关键组件。线程栈提供了每个线程执行代码的独立空间，而TLS则确保了线程间的数据隔离，两者共同构建了一个安全、高效的多线程环境。了解这些概念对于理解和优化Linux系统上的多线程程序至关重要。

关于关于Linux线程的线程栈以及线程的线程栈以及TLS

说明：

a.本文描述Linux NPTL的线程栈简要实现以及线程本地存储的原理，实验环境中Linux内核版本为2.6.32，glibc版本是

2.12.1，Linux发行版为ubuntu，硬件平台为x86的32位系统。

b.对于Linux NPTL线程，有很多话题。本文挑选了原则上是每线程私有的地址空间来讨论，分别是线程栈和TLS。原则山私有

并不是真的私有，因为大家都知道线程的特点就是共享地址空间，原则私有空间就是一般而言通过正常手段其它线程不会触及

这些空间的数据。

一.线程栈

虽然Linux将线程和进程不加区分的统一到了task_struct，但是对待其地址空间的stack还是有些区别的。对于Linux进程或者说

主线程，其stack是在fork的时候生成的，实际上就是复制了父亲的stack空间地址，然后写时拷贝(cow)以及动态增长，这可从

sys_fork调用do_fork的参数中看出来：

int sys_fork(struct pt_regs *regs)

{

return do_fork(SIGCHLD, regs->sp, regs, 0, NULL, NULL);

}

何谓动态增长呢？可以看到子进程初始的size为0，然后由于复制了父亲的sp以及稍后在dup_mm中复制的所有vma，因此子

进程stack的flags仍然包含：

#define VM_STACK_FLAGS (VM_GROWSDOWN | VM_STACK_DEFAULT_FLAGS | VM_ACCOUNT)

这就说针对带有这个flags的vma(stack也在一个vma中！)可以动态增加其大小了，这可从do_page_fault中看到：

if (likely(vma->vm_start <= address))

goto good_area;

if (unlikely(!(vma->vm_flags & VM_GROWSDOWN))) {

bad_area(regs, error_code, address);

return;

}

很清晰。

然而对于主线程生成的子线程而言，其stack将不再是这样的了，而是事先固定下来的，使用mmap系统调用，它不带有

VM_STACK_FLAGS 标记(估计以后的内核会支持！)。这个可以从glibc的nptl/allocatestack.c中的allocate_stack函数中看到：

mem = mmap (NULL, size, prot,

MAP_PRIVATE | MAP_ANONYMOUS | MAP_STACK, -1, 0);

此调用中的size参数的获取很是复杂，你可以手工传入stack的大小，也可以使用默认的，一般而言就是默认的。这些都不重

要，重要的是，这种stack不能动态增长，一旦用尽就没了，这是和生成进程的fork不同的地方。在glibc中通过mmap得到了

stack之后，底层将调用sys_clone系统调用：

int sys_clone(struct pt_regs *regs)

{

unsigned long clone_flags;

unsigned long newsp;

int __user *parent_tidptr, *child_tidptr;

clone_flags = regs->bx;

//获取了mmap得到的线程的stack指针

newsp = regs->cx;

parent_tidptr = (int __user *)regs->dx;

child_tidptr = (int __user *)regs->di;

if (!newsp)

newsp = regs->sp;

return do_fork(clone_flags, newsp, regs, 0, parent_tidptr, child_tidptr);

}

因此，对于子线程的stack，它其实是在进程的地址空间中map出来的一块内存区域，原则上是线程私有的，但是同一个进程

的所有线程生成的时候浅拷贝生成者的task_struct的很多字段，其中包括所有的vma，如果愿意，其它线程也还是可以访问到

的，于是一定要注意。

二.线程本地存储-TLS

Linux的glibc使用GS寄存器来访问TLS，也就是说，GS寄存器指示的段指向本线程的TEB(Windows的术语)，也就是TLS，这

么做有个好处，那就是可以高效的访问TLS里面存储的信息而不用一次次的调用系统调用，当然使用系统调用的方式也是可以

的。之所以可以这么做，是因为Intel对各个寄存器的作用的规范规定的比较松散，因此你可以拿GS，FS等段寄存器来做几乎

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38677306

粉丝: 4
资源: 916

Linux NPTL线程栈与TLS原理探索

Linux NPTL线程栈与TLS详解：内核2.6.32环境下的私有空间

Linux多线程编程入门指南

Linux多线程编程指南

Linux多线程编程手册,linux多线程编程手册pdf,C,C++

Linux多线程编程手册,linux多线程编程手册pdf,C,C++源码.zip

linux 多线程合集

linux多线程编程

linux多线程编程的例程

Linux多线程编程实战指南

Linux多线程编程实战详解

最新资源