Linux线程比较:LinuxThreads 和NPTL

LinuxThreads 项目最初将多线程的概念引入了 Linux?,但是 LinuxThreads 并不遵守 POSIX 线程标准 。尽管更新的 Native POSIX Thread Library(NPTL)库填补了一些空白,但是这仍然存在一些问题 。本文为那些需要将自己的应用程序从 LinuxThreads 移植到 NPTL 上或者只是希望理解有何区别的开发人员介绍这两种 Linux 线程模型之间的区别 。
当 Linux 最初开发时,在内核中并不能真正支持线程 。但是它的确可以通过 clone() 系统调用将进程作为可调度的实体 。这个调用创建了调用进程(calling process)的一个拷贝,这个拷贝与调用进程共享相同的地址空间 。LinuxThreads 项目使用这个调用来完全在用户空间模拟对线程的支持 。不幸的是,这种方法有一些缺点,尤其是在信号处理、调度和进程间同步原语方面都存在问题 。另外,这个线程模型也不符合 POSIX 的要求 。
要改进 LinuxThreads,非常明显我们需要内核的支持,并且需要重写线程库 。有两个相互竞争的项目开始来满足这些要求 。一个包括 IBM 的开发人员的团队开展了 NGPT(Next-Generation POSIX Threads)项目 。同时,Red Hat 的一些开发人员开展了 NPTL 项目 。NGPT 在 2003 年中期被放弃了,把这个领域完全留给了 NPTL 。
尽管从 LinuxThreads 到 NPTL 看起来似乎是一个必然的过程,但是如果您正在为一个历史悠久的 Linux 发行版维护一些应用程序,并且计划很快就要进行升级,那么如何迁移到 NPTL 上就会变成整个移植过程中重要的一个部分 。另外,我们可能会希望了解二者之间的区别,这样就可以对自己的应用程序进行设计,使其能够更好地利用这两种技术 。
本文详细介绍了这些线程模型分别是在哪些发行版上实现的 。
LinuxThreads 设计细节
线程 将应用程序划分成一个或多个同时运行的任务 。线程与传统的多任务进程 之间的区别在于:线程共享的是单个进程的状态信息,并会直接共享内存和其他资源 。同一个进程中线程之间的上下文切换通常要比进程之间的上下文切换速度更快 。因此,多线程程序的优点就是它可以比多进程应用程序的执行速度更快 。另外,使用线程我们可以实现并行处理 。这些相对于基于进程的方法所具有的优点推动了 LinuxThreads 的实现 。
LinuxThreads 最初的设计相信相关进程之间的上下文切换速度很快,因此每个内核线程足以处理很多相关的用户级线程 。这就导致了一对一 线程模型的革命 。
让我们来回顾一下 LinuxThreads 设计细节的一些基本理念:
LinuxThreads 非常出名的一个特性就是管理线程(manager thread) 。管理线程可以满足以下要求:
系统必须能够响应终止信号并杀死整个进程 。以堆栈形式使用的内存回收必须在线程完成之后进行 。因此,线程无法自行完成这个过程 。终止线程必须进行等待,这样它们才不会进入僵尸状态 。线程本地数据的回收需要对所有线程进行遍历;这必须由管理线程来进行 。如果主线程需要调用 pthread_exit(),那么这个线程就无法结束 。主线程要进入睡眠状态,而管理线程的工作就是在所有线程都被杀死之后来唤醒这个主线程 。
;为了维护线程本地数据和内存,LinuxThreads 使用了进程地址空间的高位内存(就在堆栈地址之下) 。
;原语的同步是使用信号 来实现的 。例如,线程会一直阻塞,直到被信号唤醒为止 。
;在克隆系统的最初设计之下,LinuxThreads 将每个线程都是作为一个具有惟一进程 ID 的进程实现的 。
;终止信号可以杀死所有的线程 。LinuxThreads 接收到终止信号之后,管理线程就会使用相同的信号杀死所有其他线程(进程) 。

推荐阅读