一、基本概念 1、线程就是进程的进程路线,它是进程内部的控制序列,或者说它是进程的一部分(进程是一个资源单位,线程是的一部分负责真正的执行)。 2、线程是轻量级的,没有自己独立的代码段、数据段、bss段、堆、环境变量、命令行参数、文件描述符、信号处理函数、当前目录等资源。 3、线程有自己独立的栈内存、线程ID、错误码、信号掩码等。 4、一个进程中可以包含多个线程(多个执行路线),但至少有一个,这个线程要主线程,//默认情况下主线程结束其它线程会跟着一起结束。 5、ps -T -p 或者使用htop命令查看线程 6、线程是进程的实体,可作为系统独立的任务高度和分派基本单位。 7、线程有不同状态,系统提供了线程的控制接口,如:创建、销毁、控制等。 8、进程中的所有线程都在同一个地址空间,进程中的所有资源对于线程来说都是共享的,因此多个线程协同工作需要解决资源竞争的问题(同步)。 9、线程的系统开销小,任务切换快,多个线程之间不需要数据交换,也就不需要类似IPC的通信机制,因此使用线程简单面高效。 10、线程之间有优先级的差异。
二、POSIX线程 1、早期的UNIX和Linux系统是没有线程概念的,微软的Windows系统首先使用的线程,之后UNIX和Linux系统也逐渐增加了线程。 2、早期各个厂商提供私有的线程库,但接口和实现差异比较大,不易于移植,在1995年IEEE POSIX 1003.1c标准,定义了统一的线程接口,遵循该标准的线程实现方式被统称为POSIX线程,即pthread。 3、pthread线程包含一个头文件pthread.h和一个共享库libpthread.so。
三、线程管理 int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine) (void *), void *arg); 功能:创建线程 thread:输出型参数,用于获取线程ID, attr:线程属性,一般写NULL即可。 start_routine:线程的入口函数 注意:入口函数的参数和返回值要确保它们的持久化。 arg:传递给入口函数的参数 返回值:成功返回0,失败返回错误编码。
int pthread_join(pthread_t thread, void **retval); 功能:等待线程结束,并获取线程结束时的返回值(释放线程资源)。 thread:要等待的线程和ID retval:用于存储线程结束时的指针的地址 返回值:成功返回0,失败返回错误编码。 pthread_t pthread_self(void); 功能:获取当前线程的ID int pthread_equal(pthread_t t1, pthread_t t2); 功能:判断两个线程ID是否相等。 注意:部分系统的线程ID是以结构实现的,因此不能直接使用==运算符。四、线程的执行轨迹 同步方式:(非分离状态) 创建子线程后,主线程调用pthread_join函数等待子线程终止,并释放线程资源。 异步方式:(分享状态) 无需创建者等待(创建者调用pthread_join函数会立即返回),线程终止后自行释放资源。
int pthread_detach(pthread_t thread); 功能:使用thread所标识的线程与创建者线程分离。五、线程的终止 1、线程执行完后入口函数的最后一行代码。 2、线程调用pthread_exit函数。 void pthread_exit(void *retval); 注意:主线程结束并不会影响子线程的运行。 功能:结束当前结束并返回参数retval返回给pthread_join函数。 3、如果进程结束,那么所有的进程中的所有线程就都会结束。 任何线程调用exit系列函数会导致进程结束,所有的线程一起结束。 主函数中执行return val,所有结束一起结束; 4、向指定的线程发出取消请求。 int pthread_cancel(pthread_t thread); 功能:向指定的线程发出取消请求,默认情况下线程会响应。
int pthread_setcancelstate(int state, int *oldstate); 功能:设置线程是不响应取消请求,并获取之前的状态。 PTHREAD_CANCEL_ENABLE 允许响应 PTHREAD_CANCEL_DISABLE 禁止响应 int pthread_setcanceltype(int type, int *oldtype); PTHREAD_CANCEL_DEFERRED:延迟响应,在接收到取消文请求后不立即响应,而等到合适的时间再响应。 PTHREAD_CANCEL_ASYNCHRONOUS:立即响应,被取消的线程在接收取消请求后立即响应。六、线程属性 int pthread_attr_init(pthread_attr_t *attr); 功能:初始化线程属性结构体,必须使用此函数(成员中有使用到堆内存)。
int pthread_attr_destroy(pthread_attr_t *attr); 功能:销毁线程属性结构 int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate); 功能:设置线程的分离状态属性 int pthread_attr_getdetachstate(pthread_attr_t *attr, int *detachstate); 功能:获取线程的分离状态属性 int pthread_attr_setscope(pthread_attr_t *attr, int scope); 功能:设置线程的竞争范围属性 int pthread_attr_getscope(pthread_attr_t *attr, int *scope); 功能:获取线程的竞争范围属性 PTHREAD_SCOPE_SYSTEM 在系统范围内与其它线程竞争 PTHREAD_SCOPE_PROCESS 在进程内与其它线程竞争 int pthread_attr_setstackaddr(pthread_attr_t *attr, void *stackaddr); 功能:设置线程的栈内存地址 int pthread_attr_getstackaddr(pthread_attr_t *attr, void **stackaddr); 功能:获取线程的栈内存地址 int pthread_attr_setstacksize(pthread_attr_t *attr, size_t stacksize); 功能:设置线程栈内存的大小 int pthread_attr_getstacksize(pthread_attr_t *attr, size_t *stacksize); 功能:获取线程栈内存的大小 int pthread_attr_setguardsize(pthread_attr_t *attr, size_t guardsize); 功能:设置栈尾的警戒区大小 int pthread_attr_getguardsize(pthread_attr_t *attr, size_t *guardsize); 功能:获取栈尾的警戒区大小 int pthread_attr_setstack(pthread_attr_t *attr,void *stackaddr, size_t stacksize); 功能:设置线程的栈内存地址和栈内存大小 int pthread_attr_getstack(pthread_attr_t *attr,void **stackaddr, size_t *stacksize); 功能:获取线程的栈内存地址和栈内存大小 int pthread_attr_setschedpolicy(pthread_attr_t *attr, int policy); 功能:设置线程的调试策略 SCHED_FIFO 先进入先出策略 SCHED_RR 轮转策略 给每个线程分配时间片,一旦线程的时间片耗尽,系统移动到下一线程。 SCHED_OTHER 普通策略 优先级最低,任何就绪状态的FIFO、RR线程都会抢占此类线程。 int pthread_attr_getschedpolicy(pthread_attr_t *attr, int *policy); int pthread_attr_setschedparam(pthread_attr_t *attr,const struct sched_param *param); 功能:设置线程的调试参数 struct sched_param { int sched_priority; 线程的优先级,数值越大级别越高。 }; int pthread_attr_getschedparam(pthread_attr_t *attr,struct sched_param *param) 功能:获取线程的调试参数 int pthread_attr_setinheritsched(pthread_attr_t *attr,int inheritsched); 功能:设置线程的继承属性 PTHREAD_INHERIT_SCHED,新线程继承创建者的相关属性,但忽略调度属性。 PTHREAD_EXPLICIT_SCHED,新线程使用attr参数作为其属性。 int pthread_attr_getinheritsched(pthread_attr_t *attr,int *inheritsched); 功能:获取线程的继承属性 int pthread_attr_setaffinity_np(pthread_attr_t *attr,size_t cpusetsize, const cpu_set_t *cpuset); 功能:指定线程在哪些CPU的核上运行。 int pthread_attr_getaffinity_np(pthread_attr_t *attr,size_t cpusetsize, cpu_set_t *cpuset); 获取:线程在哪些CPU的核上运行。七、基本概念 竞争与同步: 同一个进程中的线程能共享进程中的绝大多数资源,当它们随意竞争时可以导致资源会破坏、脏数据、不完整、不一致等问题。 通过一些方法让进程在竞争资源时相互协调,避免出现数据不完全、不一致等问题,这就叫线程同步。 临界区与临界资源: 被多个线程同时访问的代码叫临界区,被同时访问的资源叫临界资源。 原子操作:中间不会打断的操作叫原子操作。 八、互斥量(互斥锁) pthread_mutex_t 是一种数据类型,可以定义变量。
int pthread_mutex_init(pthread_mutex_t *mutex, const pthread_mutexattr_t *mutexattr); 功能:初始化互斥量,也可以使用PTHREAD_MUTEX_INITIALIZER初始化,默认处于开锁状态。 int pthread_mutex_lock(pthread_mutex_t *mutex); 功能:对互斥量加锁,成功则继续执行,失败则阻塞,直到互斥量解锁,才返回。 int pthread_mutex_trylock(pthread_mutex_t *mutex); 功能:尝试对互斥量加锁,成功(0)或失败(EBUSY)都立即返回。 int pthread_mutex_unlock(pthread_mutex_t *mutex); 功能:对互斥量解锁 int pthread_mutex_destroy(pthread_mutex_t *mutex); 功能:销毁互斥量九、信号量 与XSI中的信号量原理相同,线程之间所使用的计数器,用于控制访问有限的共享资源的线程数。
int sem_init(sem_t *sem, int pshared, unsigned int value); 功能:初始化信号量 sem:被初始化的信号量 pshared: 0 只能在进程内使用 非0 表示该信号量可以用共享内存的方式,多个进程共享(Linux不支持)。 value:信号量的初始值 int sem_wait(sem_t *sem); 功能:对号量减1,如果不够减则阻塞 int sem_trywait(sem_t *sem); 功能:对信号量减1,成功(0)或失败(EAGAIN)都立即返回 int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout); 功能:对信号量减,如果不够减则等待abs_timeout时间,超时后返回(ETIMEDOUT)。 int sem_post(sem_t *sem); 功能:对信号量加1。 int sem_destroy(sem_t *sem); 功能:销毁信号量十:死锁 1、什么是死锁 多个进程或线程互相等待对方的资源,在得到新的资源之前不会释放自己的资源,这样就形成了循环等待,这种现象被称为死锁。 2、产生死锁的四大必要条件 资源互斥:资源只有两种状态,只有可用和不可用两状态,不能同时使用,同一时刻只能被一个进程或线程使用。 占有且请求:已经得到资源的进程或线程,继续请求新的资源,并持续占有旧的资源。 资源不可剥夺:资源已经分配进程或线程后,不能被其它进程或线程强制性获取,除非资源的占有者主动释放。 环路等待:死锁发生时,系统中必定有两个或两个以上的进程或线程组成一条等待环路。 注意:死锁一旦产生基本无解,现在的操作系统无法解决死锁,因此只能防止死锁产生。 3、防止死锁产生的方法 破坏互斥条件:相办法让资源能够共享使用。 缺点:受环境或资金的影响无法让资源共享。 破坏占用且请求条件:采用预先静态分配的方法,进程或线程在运行前一次申请所有资源,在资源没有满足前不投入运行。 缺点:系统资源会被严重浪费,因为有些资源可能开始时使用,而有些资源结束时才使用。 破坏不可剥夺条件:当一个进程或线程已经占有一个不可剥夺的资源时,请求新资源时无法满足,则释放已经占有的资源,一段时间后再重新申请。 缺点:该策略实现起来比较复杂,释放已经获取资源可能会导致前一阶段的工作失效,反复的申请释放资源会增加系统开销,占用CPU和寄存器、内存等资源。 破坏循环等待条件:给每个资源进行编号,进程或线程按照顺序请求资源,只有拿到前一外资源,才能继续请求下一个资源。 缺点:资源的编号必须相对稳定,资源添加或销毁时会受到影响。 算法:银行家算法 4、如何判断死锁 1、画出资源分配图 2、简化资源分配图 3、使用死锁定理判断:如果没有环路肯定不会出现死锁。 十一、条件变量 当某些条件满足时可以让线程自己可以进入睡眠,也可以在某些条件满足时可以被其它线程唤醒。
int pthread_cond_init(pthread_cond_t *cond, pthread_condattr_t*cond_attr); 功能:初始化条件变量,也可以使用PTHREAD_COND_INITIALIZER。 int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex); 功能:让当前线程睡入cond中,并解锁mutex。 int pthread_cond_signal(pthread_cond_t *cond); 功能:唤醒cond中的一个线程,之前的锁必须处于打开状态,线程醒来后会自动把锁再加上。 int pthread_cond_broadcast(pthread_cond_t *cond); 功能:唤醒cond中的所有线程,线程醒来时互斥量必须能再次加锁。 int pthread_cond_timedwait(pthread_cond_t *cond, pthread_mutex_t *mutex, const struct timespec *abstime); 功能:让当前线程睡入cond,只睡abstime时间,超时后会自动醒来。 int pthread_cond_destroy(pthread_cond_t *cond); 功能:销毁条件变量 注意:使用条件变量可以实现生产者与消费者模型。十二、生产者与消费者模型 生产者:产生数据的线程 消费者:使用数据的线程 仓库:临时存储数据的缓冲区
可能产生的问题: 生产快于消费,仓库爆满,撑死。 消费快于生产,仓库空虚,饿死。 利用条件变量解决问题: 当缓冲区满的时候,生产线程睡入条件变量(full),通知消费线程全部醒来(null)。 当缓冲区空的时候,消费线程睡入条件变量(null),通信生产线程全部醒来(full)。