进程控制

进程标识

每个进程都有一个非负整型表示的唯一进程ID。

#include <unistd.h>
  pid_t getpid(void);
            //返回值：调用进程的进程ID
  pid_t getppid(void);
            //返回值：调用进程的父进程ID
  uid_t getuid(void);
            //返回值：调用进程的实际用户ID
  uid_t geteuid(void);
            //返回值：调用进程的有效用户ID
  gid_t getgid(void);
            //返回值：调用进程的实际组ID
  gid_t getegid(void);
            //返回值：调用进程的有效组ID

函数 fork

一个现有的进程可以调用 fork 函数创建一个新进程。

#include <unistd.h>
  pid_t fork(void);
            //返回值：子进程返回0，父进程返回子进程ID；若出错，返回-1

/*
  1. 由 fork 创建的新进程被称为子进程。fork 函数被调用一次，但返回两次。两次返回的区别是子进程的返回值是0，而父进程的返回值则是新建子进程的进程ID。
  2. 子进程获得父进程数据空间、堆和栈的副本。这是子进程所拥有的副本。父进程和子进程并不共享这些存储空间部分。
  3. 父进程和子进程共享正文段。
  4. 写时复制技术
    由于在 fork 之后经常跟随着 exec，所以现在的很多实现并不执行一个父进程数据段、栈和堆的完全副本。这些区域由父进程和子进程共享，而且内核将它们的访问权限改变为只读。如果父进程和子进程中的任一个试图修改这些区域，则内核只为修改区域的那块内存制作一个副本。
*/

//eg
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int globvar = 6;
char buf[] = "a write to stdout\n";

int main()
{
    int var;
    pid_t pid;

    var = 88;
    if (write(STDOUT_FILENO, buf, sizeof(buf) - 1) != sizeof(buf) - 1) {
        perror("write error");
        exit(EXIT_FAILURE);
    }
    printf("before fork \n");
    if ((pid = fork() < 0)) {
        perror("fork error");
        exit(EXIT_FAILURE);
    } else if (pid == 0) {
        globvar++;
        var++;
    } else {
        sleep(2);
    }
    printf("pid = %ld,glob = %d, var = %d\n", (long)getpid(), globvar, var);
    exit(EXIT_SUCCESS);
}
/*
  strlen 计算不包含终止 null 字节的字符串长度，而 sizeof 则计算包括终止 null 字节的缓冲区长度。
  两者之间另一个差别是，使用 strlen 需进行一次函数调用，而对于 sizeof 而言，因为缓冲区已用已知字符串进行初始化，其长度是固定的，所以 sizeof 是在编译时计算缓冲区长度。
*/
/*
  执行结果
    machunyudeMacBook-Pro:example machunyu$ gcc -o 8_3_fork 8_3_fork.c 
    machunyudeMacBook-Pro:example machunyu$ ./8_3_fork 
    a write to stdout
    before fork 
    pid = 1529,glob = 7, var = 89
    pid = 1530,glob = 7, var = 89
    machunyudeMacBook-Pro:example machunyu$ ./8_3_fork >> file
    machunyudeMacBook-Pro:example machunyu$ cat file
    a write to stdout
    before fork 
    pid = 1534,glob = 7, var = 89
    before fork 
    pid = 1535,glob = 7, var = 89
*/

printf 输出两次 ：在 fork 之前调用 printf 一次，但当调用 fork 时，该行数据仍在缓冲区中，然后在将父进程数据空间复制到子进程中时，改行缓冲区数据也被复制到子进程中，此时父进程和子进程各自有了带该行缓冲内容的缓冲区。当每个进程终止时，其缓冲区中的内容被写到相应文件中。（标准I/O库带缓冲，终端是行缓冲，其他是全缓冲）。

文件共享 ：重定向父进程的标准输出时，子进程的标准输出也被重定向。实际上，fork 的一个特性是父进程的所有打开文件描述符都被复制到子进程中。父进程和子进程每个相同的打开描述符共享一个文件表项。

在 fork 之后处理文件描述符有以下两种常见的情况。

父进程等待子进程完成。在这种情况下，父进程无需对其描述符做任何处理。当子进程终止后，它曾进行过读、写操作的任一共享描述符的文件偏移量已做了相应更新。
是父进程和子进程各自执行不同的程序段。在这种情况下，在 fork 之后，父进程和子进程各自关闭它们不需使用的文件描述符，这样就不会干扰对方使用的文件描述符。这种方法是网络服务器进程经常使用的。

fork 失败的两个主要原因是：

系统已经有了太多的进程。
该实际用户ID的进程总数超过了系统限制。

函数 wait 和 waitpid

调用 wait 或 waitpid 的进程可能发生的情况：

如果其所有子进程都还在运行，则阻塞。
如果一个子进程已终止，正等待父进程获取其终止状态，则取得该子进程的终止状态立即返回。
如果它没有任何子进程，则立即出错返回。

#include <sys/wait.h>
  pid_t wait(int *statloc);
  pid_t waitpid(pid_t pid, int *statloc, int options);
            //两个函数返回值：若成功，返回进程ID；若出错，返回0 或者 -1

/*
  区分
    1. 在一个子进程终止前，wait 使其调用者阻塞，而 waitpid 有一选项，可使调用者不阻塞。
    2. waitpid 并不等待在其调用之后的第一个终止子进程，它有若干个选项，可以控制它所等待的进程。

  statloc
    是一个整型指针。如果 statloc 不是一个空指针，则终止进程的终止状态就存放在它所指向的单元内。如果不关心终止状态，则可将该参数指定为空指针。
  waitpid 函数中的pid参数作用
    pid == -1 等待任一子进程。此种情况下，waitpid 与 wait 等效。
    pid > 0 等待进程 ID 与 pid 相等的子进程。
    pid == 0 等待组 ID 等于调用进程组ID的任一子进程。
    pid < -1 等待组 ID 等于pid的绝对值的任一子进程。
  
*/

//eg
#include <stdlib.h>
#include <stdio.h>
#include <sys/wait.h>
#include <unistd.h>

void pr_exit(int status)
{
    if (WIFEXITED(status)) {
        printf("normal termination, exit status = %d\n",WEXITSTATUS(status));
    } else if (WIFSIGNALED(status)) {
        printf("abnormal termination, signal number = %d%s\n",WTERMSIG(status),
        #ifdef WCOREDUMP
          WCOREDUMP(status) ? "(core file generated)" : "");
        #else
        "");
        #endif
    } else if (WIFSTOPPED(status)){
        printf("child stopped, signal number = %d\n",WSTOPSIG(status));
    }
}

int main()
{
    pid_t pid;
    int status;
    //正常终止
    if ((pid = fork()) < 0) {
        printf("fork error");
        exit(EXIT_FAILURE);
    } else if (pid == 0) {
        exit(7);
    }
    if (wait(&status) != pid) {
        printf("wait error");
        exit(EXIT_FAILURE);
    }
    pr_exit(status);
    //abort
    if ((pid = fork()) < 0) {
        printf("fork error");
        exit(EXIT_FAILURE);
    } else if (pid == 0) {
        abort();
    }
    if (wait(&status) != pid) {
        printf("wait error");
        exit(EXIT_FAILURE);
    }
    pr_exit(status);
    exit(0);
}

waitid

#include <sys/wait.h>
  int waitid(idtype_t idtype, id_t id, siginfo_t *infop, int options);
            //返回值：若成功，返回0；若出错，返回-1
  /*
    waitid 允许一个进程指定要等待的子进程，但它使用两个单独的参数表示要等待的子进程所属的类型，而不是将此与进程ID或进程组ID组合一个参数。id 参数的作用与 idtype 的值相关。
    idtype
      P_PID 等待一待定进程；id 包含要等待子进程的进程ID
      P_PGID 等待一特定进程组的任一子进程；id 包含要等待子进程的进程组ID。
      P_ALL 等待任一子进程；忽略ID。
    options
      WCONTINUED 等待一进程，它以前曾被停止，此后又已继续，但其状态尚未报告
      WEXITED 等待已退出的进程
      WNOHANG 如无可用的子进程退出状态，立即返回而非阻塞
      WNOWAIT 不破坏子进程退出状态，该子进程退出状态可由后续的 wait、waitid 和 waitpid 调用取得。
      WSTOPPED 等待一进程，它已经停止，但其状态尚未报告。
  */

函数 exec

#include <unistd.h>
  int execl(const char *pathname, const char *arg0, .../* (char *)0 */ );
  int execv(const char *pathname, char *const argv[]);
	int execle(const char *pathname, const char *arg0, .../* (char *)0, char *const envp[]*/);
  int execve(const char *pathname, char *const argv[], char *const envp[]);
  int execlp(const char *filename, const char *arg0, .../* (char *)0 */);
  int execvp(const char *filename, char *const argv[]);
  int fexecve(int fd, char *const argv[], char *const envp[]);
            //7个函数返回值；若出错，返回-1，若成功，不返回。

/*
  1. (char *)0 说明了最后一个命令行参数之后跟了一个空指针。如果用常量0来表示一个空指针，则必须将它强制转换为一个指针：否则它将被解释为整型参数。
  2. 函数 execl、execlp 和 execle 要求将新程序的每个命令行参数都说明为一个单独的参数。这种参数表以空指针结尾。
  3. 以 e 结尾的3个函数可以传递一个指向环境字符串指针数组的指针。其他4个函数则使用调用进程中的 environ 变量为新程序复制现有的环境。
  4. 在 exec 前后实际用户ID和实际组ID保持不变，而有效ID是否改变则取决于所执行程序文件的设置用户ID位和设置组ID位是否设置。如果新程序的设置用户ID位已设置，则有效用户ID变成程序文件所有者的ID；否则有效用户ID不变。对组ID的处理方式与此相同。
*/

//eg
  //execl
      execl("/bin/ls","ls","-al","/etc/passwd",(char *)0);
  //execv
      char *argv[] = {"ls","-al","/etc/passwd",(char *)0};
      execv("/bin/ls", argv);
  //execve
      char *argv[] = {"ls","-al","/etc/passwd",(char *)0};
      char *envp[] = {"PATH=/bin",(char *)0};
      execve("~/code/test", argv, envp);
  //execlp
      //执行ls -al /etc/passwd，execlp()会依PATH 变量中的/bin 找到/bin/ls
      execlp("ls","ls","-al","/etc/passwd",(char*)0);
  //execvp
      //execvp()会从PATH 环境变量所指的目录中查找符合参数file 的文件名, 找到后便执行该文件, 然后将第二个参数argv 传给该欲执行的文件。
      char *argv[] = {"ls","-al","/etc/passwd",(char *)0};
      execvp("ls",argv);

更改用户ID和更改组ID

设置实际用户ID和有效用户ID。

#include <unistd.h>
  int setuid(uid_t uid);
  int setgid(gid_t gid);
            //两个函数返回值：若成功，返回0；若出错，返回-1
  /*
    1. 若进程具有超级用户特权，则 setuid 函数将实际用户ID、有效用户ID以及保存的设置用户ID设置为 uid。
    2. 若进程没有超级用户特权，但是 uid 等于实际用户ID或保存的设置用户ID，则 setuid 只将有效用户ID设置为uid。不更改实际用户ID和保存的设置用户ID。
    3. 如果上面两个条件都不满足，则 errno 设置为 EPERM，并返回 -1
  */

#include <unistd.h>
  int setreuid(uid_t ruid, uid_t euid);
  int setregid(gid_t rgid, gid_t egid);
            //两个函数返回值：若成功，返回0；若出错，返回-1
  /*
   1. 交换实际用户ID和有效用户ID的值
   2. 一个非特权用户总能交换实际用户ID和有效用户ID。这就允许一个设置用户ID程序交换成用户的普通权限，以后又可再次交换回设置用户ID权限。
  */

#include <unistd.h>
  int seteuid(uid_t uid);
  int setegid(gid_t gid);
            //两个函数返回值：若成功，返回0；若出错，返回-1
  /*
    1. 只更改有效用户ID和有效组ID
    2. 一个非特权用户可将其有效用户ID设置为其实际用户ID或其保存的设置用户ID。
    3. 对于一个特权用户则可将有效用户ID设置为 uid。
  */

内核所维护的3个用户ID：

只有超级用户进程可以更改实际用户ID。通常，实际用户ID是在用户登录时，由 login 程序设置的，而且决不会改变它，因为 login 是一个超级用户进程，当它调用 setuid 时，设置所有3个用户ID。
仅当对程序文件设置了设置用户ID位时，exec 函数才设置有效用户ID。如果设置用户ID位没有设置，exec 函数不会改变有效用户ID，而将维持其现有值。任何时候都可以调用 setuid ，将有效用户ID设置为实际用户ID或保存的设置用户ID。
保存的设置用户ID是由 exec 复制有效用户ID而得到的。如果设置了文件的设置用户ID位，则在 exec 根据文件的用户ID设置了进程的有效用户ID以后，这个副本就被保存起来了。

函数 system

#include <stdlib.h>
  int system(const char *cmdstring);
  /*
    因为 system 在实现中调用了 fork、exec 和 waitpid，因此有3种返回值。
     1. fork 失败或者 waitpid 返回除 EINTR 之外的错误，则 system 返回-1，并且设置 errno 以指示错误类型。
     2. 如果 exec 失败（表示不能执行shell），则其返回值如果shell 执行了 exit(127) 一样。
     3. 否则所有3个函数（fork、exec和waitpid）都成功，那么system的返回值是 shell 的终止状态。
  */

用户标识

用 getlogin 函数可以获取登录名。

#include <unistd.h>
  char *getlogin(void);
            //返回值：若成功，返回指向登录名字符串的指针；若出错，返回 NULL。
/*
  给出了登录名，就可用 getpwnam 在口令文件中查找用户的相应记录，从而确定其登录 shell。
*/

进程关系

进程组

进程组是一个或多个进程的集合，同一个进程组中的各进程接收来自同一终端的各种信号。每个进程组有一个唯一的进程组ID。

每个进程组有一个组长进程。组长进程的进程组ID等于其进程ID。

#include <unistd.h>
  pid_t getpgrp(void);
            //返回值：调用进程的进程组ID

  pid_t getpgid(pid_t pid);
            //返回值：若成功，返回进程组ID；若出错，返回-1

  //进程调用 setpgid 可以加入一个现有的进程组或者创建一个新进程组
  int setpgid(pid_t pid, pid_t pgid);
            //返回值：若成功，返回0；若出错，返回-1
/*
  1. setpgid 函数将 pid 进程的进程组 ID 设置为 pgid。如果这两个参数相等，则由 pid 指定的进程变成进程组组长。如果 pid 是0，则使用调用者的进程ID。另外，如果 pgid 是0，则由 pid 指定的进程ID用作进程组ID。
  2. 一个进程只能为它自己或它的子进程设置进程组ID。在它的子进程调用了 exec 后，它就不再更改该子进程的进程组ID。
  3. 在大多数作业控制 shell 中，在 fork 之后调用此函数，使父进程设置其子进程的进程组ID，并且也使子进程设置其自己的进程组ID。（为了保证进入了进程组）
*/

会话

会话是一个或多个进程组的集合。

#include <unistd.h>
  pid_t setsid(void);
            //返回值：若成功，返回进程组ID；若出错，返回-1
  pid_t getsid(pid_t pid);
            //返回值：若成功，返回会话首进程的进程组ID；若出错，返回-1

/*
  setsid 调用此函数的进程不是一个进程组的组长，则此函数创建一个新会话。具体会发生以下3件事
    1. 该进程变成新会话的会话首进程（会话首进程是创建该会话的进程）。此时，该进程时新会话中的唯一进程。
    2. 该进程成为一个新进程组的组长进程。新进程组ID是该调用进程的进程ID。
    3. 该进程没有控制终端。如果在调用 setsid 之前该进程有一个控制终端，那么这种联系也被切断。
    4. 如果该调用进程已经是一个进程组的组长，则此函数返回出错。为了保证不处于这种情况，通常先调用 fork，然后使其父进程终止，而子进程则继续。因为子进程继承了父进程的进程组ID，而其进程ID则是新分配的，两者不可能相等，这就保证了子进程不是一个进程组的组长。
*/

信号

信号是软件中断，很多比较重要的应用程序都需处理信号。信号提供了一种处理异步事件的方法。

函数 signal

#include <signal.h>
  void (*signal(int signo, void (*func)(int))) (int);
            //返回值：若成功，返回以前的信号处理配置；若出错，返回 SIG_ERR
/*
  func 的值是常量 SIG_IGN、常量 SIG_DFL 或当接到此信号后要调用的函数地址。
    SIG_IGN 则向内核表示忽略此信号（SIGKILL和SIGSTOP不能忽略）
    SIG_DFL 则表示接到此信号后的动作是系统默认动作。
    当指定函数地址时，则在信号发生时，调用该函数，我们称这种处理为捕捉该信号。称此函数为信号处理程序或者信号捕捉函数。
  
  signal 函数，返回一个函数指针，而该指针所指向的函数无返回值 (void)。该函数有一个整型参数(即最后的(int))。
*/

//eg
#include <stdio.h>
#include <signal.h>
#include <unistd.h>
#include <stdlib.h>

static void sig_usr(int);

int main(void)
{
    if (signal(SIGUSR1, sig_usr) == SIG_ERR) {
        printf("can't catch SIGUSR1");
        exit(EXIT_FAILURE);
    }
    if (signal(SIGUSR2, sig_usr) == SIG_ERR) {
        printf("can't catch SIGUSR2");
        exit(EXIT_FAILURE);
    }
    for (;;) {
        pause();
    }
}

static void sig_usr(int signo) {
    if (signo == SIGUSR1) {
        printf("received SIGUSR1\n");
    } else if (signo == SIGUSR2) {
        printf("received SIGUSR2\n");
    } else {
        printf("received signal %d\n", signo);
    }
}
/*
  向进程发送信号
    kill -USR1 9160
    kill -USR2 9160
*/

可重入函数

进程捕捉到信号并对其进行处理时，进程正在执行的正常指令序列就被信号处理程序临时中断，它首先执行该信号处理程序中的指令。如果从信号处理程序返回（例如没有调用 exit 或 longjmp），则继续执行在捕捉到信号时进程正在执行的正常指令序列。但在信号处理程序中，不能判断捕捉到信号时进程执行到何处。

Single UNIX Specification 说明了在信号处理程序中保证调用安全的函数。这些函数是可重入的并被称为是异步信号安全的 。具体函数看 第10章10.6节

不安全的原因

已知它们使用静态数据结构。
它们调用 malloc 或者 free。
它们是标准 I/O 函数，标准 I/O 库的很多实现都以不可重入方式使用全局数据结构。

函数 kill 和 raise

kill 函数讲信号发送给进程或进程组。raise 函数则允许进程向自身发送信号。

#include <signal.h>
  int kill(pid_t pid, int signo);
  int raise(int signo);
            //两个函数返回值：若成功，返回0；若出错，返回-1
  /*
    1. 调用 raise(signo) 等价于调用 kill(getpid(),signo);
    2. kill 的 pid 参数有以下 4 种不同的情况
      pid > 0，将该信号发送给进程 ID 为 pid 的进程。
      pid == 0，将该信号发送给与发送进程属于同一进程组的所有进程（这些进程的进程组 ID 等于发送进程的进程组ID），而且发送进程具有权限向这些进程发送信号。这里用的术语“所有进程”不包括实现定义的系统进程集。对于大多数 UNIX 系统，系统进程集包括内核进程和 init（pid为1）。
      pid < 0，将该信号发送给其进程组ID等于 pid 绝对值，而且发送进程具有权限向其发送信号的所有进程。
      pid == -1，将该信号发送给发送进程有权限向它们发送信号的所有进程。
    3. 进程将信号发送给其他进程需要权限。超级用户可将信号发送给任一进程。对于非超级用户，其基本规则是发送者的实际用户 ID 或有效用户 ID 必须等于接收者的实际用户ID或者有效用户ID。
  */

函数 alarm 和 pause

使用 alarm 函数可以设置一个定时器（闹钟时间），在将来的某个时刻该定时器会超时。当定时器超时时，产生 SIGALRM 信号。如果忽略或不捕捉此信号，则其默认动作是终止调用该 alarm 函数的进程。

#include <unistd.h>
  unsigned int alarm(unsigned int seconds);
            //返回值：0或以前设置的闹钟时间的余留秒数
  int pause(void);
            //返回值：-1，errno设置为EINTR
  /*
    alarm 参数 seconds 的值是产生信号 SIGALRM 需要经过的时钟秒数。
    pause 函数只有执行了一个信号处理程序并从其返回时，pause 才返回。在这种情况下，pause 返回-1。
  */

//eg
  #include <stdlib.h>
  #include <stdio.h>
  #include <unistd.h>

  static void sig_alrm(int signo) {}

  unsigned int sleep1(unsigned int seconds) //模拟 sleep 函数
  {
      if (signal(SIGALRM, sig_alrm) == SIG_ERR) {
          return seconds;
      }
      alarm(seconds);
      pause();
      return (alarm(0));
  }

//alarm 还常用于对可能阻塞的操作设置时间上限制。例如，程序中有一个读低速设备的可能阻塞的操作，我们希望超过一定时间量就停止执行该操作。
  #include <stdlib.h>
  #include <stdio.h>
  #include <unistd.h>

  #define	MAXLINE	4096

  static void sig_alrm(int);

  int main()
  {
      int n;
      char line[MAXLINE];
      if (signal(SIGALRM,sig_alrm) == SIG_ERR) {
          printf("signal(SIGALRM) error");
          exit(EXIT_FAILURE);
      }
      alarm(10);
      if ((n = read(STDIN_FILENO,line,MAXLINE)) < 0) {
          printf("read error");
          exit(EXIT_FAILURE);
      }
      alarm(0);
      write(STDOUT_FILENO,line,n);
      exit(0);
  }
  static void sig_alrm(int signo) {}

线程

线程标识

线程ID 是用 pthread_t 数据类型来表示的，实现的时候可以用一个结构来代表 pthread_t 数据类型，所以可移植的操作系统实现不能把它作为整数处理。

#include <pthread.h>
  int pthread_equal(pthread_t tid1,pthread_t tid2);
            //返回值：若相等，返回非0数值；否则，返回0
  pthread_t pthread_self(void);
            //返回值：调用线程的线程ID
  /*
    pthread_equal 来对比两个线程 ID 进行比较。
    pthread_self 获取自身的线程 ID。
  */

线程创建

#include <pthread.h>
  int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(*start_rtn)(void *), void *restrict arg);
            //返回值：若成功，返回0；否则，返回错误编号
  /*
    1. 当 pthread_create 成功返回时，新创建线程的线程ID会被设置成 tidp 指向的内存单元。 
    2. attr 参数用于定制各种不同的线程属性。
    3. 新创建的线程从 start_rtn 函数的地址开始运行，该函数只有一个无类型指针参数 arg。
  */

//eg
  #include <stdio.h>
  #include <stdlib.h>
  #include <pthread.h>
  #include <unistd.h>

  pthread_t ntid;

  void printids(const char *s)
  {
      pid_t pid;
      pthread_t tid;

      pid = getpid();
      tid = pthread_self();
      printf("%s pid %lu tid %lu (0x%lx)\n", s, (unsigned long)pid, (unsigned long)tid, (unsigned long)tid);
  }

  void *thr_fn(void *arg)
  {
      printids("new thread: ");
      return ((void *)0);
  }

  int main(void)
  {
      int err;
      err = pthread_create(&ntid, NULL, thr_fn, NULL);
      if (err != 0)
      {
          printf("cant't creat thread");
          exit(EXIT_FAILURE);
      }
      printids("main thread:");
      sleep(1);
      exit(0);
  }

线程终止

如果进程中的任意线程调用了 exit、_Exit 或者 _exit ，那么整个进程就会终止。与此相类似，如果默认的动作是终止进程，那么，发送到线程的信号就会终止整个进程。

单个线程可以通过 3 种方式退出。因此可以在不终止整个进程的情况下，停止它的控制流。

线程可以简单地从启动例程中返回，返回值是线程的退出码。
线程可以被同一进程中的其他线程取消。
线程调用 pthread_exit 。

#include <pthread.h>
  void pthread_exit(void *rval_ptr);
  /*
    rval_ptr 参数是一个无类型指针，与传给启动例程的单个参数类似。进程中的其他线程也可以通过调用 pthread_join 函数访问到这个指针。
  */

  int pthread_join(pthread_t thread, void **rval_ptr);
            //返回值：若成功，返回0；否则，返回错误编号
  /*
    1. 调用线程将一直阻塞，直到指定的线程调用 pthread_exit、从启动例程中返回或者被取消。如果线程简单地从它的启动例程返回，rval_ptr 就包含返回码。如果线程被取消，由 rval_ptr 指定的内存单元就设置为 PTHREAD_CANCELED。
    2. 如果对线程的返回值并不感兴趣，那么可以把 rval_ptr 设置为 NULL。在这种情况下，调用 pthread_join 函数可以等待指定的线程终止，但并不获取线程的终止状态。
    3. pthread_create 和 pthread_exit 函数的无类型指针参数可以传递的值不止一个，这个指针可以传递包含复杂信息的结构的地址。但注意，这个结构所使用的内存在调用者完成调用以后必须仍然是有效的。
  */

  int pthread_cancel(pthread_t tid);
            //返回值：若成功，返回0；否则，返回错误编号
  /*
    线程可以通过调用 pthread_cancel 函数来请求取消同一进程中的其他线程。注意 pthread_cancel 并不等待线程终止，它仅仅提出请求。
   */

  void pthread_cleanup_push(void (*rtn)(void *), void *arg);
  void pthread_cleanup_pop(int execute);
	/*
	  1. 线程可以安排它退出时需要调用的函数，这样的函数称为线程清理处理程序。一个线程可以建立多个清理处理程序。处理程序记录在栈中，也就是说，它们的执行顺序与它们注册时相反。
	  2. 当线程执行一下动作时，清理函数 rtn 是由 pthread_cleanup_push 函数调度的，调用时只有一个参数 arg：
	    1. 调用 pthread_exit 时。
	    2. 响应取消请求时。
	    3. 用非零 execute 参数调用 pthread_cleanup_pop 时
	*/

//eg:获取已终止的线程的退出码
  #include <stdio.h>
  #include <stdlib.h>
  #include <pthread.h>
  #include <unistd.h>

  void *thr_fn1(void *arg)
  {
      printf("thread 1 exiting \n");
      pthread_exit((void *)1);
  }

  void *thr_fn2(void *arg)
  {
      printf("thread 2 exiting \n");
      pthread_exit((void *)2);
  }

  int main()
  {
      int err;
      pthread_t tid1, tid2;
      void *tret;

      err = pthread_create(&tid1, NULL, thr_fn1, NULL);
      if (err != 0)
      {
          perror("can't create thread 1");
          exit(EXIT_FAILURE);
      }
      err = pthread_create(&tid2, NULL, thr_fn2, NULL);
      if (err != 0)
      {
          perror("can't create thread 2");
          exit(EXIT_FAILURE);
      }
      err = pthread_join(tid1, &tret);
      if (err != 0)
      {
          perror("can't join with thread 1");
          exit(EXIT_FAILURE);
      }
      printf("thread 1 exit code %ld\n", (long)tret);
      err = pthread_join(tid2, &tret);
      if (err != 0)
      {
          perror("can't join with thread 2");
          exit(EXIT_FAILURE);
      }
      printf("thread 1 exit code %ld\n", (long)tret);
      exit(0);
  }
/*
 *运行结果
  thread 2 exiting 
  thread 1 exiting 
  thread 1 exit code 1
  thread 2 exit code 2
*/

线程同步

互斥量

#include <pthread.h>
  int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t * restrict attr);
  int pthread_mutex_destroy(pthread_mutex_t *mutex);
            //返回值：若成功，返回0；否则，返回错误编号
/*
  互斥变量是用 pthread_mutex_t 数据类型表示的。在使用互斥变量以前，必须首先对它进行初始化，可以把它设置为常量 PTHREAD_MUTEX_INITIALIZER (只适用于静态分配的互斥量)，也可以通过调用 pthread_mutex_init 函数进行初始化。如果动态分配互斥量（例如，通过调用 malloc 函数），在释放内存前需要调用 pthread_mutex_destroy。
*/

  int pthread_mutex_lock(pthread_mutex_t *mutex);
  int pthread_mutex_trylock(pthread_mutex_t *mutex);
  int pthread_mutex_unlock(pthread_mutex_t *mutex);
            //返回值：若成功，返回0；否则，返回错误编号
/*
  1. 对互斥量进行加锁，需要调用 pthread_mutex_lock。如果互斥量已经上锁，调用线程将阻塞直到互斥量被解锁。对互斥量解锁，需要调用 pthread_mutex_unlock。
  2. 如果线程不希望被阻塞，它可以使用 pthread_mutex_trylock 尝试对互斥量进行加锁。如果调用 pthread_mutex_trylock 时互斥量处于未锁住状态，那么 pthread_mutex_trylock 将锁住互斥量，不会出现阻塞直接返回0，否则 pthread_mutex_trylock 就会失败，不能锁住互斥量，返回 EBUSY。
*/

  int pthread_mutex_timedlock(pthread_mutex_t *restrict mutex, const struct timespec *restrict tsptr);
            //返回值：若成功，返回0；否则，返回错误编号
/*
  当线程试图获取一个已加锁的互斥量时，pthread_mutex_timedlock 在达到超时时间值时，不会对互斥量进行加锁，而是返回错误码 ETIMEDOUT。
*/

//eg
  #include <stdlib.h>
  #include <pthread.h>

  struct foo
  {
      int f_count;
      pthread_mutex_t f_lock;
      int f_id;
  };

  struct foo *foo_alloc(int id)
  {
      struct foo *fp;
      if ((fp = malloc(sizeof(struct foo))) != NULL) {
          fp->f_count = 1;
          fp->f_id = id;
          if (pthread_mutex_init(&fp->f_lock, NULL) != 0)
          {
              free(fp);
              return (NULL);
          }
      }
      return (fp);
  }

  void foo_hold(struct foo *fp)
  {
      pthread_mutex_lock(&fp->f_lock);
      fp->f_count++;
      pthread_mutex_unlock(&fp->f_lock);
  }

  void foo_rele(struct foo *fp)
  {
      pthread_mutex_lock(&fp->f_lock);
      if (--fp->f_count == 0) {
          pthread_mutex_unlock(&fp->f_lock);
          pthread_mutex_destroy(&fp->f_lock);
          free(fp);
      } else {
          pthread_mutex_unlock(&fp->f_lock);
      }
  }

读写锁

读写锁可以有3种状态：读模式下加锁状态，写模式下加锁状态，不加锁状态。

读写锁非常适合于对数据结构读的次数远大于写的情况。

#include <pthread.h>
  int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockattr_t *restrict attr);
  int pthread_rwlock_destroy(pthread_rwlock_t *rwlock);

  int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);
  int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock);
  int pthread_rwlock_unlock(pthread_rwlock_t *rwlock);

  int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock);
  int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock);

  int pthread_rwlock_timedrdlock(pthread_mutex_t *restrict rwlock, const struct timespec *restrict tsptr);
  int pthread_rwlock_timedwrlock(pthread_mutex_t *restrict rwlock, const struct timespec *restrict tsptr);
            //所以函数返回值：若成功，返回0；否则，返回错误编号

条件变量

与互斥锁不同，条件变量是用来等待而不是用来上锁的。条件变量用来自动阻塞一个线程，直到某特殊情况发生为止。通常条件变量和互斥锁同时使用。条件变量使我们可以睡眠等待某种条件出现。条件变量是利用线程间共享的全局变量进行同步的一种机制，主要包括两个动作：一个线程等待"条件变量的条件成立"而挂起；另一个线程使 “条件成立”（给出条件成立信号）。

#include <pthread.h>
  int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);
  int pthread_cond_destroy(pthread_cond_t *cond);

  int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
  int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, const struct timespec *restrict tsptr);

  int pthread_cond_signal(pthread_cond_t *cond);
  int pthread_cond_broadcast(pthread_cond_t *cond);
            //所以函数返回值：若成功，返回0；否则，返回错误编号
  /*
    pthread_cond_signal 函数至少能唤醒一个等待该条件的线程。
    pthread_cond_broadcast 函数则能唤醒等待该条件的所有线程。
  */

自旋锁

自旋锁与互斥量功能一样，唯一一点不同的就是互斥量阻塞后休眠让出cpu，而自旋锁阻塞后不会让出cpu，会一直忙等待，直到得到锁。

自旋锁可用于以下情况：锁被持有的时间短，而且线程并不希望在重新调度上花费太多的成本。

屏障

屏障是用户协调多个线程并行工作的同步机制。屏障允许每个线程等待，直到所有的合作线程都达到某一点，然后从该点继续执行。

线程控制

线程属性

pthread_attr_t 结构修改线程默认属性，并把这些属性与创建的线程联系起来。

详细UNIX 环境高级编程12.3

#include <pthread.h>
  int pthread_attr_init(pthread_attr_t *attr);
  int pthread_attr_destroy(pthread_attr_t *attr);
            //所以函数返回值：若成功，返回0；否则，返回错误编号

  int pthread_attr_getdetachstate(const pthread_attr_t *restrict attr, int *detachstate);
  int pthread_attr_setdetachstate(pthread_attr_t *attr, int *detachstate);
            //所以函数返回值：若成功，返回0；否则，返回错误编号
  /*
    如果在创建线程时就知道不需要了解线程的终止状态，就可以修改 pthread_attr_t 结构中的 detachstate 线程属性，让线程一开始就处于分离状态。可以使用 pthread_attr_setdetachstate 函数把线程属性 detachstate 设置成一下两个合法值之一：PTHREAD_CREATE_DETACHED，以分离状态启动线程；或者 PTHREAD_CREATE_JOINABLE，正常启动线程，应用程序可以获取线程的终止状态。
  */

//eg:以分离状态创建线程的函数
  #include <pthread.h>

  int makethread(void *(*fn)(void *), void *arg)
  {
      int err;
      pthread_t tid;
      pthread_attr_t attr;

      err = pthread_attr_init(&attr);
      if (err != 0) {
          return (err);
      }
      err = pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
      if (err == 0) {
          err = pthread_create(&tid, &attr, fn, arg);
      }
      pthread_attr_destroy(&attr);
      return (err);
  }

重入

如果一个函数在相同的时间点可以被多个线程安全地调用，就称该函数是线程安全的。

线程特定数据

线程特定数据，也称为线程私有数据，是存储和查询某个特定线程相关数据的一种机制。

线程模型促进了进程中数据和属性的共享。

#include <pthread.h>
  int pthread_key_create(pthread_key_t *keyp, void (*destructor)(void *));
            //函数返回值：若成功，返回0；否则，返回错误编号
  /*
    在分配线程特定数据之前，需要创建与该数据关联的键名，这个键将用于获取对线程特定数据的访问。
    除了创建键以外，pthread_key_create 可以为该键关联一个可选择的析构函数。当这个线程退出时，如果数据地址已经被置为非空值，那么析构函数就会被调用。
    当线程调用 pthread_exit 或者线程执行返回，正常退出时，析构函数就会被调用，
  */

  int pthread_key_delete(pthread_key_t key);
            //函数返回值：若成功，返回0；否则，返回错误编号
  /*
    对所有线程，我们都可以通过调用 pthread_key_delete 来取消键与线程特定数据值之间的关联关系。
    调用 pthread_key_delete 并不会激活与键关联的析构函数。要释放任何与键关联的线程特定数据值的内存，需要在应用程序中采取额外的步骤。
  */

  pthread_once_t initflag = PTHREAD_ONCE_INIT;
  int pthread_once(pthread_once_t *initflag, void (*initfn)(void));
            //函数返回值：若成功，返回0；否则，返回错误编号
  /*
    initflag 必须是一个非本地变量（如全局变量或静态变量），而且必须初始化为 PTHREAD_ONCE_INIT
    如果每个线程都调用 pthread_once，系统就能保证初始化例程 initfn 只被调用一次。创建键时避免出现冲突的一个正确方法如下:
		void destructor(void *);
    pthread_key_t key;
    pthread_once_t init_done = PTHREAD_ONCE_INIT;
    void thread_init(void)
    {
      err = pthread_key_create(&key, destructor);
    }
    int threadfunc(void *arg)
    {
      pthread_once(&init_done, thread_init);
    }
  */

  void *pthread_getspecific(pthread_key_t key);
            //返回值：线程特定数据值；若没有值与该键关联，返回 NULL
  int pthread_setspecific(pthread_key_t key, const void *value);
            //函数返回值：若成功，返回0；否则，返回错误编号
  /*
    键一旦创建以后，就可以通过调用 pthread_setspecific 函数把键和线程特定数据关联起来。可以通过 pthread_getspecific 函数获得线程特定数据的地址。
    如果没有线程特定数据值与键关联，pthread_getspecific 将返回一个空指针，我们可以用这个返回值来确定是否需要调用 pthread_setspecific。
  */

//eg:线程安全 getenv 的兼容版本
  #include <limits.h>
  #include <string.h>
  #include <pthread.h>
  #include <stdlib.h>

  #define MAXSTRINGSZ 4096

  static pthread_key_t key;
  static pthread_once_t init_done = PTHREAD_ONCE_INIT;
  pthread_mutex_t env_mutex = PTHREAD_MUTEX_INITIALIZER;

  extern char **environ;

  static void thread_init(void)
  {
      pthread_key_create(&key, free);
  }

  char *getenv(const char *name)
  {
      int i, len;
      char *envbuf;

      pthread_once(&init_done, thread_init);
      pthread_mutex_lock(&env_mutex);
      envbuf = (char *)pthread_getspecific(key);
      if (envbuf == NULL) {
          envbuf = malloc(MAXSTRINGSZ);
          if (envbuf == NULL) {
              pthread_mutex_unlock(&env_mutex);
              return (NULL);
          }
          pthread_setspecific(key, envbuf);
      }
      len = strlen(name);
      for (i = 0; environ[i] != NULL; i++) {
          if ((strncmp(name, environ[i], len) == 0) && (environ[i][len] == '='))) {
              strncpy(envbuf, &environ[i][len + 1], MAXSTRINGSZ - 1);
              pthread_mutex_unlock(&env_mutex);
              return (envbuf);
          }
      }
      pthread_mutex_unlock(&env_mutex);
      return (NULL);
  }

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

UNIX环境高级编程-2.md

UNIX环境高级编程-2.md

进程控制

进程标识

函数 fork

函数 wait 和 waitpid

waitid

函数 exec

更改用户ID和更改组ID

函数 system

用户标识

进程关系

进程组

会话

信号

函数 signal

可重入函数

函数 kill 和 raise

函数 alarm 和 pause

线程

线程标识

线程创建

线程终止

线程同步

互斥量

读写锁

条件变量

自旋锁

屏障

线程控制

线程属性

重入

线程特定数据

Files

UNIX环境高级编程-2.md

Latest commit

History

UNIX环境高级编程-2.md

File metadata and controls

进程控制

进程标识

函数 fork

函数 wait 和 waitpid

waitid

函数 exec

更改用户ID和更改组ID

函数 system

用户标识

进程关系

进程组

会话

信号

函数 signal

可重入函数

函数 kill 和 raise

函数 alarm 和 pause

线程

线程标识

线程创建

线程终止

线程同步

互斥量

读写锁

条件变量

自旋锁

屏障

线程控制

线程属性

重入

线程特定数据