Linux 进程

    技术2022-05-11  17

    一、进程

    1、什么是进程    当运行任何一个UNIX命令时,shell至少会建立一个进程来运行这个命令,所以可以把任何在UNIX系统中运行的程序叫做进程;但是进程并不是程序,进程是动态的,而程序是静态的,并且多个进程可以并发的调用同一个程序。    系统中每一个进程都包含一个task_struct数据结构,所有指向这些数据结构的指针组成一个进程向量数组,系统缺省的进程向量数据大小是512,表示系统中可同时容纳512个进程。进程的task_struct数据结构包括了进程的状态、调度信息、进程标识符等信息。    由于UNIX系统是一个多进程的操作系统,所以每一个进程都是独立的,都有自己的权限及任务,所以当某一进程失败时并不会导致别的进程失败。系统通过进程标识符来区分不同的进程,进程标识符是一个非负正数,他在任何时刻都是唯一的,当某个进程结束时,他的进程标识符可以分配给另外一个新进程。系统将标识符0分配给调度进程,标识符1分配给初始化进程。    系统在刚刚启动时,运行于内核方式,这时候只有一个初始化进程在运行,他首先做系统的初始化,然后执行初始化程序(一般是/sbin/init)。初始化进程是系统的第一个进程,以后所有的进程都是初始化进程的子进程。2、进程的创建    进程由fock函数创建,在unistd.h库中定义如下:        #include         pid_t fock(void);    fock函数调用一次却返回两次;在父进程中返回子进程的ID,在进程中返回0,这是因为父进程可能存在很多过子进程,所以必须通过这个返回的子进程ID来跟踪子进程,而子进程只有一个父进程,他的ID可以通过getppid取得。先面程序创建一个子进程:        #include         #include         main() {          pid_t pid;          pid = fork();          if(!pid)            printf("this is child ");          else if (pid>0)            printf("this is parent,child has pid %d ",pid);          else            printf("fork fail ");        }    调用fock创建子进程后,父进程中所有打开的描述字在子进程中是共享的,这个特性在网络服务器中广泛使用,例如父进程通过socket函数返回一个套接字,然后调用fock函数创建字进程,这个子进程就可以直接对这个已经存在的套接字进行操作。fock的另一个典型应用是创建一个子进程调用exec函数来代替自己去执行新的程序。

    3、进程的执行    UNIX系统执行以文件形式存储在磁盘上的可执行程序的唯一方法是用一个现有的进程去调用六个exec函数之一,六个exec函数定义如下:        #include         int execl(const char *pathname,const char *arg0,.../* (char *)0*/);        int execv(const char *pathname,char *const argv[]);        int execle(const char *pathname,const char *arg0,... / (char *)0,char *const envp[]*/);        int execve(const char * pathname,char *const argv[],char *const envp[]);        int execlp(const char *filename,const char *arg0,.../* (char *)0*/);        int execvp(const char *filename,char *const argv[]);    在以上六个exec函数中,第一个参数如果为pathname,则说明被执行程序是由路径名指定,如果为filename,则说明是由文件名指定;第二个参数如果为数组,说明被执行程序的参数是由一个数组来索引(数组必须含有一个空指针来表示结束),否则需要将参数一一列出;execle()及execve()的envp指针数组表示这两个函数显示指定一个环境表(这个数组必须以一个空指针结束),而另外四个函数则用外部变量environ的当前值来创建一个环境表传递给新程序。

        exec函数把新程序装入调用进程的内存空间,来改变调用进程的执行代码。当exec函数执行成功,调用进程将被覆盖,相当于产生一个新进程,但是新进程的进程表识符号和调用进程的进程表识符相同,所以exec并没象fock函数一样创建一个新进程,而是用新进程取代了调用进程。下面是一个fork()结合exec()的程序:        #include         #include         main() {          int pid;          pid = fork();          switch(pid) {            case -1:                    perror("fork failed");                    exit(1);            case 0:                    execl("/bin/ls","ls","-l",NULL);                    perror("execl failed");                    exit(1);          }        }二、守护进程1、什么是守护进程    守护进程是脱离于终端并且在后台运行的进程。守护进程脱离于终端是为了避免进程在执行过程中的信息不在任何终端上显示并且进程也不会被任何终端所产生的终端信息所打断。

    2、守护进程的启动    守护进程一般可以通过以下方式启动:        A:在系统启动时由启动脚本启动,这些启动脚本通常放在/etc/rc.d目录下        B:利用inetd超级服务器启动,大部分网络服务都是这样启动的,如ftp、telnet等        C:另外,由cron定时启动以及在终端用nohup启动的进程也是守护进程

    3、守护进程的错误输出    由于守护进程是脱离于任何终端的,所以他的任何信息都无法直接输出到标准输出设备和标准错误输出设备中,在Linux系统中提供了syslog()系统调用来解决这个问题。syslog()在shslog.h定义如下:      #include       void syslog(int priority,char *format,...);    其中参数priority指明了进程要写入信息的等级和用途。

     

     第二个参数是一个格式串,指定了记录输出的格式,在这个串的最后需要指定一个%m,对应errno错误码。

    4、守护进程的建立    首先fock一个子进程并关闭父进程,如果此进程是作为一个shell命令在控制台执行的,当父进程被终止时,shell就认为该命令已经结束,这时子进程自动转为后台运行,由于子进程在父进程那里继承了组标识符同时又拥有自己的进程标识符,就保证了子进程不是一个进程组的首进程;接着调用setsid()创建一个新进程组,调用进程成为该进程组的首进程,这就使该进程脱离于原终端;接下来重新调用fock(),使进程不再是进程组的首进程,从而忽略SIGHUP信号,以避免在某些情况下进程以外打开终端而重新与终端发生联系;最后改变工作目录,关闭全部已经打开的文件句柄,并打开log系统,到此守护进程成功建立。

     

     

    守护进程(Daemon)是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。Linux的大多数服务器就是用守护进程实现的。比如,Internet服务器inetd,Web服务器httpd等。同时,守护进程完成许多系统任务。比如,作业规划进程crond,打印进程lpd等。 守护进程的编程本身并不复杂,复杂的是各种版本的Unix的实现机制不尽相同,造成不同Unix环境下守护进程的编程规则并不一致。这需要读者注意,照搬某些书上的规则(特别是BSD4.3和低版本的System V)到Linux会出现错误的。下面将全面介绍Linux下守护进程的编程要点并给出详细实例。 一. 守护进程及其特性 守护进程最重要的特性是后台运行。在这一点上DOS下的常驻内存程序TSR与之相似。其次,守护进程必须与其运行前的环境隔离开来。这些环境包括未关闭的文件描述符,控制终端,会话和进程组,工作目录以及文件创建掩模等。这些环境通常是守护进程从执行它的父进程(特别是shell)中继承下来的。最后,守护进程的启动方式有其特殊之处。它可以在Linux系统启动时从启动脚本/etc/rc.d中启动,可以由作业规划进程crond启动,还可以由用户终端(通常是shell)执行。总之,除开这些特殊性以外,守护进程与普通进程基本上没有什么区别。因此,编写守护进程实际上是把一个普通进程按照上述的守护进程的特性改造成为守护进程。如果读者对进程有比较深入的认识就更容易理解和编程了。 二. 守护进程的编程要点 前面讲过,不同Unix环境下守护进程的编程规则并不一致。所幸的是守护进程的编程原则其实都一样,区别在于具体的实现细节不同。这个原则就是要满足守护进程的特性。同时,Linux是基于Syetem V的SVR4并遵循Posix标准,实现起来与BSD4相比更方便。编程要点如下; 1. 屏蔽一些有关控制终端操作的信号。这是为了防止在守护进程没有正常运转起来时,控制终端受到干扰退出或挂起。示例如下:

    signal(SIGTTOU,SIG_IGN); signal(SIGTTIN,SIG_IGN); signal(SIGTSTP,SIG_IGN); signal(SIGHUP ,SIG_IGN);  所有的信号都有自己的名字。这些名字都以“SIG”开头,只是后面有所不同。开发人员可以通过这些名字了解到系统中发生了什么事。当信号出现时,开发人员可以要求系统进行以下三种操作:

     忽略信号。大多数信号都是采取这种方式进行处理的,这里就采用了这种用法。但值得注意的是对SIGKILL和SIGSTOP信号不能做忽略处理。 捕捉信号。最常见的情况就是,如果捕捉到SIGCHID信号,则表示子进程已经终止。然后可在此信号的捕捉函数中调用waitpid()函数取得该子进程的进程ID和它的终止状态。另外,如果进程创建了临时文件,那么就要为进程终止信号SIGTERM编写一个信号捕捉函数来清除这些临时文件。 执行系统的默认动作。对绝大多数信号而言,系统的默认动作都是终止该进程。对这些有关终端的信号,一般采用忽略处理,从而保障了终端免受干扰。 这类信号分别是,SIGTTOU(表示后台进程写控制终端)、SIGTTIN(表示后台进程读控制终端)、SIGTSTP(表示终端挂起)和SIGHUP(进程组长退出时向所有会议成员发出的)。

    2. 在后台运行。 为避免挂起控制终端将Daemon放入后台执行。方法是在进程中调用fork使父进程终止,让Daemon在子进程中后台执行。 if(pid=fork()) exit(0);//是父进程,结束父进程,子进程继续 3. 脱离控制终端,登录会话和进程组 有必要先介绍一下Linux中的进程与控制终端,登录会话和进程组之间的关系:进程属于一个进程组,进程组号(GID)就是进程组长的进程号(PID)。登录会话可以包含多个进程组。这些进程组共享一个控制终端。这个控制终端通常是创建进程的登录终端。 控制终端,登录会话和进程组通常是从父进程继承下来的。我们的目的就是要摆脱它们,使之不受它们的影响。方法是在第1点的基础上,调用setsid()使进程成为会话组长: setsid(); 说明:当进程是会话组长时setsid()调用失败。但第一点已经保证进程不是会话组长。setsid()调用成功后,进程成为新的会话组长和新的进程组长,并与原来的登录会话和进程组脱离。由于会话过程对控制终端的独占性,进程同时与控制终端脱离。 4. 禁止进程重新打开控制终端 现在,进程已经成为无终端的会话组长。但它可以重新申请打开一个控制终端。可以通过使进程不再成为会话组长来禁止进程重新打开控制终端: if(pid=fork()) exit(0);//结束第一子进程,第二子进程继续(第二子进程不再是会话组长) 5. 关闭打开的文件描述符 进程从创建它的父进程那里继承了打开的文件描述符。如不关闭,将会浪费系统资源,造成进程所在的文件系统无法卸下以及引起无法预料的错误。按如下方法关闭它们(NOFILE在头文件 中定义): for(i=0;i < NOFILE;i++)close(i); 6. 改变当前工作目录 进程活动时,其工作目录所在的文件系统不能卸下。一般需要将工作目录改变到根目录。对于需要转储核心,写运行日志的进程将工作目录改变到特定目录如/tmp: chdir("/tmp") 7. 重设文件创建掩模 进程从创建它的父进程那里继承了文件创建掩模。它可能修改守护进程所创建的文件的存取位。为防止这一点,将文件创建掩模清除: umask(0); 8. 处理SIGCHLD信号 处理SIGCHLD信号并不是必须的。但对于某些进程,特别是服务器进程往往在请求到来时生成子进程处理请求。如果父进程不等待子进程结束,子进程将成为僵尸进程(zombie)从而占用系统资源。如果父进程等待子进程结束,将增加父进程的负担,影响服务器进程的并发性能。在Linux下可以简单地将 SIGCHLD信号的操作设为SIG_IGN。 signal(SIGCHLD,SIG_IGN); 这样,内核在子进程结束时不会产生僵尸进程。这一点与BSD4不同,BSD4下必须显式等待子进程结束才能释放僵尸进程。   int init_daemon(void){ int pid; int i; //if it is parent process ,terminated it if(pid=fork()) {  exit(0);      } else if(pid<0) {  //fork failed,exit  exit(1);      } // if it is the first child process,go on in back setsid();           //make the first child porcess new leader,dispart with console if(pid=fork()) {  //end the first child process  exit(0);     } else if(pid<0) {  //fork failed,exit  exit(1);     } //if it is the second child process ,go on back for(i=0;i<NOFILE;i++)   {  //close the opened file descriptions  close(i); } //change the work directory to /tmp chdir("/tmp"); //reconfigure the file umask umask(0);             return SUCCESS;}

    最新回复(0)