APUE(1)----UNIX基础知识

一、UNIX体系结构

  所有操作系统都为他们所运行的程序提供服务,典型的服务包括:执行新程序、打开文件、读文件、分配存储区等。严格意义上来说,操作系统可以定义为一种软件,它控制计算机硬件资源,提供程序运行环境。我们也将这种软件成为内核,因为它相对较小,并且位于环境的核心。内核的接口被称为系统调用。公共函数库构建在之上,普通的应用程序可以调用系统调用,也可以调用公共函数库。shell是一个特殊的应用程序,位运行其他应用程序提供了一个接口。

二、文件和目录

1.文件系统

  UNXI文件系统是目录和文件的一种层次结构,所有东西的起点称为根(root)的目录,这个目录的名称是一个字符“/”。目录是一个包含目录项的文件,由文件名和文件属性(文件类型、文件大小、文件所有者、文件权限等)组成。这里需要注意的是逻辑视图和实际存放在磁盘上的方式是不同的。UNIX文件系统的大多数实现并不在目录项中存放属性,这是因为当一个文件具有多个硬链接时,很难保持多个属性副本之间的同步。

2.文件名和路径名

  创建新目录时会自动创建两个文件名:“.”指向当前目录,“..”指向父目录,在最高层次,二者指向相同。由斜线分隔的一个或多个文件名组成的序列构成路径名,以斜线开头的路径名称为绝对路径名,否则称为相对路径名。

#include<stdio.h>
#include<stdlib.h>
#include<dirent.h>

int main(int argc, char *argv[])
{
        DIR           *dp;
        struct dirent *dirp;

        if(2 != argc)
        {
                printf("usage: ls directory_name
");
                return -1;
        }

        if(NULL == (dp = opendir(argv[1])))
        {
                printf("can't open %s
", argv[1]);
                return -1;
        }

        while(NULL != (dirp = readdir(dp)))
        {
                printf("%s
", dirp->d_name);
        }

        closedir(dp);
        exit(0);
}

1-1:列出一个目录中的所有文件

3.工作目录和起始目录

  每个进程都有一个工作目录,所有相对路径名都从工作目录开始解释,进程可以用chdir函数更改其工作目录。登陆时,工作目录设置为起始目录,这个目录是从口令文件中相应用户的登录项中获取的。

三、输入和输出

1.文件描述符

  文件描述符通常是一个小的非负整数,内核用以标识一个特定进程正在访问的文件。当内核打开一个先用文件或创建一个新文件时,它都返回一个文件描述符,在读写文件时,可以使用这个文件描述符。按惯例,每当运行一个新程序时,所有的shell都为其打开3个文件描述符,即标准输入、标准输出以及标准错误,如果不做特殊处理,这三个文件描述符都链接向终端。

2.不带缓冲的I/O

  函数open、read、write、lseek以及close提供了不带缓冲的I/O。这些函数都使用文件描述符。

#include<unistd.h>
#include<stdio.h>
#include<stdlib.h>

#define BUFFSIZE 4096

int main(void)
{
        int     n;
        char    buf[BUFFSIZE];
        while((n = read(STDIN_FILENO, buf, BUFFSIZE)) > 0)
        {
                if(write(STDOUT_FILENO, buf, n) != n)
                {
                        printf("write error.
");
                        return -1;
                }
        }

        if(n > 0)
        {
                printf("read error.
");
                return -1;
        }

        exit(0);
}

1-2:将标准输入复制到标准输出

注释:1.头文件<unistd.h>包含了很多UNIX系统服务的函数原型,STDID_FILENO/STDOUT_FILENO,以及read/write都定义在其中。2.read函数返回其读取到的字节数,当发生错误时,read返回-1;3输入ctrl+D作为文件结束符,终止程序;

3.标准I/O

  标准I/O函数为那些不带缓冲I/O函数提供了一个带缓冲的接口。使用标准I/O函数无需担心如何选取最佳的缓冲区大小,不用像上例那样需要定义BUFFSIZE。并且还简化了对输入行的处理。

#include<unistd.h>
#include<stdio.h>
#include<stdlib.h>
int main(void)
{
        int c;
        while((c = getc(stdin)) != EOF)
        {
                if(putc(c, stdout) == EOF)
                {
                        printf("output error.
");
                        return -1;
                }
        }

        if(ferror(stdin))
        {
                printf("input error.
");
        }

        exit(0);
}

1-3:用标准I/O将标准输入复制到标准输出

四、程序和进程

1.程序、进程和进程ID

  程序是一个存储在磁盘上某个目录中的可执行文件。内核使用exec函数将程序读入内存,并执行程序。程序的执行实例称为进程,每一个进程都有一个唯一的数字标识符,被称为进程ID(非负整数)。

#include<unistd.h>
#include<stdio.h>
#include<stdlib.h>

int main(void)
{
        printf("Hello world from process ID %ld
", (long)getpid());
        exit(0);
}

1-4:打印进程ID

2.进程控制

  进程控制主要函数:fork、exec和waitpid。

#include<stdlib.h>
#include<stdio.h>
#include<string.h>
#include<unistd.h>
#include<sys/wait.h>

#define MAXLINE 1024

int main(void)
{
        char  buff[MAXLINE];
        pid_t pid;
        int   status;

        printf("%% ");

        while(NULL != (fgets(buff, MAXLINE, stdin)))
        {
                if('
' == buff[strlen(buff) - 1])
                {
                        buff[strlen(buff) - 1] = 0;
                }

                if(0 > (pid = fork()))
                {
                        printf("fork error
");
                        return -1;
                }
                else if(0 == pid)
                {
                        execlp(buff, buff, (char *) 0);
                        printf("couldn't execute:%s
", buff);
                        return -1;
                }

                if(0 > (pid == waitpid(pid, &status, 0)))
                {
                        printf("wait pid error
");
                }

                printf("%% ");
        }
}

1-5:从标准输入读命令并执行

注释:1.fgets是一个标准I/O函数,一次读取一行。和read的区别在于自己管理缓冲区,不返回读取的长度,在读取的末尾加入" "。而execlp要求参数以null结束,所以需要进行替换;2.fork调用一次,返回两次,在子进程中返回0,父进程返回子进程PID;3.execlp以执行从标准输入读取的命令,这就用新的程序文件替换了子进程原先执行的程序文件;4.父进程和子进程同步是通过waipid实现的。

3.线程和线程ID

  一个进程内的所有线程共享同一地址空间、文件描述符、栈以及与进程相关的属性。因为他们能访问同意存储区,所以各线程在访问共享数据时需要采取同步措施以避免不一致性。和进程ID相同, 线程也有ID,但是线程ID只在它所属的进程内其作用。

五、出错处理

  当UNIX系统函数出错时,通常会返回一个负值,而且整形变量errno通常被设置为具有特定信息的值。对于errno应当注意两条规则:1.如果没有出错,其值不会被例程清楚,因此,仅当函数的返回值指明出错时,才检验其值;2.任何函数都不会将errno值设为0.

#include<unistd.h>
#include<stdlib.h>
#include<string.h>
#include<stdio.h>
#include<errno.h>

int main(int argc, char * argv[])
{
        fprintf(stderr, "EACCES: %s
", strerror(EACCES));

        errno = ENOENT;
        perror(argv[0]);
        exit(0);
}

1-6:例示strerror和perror

注释:1.我们将程序名(argv[0])作为参数传递给main,这是一个标准的UNIX惯例。
六、用户标识

  口令文件登录项中的用户ID是一个数值,它向系统标识不同的用户。根用户的ID为0.

#include<unistd.h>
#include<stdlib.h>
#include<stdio.h>

int main(void)
{
        printf("uid = %d, gid = %d
", getuid(), getgid());
        exit(0);
}

1-7:打印用户ID和组ID

七、信号

  信号(signal)用于通知进程发生了某种情况。进程有以下三种处理方式:1.忽略信号;2.按系统默认方式处理;3.提供一个函数。该信号发生时调用该函数。当向一个进程发送信号时,我们必须是那个进程的所有者或者是超级用户。

#include<stdlib.h>
#include<stdio.h>
#include<string.h>
#include<unistd.h>
#include<sys/wait.h>

#define MAXLINE 1024

static void sig_int(int);

int main(void)
{
    char  buff[MAXLINE];
    pid_t pid;
    int   status;

    if(signal(SIGINT, sig_int) == SIG_ERR)
    {
        printf("signal error
");
        return -1;
    }


    printf("%% ");

    while(NULL != (fgets(buff, MAXLINE, stdin)))
    {
        if('
' == buff[strlen(buff) - 1])
        {
            buff[strlen(buff) - 1] = 0;
        }
        
        if(0 > (pid = fork()))
        {
            printf("fork error
");
            return -1;
        }
        else if(0 == pid)
        {
            execlp(buff, buff, (char *) 0);
            printf("couldn't execute:%s
", buff);
            return -1;
        }

        if(0 > (pid == waitpid(pid, &status, 0)))
        {
            printf("wait pid error
");
        }
        
        printf("%% ");
    }

}

void sig_int(int signo)
{
    printf("interrupt 
%% ");
}

1-8:从标准输入读命令并执行

八、时间值

  UNIX系统为一个进程维护了3个进程时间值:1.时钟时间:进程运行的时间总量,其值与系统中同时运行的进程数有关;2.用户CPU时间:执行用户指令所用的时间量;3.系统CPU时间:为该进程执行内核程序所经历的时间。2和3之和又称为CPU时间。

九、系统调用和库函数

  从实现者的角度来看,系统调用和库函数之间有根本的区别,但从用户的角度来看,其区别不重要。用户可以替换库函数,但是不能替换系统调用。并且系统调用通常提供一种最小接口,而库函数通常提供比较复杂的功能。

原文地址:https://www.cnblogs.com/cauchy007/p/5393523.html