《linux内核设计与实现》读书笔记第五章——系统调用 第5章 系统调用

操作系统提供接口主要是为了保证系统稳定可靠,避免应用程序恣意妄行。

5.1 与内核通信

系统调用在用户空间进程和硬件设备之间添加了一个中间层。 该层主要作用有三个:

  • 为用户空间提供了一种硬件的抽象接口。
  • 系统调用保证了系统的稳定和安全
  • 每个进程都运行在虚拟系统中,而在用户空间和系统的其余部分提供这样一层公共接口。

5.2 API、POSIX和C库

1、API可以在各种不同的操作系统实现,给应用程序提供完全相同的接口,而它们本身在这些系统上的实现却可能迥异。

2、在Unix世界中,最流行的应用编程接口是基于POSIX标准的。

3、C库包括:

  • 标准C库函数
  • 系统调用接口

4、提供机制而不是策略

5.3 系统调用

1、系统调用——在linux中常称作syscall

2、系统调用再出现错误的时候C库会把错误码写入errno全局变量。通过调用perror()库函数,可以把该变量翻译成用户可以理解的错误字符串。

3、SYSCALL_DEFINE0只是一个宏,它定义一个无参数的系统调用。

3、asmlinkage:这是一个编译指令,通知编译器仅从栈中提取该函数的参数。

  • 所有的系统调用都需要这个限定词。
  • 其次函数返回long。 
    系统调用在用户空间和内核空间有不同的返回值类型,在用户空间为int在内核空间为long。

5.3.1 系统调用号

1、系统调用号一旦分配就不能再有任何变更。

  • 如果一个系统调用被删除,它所占用的系统调用号也不允许被回收利用。
  • Linux有一个“未实现”系统调用sysnisyscall(),它除了返回―ENOSYS外不做任何其他工作,这个错误号就是专门针对无效的系统调用而设的。

2、内核记录了系统调用表中的所有已注册过的系统调用的列表,存储在syscalltable中。

  • 在×86-64中,它定义于arch/i386/kernel/syscall_64.c文件中。

5.3.2 系统调用的性能

Linux系统执行快的原因:

  • 很短的上下文切换时间。
  • 系统调用处理程序和每个系统调用本身也十分简洁。

5.4 系统调用处理程序

通知内核的机制是靠软中断实现的:

  • 通过引发一个异常来促使系统切换到内核态去执行异常处理程序,此时的异常处理程序实际上就是系统调用处理程序.
  • 它与硬件体系结构紧密相关。

5.4.1 指定恰当的系统调用

1、在x86上,系统调用号是通过eax寄存器传递给内核的。

2、system_call()函数通过将给定的系统调用号与NR——syscall做比较来检查其有效性。

3、由于系统调用表中的表项是以64位类型存放的,内核需要将给定的系统调用号乘以4,然后用所得到的结果在该表中查询其位置。

5.4.2 参数传递

最简单的办法是像传递系统调用号一样,把这些参数也放在寄存器里。

5.5 系统调用的实现

5.5.1 实现系统调用

(1)决定它的用途。

  • 很多系统调用提供了标志参数以确保向前兼容。标志并不是用来让单个系统调用具有多个不同的行别行为,为了即使增加新的功能和选项,也不破坏向后兼容或不需要增加新的系统调用。

(2)这个系统调用可移植吗?

  • 提供机制而不是策略。

5.5.2 参数验证

  • 与文件I/O相关的系统调用必须检查文件描述符是否有效。
  • 与进程相关的函数必须检查提供的PID是否有效。

最重要的一种检查就是检查用户提供的指针是否有效。

内核必须保证:

  • 指针指向的内存区域属于用户空间。
  • 指针指向的内存区域在进程的地址空间里,进程决不能绕过内存访问限制。

最后一项检查针对是否有合法权限。

5.6 系统调用上下文

1、 内核在执行系统调用的时候处于进程上下文。 
- current指针指向当前任务,即引发系统调用的那个进程。

2、在进程上下文中,内核可以休眠并且可以被抢占。

3、当系统调用返回的时候,控制权仍在system_call()中,它最终会负责切换到用户空间,并让用户进程继续执行下去。

5.6.1 绑定一个系统调用的最后步骤

1、当编写完一个系统调用后,把它注册成一个正式的系统调用是件琐碎的工作:

  • 首先,在系统调用表的最后加入一个表项。
  • 对于所支持的各种体系结构,系统调用号都必须定义于<asm/unistd.h>中。
  • 系统调用必须被编译进内核映象(不能被编译成模块)。比如sys.c,它包含了各种各样的系统调用。

2、系统调用号是专属于体系结构ABI(应用程序二进制接口)的部分

5.6.2 从用户空间访问系统调用

1、用户程序通过包含标准头文件并和C库链接,就可以使用系统调用。

2、对于每个宏来说,都有2+2*n个参数。 
- 第一个参数对应着系统调用的返回值类型。 
- 第二个参数是系统调用的名称 
- 在以后是按照系统调用参数的顺序排列的每个参数的类型和名称。

5.6.3 为什么不通过系统调用的方式实现

建立一个新的系统调用的好处

  • 系统调用创建容易且使用方便。
  • Linux系统调用的高性能显而易见。

问题是:

  • 你需要―个系统调用号,而这需要一个内核在处于开发版本的时候由官方分配给你。
  • 系统调用被加入稳定内核后就被固化了,它的接口不允许做改动。
  • 需要将系统调用分别注册到每个需要支持的体系结构中去。
  • 在脚本中不容易调用系统调用,也不能从文件系统直接访问系统调用。
  • 由于你需要系统调用号,因此在主内核树之外是很难维护和使用系统调用的。

替代方法:

实现一个设备节点,并对此实现read()和write()。使用特定的信息进行检索。

  • 像信号量这样的某些接口,可以用文件描述符来表示,因此也就可以按上述方式对其进行操作。
  • 把增加的信息作为一个文件放在sysfs的合适位置。

5.7 小结

1、系统调用到底是什么。
2、它们与库函数和应用程序接口有怎样的关系。 
3、执行系统调用的连锁反应:

  • 陷入内核
  • 传递系统调用号和参数
  • 执行正确的系统调用函数
  • 并把返回值带回用户空间。