2020-2021-1 20209322《Linux内核原理与分析》第四周作业 本周学习了MenuOS的构造 一、知识点总结 二、在自己的Linux环境中搭建MenuOS

一、知识点总结

1.“三大法宝”和“两把宝剑”

计算机三大法宝:存储程序计算机、函数调用堆栈、中断
操作系统两把宝剑:中断上下文(保存现场和恢复现场),进程上下文

2.源代码根目录

arch

arch目录里的代码可以用来使Linux内核支持不同的cpu和体系结构。X86的CPU的所有文件都在arch/x86目录下,只需关注arch/x86。

block

在linux中block表示块设备(以块(多个字节组成一个整体,类似于扇区)为单位进行访问),例如SD卡、iNand、Nand、硬盘等都是块设备。几乎可以认为块设备就是存储设备。block目录下放的是一些linux存储体系中关于块设备管理的代码。

crypto

英文意思是加密。这个目录下放了一些各种常见的加密算法的C语言代码实现,例如crc32、md5、sha1等。

Documentation

这个目录下放了一些文档。

drivers

驱动目录,里面分门别类地列出了linux内核支持的所有硬件设备的驱动源代码。

firmware

固件。什么叫固件?固件其实就是软件,不过这个软件是固化到IC里面运行的,就像S5PV210里的iROM代码。

fs

fs就是file system,文件系统,里面列出了linux支持的各种文件系统的实现。

include

头文件目录,公共的(各种CPU架构共用的)头文件都在这里。各种CPU架构特有的一些头文件在arch/arm/include目录及其子目录下。

init(内核启动起点)

init是初始化的意思,这个目录下的代码就是linux内核启动时初始化内核的代码。再init目录下,有main.c源文件,这是整个Linux内核启动的起点,但它的起点不是main函数,而是star_kernel函数。

ipc

ipc就是inter process communication,进程间通信,里面都是linux支持的IPC的代码实现。

kernel

kernel就是内核,就是linux内核,所以这个文件夹下放的就是内核本身需要的一些核心代码文件。

lib

lib是库的意思,这里面都是一些公用的有用的库函数,注意这里的库函数和C语言的库函数是不一样的。在内核编程中是不能用C语言标准库函数,这里的lib目录下的库函数就是用来替代那些标准库函数的。例如在内核中要把字符串转成数字用atoi,但是在内核编程中只能用lib目录下的atoi函数,不能用标准C语言库中的atoi。还比如在内核中要打印信息时不能用printf,而要用printk,这个printk就是我们这个lib目录下的。

mm

mm就是memory management,内存管理,linux的内存管理代码都在这里。

net

该目录下是网络相关的代码,例如TCP/IP协议栈等。

3.在实验楼上运行一个Linux系统

cd LinuxKernel/
qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img //bzImage是vmLinux经过gzip压缩后的文件,是压缩内核的映像,initrd是

initrd(initial RAM disk)是为了支持linux启动的两个阶段,而设计的临时根文件系统。通常,initrd内包含多种可执行文件和驱动库,用于实现最后挂载真实的根文件系统,并在之后卸载临时的initrd根文件系统并释放相应的内存。在很多嵌入式的Linux系统中,没有使用其他真实的根文件系统,而采用initrd做为最后使用的根文件系统。
在这里,这个根文件系统只是创建了一个rootfs.img,只有一个init的功能,用menu程序替代了init,支持三个命令help、version、quit。
2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

二、在自己的Linux环境中搭建MenuOS

1.下载内核代码

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

编译时出错,缺少compiler-gcc9.h,查看include/linux目录内,复制一个compiler-gcc5.h重命名为compiler-gcc9.h,编译通过

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

2.制作根文件系统

出现问题

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

原因是缺少编译环境,使用如下命令:

sudo apt-get install gcc-multilib

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

sudo apt-get install qemu

qemu安装成功,却无法使用。

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

安装qemu-system-i386,使用qemu-system-i386指令替换qemu指令。如果你想还是使用qemu指令,可以建立一条软链接:

sudo apt-get install qemu-system-i386
sudo ln -s /usr/bin/qemu-system-i386 /usr/bin/qemu

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

3.跟踪调试

make menuconfig出现问题

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

sudo apt-get install libncurses5-dev重新make menuconfig。按照书中步骤操作。

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -S -s
将cpu初始化之前先冻结起来。

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

使用gdb建立连接。

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

设置断点,并执行。

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

继续设置断点,执行。rest_init()函数

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

4.函数分析

4.1 start_kernel函数代码

asmlinkage __visible void __init start_kernel(void)
{
	char *command_line;
	char *after_dashes;

	/*
	 * Need to run as early as possible, to initialize the
	 * lockdep hash:
	 */
	lockdep_init();
	set_task_stack_end_magic(&init_task);
	smp_setup_processor_id();
	debug_objects_early_init();

	/*
	 * Set up the the initial canary ASAP:
	 */
	boot_init_stack_canary();

	cgroup_init_early();

	local_irq_disable();
	early_boot_irqs_disabled = true;

/*
 * Interrupts are still disabled. Do necessary setups, then
 * enable them
 */
	boot_cpu_init();
	page_address_init();
	pr_notice("%s", linux_banner);
	setup_arch(&command_line);
	mm_init_cpumask(&init_mm);
	setup_command_line(command_line);
	setup_nr_cpu_ids();
	setup_per_cpu_areas();
	smp_prepare_boot_cpu();	/* arch-specific boot-cpu hooks */

	build_all_zonelists(NULL, NULL);
	page_alloc_init();

	pr_notice("Kernel command line: %s
", boot_command_line);
	parse_early_param();
	after_dashes = parse_args("Booting kernel",
				  static_command_line, __start___param,
				  __stop___param - __start___param,
				  -1, -1, &unknown_bootoption);
	if (!IS_ERR_OR_NULL(after_dashes))
		parse_args("Setting init args", after_dashes, NULL, 0, -1, -1,
			   set_init_arg);

	jump_label_init();

	/*
	 * These use large bootmem allocations and must precede
	 * kmem_cache_init()
	 */
	setup_log_buf(0);
	pidhash_init();
	vfs_caches_init_early();
	sort_main_extable();
	trap_init();
	mm_init();

	/*
	 * Set up the scheduler prior starting any interrupts (such as the
	 * timer interrupt). Full topology setup happens at smp_init()
	 * time - but meanwhile we still have a functioning scheduler.
	 */
	sched_init();
	/*
	 * Disable preemption - early bootup scheduling is extremely
	 * fragile until we cpu_idle() for the first time.
	 */
	preempt_disable();
	if (WARN(!irqs_disabled(),
		 "Interrupts were enabled *very* early, fixing it
"))
		local_irq_disable();
	idr_init_cache();
	rcu_init();
	context_tracking_init();
	radix_tree_init();
	/* init some links before init_ISA_irqs() */
	early_irq_init();
	init_IRQ();
	tick_init();
	rcu_init_nohz();
	init_timers();
	hrtimers_init();
	softirq_init();
	timekeeping_init();
	time_init();
	sched_clock_postinit();
	perf_event_init();
	profile_init();
	call_function_init();
	WARN(!irqs_disabled(), "Interrupts were enabled early
");
	early_boot_irqs_disabled = false;
	local_irq_enable();

	kmem_cache_init_late();

	/*
	 * HACK ALERT! This is early. We're enabling the console before
	 * we've done PCI setups etc, and console_init() must be aware of
	 * this. But we do want output early, in case something goes wrong.
	 */
	console_init();
	if (panic_later)
		panic("Too many boot %s vars at `%s'", panic_later,
		      panic_param);

	lockdep_info();

	/*
	 * Need to run this when irqs are enabled, because it wants
	 * to self-test [hard/soft]-irqs on/off lock inversion bugs
	 * too:
	 */
	locking_selftest();

#ifdef CONFIG_BLK_DEV_INITRD
	if (initrd_start && !initrd_below_start_ok &&
	    page_to_pfn(virt_to_page((void *)initrd_start)) < min_low_pfn) {
		pr_crit("initrd overwritten (0x%08lx < 0x%08lx) - disabling it.
",
		    page_to_pfn(virt_to_page((void *)initrd_start)),
		    min_low_pfn);
		initrd_start = 0;
	}
#endif
	page_cgroup_init();
	debug_objects_mem_init();
	kmemleak_init();
	setup_per_cpu_pageset();
	numa_policy_init();
	if (late_time_init)
		late_time_init();
	sched_clock_init();
	calibrate_delay();
	pidmap_init();
	anon_vma_init();
	acpi_early_init();
#ifdef CONFIG_X86
	if (efi_enabled(EFI_RUNTIME_SERVICES))
		efi_enter_virtual_mode();
#endif
#ifdef CONFIG_X86_ESPFIX64
	/* Should be run before the first non-init thread is created */
	init_espfix_bsp();
#endif
	thread_info_cache_init();
	cred_init();
	fork_init(totalram_pages);
	proc_caches_init();
	buffer_init();
	key_init();
	security_init();
	dbg_late_init();
	vfs_caches_init(totalram_pages);
	signals_init();
	/* rootfs populating might need page-writeback */
	page_writeback_init();
	proc_root_init();
	cgroup_init();
	cpuset_init();
	taskstats_init_early();
	delayacct_init();

	check_bugs();

	sfi_init_late();

	if (efi_enabled(EFI_RUNTIME_SERVICES)) {
		efi_late_init();
		efi_free_boot_services();
	}

	ftrace_init();

	/* Do the rest non-__init'ed, we're now alive */
	rest_init();
}

4.2 rest_init函数代码

static noinline void __init_refok rest_init(void)
{
	int pid;

	rcu_scheduler_starting();
	/*
	 * We need to spawn init first so that it obtains pid 1, however
	 * the init task will end up wanting to create kthreads, which, if
	 * we schedule it before we create kthreadd, will OOPS.
	 */
	kernel_thread(kernel_init, NULL, CLONE_FS);
	numa_default_policy();
	pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);
	rcu_read_lock();
	kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);
	rcu_read_unlock();
	complete(&kthreadd_done);

	/*
	 * The boot idle thread must execute schedule()
	 * at least once to get things moving:
	 */
	init_idle_bootup_task(current);
	schedule_preempt_disabled();
	/* Call into cpu_idle with preempt disabled */
	cpu_startup_entry(CPUHP_ONLINE);
}

4.3 函数调用分析

main.c中,没有main函数,start_kernel相当于main函数,是一切的起点。
在start_kernel()中,有很多重要的模块,例如:
trap_init();//对异常进行初始化,在arm里是空函数
init_timers();//初始化引导cpu的时钟相关的数据结构,注册时钟的回调函数,当时钟到达时可以回调时钟处理函数,最后初始化时钟软件中断处理
time_init();//初始化系统时钟
console_init();//初始化控制台,以便输出内容,在此函数调用时,原先存放在缓冲区内的信息都会被立即输出
mm_init();//内存管理的初始化
sched_init();//调度模块的初始化
rest_init();//后继初始化,主要是创建内核线程init,并运行。
在书中,主要讨论内核进程的创建过程。

4.3.1 Linux下的3个特殊进程

Linux下有3个特殊的进程,idle进程(PID = 0), init进程(PID = 1)和kthreadd(PID = 2)

  • idle进程由系统自动创建, 运行在内核态,idle进程其pid=0,其前身是系统创建的第一个进程,也是唯一一个没有通过fork或者kernel_thread产生的进程。完成加载系统后,演变为进程调度、交换。
  • init进程由idle通过kernel_thread创建,在内核空间完成初始化后,加载init程序,由0进程创建,完成系统的初始化,是系统中所有其它用户进程的祖先进程。
    Linux中的所有进程都是有init进程创建并运行的。首先Linux内核启动,然后在用户空间中启动init进程,再启动其他系统进程。在系统启动完成完成后,init将变为守护进程监视系统其他进程。
  • kthreadd进程由idle通过kernel_thread创建,并始终运行在内核空间, 负责所有内核线程的调度和管理。
    它的任务就是管理和调度其他内核线程kernel_thread, 会循环执行一个kthread的函数,该函数的作用就是运行kthread_create_list全局链表中维护的kthread, 当我们调用kernel_thread创建的内核线程会被加入到此链表中,因此所有的内核线程都是直接或者间接的以kthreadd为父进程

4.3.2 0号进程的创建

/* Initial task structure */
struct task_struct init_task = INIT_TASK(init_task);
EXPORT_SYMBOL(init_task);

init_task是内核中所有进程、线程的task_struct雏形,在内核初始化过程中,通过INIT_TASK静态定义构造出了一个task_struct接口,取名为init_task,然后在内核初始化的后期,通过rest_init()函数新建了内核init线程,kthreadd内核线程。
init_idle_bootup_task():当前0号进程init_task最终会退化成idle进程,所以这里调用init_idle_bootup_task()函数,让init_task进程隶属到idle调度类中。即选择idle的调度相关函数。
调用schedule()函数切换当前进程,在调用该函数之前,Linux系统中只有两个进程,即0号进程init_task和1号进程kernel_init,其中kernel_init进程也是刚刚被创建的。调用该函数后,1号进程kernel_init将会运行!
调用cpu_idle(),0号线程进入idle函数的循环,在该循环中会周期性地检查。

4.3.3 1号进程的创建

在rest_init()函数中,新建kernel_init和kthreadd内核线程,

2020-2021-1 20209322《Linux内核原理与分析》第四周作业
本周学习了MenuOS的构造
一、知识点总结
二、在自己的Linux环境中搭建MenuOS

kernel_init(内核init线程),开始的init是有kthread_thread创建的内核线程, 他在完成初始化工作后, 转向用户空间, 执行/sbin/init进程变为所有用户态程序的根进程(pstree命令显示),即用户空间的init进程,并且生成所有用户进程的祖先。

4.3.4 2号进程的创建

Linux在无进程概念的情况下将一直从初始化部分的代码执行到start_kernel,然后再到其最后一个函数调用rest_init。从rest_init开始,Linux开始产生进程,因为init_task是静态制造出来的,pid=0,它试图将从最早的汇编代码一直到start_kernel的执行都纳入到init_task进程上下文中。这个函数其实是由0号进程执行的, 他就是在这个函数中, 创建了init进程和kthreadd进程。

内核kthreadd内核线程,变为所有内核态其他守护线程的父线程。它的任务就是管理和调度其他内核线程kernel_thread, 会循环执行一个kthread的函数,该函数的作用就是运行kthread_create_list全局链表中维护的kthread, 当我们调用kernel_thread创建的内核线程会被加入到此链表中,因此所有的内核线程都是直接或者间接的以kthreadd为父进程。

参考:https://blog.csdn.net/gatieme/article/details/51484562