第20章、开机流程、模块管理与 Loader

20.1. Linux 的开机流程分析
开机不是只要单击电源钮而关机只要关掉电源钮就可以了吗?有何大学问?话是这样没错,但是由于 Linux 是一套多人多任务的操作系统,你难保你在关机时没有人还在线,如果你关机的时候碰巧一大群人在在线工作, 那会让当时在在线工作的人马上断线的!那不是害死人了?一些数据可是无价之宝!
另外 Linux 在执行的时候,虽然你在画面上只会看到黑压压的一片,完全没有任何画面, 但其实他是有很多的程序在背景底下执行的,例如登录文件管控程序、前面提到的例行性工作排程等, 当然还有一大堆网络服务,如邮件服务器、WWW 服务器等等。你如果随便关机的话, 是很容易伤害硬盘及数据传输的动作的!所以在 Linux 下关机可是一门大学问。

20.1.1. 开机流程一览
既然开机是很严肃的一件事,那我们就来了解一下整个开机的过程吧! 好让大家比较容易发现开机过程里面可能会发生问题的地方,以及出现问题后的解决之道! 不过,由于开机的过程中,那个开机管理程序 (Boot Loader) 使用的软件可能不一样,例如目前各大 Linux distributions 的主流为 grub,但早期 Linux 预设是使用 LILO ,台湾地区则很多朋友喜欢使用 spfdisk 。 但无论如何,我们总是得要了解整个 boot loader 的工作情况,才能了解为何进行多重引导的设定时, 老是听人家讲要先安装 Windows 再安装 Linux 的原因~
假设以个人计算机架设的 Linux 主机为例 (先回到第零章计算器概论看看相关的硬件常识), 当你按下电源按键后计算机硬件会主动的读取 BIOS 来加载硬件信息及进行硬件系统的自我测试, 之后系统会主动的去读取第一个可开机的装置 (由 BIOS 设定的) ,此时就可以读入开机管理程序了。
开机管理程序可以指定使用哪个核心档案来开机,并实际加载核心到内存当中解压缩与执行, 此时核心就能够开始在内存内活动,并侦测所有硬件信息与加载适当的驱动程序来使整部主机开始运作, 等到核心侦测硬件与加载驱动程序完毕后,一个最阳春的操作系统就开始在你的 PC 上面跑了。
主机系统开始运作后,此时 Linux 才会呼叫外部程序开始准备软件执行的环境, 并且实际的加载所有系统运作所需要的软件程序!最后系统就会开始等待你的登入与操作! 简单来说,系统开机的经过可以汇整成底下的流程的:

  1. 加载 BIOS 的硬件信息与进行自我测试,并依据设定取得第一个可开机的装置;
  2. 读取并执行第一个开机装置内 MBR 的 boot Loader (亦即是 grub, spfdisk 等程序);
  3. 依据 boot loader 的设定加载 Kernel ,Kernel 会开始侦测硬件与加载驱动程序;
  4. 在硬件驱动成功后,Kernel 会主动呼叫 init 程序,而 init 会取得 run-level 信息;
  5. init 执行 /etc/rc.d/rc.sysinit 档案来准备软件执行的作业环境 (如网络、时区等);
  6. init 执行 run-level 的各个服务之启动 (script 方式);
  7. init 执行 /etc/rc.d/rc.local 档案;
  8. init 执行终端机仿真程序 mingetty 来启动 login 程序,最后就等待用户登入;

大概的流程就是上面写的那个样子,你会发现 init 这个家伙占的比重非常重! 所以我们才会在第十七章的 pstree 指令中谈到这家伙。 那每一个程序的内容主要是在干嘛呢?底下就分别来谈一谈吧!

20.1.2. BIOS, boot loader 与 kernel 载入
我们在第三章曾经谈过简单的开机流程与 MBR 的功能, 当时为了多重引导而进行的简短的介绍。现在你已经有足够的 Linux 基础了,所以底下让我们来加强说明!

一、BIOS, 开机自我测试与 MBR
我们在第零章的计算器概论就曾谈过计算机主机架构, 在个人计算机架构下,你想要启动整部系统首先就得要让系统去加载 BIOS (Basic Input Output System),并透过 BIOS 程序去加载 CMOS 的信息,并且藉由 CMOS 内的设定值取得主机的各项硬件配置, 例如 CPU 与接口设备的沟通频率、开机装置的搜寻顺序、硬盘的大小与类型、 系统时间、各周边总线的是否启动 Plug and Play (PnP, 即插即用装置) 、 各接口设备的 I/O 地址、以及与 CPU 沟通的 IRQ 岔断等等的信息。
在取得这些信息后,BIOS 还会进行开机自我测试 (Power-on Self Test, POST) (注1)。 然后开始执行硬件侦测的初始化,并设定 PnP 装置,之后再定义出可开机的装置顺序, 接下来就会开始进行开机装置的数据读取了 (MBR 相关的任务开始)。
由于我们的系统软件大多放置到硬盘中!所以 BIOS 会指定开机的装置好让我们可以读取磁盘中的操作系统核心档案。 但由于不同的操作系统他的文件系统格式不相同,因此我们必须要以一个开机管理程序来处理核心档案加载 (load) 的问题, 因此这个开机管理程序就被称为 Boot Loader 了。那这个 Boot Loader 程序安装在哪里呢?就在开机装置的第一个扇区 (sector) 内,也就是我们一直谈到的 MBR (Master Boot Record, 主要启动记录区)。
那你会不会觉得很奇怪啊?既然核心档案需要 loader 来读取,那每个操作系统的 loader 都不相同, 这样的话 BIOS 又是如何读取 MBR 内的 loader 呢?很有趣的问题吧!其实 BIOS 是透过硬件的 INT 13 中断功能来读取 MBR 的,也就是说,只要 BIOS 能够侦测的到你的磁盘 (不论该磁盘是 SATA 还是 IDE 接口),那他就有办法透过 INT 13 这条信道来读取该磁盘的第一个扇区内的 MBR !(注2) 这样 boot loader 也就能够被执行!

二、Boot Loader 的功能
刚刚说到 Loader 的最主要功能是要认识操作系统的文件格式并据以加载核心到主存储器中去执行。 由于不同操作系统的文件格式不一致,因此每种操作系统都有自己的 boot loader !用自己的 loader 才有办法载入核心档案嘛!那你应该有听说过多重操作系统吧? 既然你 (1)必须要使用自己的 loader 才能够加载属于自己的操作系统核心,而 (2)系统的 MBR 只有一个,那你怎么会有办法同时在一部主机上面安装 Windows 与Linux 呢?
这就得要回到第八章的磁盘文件系统去回忆一下文件系统功能了。 其实每个文件系统 (filesystem, 或者是 partition) 都会保留一块启动扇区 (boot sector) 提供操作系统安装 boot loader , 而通常操作系统默认都会安装一份 loader 到他根目录所在的文件系统的 boot sector 上。如果我们在一部主机上面安装 Windows 与 Linux 后,该 boot sector, boot loader 与 MBR 的相关性会有点像下图:
这里写图片描述
如上图所示,每个操作系统默认是会安装一套 boot loader 到他自己的文件系统中 (就是每个 filesystem 左下角的方框),而在 Linux 系统安装时,你可以选择将 boot loader 安装到 MBR 去,也可以选择不安装。 如果选择安装到 MBR 的话,那理论上你在 MBR 与 boot sector 都会保有一份 boot loader 程序的。 至于Windows 安装时,他预设会主动的将 MBR 与 boot sector 都装上一份 boot loader !所以你会发现安装多重操作系统时,你的 MBR 常常会被不同的操作系统的 boot loader 所覆盖!
我们刚刚提到的两个问题还是没有解决!虽然各个操作系统都可以安装一份 boot loader 到他们的 boot sector 中, 这样操作系统可以透过自己的 boot loader 来加载核心了。问题是系统的 MBR 只有一个! 你要怎么执行 boot sector 里面的 loader ?这个我们得要回忆一下第三章约略提过的 boot loader 的功能了。boot loader 主要的功能如下:

  • 提供选单:用户可以选择不同的开机项目,这也是多重引导的重要功能!
  • 载入核心档案:直接指向可开机的程序区段来开始操作系统;
  • 转交其他 loader:将开机管理功能转交给其他 loader 负责。

由于具有选单功能,因此我们可以选择不同的核心来开机。而由于具有控制权转交的功能,因此我们可以加载其他 boot sector 内的 loader !不过 Windows 的 loader 预设不具有控制权转交的功能,因此你不能使用 Windows 的 loader 来加载 Linux 的 loader !这也是为啥第三章谈到 MBR 与多重引导时,会特别强调先装 Windows 再装 Linux 的缘故。 我们将上述的三个功能以底下的图标来解释你就看的懂了!(与第三章的图示也非常类似!)
这里写图片描述
如上图所示,我的 MBR 使用 Linux 的 grub 这个开机管理程序,并且里面假设已经有了三个选单, 第一个选单可以直接指向 Linux 的核心档案并且直接加载核心来开机;第二个选单可以将开机管理程控权交给 Windows 来管理,此时 Windows 的 loader 会接管开机流程,这个时候他就能够启动 windows 了。第三个选单则是使用 Linux 在 boot sector 内的开机管理程序,此时就会跳出另一个 grub 的选单!了解了吗?
而最终 boot loader 的功能就是『加载 kernel 档案』!

三、加载核心侦测硬件与 initrd 的功能
当我们藉由 boot loader 的管理而开始读取核心档案后,接下来, Linux 就会将核心解压缩到主存储器当中, 并且利用核心的功能,开始测试与驱动各个周边装置,包括储存装置、CPU、网络卡、声卡等等。 此时 Linux 核心会以自己的功能重新侦测一次硬件,而不一定会使用 BIOS 侦测到的硬件信息!也就是说,核心此时才开始接管 BIOS 后的工作了。 那么核心档案在哪里啊?一般来说,他会被放置到 /boot 里面,并且取名为 /boot/vmlinuz 才对!
这里写图片描述
从上表我们也可以知道此版本的 Linux 核心为 2.6.18-92.el5 这个版本!为了硬件开发商与其他核心功能开发者的便利, 因此 Linux 核心是可以透过动态加载核心模块的 (就请想成驱动程序即可),这些核心模块就放置在 /lib/modules/ 目录内。 由于模块放置到磁盘根目录内 (要记得 /lib 不可以与 / 分别放在不同的 partition !), 因此在开机的过程中核心必须要挂载根目录,这样才能够读取核心模块提供加载驱动程序的功能。 而且为了担心影响到磁盘内的文件系统,因此开机过程中根目录是以只读的方式来挂载的。
一般来说,非必要的功能且可以编译成为模块的核心功能,目前的 Linux distributions 都会将他编译成为模块。 因此 USB, SATA, SCSI… 等磁盘装置的驱动程序通常都是以模块的方式来存在的。 现在来思考一种情况,假设你的 linux 是安装在 SATA 磁盘上面的,你可以透过 BIOS 的 INT 13 取得 boot loader 与 kernel 档案来开机,然后 kernel 会开始接管系统并且侦测硬件及尝试挂载根目录来取得额外的驱动程序。
问题是,核心根本不认识 SATA 磁盘,所以需要加载 SATA 磁盘的驱动程序, 否则根本就无法挂载根目录。但是 SATA 的驱动程序在 /lib/modules 内,你根本无法挂载根目录又怎么读取到 /lib/modules/ 内的驱动程序?是吧!非常的两难吧!在这个情况之下,你的 Linux 是无法顺利开机的! 那怎办?没关系,我们可以透过虚拟文件系统来处理这个问题。
虚拟文件系统 (Initial RAM Disk) 一般使用的档名为 /boot/initrd ,这个档案的特色是,他也能够透过 boot loader 来加载到内存中, 然后这个档案会被解压缩并且在内存当中仿真成一个根目录, 且此仿真在内存当中的文件系统能够提供一支可执行的程序,透过该程序来加载开机过程中所最需要的核心模块, 通常这些模块就是 USB, RAID, LVM, SCSI 等文件系统与磁盘接口的驱动程序 !等载入完成后, 会帮助核心重新呼叫 /sbin/init 来开始后续的正常开机流程。
这里写图片描述
如上图所示,boot loader 可以加载 kernel 与 initrd ,然后在内存中让 initrd 解压缩成为根目录, kernel 就能够藉此加载适当的驱动程序,最终释放虚拟文件系统,并挂载实际的根目录文件系统, 就能够开始后续的正常开机流程。更详细的 initrd 说明,你可以自行使用 man initrd 去查阅看看。 底下让我们来了解一下 CentOS 5.x 的 initrd 档案内容有什么吧!
这里写图片描述
这里写图片描述
透过上述执行档的内容,我们可以知道 initrd 有加载模块并且尝试挂载了虚拟文件系统。 接下来就能够顺利的运作!那么是否一定需要 initrd 呢?
这里写图片描述
在核心完整的加载后,您的主机应该就开始正确的运作了,接下来,就是要开始执行系统的第一支程序: /sbin/init。

20.1.3. 第一支程序 init 及配置文件 /etc/inittab 与 runlevel
在核心加载完毕、进行完硬件侦测与驱动程序加载后,此时你的主机硬件应该已经准备就绪了 (ready) , 此时核心会主动的呼叫第一支程序,那就是 /sbin/init 。这也是为啥第十七章的 pstree 指令介绍时,你会发现 init 的 PID 号码是一号。 /sbin/init 最主要的功能就是准备软件执行的环境,包括系统的主机名、网络设定、语系处理、文件系统格式及其他服务的启动等。 而所有的动作都会透过 init 的配置文件,亦即是 /etc/inittab 来归划,而 inittab 内还有一个很重要的设定项目,那就是默认的 runlevel (开机执行等级) !

一、Run level:执行等级有哪些?
Linux 就是藉由设定 run level 来规定系统使用不同的服务来启动,让 Linux 的使用环境不同。基本上,依据有无网络与有无 X Window 而将 run level 分为 7 个等级,分别是:

  • 0 - halt (系统直接关机)
  • 1 - single user mode 单人维护模式,用在系统出问题时的维护)
  • 2 - Multi-user, without NFS (类似底下的 runlevel 3,但无 NFS 服务)
  • 3 - Full multi-user mode (完整含有网络功能的纯文本模式)
  • 4 - unused (系统保留功能)
  • 5 - X11 (与 runlevel 3 类似,但加载使用 X Window)
  • 6 - reboot (重新启动)

由于 run level 0, 4, 6 不是关机、重新启动就是系统保留的,所以:『 您当然不能将预设的 run level 设定为这三个值 』, 否则系统就会不断的自动关机或自动重新启动…. 好了,那么我们开机时,到底是如何取得系统的 run level 的?当然是 /etc/inittab 所设定的! 那么 /etc/inittab 到底有什么信息呢?我们先来看看这个档案的内容好了:

二、/etc/inittab 的内容与语法
这里写图片描述
这里写图片描述
首先,这个档案的语法是利用冒号 (:) 将设定分隔成为四个字段,每个字段的意义与说明如下:
这里写图片描述

  1. 设定项目:最多四个字符,代表 init 的主要工作项目,只是一个简单的代表说明。
  2. run level:该项目在哪些 run level 底下进行的意思。如果是 35 则代表 runlevel 3 与 5 都会执行。
  3. init 的动作项目:主要可以进行的动作项目意义有:
    这里写图片描述
  4. 更多的设定项目请参考 man inittab 的说明。
  5. 指令项目:亦即应该可以进行的指令,通常是一些 script 。

三、init 的处理流程
事实上 /etc/inittab 的设定也有点类似 shell script ,因为该档案内容的设定也是一行一行的从上往下处理的, 因此我们可以知道 CentOS 的 init 依据 inittab 设定的处理流程会是:

  1. 先取得 runlevel 亦即默认执行等级的相关等级 (以我的测试机为例,为 5 号);
  2. 使用 /etc/rc.d/rc.sysinit 进行系统初始化;
  3. 由于 runlevel 是 5 ,因此只进行『l5:5:wait:/etc/rc.d/rc 5』,其他行则略过;
  4. 设定好 [ctrl]+[alt]+[del] 这组的组合键功能;
  5. 设定不断电系统的 pf, pr 两种机制;
  6. 启动 mingetty 的六个终端机 (tty1 ~ tty6)
  7. 最终以 /etc/X11/perfdm -nodaemon 启动图形接口!

现在你可以知道为啥 [ctrl]+[alt]+[del] 可以重新启动而我们预设提供 6 个虚拟终端机 (tty1~tty6) 给你使用了吧!由于整个设定都是依据 /etc/inittab 来决定的,因此如果你想要修改任何细节的话, 可以这样做:

  • 如果不想让使用者利用 [crtl]+[alt]+[del] 来重新启动系统,可以将『 ca::ctrlaltdel:/sbin/shutdown -t3 -r now 』加上批注 (#) 来取消该设定
  • 规定开机的预设 run level 是纯文本的 3 号或者是具有图形接口的 5 号 ,可经由 『 id:5:initdefault: 』那个数字来决定! 以我自己这个档案为例,我是使用默认的图形接口。如果你想要关闭图形接口的话,将该行 5 改成 3 即可。
  • 如果不想要启动六个终端机 (tty1~tty6),那么可以将『 6:2345:respawn:/sbin/mingetty tty6』关闭数个。但务必至少激活一个!

所以说,你现在会自行修改登入时的预设 run level 设定值了吗? 一般来说,我们预设都是 3 或者是 5 来作为预设的 run level 的。但有时后可能需要进入 run level 1, 也就是单人维护模式的环境当中。这个 run level 1 有点像是 Windows 系统当中的『安全模式』, 专门用来处理当系统有问题时的操作环境。此外,当系统发现有问题时,举例来说,不正常关机造成 filesystem 的不一致现象时,系统会主动的进入单人维护模式!
init 在取得 run level 之后,接下来要干嘛? 上面 /etc/inittab 档案内容不是有提到 sysinit 吗?准备初始化系统了吧!

20.1.4. init 处理系统初始化流程 (/etc/rc.d/rc.sysinit)
还记得上面提到 /etc/inittab 里头有这一句『 si::sysinit:/etc/rc.d/rc.sysinit 』吧? 这表示:『我开始加载各项系统服务之前,得先做好整个系统环境,我主要利用 /etc/rc.d/rc.sysinit 这个 shell script 来设定好我的系统环境的。』够清楚了吧? 所以,我想要知道到底 CentOS 开机的过程当中帮我进行了什么动作,就得要仔细的分析 /etc/rc.d/rc.sysinit 。
如果你使用 vim 去查阅过 /etc/rc.d/rc.sysinit 的话,那么可以发现他主要的工作大概有这几项:

  1. 取得网络环境与主机类型: 读取网络配置文件 /etc/sysconfig/network ,取得主机名与默认通讯闸 (gateway) 等网络环境。
  2. 测试与挂载内存装置 /proc 及 USB 装置 /sys: 除挂载内存装置 /proc 之外,还会主动侦测系统上是否具有 usb 的装置, 若有则会主动加载 usb 的驱动程序,并且尝试挂载 usb 的文件系统。
  3. 决定是否启动 SELinux : 我们在第十七章谈到的 SELinux 在此时进行一些检测, 并且检测是否需要帮所有的档案重新编写标准的 SELinux 类型 (auto relabel)。
  4. 启动系统的随机数生成器: 随机数生成器可以帮助系统进行一些密码加密演算的功能,在此需要启动两次随机数生成器。
  5. 设定终端机 (console) 字形;
  6. 设定显示于开机过程中的欢迎画面 (text banner);
  7. 设定系统时间 (clock) 与时区设定:需读入 /etc/sysconfig/clock 设定值;
  8. 接口设备的侦测与 Plug and Play (PnP) 参数的测试: 根据核心在开机时侦测的结果 (/proc/sys/kernel/modprobe ) 开始进行 ide / scsi / 网络 / 音效 等接口设备的侦测,以及利用以加载的核心模块进行 PnP 装置的参数测试。
  9. 用户自定义模块的加载:使用者可以在 /etc/sysconfig/modules/*.modules 加入自定义的模块,则此时会被加载到系统当中 ;
  10. 加载核心的相关设定: 系统会主动去读取 /etc/sysctl.conf 这个档案的设定值,使核心功能成为我们想要的样子。
  11. 设定主机名与初始化电源管理模块 (ACPI) ;
  12. 初始化软件磁盘阵列:主要是透过 /etc/mdadm.conf 来设定好的。
  13. 初始化 LVM 的文件系统功能 ;
  14. 以 fsck 检验磁盘文件系统:会进行 filesystem check;
  15. 进行磁盘配额 quota 的转换 (非必要);
  16. 重新以可擦写模式挂载系统磁盘;
  17. 启动 quota 功能:所以我们不需要自定义 quotaon 的动作;
  18. 启动系统虚拟随机数生成器 (pseudo-random);
  19. 清除开机过程当中的临时文件;
  20. 将开机相关信息加载 /var/log/dmesg 档案中。

在 /etc/rc.d/rc.sysinit 将基本的系统设定数据都写好了,也将系统的数据设定完整! 而如果你想要知道到底开机的过程中发生了什么事情呢?那么就执行『 dmesg 』吧。 另外,基本上,在这个档案当中所进行的很多工作的预设配置文件,其实都在 /etc/sysconfig/ 当中! 所以,请记得将 /etc/sysconfig/ 内的档案好好的瞧一瞧!
在这个过程当中,比较值得注意的是自定义模块的加载!在 CentOS 当中,如果我们想要加载核心模块的话, 可以将整个模块写入到 /etc/sysconfig/modules/*.modules 当中,在该目录下, 只要记得档名最后是以 .modules 结尾即可。 这个过程是非必要的,因为我们目前的默认模块实在已经很够用了,除非是您的主机硬件实在太新了, 非要自己加载新的模块不可,否则,在经过 /etc/rc.d/rc.sysinit 的处理后, 你的主机系统应该是已经跑得很顺畅了!就等着你将系统相关的服务与网络服务启动!

20.1.5. 启动系统服务与相关启动配置文件 (/etc/rc.d/rc N & /etc/sysconfig)
加载核心让整个系统准备接受指令来工作,再经过 /etc/rc.d/rc.sysinit 的系统模块与相关硬件信息的初始化后,你的 CentOS 系统应该已经顺利工作了。 只是,我们还得要启动系统所需要的各项『服务』!这样主机才能提供我们相关的网络或者是主机功能! 这个时候,依据我们在 /etc/inittab 里面提到的 run level 设定值,就可以来决定启动的服务项目了。 举例来说,使用 run level 3 当然就不需要启动 X Window 的相关服务。
那么各个不同的 run level 服务启动的各个 shell script 放在哪?还记得 /etc/inittab 里面提到的:
这里写图片描述
上面提到的就是各个 run level 要执行的各项脚本放置处!主要是透过 /etc/rc.d/rc 这个指令来处理相关任务! 由于我使用预设的 runlevel 5 ,因此我们主要针对上述特殊字体那行来解释好了: /etc/rc.d/rc 5 的意义是这样的 (建议您自行使用 vim 去观察一下 /etc/rc.d/rc 这个档案,你会更有概念!):

  • 透过外部第一号参数 ($1) 来取得想要执行的脚本目录。亦即由 /etc/rc.d/rc 5 可以取得 /etc/rc5.d/ 这个目录来准备处理相关的脚本程序;
  • 找到 /etc/rc5.d/K??* 开头的档案,并进行『 /etc/rc5.d/K??* stop 』的动作;
  • 找到 /etc/rc5.d/S??* 开头的档案,并进行『 /etc/rc5.d/S??* start 』的动作;

透过上面的说明我们可以知道所有的项目都与 /etc/rc5.d/ 有关,那么我们就来瞧瞧这个目录下有些什么玩意儿吧!
这里写图片描述
这里写图片描述
在这个目录下的档案很有趣,主要具有几个特点:

  • 档名全部以 Sxx 或 Kxx ,其中 xx 为数字,且这些数字在档案之间是有相关性的!
  • 全部是连结档,连结到 stand alone 服务启动的目录 /etc/init.d/ 去。

我们在第十八章谈过服务的启动主要是以『/etc/init.d/服务档名 {start,stop}』来启动与关闭的,那么透过刚刚 /etc/rc.d/rc 程序的解说,我们可以清楚的了解到了 /etc/rc5.d/[SK]xx 其实就是跑到 /etc/init.d/ 去找到相对应的服务脚本, 然后分别进行 start (Sxx) 或 stop (Kxx) 的动作而已!举例来说,以上述的表格内的 K91capi 及 S10network 为例好了, 透过 /etc/rc.d/rc 5 的执行,这两个档案会这样进行:

  • /etc/rc5.d/K91capi stop –> /etc/init.d/capi stop
  • /etc/rc5.d/S10network start –> /etc/init.d/network start

所以说,你有想要启动该 runlevel 时就执行的服务,那么利用 Sxx 并指向 /etc/init.d/ 的特定服务启动脚本后, 该服务就能够在开机时启动!问题是,你需要自行处理这个 K, S 开头的连结档吗? 并不需要的,第十八章谈到的 chkconfig 就是在负责处理这个连结档!这样有没有跟第十八章的观念串在一起了呢?
那么为什么 K 与 S 后面要有数字呢?因为各不同的服务其实还是互有关系的。举例来说,如果要启动 WWW 服务,总是得要有网络吧?所以 /etc/init.d/network 就会比较先被启动!那么您就会知道在 S 或者是 K 后面接的数字是啥意思了吧?那就是执行的顺序!那么哪个档案被最后执行呢? 看到最后一个被执行的项目是啥?没错,就是 S99local ,亦即是: /etc/rc.d/rc.local 这个档案!

20.1.6. 用户自定义开机启动程序 (/etc/rc.d/rc.local)
在完成预设 runlevel 指定的各项服务的启动后,如果我还有其他的动作想要完成时,举例来说, 我还想要寄一封 mail 给某个系统管理账号,通知他,系统刚刚重新启动完毕,那么是否应该要制作一个 shell script 放置在 /etc/init.d/ 里面,然后再以连结方式连结到 /etc/rc5.d/ 里面呢?当然不需要!还记得上一小节提到的 /etc/rc.d/rc.local 吧? 这个档案就可以执行您自己想要执行的系统指令了。
也就是说,我有任何想要在开机时就进行的工作时,直接将他写入 /etc/rc.d/rc.local , 那么该工作就会在开机的时候自动被加载!而不必等我们登入系统去启动!一般来说,我就很喜欢把自己制作的 shell script 完整档名写入 /etc/rc.d/rc.local ,如此一来,开机就会将我的 shell script 执行过,真是好棒!

20.1.7. 根据 /etc/inittab 之设定,加载终端机或 X-Window 接口
在完成了系统所有服务的启动后,接下来 Linux 就会启动终端机或者是 X Window 来等待使用者登入! 实际参考的项目是 /etc/inittab 内的这一段:
这里写图片描述
这里写图片描述
这一段代表,在 run level 2, 3, 4, 5 时,都会执行 /sbin/mingetty 这个咚咚, 而且执行六个,这也是为何我们 Linux 会提供『六个纯文本终端机』的设定所在! 因为 mingetty 就是在启动终端机的指令说。
要注意的是那个 respawn 的 init 动作项目,他代表『当后面的指令被终止 (terminal) 时, init 会主动的重新启动该项目。』这也是为何我们登入 tty1 终端机接口后,以 exit 离开后, 系统还是会重新显示等待用户输入的画面的原因!
如果改天您不想要有六个终端机时,如何取消某些终端机接口? 就将上面表格当中的某些项目批注掉即可!例如不想要 tty5 与 tty6 ,就将那两行批注, 则下次重新启动后,您的 Linux 就只剩下『 F1 ~ F4 』有效而已!
至于如果我们使用的是 run level 5 呢?那么除了这六个终端机之外, init 还会执行 /etc/X11/prefdm -nodaemon 那个指令!该指令我们会在第二十四章、X Window 再来详谈! 他主要的功能就是在启动 X Window !

20.1.8. 开机过程会用到的主要配置文件: /etc/modprobe.conf, /etc/sysconfig/*
我们在 /sbin/init 的运作过程中有谈到许多执行脚本,包括 /etc/rc.d/rc.sysinit 以及 /etc/rc.d/rc 等等, 其实这些脚本都会使用到相当多的系统配置文件,这些开机过程会用到的配置文件则大多放置在 /etc/sysconfig/ 目录下。 同时,由于核心还是需要加载一些驱动程序 (核心模块),此时系统自定义的装置与模块对应文件 (/etc/modprobe.conf) 就显的挺重要了!

一、关于模块: /etc/modprobe.conf
还记得我们在 /etc/rc.d/rc.sysinit 当中谈到的加载用户自定义模块的地方吗?就是在 /etc/sysconfig/modules/ 目录下! 虽然核心提供的默认模块已经很足够我们使用了,但是,某些条件下我们还是得对模块进行一些参数的规划, 此时就得要使用到 /etc/modprobe.conf !举例来说,我的 CentOS 主机的 modprobe.conf 有点像这样:
这里写图片描述
这个档案大多在指定系统内的硬件所使用的模块!这个档案通常系统是可以自行产生的,所以你不必手动去订正他! 不过,如果系统捉到错误的驱动程序,或者是你想要使用更新的驱动程序来对应相关的硬件配备时, 你就得要自行手动的处理一下这个档案了。
以上表的第一行为例,我使用螃蟹卡 (Realtek 的芯片组) 来作为我的网络卡,那螃蟹卡使用的模块就是 8139too !当我要启动网络卡时,系统会跑到这个档案来查阅一下,然后加载 8139too 驱动程序来驱动网络卡!更多的相关说明,请 man modprobe.conf !

二、/etc/sysconfig/*
整个开机的过程当中,老是读取的一些服务的相关配置文件都是记录在 /etc/sysconfig 目录下的!那么该目录底下有些啥玩意儿?我们找几个重要的档案来谈谈:

  • authconfig:
    这个档案主要在规范使用者的身份认证的机制,包括是否使用本机的 /etc/passwd, /etc/shadow 等, 以及 /etc/shadow 密码记录使用何种加密算法,还有是否使用外部密码服务器提供的账号验证 (NIS, LDAP) 等。 系统默认使用 MD5 加密算法,并且不使用外部的身份验证机制;

  • clock:
    此档案在设定 Linux 主机的时区,可以使用格林威治时间(GMT),也可以使用本地的时间 (local)。基本上,在 clock 档案内的设定项目『 ZONE 』所参考的时区位于 /usr/share/zoneinfo 目录下的相对路径中。而且要修改时区的话,还得将 /usr/share/zoneinfo/Asia/Taipei 这个档案复制成为 /etc/localtime 才行!

  • i18n:
    i18n 在设定一些语系的使用方面,例如最麻烦的文字接口下的日期显示问题! 如果你是以中文安装的,那么预设语系会被选择 zh_TW.UTF8 ,所以在纯文本接口之下, 你的档案日期显示可能就会呈现乱码!这个时候就需要更改一下这里!更动这个 i18n 的档案,将里面的 LC_TIME 改成 en 即可!

  • keyboard & mouse:
    keyboard 与 mouse 就是在设定键盘与鼠标的形式;

  • network:
    network 可以设定是否要启动网络,以及设定主机名还有通讯闸 (GATEWAY) 这两个重要信息!

  • network-scripts/:
    至于 network-scripts 里面的档案,则是主要用在设定网络卡~ 这部份我们在服务器架设篇才会提到!

总而言之一句话,这个目录下的档案很重要的!开机过程里面常常会读取到的!

20.1.9. Run level 的切换: runlevel, init
在我们完成上面的所有信息后,其实整个 Linux 主机就已经在等待我们使用者的登入! 但是,相信您应该还是会有一点疑问的地方,那我该如何切换 run level 呢?会不会很难啊? 很简单~但是依据执行的时间而有不同的方式!
事实上,与 run level 有关的启动其实是在 /etc/rc.d/rc.sysinit 执行完毕之后。也就是说,其实 run level 的不同仅是 /etc/rc[0-6].d 里面启动的服务不同而已。不过,依据开机是否自动进入不同 run level 的设定,我们可以说:

  • 要每次开机都执行某个预设的 run level ,则需要修改 /etc/inittab 内的设定项目, 亦即是『 id:5:initdefault: 』里头的数字;
  • 如果仅只是暂时变更系统的 run level 时,则使用 init [0-6] 来进行 run level 的变更。 但下次重新启动时,依旧会是以 /etc/inittab 的设定为准。

假设原本我们是以 run level 5 登入系统的,但是因为某些因素,想要切换成为 run level 3 时, 执行『 init 3 』即可切换。但是 init 3 这个动作到底做了什么呢?事实上,不同的 run level 只是加载的服务不同罢了, 亦即是 /etc/rc5.d/ 还有 /etc/rc3.d 内的 Sxxname 与 Kxxname 有差异而已。 所以说,当执行 init 3 时,系统会:

  • 先比对 /etc/rc3.d/ 及 /etc/rc5.d 内的 K 与 S 开头的档案;
  • 在新的 runlevel 亦即是 /etc/rc3.d/ 内有多的 K 开头档案,则予以关闭;
  • 在新的 runlevel 亦即是 /etc/rc3.d/ 内有多的 S 开头档案,则予以启动;

也就是说,两个 run level 都存在的服务就不会被关闭!如此一来,就很无奈容易切换 run level 了, 而且还不需要重新启动! 那我怎么知道目前的 run level 是多少呢? 直接在 bash 当中输入 runlevel 即可!
这里写图片描述
那么你能不能利用 init 来进行关机与重新启动呢?可以的!利用『 init 0 』就能够关机, 而『 init 6 』就能够重新启动!

20.2. 核心与核心模块
谈完了整个开机的流程,您应该会知道,在整个开机的过程当中,是否能够成功的驱动我们主机的硬件配备, 是核心 (kernel) 的工作!而核心一般都是压缩文件,因此在使用核心之前,就得要将他解压缩后, 才能加载主存储器当中。 另外,为了应付日新月异的硬件,目前的核心都是具有『可读取模块化驱动程序』的功能, 亦即是所谓的『 modules (模块化)』的功能!所谓的模块化可以将他想成是一个『插件』, 该插件可能由硬件开发厂商提供,也有可能我们的核心本来就支持~不过,较新的硬件, 通常都需要硬件开发商提供驱动程序模块!
那么核心与核心模块放在哪?

  • 核心: /boot/vmlinuz 或 /boot/vmlinuz-version;
  • 核心解压缩所需 RAM Disk: /boot/initrd (/boot/initrd-version);
  • 核心模块: /lib/modules/version/kernel 或 /lib/modules/$(uname -r)/kernel;
  • 核心原始码: /usr/src/linux (要安装才会有!否则预设不安装的!)

如果该核心被顺利的加载系统当中了,那么就会有几个信息记录下来:

  • 核心版本: /proc/version
  • 系统核心功能: /proc/sys/kernel

问题来啦,如果我有个新的硬件,偏偏我的操作系统不支持,该怎么办?

  • 重新编译核心,并加入最新的硬件驱动程序原始码;
  • 将该硬件的驱动程序编译成为模块,在开机时加载该模块;

上面第一点还很好理解,反正就是重新编译核心就是了。不过,核心编译很不容易啊! 我们会在后续章节约略介绍核心编译的整个程序。比较有趣的则是将该硬件的驱动程序编译成为模块! 关于编译的方法,可以参考后续的第二十二章、原始码与 tarball的介绍。 我们这个章节仅是说明一下,如果想要加载一个已经存在的模块时,该如何是好?

20.2.1. 核心模块与相依性: depmod
既然要处理核心模块,自然就得要了解我们核心提供的模块之间的相关性! 基本上,核心模块的放置处是在 /lib/modules/$(uname -r)/kernel 当中,里面主要还分成几个目录:
这里写图片描述
如果要我们一个一个的去检查这些模块的主要信息,然后定义出他们的相依性, 我们可能会疯掉吧!所以我们的 Linux 当然会提供一些模块相依性的解决方案!那就是检查 /lib/modules/$(uname -r)/modules.dep 这个档案!他记录了在核心支持的模块的各项相依性。
那么这个档案如何建立呢?利用 depmod 这个指令就可以达到建立该档案的需求了!
这里写图片描述
以上面的范例一为例,我们的 Linux kernel 2.6.x 版本的核心模块扩展名一定是 .ko 结尾的, 当你使用 depmod 之后,该程序会跑到模块标准放置目录 /lib/modules/$(uname -r)/kernel , 并依据相关目录的定义将全部的模块捉出来分析,最终才将分析的结果写入 modules.dep 档案中的! 这个档案很重要!因为他会影响到本章稍后会介绍的 modprobe 指令的应用!

20.2.2. 核心模块的观察: lsmod, modinfo
那你到底晓不晓得目前核心加载了多少的模块呢?利用 lsmod 即可!
这里写图片描述
使用 lsmod 之后,系统会显示出目前已经存在于核心当中的模块,显示的内容包括有:

  • 模块名称(Module);
  • 模块的大小(size);
  • 此模块是否被其他模块所使用 (Used by)。

也就是说,模块其实真的有相依性!举上表为例, mii 这个模块会被 8139too 所使用。 简单的说,就是『当你要加载 8139too 时,需要先加载 mii 这个模块才可以顺利的加载 8139too』的意思。 那么除了显示出目前的模块外,我还可以查阅每个模块的信息吗?举例来说,我们知道 8139too 是螃蟹卡的驱动程序,那么 mii 是什么咚咚?就用 modinfo 来观察吧!
这里写图片描述
事实上,这个 modinfo 除了可以『查阅在核心内的模块』之外,还可以检查『某个模块档案』, 因此,如果你想要知道某个档案代表的意义为何,利用 modinfo 加上完整档名! 看看就晓得是啥玩意儿啰!

20.2.3. 核心模块的加载与移除:insmod, modprobe, rmmod
如果我想要自行手动加载模块,又该如何是好?最简单而且建议的,是使用 modprobe 这个指令来加载模块, 这是因为 modprobe 会主动的去搜寻 modules.dep 的内容,先克服了模块的相依性后, 才决定需要加载的模块有哪些。至于 insmod 则完全由使用者自行加载一个完整文件名的模块, 并不会主动的分析模块相依性!
这里写图片描述
他立刻就将该模块加载~但是 insmod 后面接的模块必须要是完整的『档名』才行!那如何移除这个模块呢?
这里写图片描述
使用 insmod 与 rmmod 的问题就是,你必须要自行找到模块的完整文件名才行,而且如同上述范例二的结果, 万一模块有相依属性的问题时,你将无法直接加载或移除该模块!所以近年来我们都建议直接使用 modprobe 来处理模块加载的问题,这个指令的用法是:
这里写图片描述
使用 modprobe 真的是要比 insmod 方便很多!因为他是直接去搜寻 modules.dep 的记录, 所以当然可以克服模块的相依性问题,而且还不需要知道该模块的详细路径!
这里写图片描述

20.2.4. 核心模块的额外参数设定:/etc/modprobe.conf
这个档案我们之前已经谈过了,这里只是再强调一下而已,如果您想要修改某些模块的额外参数设定, 就在这个档案内设定!假设我的网络卡 eth0 是使用 ne , 但是 eth1 同样也使用 ne ,为了避免同一个模块会导致网络卡的错乱, 因此,我可以先找到 eth0 与 eth1 的 I/O 与 IRQ ,假设:

  • eth0 : I/O (0x300) 且 IRQ=5;
  • eth1 : I/O (0x320) 且 IRQ=7;

则:
这里写图片描述
如此一来,我的 Linux 就不会捉错网络卡的对应!因为被我强制指定某个 I/O !

20.3. Boot loader: Grub
在看完了前面的整个开机流程以及核心模块的整理之后,你应该会发现到一件事情, 那就是『 boot loader 是载入核心的重要工具』啊!没有 boot loader 的话,那么 kernel 根本就没有办法被系统加载的!所以,底下我们会先谈一谈 boot loader 的功能, 然后再讲一讲现阶段 Linux 里头最主流的 grub 这个 boot loader !

20.3.1. boot loader 的两个 stage
我们在第一小节开机流程的地方曾经讲过,在 BIOS 读完信息后,接下来就是会到第一个开机装置的 MBR 去读取 boot loader 了。这个 boot loader 可以具有选单功能、直接加载核心档案以及控制权移交的功能等, 系统必须要有 loader 才有办法加载该操作系统的核心就是了。但是我们都知道, MBR 是整个硬盘的第一个 sector 内的一个区块,充其量整个大小也才 446 bytes 而已。 我们的 loader 功能这么强,光是程序代码与设定数据不可能只占不到 446 bytes 的容量吧?那如何安装?
为了解决这个问题,所以 Linux 将 boot loader 的程序代码执行与设定值加载分成两个阶段 (stage) 来执行:

  • Stage 1:执行 boot loader 主程序:
    第一阶段为执行 boot loader 的主程序,这个主程序必须要被安装在开机区,亦即是 MBR 或者是 boot sector 。但如前所述,因为 MBR 实在太小了,所以,MBR 或 boot sector 通常仅安装 boot loader 的最小主程序, 并没有安装 loader 的相关配置文件;
  • Stage 2:主程序加载配置文件:
    第二阶段为透过 boot loader 加载所有配置文件与相关的环境参数档案 (包括文件系统定义与主要配置文件 menu.lst), 一般来说,配置文件都在 /boot 底下。

那么这些配置文件是放在哪里啊?这些与 grub 有关的档案都放置到 /boot/grub 中,那我们就来看看有哪些档案吧!
这里写图片描述
从上面的说明你可以知道 /boot/grub/ 目录下最重要的就是配置文件 (menu.lst) 以及各种文件系统的定义! 我们的 loader 读取了这种文件系统定义数据后,就能够认识文件系统并读取在该文件系统内的核心档案。 至于 grub 的配置文件档名,其实应该是 menu.lst 的,只是在 Red Hat 里面被定义成为 /boot/grub.conf 而已。 建议您还是记忆 menu.lst 比较好!
所以从上面的档案来看, grub 认识的文件系统真的非常多!正因为如此,所以 grub 才会取代 Lilo 这个老牌的 boot loader !好了,接下来就来瞧瞧配置文件内有啥设定值吧!

20.3.2. grub 的配置文件 /boot/grub/menu.lst 与选单类型: 磁盘代号, menu.lst
grub 是目前使用最广泛的 Linux 开机管理程序,旧的 Lilo 这个开机管理程序现在已经很少见了, 所以本章才会将 Lilo 的介绍舍弃的说。grub 的优点挺多的,包括有:

  • 认识与支持较多的文件系统,并且可以使用 grub 的主程序直接在文件系统中搜寻核心档名;
  • 开机的时候,可以『自行编辑与修改开机设定项目』,类似 bash 的指令模式;
  • 可以动态搜寻配置文件,而不需要在修改配置文件后重新安装 grub 。亦即是我们只要修改完 /boot/grub/menu.lst 里头的设定后,下次开机就生效了!

上面第三点其实就是 Stage 1, Stage 2 分别安装在 MBR (主程序) 与文件系统当中 (配置文件与定义档) 的原因!接下来,让我们好好了解一下 grub 的配置文件: /boot/grub/menu.lst ! 要注意喔,那个 lst 是 LST 的小写,不要搞错!

一、硬盘与分割槽在 grub 中的代号
安装在 MBR 的 grub 主程序,最重要的任务之一就是从磁盘当中加载核心档案, 以让核心能够顺利的驱动整个系统的硬件。所以 grub 必须要认识硬盘才行!那么 grub 到底是如何认识硬盘的呢? grub 对硬盘的代号设定与传统的 Linux 磁盘代号可完全是不同的!grub 对硬盘的识别使用的是如下的代号:
(hd0,0)
够神了吧?跟 /dev/hda1 风马牛不相干~怎么办啊?其实只要注意几个东西即可,那就是:

  • 硬盘代号以小括号 ( ) 包起来;
  • 硬盘以 hd 表示,后面会接一组数字;
  • 以『搜寻顺序』做为硬盘的编号,而不是依照硬盘扁平电缆的排序!(这个重要!)
  • 第一个搜寻到的硬盘为 0 号,第二个为 1 号,以此类推;
  • 每颗硬盘的第一个 partition 代号为 0 ,依序类推。

所以说,第一颗『搜寻到的硬盘』代号为:『(hd0)』,而该颗硬盘的第一号分割槽为『(hd0,0)』,这样说了解了吧? 反正你要记得,在 grub 里面,他开始的数字是 0 而不是 1 就是了!
所以说,整个硬盘代号为:
这里写图片描述
第一颗硬盘的 MBR 安装处的硬盘代号就是『(hd0)』, 而第一颗硬盘的第一个分割槽的 boot sector 代号就是『(hd0,0)』第一颗硬盘的第一个逻辑分割槽的 boot sector 代号为『(hd0,4)』!

二、/boot/grub/menu.lst 配置文件:
了解了 grub 当中最麻烦的硬盘代号后,接下来,我们就可以瞧一瞧配置文件的内容了。先看一下我的 CentOS 内的 /boot/grub/menu.lst 好了:
这里写图片描述
这里写图片描述
在 title 以前的四行,都是属于 grub 的整体设定,包括预设的等待时间与默认的开机项目, 还有显示的画面特性等等。至于 title 后面才是指定开机的核心档案或者是 boot loader 控制权。 在整体设定方面的项目主要常见的有:

  • default=0
    这个必须要与 title 作为对照,在配置文件里面有几个 title ,开机的时候就会有几个选单可以选择。 由于 grub 启始号码为 0 号,因此 default=0 代表使用『第一个 title 项目』来开机的意思。 default 的意思是,如果在读秒时间结束前都没有动到键盘, grub 默认使用此 title 项目 (在此为 0 号) 来开机。
  • timeout=5
    开机时会进行读秒,如果在 5 秒钟内没有按下任何按键,就会使用上面提到的 default 后面接的那个 title 项目来开机的意思。如果你觉得 5 秒太短,那可以将这个数值调大 (例如 30 秒) 即可。此外,如果 timeout=0 代表直接使用 default 值进行开机而不读秒,timeout=-1 则代表直接进入选单不读秒了!
  • splashimage=(hd0,0)/grub/splash.xpm.gz
    有没有发现你的 CentOS 在开机的时候背景不是黑白而是有色彩变化的呢?那就是这个档案提供的背景图示(注3) !不过这个档案的实际路径写法怎么会是这样啊?上述的意思是:在 (hd0,0) 这个分割槽内的最顶层目录中,底下的 grub/splash.xpm.gz 那个档案的意思。 由于我将 /boot 这个目录独立成为 /dev/hda1 ,因此这边就会写成『在 /dev/hda1 里面的 grub/splash.xpm.gz 』的意思!想一想,如果你的 /boot 目录并没有独立成为一个分割槽, 这里会写成如何?
  • hiddenmenu
    这个说的是,开机时是否要显示选单?目前 CentOS 默认是不要显示选单, 如果您想要显示选单,那就将这个设定值批注掉!

整体设定的地方大概是这样,而底下那个 title 则是显示开机的设定项目。如同前一小节提到的,开机时可以选择 (1)直接指定核心档案开机或 (2)将 boot loader 控制权转移到下个 loader (此过程称为 chain-loader)。每个 title 后面接的是『该开机项目名称的显示』,亦即是在选单出现时,选单上面的名称而已。 那么这两种方式的设定有啥不同呢?

  1. 直接指定核心开机
    既然要指定核心开机,所以当然要找到核心档案!此外,有可能还需要用到 initrd 的 RAM Disk 配置文件。但是如前说的, 尚未开机完成,所以我们必须要以 grub 的硬盘识别方式找出完整的 kernel 与 initrd 档名才行。 因此,我们可能需要有底下的方式来设定才行!
    这里写图片描述
    上面的 root, kernel, initrd 后面接的参数的意义说明如下:
    o root :
    代表的是『核心档案放置的那个 partition 而不是根目录』!不要搞错了! 以我的案例来说,我的根目录为 /dev/hda2 而 /boot 独立为 /dev/hda1 ,因为与 /boot 有关, 所以磁盘代号就会成为 (hd0,0) 。
    o kernel :
    至于 kernel 后面接的则是核心的档名,而在档名后面接的则是核心的参数。 由于开机过程中需要挂载根目录,因此 kernel 后面接的那个 root=LABEL=/1 指的是『Linux 的根目录在哪个 partition 』的意思。 还记得第八章谈过的 LABEL 挂载功能吧? 是的,这里使用 LABEL 来挂载根目录。至于 rhgb 为色彩显示而 quiet 则是安静模式 (屏幕不会输出核心侦测的信息)。
    o initrd :
    就是前面提到的 initrd 制作出 RAM Disk 的档案档名!
    这里写图片描述
    我比较喜欢这种样式的文件名写法,因为这样我们就能够知道核心档案是在哪个装置内的某个文件名, 而不会去想到我们的根目录 (/, root) !让我们来想想 /boot 有独立分割与无独立分割的情况吧!
    这里写图片描述
    这里写图片描述
  2. 利用 chain loader 的方式转交控制权所谓的 chain loader (开机管理程序的链结) 仅是在将控制权交给下一个 boot loader 而已, 所以 grub 并不需要认识与找出 kernel 的档名 ,『 他只是将 boot 的控制权交给下一个 boot sector 或 MBR 内的 boot loader 而已 』 所以通常他也不需要去查验下一个 boot loader 的文件系统! 一般来说, chain loader 的设定只要两个就够了,一个是预计要前往的 boot sector 所在的分割槽代号, 另一个则是设定 chainloader 在那个分割槽的 boot sector (第一个扇区) 上!假设我的 Windows 分割槽在 /dev/hda1 ,且我又只有一颗硬盘,那么要 grub 将控制权交给 windows 的 loader 只要这样就够了:
    这里写图片描述
    上面的范例中,我们可以很简单的这样想:那个 (hd0,0) 就是 Windows 的 C 槽所在磁盘, 而 chainloader +1 就是让系统加载该分割槽当中的第一个扇区 (就是 boot sector) 内的开机管理程序。 不过,由于 Windows 的开机碟需要设定为活化 (active) 状态,且我们的 grub 预设会去检验该分割槽的文件系统。 因此我们可以重新将上面的范例改写成这样:
    这里写图片描述
    grub 的功能还不止此,他还能够隐藏某些分割槽。举例来说,我的 /dev/hda5 是安装 Linux 的分割槽, 我不想让 Windows 能够认识这个分割槽时,你可以这样做:
    这里写图片描述

20.3.3. initrd 的重要性与建立新 initrd 档案: mkinitrd
我们在本章稍早之前『 boot loader 与 kernel 载入』的地方已经提到过 initrd 这玩意儿,他的目的在于提供开机过程中所需要的最重要核心模块,以让系统开机过程可以顺利完成。 会需要 initrd 的原因,是因为核心模块放置于/lib/modules/$(uname -r)/kernel/ 当中, 这些模块必须要根目录 (/) 被挂载时才能够被读取。但是如果核心本身不具备磁盘的驱动程序时, 当然无法挂载根目录,也就没有办法取得驱动程序,因此造成两难的地步。
initrd 可以将 /lib/modules/…. 内的『开机过程当中一定需要的模块』包成一个档案 (档名就是 initrd), 然后在开机时透过主机的 INT 13 硬件功能将该档案读出来解压缩,并且 initrd 在内存内会仿真成为根目录, 由于此虚拟文件系统 (Initial RAM Disk) 主要包含磁盘与文件系统的模块,因此我们的核心最后就能够认识实际的磁盘, 那就能够进行实际根目录的挂载!所以说:『initrd 内所包含的模块大多是与开机过程有关,而主要以文件系统及硬盘模块 (如 usb, SCSI 等) 为主』的!
一般来说,需要 initrd 的时刻为:

  • 根目录所在磁盘为 SATA、USB 或 SCSI 等连接接口;
  • 根目录所在文件系统为 LVM, RAID 等特殊格式;
  • 根目录所在文件系统为非传统 Linux 认识的文件系统时;

一般来说,各 distribution 提供的核心都会附上 initrd 档案,但如果你有特殊需要所以想重制 initrd 档案的话, 可以使用 mkinitrd 来处理的。这个档案的处理方式很简单, man mkinitrd 就知道了! 我们还是简单的介绍一下去!
这里写图片描述
这里写图片描述
initrd 建立完成之后,同时核心也处理完毕后,我们就可以使用 grub 来建立选单了!

20.3.4. 测试与安装 grub: grub-install, grub shell
如果你的 Linux 主机本来就是使用 grub 作为 loader 的话,那么你就不需要重新安装 grub 了, 因为 grub 本来就会主动去读取配置文件!但如果你的 Linux 原来使用的并非 grub , 那么就需要来安装!如何安装呢?首先,你必须要使用 grub-install 将一些必要的档案复制到 /boot/grub 里面去,你应该这样做的:
这里写图片描述
这里写图片描述
所以说 grub-install 是安装 grub 相关的档案 (例如文件系统定义档) 到你的装置上面去等待在开机时被读取,但还需要设定好配置文件 (menu.lst) 后,再以 grub shell 来安装 grub 主程序到 MBR 或者是 boot sector 上面去 !那我们来思考一下想要安装的数据。
这里写图片描述
这里写图片描述
这里写图片描述
我们已经将配置文件处理完毕,但是你要知道的是,我们并不知道 /dev/hda1 到底有没有包含 grub 的主程序, 因此我们想要将 grub 主程序再次的安装到 /dev/hda1 的 boot sector ,也想要重新安装 grub 到 MBR 上面去。 此时我们就得要使用 grub shell !整个安装与 grub shell 的劢作其实很简单, 如果您有兴趣研究的话,可以使用 info grub 去查阅~这里仅介绍几个有用的指令而已。

  • 用『 root (hdx,x) 』选择含有 grub 目录的那个 partition 代号;
  • 用『 find /boot/grub/stage1 』看看能否找到安装信息档案;
  • 用『 find /boot/vmlinuz 』看看能否找到 kernel file (不一定要成功!);
  • 用『 setup (hdx,x) 』或『 setup (hdx) 』将 grub 安装在 boot sector 或 MBR;
  • 用『 quit 』来离开 grub shell !

由于我们最需要安装的就是那个 stage1 !那才是 grub 的主程序!而且配置文件通常与主程序摆在同一个目录下。 因此我们需要使用 root (hd0,0) 去找到 /boot/grub/stage1 !接下来,请用 grub 来进入 grub shell !进入 grub 后,会出现一个『 grub> 』的提示字符!
这里写图片描述
这里写图片描述
这里写图片描述
如此一来,就已经将 grub 安装到 MBR 及 /dev/hda1 的 boot sector 里面去了! 而且读取的是 (hd0,0) 里面的 /grub/menu.lst 那个档案!真是很重要!重要到不行!

  1. 如果是从其他 boot loader 转成 grub 时,得先使用 grub-install 安装 grub 配置文件;
  2. 开始编辑 menu.lst 这个重要的配置文件;
  3. 透过 grub 来将主程序安装到系统中,如 MBR 的 (hd0) 或 boot sector 的 (hd0,0) 等等。

20.3.5. 开机前的额外功能修改
事实上,上一个小节设定好之后,你的 grub 就已经在你的 Linux 系统上面了,而且同时存在于 MBR 与 boot sector 当中!所以,我们已经可以重新启动来查阅看看! 另外,如果你正在进行开机,那么请注意,我们可以在预设选单 (我的范例当中是 30 秒) 按下任意键, 还可以进行 grub 的『在线编修』功能!真是棒!先来看看开机画面!
这里写图片描述
由于我将隐藏选单的功能取消了,因此你会直接看到这四个选单,同时会有读秒的咚咚在倒数。 选单部分的画面其实就是 title 后面的文字!你现在知道如何修改 title 后面的文字了吧! 如果你使用上下键去选择第二 (/dev/hda1 boot sector) 或第三 (MBR loader) 时,会发现同样的画面重复出现! 这是因为那两个是 loader 移交而已!而我们都使用相同的 grub 与相同的 menu.lst 配置文件! 因此这个画面就会重复出现了!
另外,如果你再仔细看的话,会发现到上图中底部还有一些细部的选项,似乎有个 ‘e’ edit 的样子! 没错~ grub 支持在线编修指令!这是个很有用的功能!假如刚刚你将 menu.lst 的内容写错了,导致出现无法开机的问题时, 我们可以查阅该 title 选单的内容并加以修改!举例来说,我想要知道第一个选单的实际内容时,将反白光棒移动到第一个选单, 再按下 ‘e’ 会进入如下画面:
这里写图片描述
这不就是我们在 menu.lst 里面设定的东西吗?没错!此时你还可以继续进一步修改! 注意看到上图最底下的说明,你还可以使用:

  • e:进入 grub shell 的编辑画面;
  • o:在游标所在行底下再新增一行;
  • d:将游标所在行删除。

我们说过, grub 是可以直接使用核心档案来开机的,所以,如果您很清楚的知道你的根目录 (/) 在那个 partition ,而且知道你的核心档案档名 (通常都会有个 /boot/vmlinuz 连结到正确的档名), 那么直接在图三的画面当中,以上述的 o, d, e 三个按键来编修,成为类似底下这样:
这里写图片描述
按下 [Enter] 按键后,然后输入 b 来 boot ,就可以开机了!所以说,万一你的 /boot/grub/menu.lst 设定错误,或者是因为安装的缘故,或者是因为核心档案的缘故,导致无法顺利开机时,记得啊,可以在 grub 的选单部分, 使用 grub shell 的方式去查询 (find) 或者是直接指定核心档案,就能够开机了!
另外,很多时候我们的 grub 可能会发生错误,导致『连 grub 都无法启动』,那么根本就无法使用 grub 的在线编修功能嘛!怎么办?没关系啊!我们可以利用具有 grub 开机的 CD 来开机, 然后再以 CD 的 grub 的在线编修,同样可以使用硬盘上面的核心档案来开机!

20.3.6. 关于核心功能当中的 vga 设定
事实上,你的 tty1~tty6 除了 80x24 的分辨率外,还能够有其他分辨率的支持!但前提之下是你的核心必须支持 FRAMEBUFFER_CONSOLE 这个核心功能选项才行。如何确定有没有支持呢?你可以查阅 /boot/config-2.6.18-92.el5 这个档案,然后这样搜寻:
这里写图片描述
那么如何调整 tty1 ~ tty6 终端机的分辨率呢?先参考底下的表格再说 (此为十进制数值):
这里写图片描述
假设你想要将你的终端机屏幕分辨率调整到 1024x768 ,且颜色深度为 15bit 色的时候,就得要指定 vga=790 那个数字! 举例来说,我的 tty1 就想要这样的分辨率时,你可以这样做:
这里写图片描述
重新启动并选择此选单进入 Linux,你跑到 tty1 去看看就已经是 1024x768 的分辨率! 只是字会变的很小,但是画面的范围会加大就是了。不过,某些版本支持的是 16 进位制,所以还需要修改一下格式! 一般使用上表当中的值应该就可以了。不过,由于不同的操作系统与硬件可能会有不一样的情况,因此, 上面的值不见得一定可以在您的机器上面测试成功,建议您可以分别设定看看~以找出可以使用的值!

20.3.7. BIOS 无法读取大硬盘的问题
现今的硬盘容量越来越大,如果你使用旧的主板来安插大容量硬盘时,可能由于系统 BIOS 或者是其他问题, 导致 BIOS 无法判断该硬盘的容量,此时你的系统读取可能会有问题。为什么呢?
我们在本章一开始的开机流程讲过,当进入 Linux 核心功能后,他会主动的再去侦测一下整个系统, 因此 BIOS 捉不到的硬件在 Linux 核心反而可能会可以捉到而正常使用。举例来说,过去很多朋友常常会发现, 『我的系统使用 DVD 开机安装时,可以顺利的安装好 Linux ,但是第一次开机时, 屏幕只出现黑压压的一片,且出现 grub> 的字样,而无法进入 Linux 系统中』,这又是怎么一回事?

  • 在安装的过程中,由于是使用 DVD 或 CD 开机,因此加载 Linux 核心不成问题,而核心会去侦测系统硬件,因此可以捉到 BIOS 捉不到的硬盘,此时你确实可以安装 Linux 在大容量的硬盘上,且不会出现任何问题。
  • 但是在进入硬盘开机时,由于 kernel 与 initrd 档案都是透过 BIOS 的 INT 13 通道读取的, 因此你的 kernel 与 initrd 如果放置在 BIOS 无法判断的扇区中,当然就无法被系统加载,而仅会出现 grub shell (grub>) 等待你的处理而已。

更多 grub 错误的代码查询可以到底下的连结查阅:
http://orgs.man.ac.uk/documentation/grub/grub_toc.html#SEC_Contents

现在你知道问题所在就是 BIOS 无法读取大容量磁盘内的 kernel 与 initrd 档案。 那如何解决呢?就让 kernel 与 initrd 档案放置在大硬盘的最前头,由于 BIOS 至少可以读到大磁盘的 1024 磁柱内的数据,因此就能够读取核心与虚拟文件系统的档案。那如何让 kernel 与 initrd 放置到整颗硬盘的最前面呢?建立 /boot 独立分割槽,并将 /boot 放置到最前面即可!更多其他的解决方案可参考文后的延伸阅读(注4)
万一你已经安装了 Linux 且发生了上述的问题,那该怎办?你可以这样作的:

  • 最简单的做法,就是直接重灌,并且制作出 /boot 挂载的 partition ,同时确认该 partition 是在 1024 cylinder 之前才行。
  • 如果实在不想重灌,没有关系,利用我们刚刚上头提到的 grub 功能,额外建立一个可开机软盘, 或者是直接以光驱开机,然后以 grub 的编写能力进入 Linux 。
  • 另外的办法其实是骗过 BIOS ,直接将硬盘的 cylinder, head, sector 等等信息直接写到 BIOS 当中去,如此一来你的 BIOS 可能就可以读得到与支持的到你的大硬盘了。

不过还是建议您可以重新安装,并且制作出 /boot 这个 partition ! 这也是为啥这次更版中, 特别强调要分割出 /boot 这个分割槽的原因!

20.3.8. 为个别选单加上密码: grub-md5-crypt
如果你管理的是一间计算机教室,这间计算机教室因为可对外开放,但是你又担心某些 partition 被学生不小心的弄乱,因此你可能会想要将某些开机选单作个保护。这个时候,为每个选单作个加密的密码就是个可行的方案! 那如何在开机的过程里面提供密码保护呢?首先,你必须要建立密码,而且还需要是加密过后的! 否则人家跑到 /boot/grub/menu.lst 不就可以探查到你的开机密码了?那如何建立加密的密码呢? 我们可以透过 grub 提供的 md5 编码来处理的,如下所示:
这里写图片描述
上面产生的最后一行,由 $ 开始到 . 结束的那行,就是你的密码经过 md5 编码过后的咚咚! 将这个密码复制下来吧!假设我们要将第一个选项加入这个密码,而第四个选项加入另外的密码, 那你应该要这样做:
这里写图片描述
上表的案例中,我们两个选单进入的密码并不相同,可以进行同学的分类!不过这样也造成一个问题, 那就是一定要输入密码才能够进入开机流程,如果你在进程使用 reboot 重新启动,并且主机前面并没有任何人的话…. 你的主机并不会主动进入开机程序!
你必须要注意的是:password 这个项目一定要在 title 底下的第一行。 不过,此项功能还是可能被破解的,因为用户可以透过编辑模式 (e) 进入选单,并删除密码字段并按下 b 就能够进行开机流程了!真糟糕!那怎办?只好透过整体的 password (放在所有的 title 之前) , 然后在 title 底下的第一行设定 lock ,那使用者想要编辑时,也得要输入密才行!设定有点像这样:
这里写图片描述
这里写图片描述
那么重新启动后,画面会像这样:
这里写图片描述
你可以看到最下方仅出现 p 的功能,由于 2, 3, 4 选单并没有使用 lock ,因此这三个选单使用者还是可以执行开机程序, 但是第一个选单由于有 lock 项目,因此除非你输入正确的密码,否则第一个选单是无法被加载执行的。 另外,这个项目也能够避免你的 menu.lst 在开机的过程中被乱改,是具有保密 menu.lst 的功能! 与刚刚的选单密码功能不同。

20.4. 开机过程的问题解决
很多时候,我们可能因为做了某些设定,或者是因为不正常关机 (例如未经通知的停电等等) 而导致系统的 filesystem 错乱,此时,Linux 可能无法顺利开机成功,那怎么办呢?难道要重灌?当然不需要! 进入 run level 1 (单人维护模式) 去处理处理,应该就 OK 的!底下我们就来谈一谈如何处理几个常见的问题!

20.4.1. 忘记 root 密码的解决之道
大家都知道我的记忆力不佳,容易忘东忘西的,那如果连 root 的密码都忘记了,怎么办? 其实在 Linux 环境中 root 密码忘记时还是可以救回来的!只要能够进入并且挂载 / , 然后重新设定一下 root 的密码,就救回来了!这是因为开机流程中,若强制核心进入 runlevel 1 时, 默认是不需要密码即可取得一个 root 的 shell 来救援的。整个动作有点像这样:

  1. 重新启动!一定要重新启动!怎么重开都没关系;
  2. 在开机进入 grub 选单后, (1)在你要进入的选单上面点 ‘e’ 进入详细设定; (2)将光棒移动到 kernel 上方并点 ‘e’ 进入编辑画面; (3)然后出现如下画面来处理:
    这里写图片描述
    重点就是那个特殊字体的咚咚!按下 [enter] 再按下 b 就能够开机进入单人维护模式了。
  3. 进入单人维护模式后,系统会以 root 的权限直接给你一个 shell ,此时你就能够执行『 passwd 』这个指令来重建 root 的密码!然后直接『 init 5 』就可以切换成为 X 窗口接口!就是这么简单。

20.4.2. init 配置文件错误
前一个 root 密码挽救的方法其实可以用在很多地方,唯一一个无法挽救的情况,那就是 /etc/inittab 这个档案设定错误导致的无法开机!根据开机流程,我们知道 runlevel 0~6 都会读取 /etc/inittab 配置文件, 因此你使用 single mode (runlevel 1) 当然也是要读取 /etc/inittab 来进行开机的。那既然无法进入单人维护模式, 就表示这题无解啰?非也非也,既然预设的 init 无法执行,那我们就告诉核心不要执行 init ,改呼叫 bash ! 可以略过 init 吗?可以的,同样在开机进入 grub 后,同样在 grub edit 的情况下这样做:
这里写图片描述
因为我们指定了核心呼叫的第一支程序 (init) 变成 /bin/bash,因此 /sbin/init 就不会被执行。 又根据开机流程的说明,我们知道此时虽然可以利用 root 取得 bash 来工作,但此时 (1)除了根目录外,其他的目录都没有被挂载; (2)根目录被挂载成为只读状态。因此我们还需要进行一些动作才行!如下所示:
这里写图片描述
我仅下达两个指令,『 mount -o remount,rw / 』用途是将根目录重新挂载成为可擦写,至于『 mount -a 』则是参考 /etc/fstab 的内容重新挂载文件系统 ! 此时你又可以开机进行救援的工作了!只救援完毕后,你得要使用『 reboot 』重新启动才行!

20.4.3. BIOS 磁盘对应的问题 (device.map)
由于前硬盘很宜,所以很多朋友就想说:『那我能不能将 Windows 安装在 /dev/hda 而 Linux 安装在 /dev/hdb , 然后调整 BIOS 的开机装置顺序,如此则两套系统各有各的 loader 安装在个别硬盘的 MBR 当中了!』。 这个想法非常好,如此一来两者就不会互相干扰,因为每颗磁盘的 MBR 个别有不同操作系统的 loader ! 问题是,grub 对磁盘的装置代号使用的是侦测到的顺序! 也就是说,你调整了 BIOS 磁盘开机顺序后,你的 menu.lst 内的装置代号就可能会对应到错误的磁盘上了!啊!真想哭! 没关系的,我们可以透过 /boot/grub/device.map 这个档案来写死每个装置对 grub 磁盘代号的对应! 举例来说,我的这个档案内容如下:
这里写图片描述
如果你不清楚如何处理的话,也可以利用 grub-install 的功能!例如:
这里写图片描述
这样 device.map 就会主动的被更新了!

20.4.4. 因文件系统错误而无法开机
如果因为设定错误导致无法开机时,要怎么办啊?最容易出错的设定而导致无法顺利开机的步骤,通常就是 /etc/fstab 这个档案了,尤其是使用者在实作 Quota 时,最容易写错参数, 又没有经过 mount -a 来测试挂载,就立刻直接重新启动,真要命!无法开机成功怎么办? 这种情况的问题大多如下面的画面所示:
这里写图片描述
看到最后两行,他说可以输入 root 的密码继续加以救援!那请输入 root 的密码来取得 bash 并以 mount -o remount,rw / 将根目录挂载成可擦写后,继续处理吧!其实会造成上述画面可能的原因除了 /etc/fstab 编辑错误之外,如果你曾经不正常关机后,也可能导致文件系统不一致 (Inconsistent) 的情况, 也有可能会出现相同的问题!如果是扇区错乱的情况,请看到上图中的第二行处, fsck 告知其实是 /dev/md0 出错, 此时你就应该要利用 fsck 去检测 /dev/md0 才是!等到系统发现错误,并且出现『clear [Y/N]』时,输入『 y 』吧!
这个 fsck 的过程可能会很长,而且如果你的 partition 上面的 filesystem 有过多的数据损毁时, 即使 fsck 完成后,可能因为伤到系统槽,导致某些关键系统档案数据的损毁,那么依旧是无法进入 Linux 的。此时,就好就是将系统当中的重要数据复制出来,然后重新安装,并且检验一下, 是否实体硬盘有损伤的现象才好!不过一般来说,不太可能会这样~ 通常都是 fsck 处理完毕后,就能够顺利再次进入 Linux 了。

20.4.5. 利用 chroot 切换到另一颗硬盘工作
仔细检查一下,你的 Linux 里面应该会有一个名为 chroot 的指令才对!这是啥? 这是『 change root directory 』的意思!意思就是说,可以暂时将根目录移动到某个目录下, 然后去处理某个问题,最后再离开该 root 而回到原本的系统当中。
举例来说,补习班中心最容易有两三个 Linux 系统在同一个主机上面,假设我的第一个 Linux 无法进入了,那么我可以使用第二个 Linux 开机,然后在第二个 Linux 系统下将第一个 Linux 挂载起来, 最后用 chroot 变换到第一个 Linux ,就能够进入到第一个 Linux 的环境当中去处理工作了。
你同样也可以将你的 Linux 硬盘拔到另一个 Linux 主机上面去,然后用这个 chroot 来切换, 以处理你的硬盘问题!方法:

  1. 用尽任何方法,进入一个完整的 Linux 系统 ( run level 3 或 5 );
  2. 假设有问题的 Linux 磁盘在 /dev/hdb1 上面,且他整个系统的排列是:
  3. 挂载点 装置文件名
  4. / → /dev/hdb1
  5. /var → /dev/hdb2
  6. /home → /dev/hdb3
    /usr → /dev/hdb5
    若如此的话,那么在我目前的这个 Linux 底下,我可以建立一个目录,然后可以这样做:
    挂载点 装置文件名
    /chroot/ → /dev/hdb1
    /chroot/var/ → /dev/hdb2
    /chroot/home/ → /dev/hdb3
    /chroot/usr/ → /dev/hdb5
  7. 全部挂载完毕后,再输入『 chroot /chroot 』!你就会发现,怎么根目录 (/) 变成那个 /dev/hdb1 的环境了!

猜你喜欢

转载自blog.csdn.net/kk53976047/article/details/79572754
今日推荐