《操作系统》by李治军 | 实验9 - proc文件系统的实现

目录

一、实验目的

二、实验内容

三、实验准备

1. procfs 简介

2. 基本思路

四、实验过程

1. 增加新的文件类型

2. 让 mknod() 支持新的文件类型

(1)修改 mknod 系统调用

(2)初始化 procfs

3. 让 proc 文件可读

(1)添加 proc_read 函数外部调用

(2)添加 proc 文件的 proc_read() 调用

4. 实现 proc 文件的处理函数

(1)编写 proc.c

(2)修改 Makefile

5. 编译运行 


一、实验目的

1、掌握虚拟文件系统的实现原理。

2、实践文件、目录、文件系统等概念。

二、实验内容

       在 Linux 0.11 上实现 procfsproc件系统)内的 psinfo 结点(还可以实现 hdinfo 和 inodeinfo)。当读取该结点的内容时,可得到系统当前所有进程的状态信息。

例如,用 cat 命令显示 /proc/psinfo 和 /proc/hdinfo 的内容,可得到:

$ cat /proc/psinfo
pid    state    father    counter    start_time
0    1    -1    0    0
1    1    0    28    1
4    1    1    1    73
3    1    1    27    63
6    0    4    12    817

$ cat /proc/hdinfo
total_blocks:    62000;
free_blocks:    39037;
used_blocks:    22963;
...
  • procfs 及其结点要在内核启动时自动创建。
  • 相关功能实现在 fs/proc.c 文件内。

三、实验准备

1. procfs 简介

       正式的 Linux 内核实现了 procfs,它是一个虚拟文件系统(process file system),通常被 mount(挂载)到 /proc 目录上,通过虚拟文件和虚拟目录的方式提供访问系统参数的机会,所以有人称它为 “了解系统信息的一个窗口” 。

       这些虚拟的文件和目录并没有真实地存在在磁盘上,而是内核中各种数据的一种直观表示。虽然是虚拟的,但它们都可以通过标准的系统调用( open()read() … )访问。

例如,/proc/meminfo 中包含内存使用的信息,可以用 cat 命令显示其内容:

       其实,Linux 的很多系统命令就是通过读取 /proc 实现的。例如 uname -a 的部分信息就来自 /proc/version,而 uptime 的部分信息来自 /proc/uptime 和 /proc/loadavg 。

关于 procfs 更多的信息请访问:http://en.wikipedia.org/wiki/Procfs

2. 基本思路

       Linux 是通过文件系统接口实现 procfs,并在启动时自动将其 mount 到 /proc 目录上。

       此目录下的所有内容都是随着系统的运行自动建立、删除和更新的,而且它们完全存在于内存中,不占用任何外存空间。

       Linux 0.11 还没有实现虚拟文件系统,也就是,还没有提供增加新文件系统支持的接口。所以本实验只能在现有文件系统的基础上,通过打补丁的方式模拟一个 procfs 。

       Linux 0.11 使用的是 Minix 的文件系统,这是一个典型的基于 inode 的文件系统,《注释》一书对它有详细描述。它的每个文件都要对应至少一个 inode,而 inode 中记录着文件的各种属性,包括文件类型。文件类型有普通文件、目录、字符设备文件和块设备文件等。在内核中,每种类型的文件都有不同的处理函数与之对应。我们可以增加一种新的文件类型 —— proc 文件,并在相应的处理函数内实现 procfs 要实现的功能。 

四、实验过程

1. 增加新的文件类型

【提示】

在 include/sys/stat.h 文件中定义了几种文件类型和相应的测试宏:

#define S_IFMT  00170000

// 普通文件
#define S_IFREG  0100000

// 块设备
#define S_IFBLK  0060000

// 目录
#define S_IFDIR  0040000

// 字符设备
#define S_IFCHR  0020000
#define S_IFIFO  0010000
//……

// 测试 m 是否是普通文件
#define S_ISREG(m)      (((m) & S_IFMT) == S_IFREG)

// 测试 m 是否是目录
#define S_ISDIR(m)      (((m) & S_IFMT) == S_IFDIR)

// 测试 m 是否是字符设备
#define S_ISCHR(m)      (((m) & S_IFMT) == S_IFCHR)

// 测试 m 是否是块设备
#define S_ISBLK(m)      (((m) & S_IFMT) == S_IFBLK)
#define S_ISFIFO(m)     (((m) & S_IFMT) == S_IFIFO)

增加新的文件类型的方法分两步:

  • 定义一个类型宏 S_IFPROC ,其值应在 0010000 到 0100000 之间,但后四位八进制数必须是 0(这是 S_IFMT 的限制,分析测试宏可知原因),而且不能和已有的任意一个 S_IFXXX 相同。
  • 定义一个测试宏 S_ISPROC(m) ,形式仿照其它的 S_ISXXX(m) 

注意,C 语言中以 “0” 直接接数字的常数是八进制数。

开始添加:

#define S_IFPROC 0030000
#define S_ISPROC(m)     (((m) & S_IFMT) ==  S_IFPROC)

2. 让 mknod() 支持新的文件类型

(1)修改 mknod 系统调用

psinfo 和 hdinfo 结点要通过 mknod() 系统调用建立,所以要让它支持新的 proc 文件类型 。

修改 fs/namei.c 文件中的 sys_mknod() 函数中的一行代码,在 if 判断中增加关于 proc 文件系统的判断,如下:

if (S_ISBLK(mode) || S_ISCHR(mode) || S_ISPROC(mode))
     inode->i_zone[0] = dev;
// 文件系统初始化
inode->i_mtime = inode->i_atime = CURRENT_TIME;
inode->i_dirt = 1;
bh = add_entry(dir,basename,namelen,&de);

(2)初始化 procfs

【提示】

内核初始化的全部工作是在 main() 中完成,而 main() 在最后从内核态切换到用户态,并调用 init() 。

init() 做的第一件事情就是挂载根文件系统:

void init(void)
{
//    ……
    setup((void *) &drive_info);
//    ……
}

procfs 的初始化工作应该在挂载根文件系统之后开始,它包括两个步骤:

  • 建立 /proc 目录;建立 /proc 目录下的各个结点
  • 建立目录和结点分别需要调用 mkdir() 和 mknod() 系统调用。因为初始化时已经在用户态,所以不能直接调用 sys_mkdir() 和 sys_mknod() 。必须在初始化代码所在文件中实现这两个系统调用的用户态接口,即 API:
#ifndef __LIBRARY__
#define __LIBRARY__
#endif

_syscall2(int,mkdir,const char*,name,mode_t,mode)
_syscall3(int,mknod,const char*,filename,mode_t,mode,dev_t,dev)

建立目录和结点的对应参数:

mkdir() 建立 /proc 目录mode 参数的值可以是 “0755”(对应 rwxr-xr-x ),表示只允许 root 用户改写此目录,其它人只能进入和读取此目录。

procfs 是一个只读文件系统,所以用 mknod() 建立 psinfo 结点时,必须通过 mode 参数将其设为只读。建议使用 S_IFPROC|0444 做为 mode 值,表示这是一个 proc 文件,权限为 0444(r--r--r--),对所有用户只读。

mknod() 的第三个参数 dev 用来说明结点所代表的设备编号。对于 procfs 来说,此编号可以完全自定义。proc 文件的处理函数将通过这个编号决定对应文件包含的信息是什么。例如,可以把 0 对应 psinfo,1 对应 hdinfo,2 对应 inodeinfo 。

开始添加:

① 在 init/main.c 中添加 mkdir()mknod() 的 API:

② 在 init/main.c 的 init 函数中初始化 procfs

mkdir("/proc",0755);
mknod("/proc/psinfo",S_IFPROC|0444,0);
mknod("/proc/hdinfo",S_IFPROC|0444,1);
mknod("/proc/inodeinfo",S_IFPROC|0444,2);

【测试初始化效果】 

如此项工作完成得没有问题,那么编译、运行 0.11 内核后,通过 ll /proc 可以看到:

还可以试着通过 cat 读一下此文件:

上面的 inode->i_mode 就是通过 mknod() 设置的 mode,前面的 030 和我们设置的 S_IFPROC 有关。通过此值可以了解 mknod() 工作是否正常。以上这些信息说明内核在对 psinfo、hdinfo、inodeinfo 进行读操作时不能正确处理,向 cat 返回了 EINVAL 错误。这是因为还没有实现处理函数,所以很正常。

以上信息至少说明,psinfo、hdinfo、inodeinfo 被正确 open() 了。所以我们不需要对 sys_open() 动任何手脚,唯一要打补丁的,是 sys_read() 。

3. 让 proc 文件可读

【提示】

首先分析 sys_read(在文件 fs/read_write.c 中):

int sys_read(unsigned int fd,char * buf,int count)
{
    struct file * file;
    struct m_inode * inode;
//    ……
    inode = file->f_inode;
    if (inode->i_pipe)
        return (file->f_mode&1)?read_pipe(inode,buf,count):-EIO;
    if (S_ISCHR(inode->i_mode))
        return rw_char(READ,inode->i_zone[0],buf,count,&file->f_pos);
    if (S_ISBLK(inode->i_mode))
        return block_read(inode->i_zone[0],&file->f_pos,buf,count);
    if (S_ISDIR(inode->i_mode) || S_ISREG(inode->i_mode)) {
        if (count+file->f_pos > inode->i_size)
            count = inode->i_size - file->f_pos;
        if (count<=0)
            return 0;
        return file_read(inode,file,buf,count);
    }

    printk("(Read)inode->i_mode=%06o\n\r",inode->i_mode);    //这条信息很面善吧?
    return -EINVAL;
}

显然,要在这里一群 if 的排比中,加上 S_IFPROC() 的分支,进入对 proc 文件的处理函数,需要传给处理函数的参数包括:

  • inode->i_zone[0],这就是 mknod() 时指定的 dev ——设备编号。
  • buf,指向用户空间,就是 read() 的第二个参数,用来接收数据。
  • count,就是 read() 的第三个参数,说明 buf 指向的缓冲区大小。
  • &file->f_posf_pos 是上一次读文件结束时 “文件位置指针” 的指向。这里必须传指针,因为处理函数需要根据传给 buf 的数据量修改 f_pos 的值。

(1)添加 proc_read 函数外部调用

在 fs/read_write.c 添加 extern proc_read ,表示 proc_read 函数是从外部调用的。

/* 新增proc_read函数外部调用 */
extern int proc_read(int dev,char* buf,int count,unsigned long *pos);

(2)添加 proc 文件的 proc_read() 调用

sys_read 函数中仿照其他 if 语句,加上 S_IFPROC() 的分支,添加对 proc 文件的 proc_read() 调用处理。

/* 新增proc_read调用 */
if (S_ISPROC(inode->i_mode))
    return proc_read(inode->i_zone[0],&file->f_pos,buf,count);

4. 实现 proc 文件的处理函数

【提示】

proc 文件的处理函数的功能是根据设备编号,把不同的内容写入到用户空间的 buf 。写入的数据要从 f_pos 指向的位置开始,每次最多写 count 个字节,并根据实际写入的字节数调整 f_pos 的值,最后返回实际写入的字节数。当设备编号表明要读的是 psinfo 的内容时,就要按照 psinfo 的形式组织数据。

实现此函数可能要用到如下几个函数:

  • malloc()
  • free()

包含 linux/kernel.h 头文件后,就可以使用 malloc() 和 free() 函数。它们是可以被核心态代码调用的,唯一的限制是一次申请的内存大小不能超过一个页面。

(1)编写 proc.c

fs 目录下新增 proc.c 文件:

代码来源

#include <linux/kernel.h>
#include <linux/sched.h>
#include <asm/segment.h>
#include <linux/fs.h>
#include <stdarg.h>
#include <unistd.h>

#define set_bit(bitnr,addr) ({ \
register int __res ; \
__asm__("bt %2,%3;setb %%al":"=a" (__res):"a" (0),"r" (bitnr),"m" (*(addr))); \
__res; })

char proc_buf[4096] ={'\0'};

extern int vsprintf(char * buf, const char * fmt, va_list args);

//Linux0.11没有sprintf(),该函数是用于输出结果到字符串中的,所以就实现一个,这里是通过vsprintf()实现的。
int sprintf(char *buf, const char *fmt, ...)
{
	va_list args; int i;
	va_start(args, fmt);
	i=vsprintf(buf, fmt, args);
	va_end(args);
	return i;
}

int get_psinfo()
{
	int read = 0;
	read += sprintf(proc_buf+read,"%s","pid\tstate\tfather\tcounter\tstart_time\n");
	struct task_struct **p;
	for(p = &FIRST_TASK ; p <= &LAST_TASK ; ++p)
 	if (*p != NULL)
 	{
 		read += sprintf(proc_buf+read,"%d\t",(*p)->pid);
 		read += sprintf(proc_buf+read,"%d\t",(*p)->state);
 		read += sprintf(proc_buf+read,"%d\t",(*p)->father);
 		read += sprintf(proc_buf+read,"%d\t",(*p)->counter);
 		read += sprintf(proc_buf+read,"%d\n",(*p)->start_time);
 	}
 	return read;
}

/*
*  参考fs/super.c mount_root()函数
*/
int get_hdinfo()
{
	int read = 0;
	int i,used;
	struct super_block * sb;
	sb=get_super(0x301);  /*磁盘设备号 3*256+1*/
	/*Blocks信息*/
	read += sprintf(proc_buf+read,"Total blocks:%d\n",sb->s_nzones);
	used = 0;
	i=sb->s_nzones;
	while(--i >= 0)
	{
		if(set_bit(i&8191,sb->s_zmap[i>>13]->b_data))
			used++;
	}
	read += sprintf(proc_buf+read,"Used blocks:%d\n",used);
	read += sprintf(proc_buf+read,"Free blocks:%d\n",sb->s_nzones-used);
	/*Inodes 信息*/
	read += sprintf(proc_buf+read,"Total inodes:%d\n",sb->s_ninodes);
	used = 0;
	i=sb->s_ninodes+1;
	while(--i >= 0)
	{
		if(set_bit(i&8191,sb->s_imap[i>>13]->b_data))
			used++;
	}
	read += sprintf(proc_buf+read,"Used inodes:%d\n",used);
	read += sprintf(proc_buf+read,"Free inodes:%d\n",sb->s_ninodes-used);
 	return read;
}

int get_inodeinfo()
{
	int read = 0;
	int i;
	struct super_block * sb;
	struct m_inode *mi;
	sb=get_super(0x301);  /*磁盘设备号 3*256+1*/
	i=sb->s_ninodes+1;
	i=0;
	while(++i < sb->s_ninodes+1)
	{
		if(set_bit(i&8191,sb->s_imap[i>>13]->b_data))
		{
			mi = iget(0x301,i);
			read += sprintf(proc_buf+read,"inr:%d;zone[0]:%d\n",mi->i_num,mi->i_zone[0]);
			iput(mi);
		}
		if(read >= 4000) 
		{
			break;
		}
	}
 	return read;
}

int proc_read(int dev, unsigned long * pos, char * buf, int count)
{
	
 	int i;
	if(*pos % 1024 == 0)
	{
		if(dev == 0)
			get_psinfo();
		if(dev == 1)
			get_hdinfo();
		if(dev == 2)
			get_inodeinfo();
	}
 	for(i=0;i<count;i++)
 	{
 		if(proc_buf[i+ *pos ] == '\0')  
          break; 
 		put_fs_byte(proc_buf[i+ *pos],buf + i+ *pos);
 	}
 	*pos += i;
 	return i;
}

(2)修改 Makefile

Makefile 在代码树中有很多,分别负责不同模块的编译工作。上面的 proc.c 添加在 fs 目录下,所以要对应修改 fs 目录下的 Makefile 。

OBJS=	open.o read_write.o inode.o file_table.o buffer.o super.o \
	block_dev.o char_dev.o file_dev.o stat.o exec.o pipe.o namei.o \
	bitmap.o fcntl.o ioctl.o truncate.o proc.o

//......

### Dependencies:

proc.o : proc.c ../include/linux/kernel.h ../include/linux/sched.h \
  ../include/linux/head.h ../include/linux/fs.h ../include/sys/types.h \
  ../include/linux/mm.h ../include/signal.h ../include/asm/segment.h

5. 编译运行 

重新编译运行 Linux 0.11,通过 cat proc/xxx 查看 psinfo(当前系统进程状态信息)和 hdinfo (硬盘信息)的信息。

猜你喜欢

转载自blog.csdn.net/Amentos/article/details/131469815