1、proc文件系统的实现实验目的 掌握虚拟文件系统的实现原理 实践文件、目录、索引节点等概念实验内容在Linux 0.11上实现 procfs(proc 文件系统)内的psinfo结点。当读取此结点的内容时,可得到系统当前所有进程的状态信息。例如,用cat命令显示/proc/psinfo的内容,可得到:# cat /proc/psinfopid state fathercounter start_time0 1 -1 0 01 1 0 28 14 1 1 1 733 1 1 27 636 0 4 12 817procfs及其结点要在内核启动时自动创建。相关功能实现在fs/proc.c文件内。实验
2、报告完成实验后,在实验报告中回答如下问题:1. 如果要求你在psinfo之外再实现另一个结点,具体内容自选,那么你会实现一个给出什么信息的结点?为什么?2. 一次read()未必能读出所有的数据,需要继续read() ,直到把数据读空为止。而数次read()之间,进程的状态可能会发生变化。你认为后几次read()传给用户的数据,应该是变化后的,还是变化前的?1. 如果是变化后的,那么用户得到的数据衔接部分是否会有混乱?如何防止混乱?2. 如果是变化前的,那么该在什么样的情况下更新psinfo的内容?评分标准 自动创建/proc,20% 自动创建/proc/psinfo,20% psinfo内容
3、可读,20% psinfo内容符合题目要求,20% 实验报告,20%实验提示procfs简介正式的Linux内核实现了 procfs,它是一个虚拟文件系统,通常被mount 到/proc目录上,通过虚拟文件和虚拟目录的方式提供访问系统参数的机会,所以有人称它为“了解系统信息的一个窗口”。这些虚拟的文件和目录并没有真实地存在在磁盘上,而是内核中各种数据的一种直观表示。虽然是虚拟的,但它们都可以通过标准的系统调用(open()、read()等)访问。例如,/proc/meminfo中包含内存使用的信息,可以用cat命令显示其内容:$ cat /proc/meminfo MemTotal: 3847
4、80 kBMemFree: 13636 kBBuffers: 13928 kBCached: 101680 kBSwapCached: 132 kBActive: 207764 kBInactive: 45720 kBSwapTotal: 329324 kBSwapFree: 329192 kBDirty: 0 kBWriteback: 0 kB其实,Linux的很多系统命令就是通过读取/proc实现的。例如uname -a 的部分信息就来自/proc/version,而uptime的部分信息来自/proc/uptime和/proc/loadavg。关于procfs更多的信息请访问:http:
5、/en.wikipedia.org/wiki/Procfs基本思路Linux是通过文件系统接口实现procfs ,并在启动时自动将其mount 到/proc目录上。此目录下的所有内容都是随着系统的运行自动建立、删除和更新的,而且它们完全存在于内存中,不占用任何外存空间。Linux 0.11还没有实现虚拟文件系统,也就是,还没有提供增加新文件系统支持的接口。所以本实验只能在现有文件系统的基础上,通过打补丁的方式模拟一个procfs。Linux 0.11使用的是 Minix的文件系统,这是一个典型的基于 inode的文件系统,注释一书对它有详细描述。它的每个文件都要对应至少一个inode,而ino
6、de中记录着文件的各种属性,包括文件类型。文件类型有普通文件、目录、字符设备文件和块设备文件等。在内核中,每种类型的文件都有不同的处理函数与之对应。我们可以增加一种新的文件类型proc文件,并在相应的处理函数内实现procfs要实现的功能。增加新文件类型在include/sys/stat.h文件中定义了几种文件类型和相应的测试宏:#define S_IFMT 00170000#define S_IFREG 0100000 /普通文件#define S_IFBLK 0060000 /块设备#define S_IFDIR 0040000 /目录#define S_IFCHR 0020000 /字符
7、设备#define S_IFIFO 0010000#define S_ISREG(m) (m) 文件系统初始化内核初始化的全部工作是在main()中完成,而main() 在最后从内核态切换到用户态,并调用init()。init() 做的第一件事情就是挂载根文件系统:void init(void)setup(void *) procfs的初始化工作应该在根文件系统挂载之后开始。它包括两个步骤:1. 建立/proc目录;2. 建立/proc目录下的各个结点。本实验只建立/proc/psinfo。建立目录和结点分别需要调用mkdir() 和mknod() 系统调用。因为初始化时已经在用户态,所以不能
8、直接调用sys_mkdir()和sys_mknod()。必须在初始化代码所在文件中实现这两个系统调用的用户态接口,即API:#include #define _LIBRARY_#include _syscall2(int,mkdir,const char*,name,mode_t,mode)_syscall3(int,mknod,const char*,filename,mode_t,mode,dev_t,dev)mkdir()时mode参数的值可以是“0755” (rwxr-xr-x),表示只允许 root用户改写此目录,其它人只能进入和读取此目录。procfs是一个只读文件系统,所以用mk
9、nod() 建立psinfo结点时,必须通过mode参数将其设为只读。建议使用“S_IFPROC|0444”做为mode值,表示这是一个proc文件,权限为0444(r-r-r-),对所有用户只读。mknod()的第三个参数dev用来说明结点所代表的设备编号。对于procfs 来说,此编号可以完全自定义。proc 文件的处理函数将通过这个编号决定对应文件包含的信息是什么。例如,可以把0对应psinfo,1对应meminfo ,2对应cpuinfo 。如此项工作完成得没有问题,那么编译、运行0.11内核后,用“ll /proc”可以看到:# ll /proctotal 0?r-r-r- 1 ro
10、ot root 0 ? ? ? psinfo此时可以试着读一下此文件:# cat /proc/psinfo(Read)inode-i_mode=XXX444cat: /proc/psinfo: EINVALinode-i_mode就是通过mknod()设置的mode。信息中的XXX和你设置的S_IFPROC有关。通过此值可以了解mknod()工作是否正常。这些信息说明内核在对psinfo进行读操作时不能正确处理,向cat返回了 EINVAL错误。因为还没有实现处理函数,所以这是很正常的。这些信息至少说明,psinfo被正确open()了。所以我们不需要对sys_open()动任何手脚,唯一要打
11、补丁的,是sys_read()。让proc文件可读open()没有变化,那么需要修改的就是 sys_read()了。首先分析 sys_read(在文件fs/read_write.c中):int sys_read(unsigned int fd,char * buf,int count)struct file * file;struct m_inode * inode;inode = file-f_inode;if (inode-i_pipe)return (file-f_modeif (S_ISCHR(inode-i_mode)return rw_char(READ,inode-i_zone0
12、,buf,count,if (S_ISBLK(inode-i_mode)return block_read(inode-i_zone0,if (S_ISDIR(inode-i_mode) | S_ISREG(inode-i_mode) if (count+file-f_pos inode-i_size)count = inode-i_size - file-f_pos;if (counti_mode=%06onr“,inode-i_mode); /这条信息很面善吧?return -EINVAL;显然,要在这里一群if的排比中,加上S_IFPROC() 的分支,进入对proc文件的处理函数。需要
13、传给处理函数的参数包括: inode-i_zone0,这就是mknod()时指定的dev设备编号 buf,指向用户空间,就是read() 的第二个参数,用来接收数据 count,就是read()的第三个参数,说明buf指向的缓冲区大小 int i;va_start(args, fmt);i=vsprintf(buf, fmt, args);va_end(args);return i;cat命令cat是Linux下的一个常用命令,功能是将文件的内容打印到标准输出。它核心实现大体如下:#include #include int main(int argc, char* argv)char buf5
14、13 = 0;int nread;int fd = open(argv1, O_RDONLY, 0);while(nread = read(fd, buf, 512)bufnread = 0;puts(buf);return 0;内核级线程实验目的 深入理解线程和进程的区别; 全面实践进程、地址空间、程序执行体、PCB、调度 、用户接口等操作系统概念; 获得在实际操作系统上设计与实现一个完整子系统的经验。实验内容1. 在Ubuntu下编写多线程的应用程序memtest.c,解决一个可并行运算的问题。2. 在Linux 0.11的进程管理基础上,按照POSIX Threads(https:/co
15、mputing.llnl.gov/tutorials/pthreads/)标准实现内核级线程,使其能支持memtest.c的运行多线程应用编写一个多线程的应用程序(memtest.c ),采用多线程并发的方式进行“并行”运算。该程序要解决的问题是“内存测试” ,即测试一段内存是否可靠。这段内存在进程空间内分配,大小不应小于1MB 。内存测试算法对任一被测内存单元,先写入一个数,再从该单元读出,比较写入和读出的数是否相等。如果相等,说明该单元功能正常,否则就不正常。对一个单元,要用如下5种数据测试:1. 全0,即02. 全1,即0xFF3. 01010101,即0x554. 10101010,即
16、0xAA5. 随机数主线程功能主线程就是进程建立后直接拥有的线程。它用命令行方式和用户交互,接受用户的命令,进行相应的工作,打印状态信息。命令包括:1. times number :设置对每个内存单元进行测试的次数。number即次数。每次测试都要测完全部的5种数据。例如,命令“times 5”表示对每个内存单元,每种数据都要测 5次。2. thread number :设置进行测试工作的线程个数。number即个数。主线程并不算在number内。例如,命令“thread 2”表示同时建立2个工作线程进行并发测试。3. go:按照设定的参数建立工作线程,开始测试。主线程仍然在命令行等待用户命令
17、。4. status:打印所有工作线程的工作状态,包括它们的当前进度和测试结果等。5. abort:停止测试。让所有工作线程都退出。6. exit:停止测试并退出程序。工作线程功能该程序始终只有主线程和用户交互,工作线程即不打印信息,也不读用户的输入。主线程和工作线程之间通过全局变量进行信息传递。工作线程唯一的功能是对主线程分配给它的内存区间进行测试。内核级线程要做到,同一个进程下的各个线程之间要能共享除指令执行序列、栈、寄存器以外的一切资源。相关功能通过系统调用和函数库共同完成。系统调用负责内核内的相关工作,其接口可自定义,直接实现在Linux 0.11已有的源程序文件中。函数库(命名为pt
18、hread.c和pthread.h)和应用程序链接到一起,对系统调用进行更高级别的封装,供应用程序直接调用。函数库应至少包含如下函数:pthread_attr_initint pthread_attr_init(pthread_attr_t *attr);用默认值初始化attr指向的pthread_attr_t结构。该数据是调用pthread_create()的第二个参数。pthread_attr_t主要定义了创建线程时需要用户提供的属性信息,pthread_create()根据这些信息创建线程。属性的具体内容可完全自定义。函数成功时返回0,出错时返回错误号。pthread_createint
19、 pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg); 该函数用来创建一个线程。attr 是创建线程时使用的各种属性,由 pthread_attr_init()设定。当该线程被调度时会从函数start_routine(一段用户态代码)开始执行。arg做为参数被传递给start_routine。start_routine的原型为:void * start_routine(void *arg);如果线程创建成功,返回值0,并且把线程的ID值
20、存放在thread中;当创建不成功时会返回一个错误号:EAGAIN 表示系统缺乏足够的资源来创建线程,EINVAL表示attr结构中的属性值非法。pthread_exitvoid pthread_exit(void *value_ptr);将调用该函数的线程销毁。它没有返回值,因为调用它的线程已经销毁,所以返回值没有任何地方可以“返回 ”。value_ptr是传给父线程的返回值,父线程调用pthread_join()可得到这个值。这是线程主动终止的唯一方式。pthread_joinint pthread_join(pthread_t thread, void *value_ptr);将调用它的线程阻塞,一直等到thread结束为止。其中thread为被等待的线程ID ,value_ptr会接收到被等待线程通过pthread_exit()设置的返回值。