深入分析_Linux_内核链表.doc

上传人:sk****8 文档编号:3559816 上传时间:2019-06-04 格式:DOC 页数:8 大小:86.50KB
下载 相关 举报
深入分析_Linux_内核链表.doc_第1页
第1页 / 共8页
深入分析_Linux_内核链表.doc_第2页
第2页 / 共8页
深入分析_Linux_内核链表.doc_第3页
第3页 / 共8页
深入分析_Linux_内核链表.doc_第4页
第4页 / 共8页
深入分析_Linux_内核链表.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、入分析 Linux 内核链表本文详细分析了 2.6.x 内核中链表结构的实现,并通过实例对每个链表操作接口进行了详尽的讲解。一、 链表数据结构简介链表是一种常用的组织有序数据的数据结构,它通过指针将一系列数据节点连接成一条数据链,是线性表的一种重要实现方式。相对于数组,链表具有更好的动态性,建立链表时无需预先知道数据总量,可以随机分配空间,可以高效地在链表中的任意位置实时插入或删除数据。链表的开销主要是访问的顺序性和组织链的空间损失。通常链表数据结构至少应包含两个域:数据域和指针域,数据域用于存储数据,指针域用于建立与下一个节点的联系。按照指针域的组织以及各个节点之间的联系形式,链表又可以分为

2、单链表、双链表、循环链表等多种类型,下面分别给出这几类常见链表类型的示意图:1 单链表图 1 单链表单链表是最简单的一类链表,它的特点是仅有一个指针域指向后继节点(next),因此,对单链表的遍历只能从头至尾(通常是 NULL 空指针)顺序进行。2 双链表图 2 双链表通过设计前驱和后继两个指针域,双链表可以从两个方向遍历,这是它区别于单链表的地方。如果打乱前驱、后继的依赖关系,就可以构成“二叉树“ ;如果再让首节点的前驱指向链表尾节点、尾节点的后继指向首节点(如图 2 中虚线部分),就构成了循环链表;如果设计更多的指针域,就可以构成各种复杂的树状数据结构。3 循环链表循环链表的特点是尾节点的

3、后继指向首节点。前面已经给出了双循环链表的示意图,它的特点是从任意一个节点出发,沿两个方向的任何一个,都能找到链表中的任意一个数据。如果去掉前驱指针,就是单循环链表。在 Linux 内核中使用了大量的链表结构来组织数据,包括设备列表以及各种功能模块中的数据组织。这些链表大多采用在include/linux/list.h实现的一个相当精彩的链表数据结构。本文的后继部分就将通过示例详细介绍这一数据结构的组织和使用。二、 Linux 2.6 内核链表数据结构的实现尽管这里使用 2.6 内核作为讲解的基础,但实际上 2.4 内核中的链表结构和 2.6 并没有什么区别。不同之处在于 2.6 扩充了两种链

4、表数据结构:链表的读拷贝更新(rcu)和 HASH链表(hlist)。这两种扩展都是基于最基本的 list 结构,因此,本文主要介绍基本链表结构,然后再简要介绍一下 rcu 和 hlist。链表数据结构的定义很简单(节选自include/linux/list.h,以下所有代码,除非加以说明,其余均取自该文件):struct list_head struct list_head *next, *prev;list_head 结构包含两个指向 list_head 结构的指针 prev 和 next,由此可见,内核的链表具备双链表功能,实际上,通常它都组织成双循环链表。和第一节介绍的双链表结构模型不

5、同,这里的 list_head 没有数据域。在 Linux 内核链表中,不是在链表结构中包含数据,而是在数据结构中包含链表节点。在数据结构课本中,链表的经典定义方式通常是这样的(以单链表为例):struct list_node struct list_node *next;ElemType data;因为 ElemType 的缘故,对每一种数据项类型都需要定义各自的链表结构。有经验的 C+程序员应该知道,标准模板库中的 采用的是 C+ Template,利用模板抽象出和数据项类型无关的链表操作接口。在 Linux 内核链表中,需要用链表组织起来的数据通常会包含一个 struct list_he

6、ad 成员,例如在include/linux/netfilter.h 中定义了一个 nf_sockopt_ops 结构来描述 Netfilter 为某一协议族准备的 getsockopt/setsockopt 接口,其中就有一个(struct list_head list)成员,各个协议族的 nf_sockopt_ops 结构都通过这个 list 成员组织在一个链表中,表头是定义在net/core/netfilter.c中的 nf_sockopts(struct list_head)。从下图中我们可以看到,这种通用的链表结构避免了为每个数据项类型定义自己的链表的麻烦。Linux 的简捷实用、不

7、求完美和标准的风格,在这里体现得相当充分。图 3 nf_sockopts 链表示意图三、 链表操作接口1. 声明和初始化实际上 Linux 只定义了链表节点,并没有专门定义链表头,那么一个链表结构是如何建立起来的呢?让我们来看看 LIST_HEAD()这个宏:#define LIST_HEAD_INIT(name) 除了用 LIST_HEAD()宏在声明的时候初始化一个链表以外, Linux 还提供了一个 INIT_LIST_HEAD 宏用于运行时初始化链表:#define INIT_LIST_HEAD(ptr) do (ptr)-next = (ptr); (ptr)-prev = (ptr

8、); while (0)我们用 INIT_LIST_HEAD(static inline void list_add_tail(struct list_head *new, struct list_head *head);因为 Linux 链表是循环表,且表头的 next、prev 分别指向链表中的第一个和最末一个节点,所以,list_add 和 list_add_tail 的区别并不大,实际上,Linux 分别用_list_add(new, head, head-next);和_list_add(new, head-prev, head);来实现两个接口,可见,在表头插入是插入在 head

9、之后,而在表尾插入是插入在 head-prev 之后。假设有一个新 nf_sockopt_ops 结构变量 new_sockopt 需要添加到 nf_sockopts 链表头,我们应当这样操作:list_add(从这里我们看出,nf_sockopts 链表中记录的并不是 new_sockopt 的地址,而是其中的 list 元素的地址。如何通过链表访问到new_sockopt 呢?下面会有详细介绍。b) 删除 static inline void list_del(struct list_head *entry);当我们需要删除 nf_sockopts 链表中添加的 new_sockopt 项

10、时,我们这么操作:list_del(被剔除下来的 new_sockopt.list,prev、next 指针分别被设为 LIST_POSITION2 和 LIST_POSITION1 两个特殊值,这样设置是为了保证不在链表中的节点项不可访问-对 LIST_POSITION1 和 LIST_POSITION2 的访问都将引起页故障。与之相对应, list_del_init()函数将节点从链表中解下来之后,调用 LIST_INIT_HEAD()将节点置为空链状态。c) 搬移 Linux 提供了将原本属于一个链表的节点移动到另一个链表的操作,并根据插入到新链表的位置分为两类:static inlin

11、e void list_move(struct list_head *list, struct list_head *head);static inline void list_move_tail(struct list_head *list, struct list_head *head);例如 list_move(假设当前有两个链表,表头分别是 list1 和 list2(都是 struct list_head 变量),当调用 list_splice(该函数在将 list 合并到 head 链表的基础上,调用 INIT_LIST_HEAD(list)将 list 设置为空链。3. 遍历遍历

12、是链表最经常的操作之一,为了方便核心应用遍历链表,Linux 链表将遍历操作抽象成几个宏。在介绍遍历宏之前,我们先看看如何从链表中访问到我们真正需要的数据项。a) 由链表节点到数据项变量 我们知道,Linux 链表中仅保存了数据项结构中 list_head 成员变量的地址,那么我们如何通过这个 list_head 成员访问到作为它的所有者的节点数据呢?Linux 为此提供了一个 list_entry(ptr,type,member)宏,其中 ptr 是指向该数据中 list_head 成员的指针,也就是存储在链表中的地址值,type 是数据项的类型,member 则是数据项类型定义中 list

13、_head 成员的变量名,例如,我们要访问 nf_sockopts 链表中首个 nf_sockopt_ops 变量,则如此调用:list_entry(nf_sockopts-next, struct nf_sockopt_ops, list);这里“list“正是 nf_sockopt_ops 结构中定义的用于链表操作的节点成员变量名。list_entry 的使用相当简单,相比之下,它的实现则有一些难懂:#define list_entry(ptr, type, member) container_of(ptr, type, member)container_of 宏定义在include/li

14、nux/kernel.h中:#define container_of(ptr, type, member) ( const typeof( (type *)0)-member ) *_mptr = (ptr); (type *)( (char *)_mptr - offsetof(type,member) );)offsetof 宏定义在include/linux/stddef.h 中:#define offsetof(TYPE, MEMBER) (size_t) list_for_each(i, 函数首先定义一个(struct list_head *)指针变量 i,然后调用 list_for

15、_each(i, pos != (head); pos = pos-next, prefetch(pos-next)它实际上是一个 for 循环,利用传入的 pos 作为循环变量,从表头 head 开始,逐项向后( next 方向)移动 pos,直至又回到head( prefetch()可以不考虑,用于预取以提高遍历速度)。那么在 nf_register_sockopt()中实际上就是遍历 nf_sockopts 链表。为什么能直接将获得的 list_head 成员变量地址当成 struct nf_sockopt_ops 数据项变量的地址呢?我们注意到在 struct nf_sockopt_o

16、ps 结构中,list 是其中的第一项成员,因此,它的地址也就是结构变量的地址。更规范的获得数据变量地址的用法应该是:struct nf_sockopt_ops *ops = list_entry(i, struct nf_sockopt_ops, list);大多数情况下,遍历链表的时候都需要获得链表节点数据项,也就是说 list_for_each()和 list_entry()总是同时使用。对此 Linux 给出了一个 list_for_each_entry()宏:#define list_for_each_entry(pos, head, member) 与 list_for_each(

17、)不同,这里的 pos 是数据项结构指针类型,而不是(struct list_head *)。nf_register_sockopt() 函数可以利用这个宏而设计得更简单:struct nf_sockopt_ops *ops;list_for_each_entry(ops,&nf_sockopts,list)某些应用需要反向遍历链表,Linux 提供了 list_for_each_prev()和 list_for_each_entry_reverse()来完成这一操作,使用方法和上面介绍的 list_for_each()、list_for_each_entry()完全相同。如果遍历不是从链表头

18、开始,而是从已知的某个节点 pos 开始,则可以使用 list_for_each_entry_continue(pos,head,member)。有时还会出现这种需求,即经过一系列计算后,如果 pos 有值,则从 pos 开始遍历,如果没有,则从链表头开始,为此, Linux 专门提供了一个 list_prepare_entry(pos,head,member)宏,将它的返回值作为 list_for_each_entry_continue()的 pos 参数,就可以满足这一要求。4. 安全性考虑在并发执行的环境下,链表操作通常都应该考虑同步安全性问题,为了方便,Linux 将这一操作留给应用自

19、己处理。Linux 链表自己考虑的安全性主要有两个方面:a) list_empty()判断 基本的 list_empty()仅以头指针的 next 是否指向自己来判断链表是否为空,Linux 链表另行提供了一个 list_empty_careful()宏,它同时判断头指针的 next 和 prev,仅当两者都指向自己时才返回真。这主要是为了应付另一个 cpu 正在处理同一个链表而造成 next、prev 不一致的情况。但代码注释也承认,这一安全保障能力有限:除非其他 cpu 的链表操作只有 list_del_init(),否则仍然不能保证安全,也就是说,还是需要加锁保护。b) 遍历时节点删除

20、前面介绍了用于链表遍历的几个宏,它们都是通过移动 pos 指针来达到遍历的目的。但如果遍历的操作中包含删除 pos 指针所指向的节点,pos 指针的移动就会被中断,因为 list_del(pos)将把 pos 的 next、prev 置成 LIST_POSITION2 和 LIST_POSITION1 的特殊值。当然,调用者完全可以自己缓存 next 指针使遍历操作能够连贯起来,但为了编程的一致性, Linux 链表仍然提供了两个对应于基本遍历操作的“_safe“接口:list_for_each_safe(pos, n, head)、list_for_each_entry_safe(pos,

21、n, head, member),它们要求调用者另外提供一个与 pos 同类型的指针 n,在 for 循环中暂存 pos 下一个节点的地址,避免因 pos 节点被释放而造成的断链。四、 扩展1. hlist图 6 list 和 hlist精益求精的 Linux 链表设计者(因为 list.h 没有署名,所以很可能就是 Linus Torvalds)认为双头(next、prev)的双链表对于 HASH 表来说“过于浪费“,因而另行设计了一套用于 HASH 表应用的 hlist 数据结构-单指针表头双循环链表,从上图可以看出,hlist 的表头仅有一个指向首节点的指针,而没有指向尾节点的指针,这样

22、在可能是海量的 HASH 表中存储的表头就能减少一半的空间消耗。因为表头和节点的数据结构不同,插入操作如果发生在表头和首节点之间,以往的方法就行不通了:表头的 first 指针必须修改指向新插入的节点,却不能使用类似 list_add()这样统一的描述。为此, hlist 节点的 prev 不再是指向前一个节点的指针,而是指向前一个节点(可能是表头)中的 next(对于表头则是 first)指针(struct list_head *pprev),从而在表头插入的操作可以通过一致的“*(node-pprev)“访问和修改前驱节点的 next(或 first)指针。2. read-copy upd

23、ate在 Linux 链表功能接口中还有一系列以“_rcu“结尾的宏,与以上介绍的很多函数一一对应。 RCU(Read-Copy Update)是 2.5/2.6 内核中引入的新技术,它通过延迟写操作来提高同步性能。我们知道,系统中数据读取操作远多于写操作,而 rwlock 机制在 smp 环境下随着处理机增多性能会迅速下降(见参考资料 4)。针对这一应用背景,IBM Linux 技术中心的 Paul E. McKenney 提出了“读拷贝更新“ 的技术,并将其应用于 Linux 内核中。RCU 技术的核心是写操作分为写-更新两步,允许读操作在任何时候无阻访问,当系统有写操作时,更新动作一直延

24、迟到对该数据的所有读操作完成为止。Linux 链表中的 RCU 功能只是 Linux RCU 的很小一部分,对于 RCU 的实现分析已超出了本文所及,有兴趣的读者可以自行参阅本文的参考资料;而对 RCU 链表的使用和基本链表的使用方法基本相同。五、 示例附件中的程序除了能正向、反向输出文件以外,并无实际作用,仅用于演示 Linux 链表的使用。 为了简便,例子采用的是用户态程序模板,如果需要运行,可采用如下命令编译:gcc -D_KERNEL_ -I/usr/src/linux-2.6.7/include pfile.c -o pfile因为内核链表限制在内核态使用,但实际上对于数据结构本身而言并非只能在核态运行,因此,在笔者的编译中使用“-D_KERNEL_“开关“欺骗“编译器。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 策划方案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。