你知道Linux内核数据结构中双向链表的作用?
3223
Linux 内核提供一套双向链表的实现,你可以在 include/linux/list.h 中找到。我们以双向链表着手开始介绍 Linux 内核中的数据结构 ,因为这个是在 Linux 内核中使用最为广泛的数据结构。
首先让我们看一下主要的结构体:
C
struct list_head { struct list_head *next, *prev;};
1
2
3
struct list_head {
struct list_head *next, *prev;
};
你可以看到其与常见的结构体实现有显著不同,比如 glib 中所使用到的双向链表实现。
C
struct GList { gpoin te r data; GList *next; GList *prev;};
1
2
3
4
5
struct GList {
gpointer data;
GList *next;
GList *prev;
};
通常来说,链表结构体要包括一个指向数据的指针,不过 Linux 内核的链表却不包含此实现。那么首要的疑问:链表是用什么方式 存储 数据的?。Linux 内核所实现的是一种被称为侵入式的链表(Intrusive list),这种链表并不在链表结构中包含数据,而仅提供用于维护前向与后向访问结构的指针。这种实现方式使得链表数据结构非常通用,因为它并不需要关注链表所维护的具体数据类型。
比如:
C
struct n mi _desc { s pi nlock_t lock; struct list_head head;};
1
2
3
4
struct nmi_desc {
spinlock_t lock;
struct list_head head;
};
接下来让我们看一些内核使用 list_head 的具体例子。正如在前文所述的,Linux 内核中诸多模块都使用了 list_head。这里我们以内核杂项 字符 设备驱动(miscellaneous character drive rs )部分实现为例。驱动的 API 在 drivers/char/misc.c 中,其实现了简单硬件外设以及虚拟设备的驱动,这个驱动共享主设备号(Major number):
C
#define MISC_MAJOR 10
1
#define MISC_MAJOR 10
每个设备有自己的次设备号,具体可以看这个列子:
ls -l /dev | grep 10crw------- 1 root root 10, 235 Mar 21 12:01 autofsdrwxr-xr-x 10 root root 200 Mar 21 12:01 cpu crw------- 1 root root 10, 62 Mar 21 12:01 cpu_ dma _latencycrw------- 1 root root 10, 203 Mar 21 12:01 cusedrwxr-xr-x 2 root root 100 Mar 21 12:01 dricrw-rw-rw- 1 root root 10, 229 Mar 21 12:01 fusecrw------- 1 root root 10, 228 Mar 21 12:01 hpetcrw------- 1 root root 10, 183 Mar 21 12:01 hwrngcrw-rw----+ 1 root kvm 10, 232 Mar 21 12:01 kvmcrw-rw---- 1 root disk 10, 237 Mar 21 12:01 loop-controlcrw------- 1 root root 10, 227 Mar 21 12:01 mcelogcrw------- 1 root root 10, 59 Mar 21 12:01 memory_bandw idt hcrw------- 1 root root 10, 61 Mar 21 12:01 network_latencycrw------- 1 root root 10, 60 Mar 21 12:01 network_throughputcrw-r----- 1 root kmem 10, 144 Mar 21 12:01 nv ram brw-rw---- 1 root disk 1, 10 Mar 21 12:01 ram10crw--w---- 1 root tty 4, 10 Mar 21 12:01 tty10crw-rw---- 1 root dialout 4, 74 Mar 21 12:01 ttyS10crw------- 1 root root 10, 63 Mar 21 12:01 vga_arbitercrw------- 1 root root 10, 137 Mar 21 12:01 vhci
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
ls -l /dev | grep 10
crw------- 1 root root 10, 235 Mar 21 12:01 autofs
drwxr-xr-x 10 root root 200 Mar 21 12:01 cpu
crw------- 1 root root 10, 62 Mar 21 12:01 cpu_dma_latency
crw------- 1 root root 10, 203 Mar 21 12:01 cuse
drwxr-xr-x 2 root root 100 Mar 21 12:01 dri
crw-rw-rw- 1 root root 10, 229 Mar 21 12:01 fuse
crw------- 1 root root 10, 228 Mar 21 12:01 hpet
crw------- 1 root root 10, 183 Mar 21 12:01 hwrng
crw-rw----+ 1 root kvm 10, 232 Mar 21 12:01 kvm
crw-rw---- 1 root disk 10, 237 Mar 21 12:01 loop-control
crw------- 1 root root 10, 227 Mar 21 12:01 mcelog
crw------- 1 root root 10, 59 Mar 21 12:01 memory_bandwidth
crw------- 1 root root 10, 61 Mar 21 12:01 network_latency
crw------- 1 root root 10, 60 Mar 21 12:01 network_throughput
crw-r----- 1 root kmem 10, 144 Mar 21 12:01 n vr am
brw-rw---- 1 root disk 1, 10 Mar 21 12:01 ram10
crw--w---- 1 root tty 4, 10 Mar 21 12:01 tty10
crw-rw---- 1 root dialout 4, 74 Mar 21 12:01 ttyS10
crw------- 1 root root 10, 63 Mar 21 12:01 vga_arbiter
crw------- 1 root root 10, 137 Mar 21 12:01 vhci
现在我们看看设备驱动是如何使用链表维护设备列表的,首先,我们看一下 miscdevice 的 struct 定义:
C
struct miscdevice{ int minor; const char *name; const struct file_opera ti ons *fops; struct list_head list; struct device *parent; struct device *this_device; const char *nodename; mode_t mode;};
1
2
3
4
5
6
7
8
9
10
11
struct miscdevice
{
int minor;
const char *name;
const struct file_opera TI ons *fops;
struct list_head list;
struct device *parent;
struct device *this_device;
const char *nodename;
mode_t mode;
};
可以看到 miscdevice 的第四个成员 list ,这个就是用于维护已注册设备链表的结构。在源代码文的首部,我们可以看到以下定义:
C
sta TI c LIST_HEAD(misc_list);
1
sta TI c LIST_HEAD(misc_list);
这个定义宏展开,可以看到是用于定义 list_head 类型变量:
C
#define LIST_HEAD(name) struct list_head name = LIST_HEAD_INIT(name)
1
2
#define LIST_HEAD(name)
struct list_head name = LIST_HEAD_INIT(name)
LIST_HEAD_INIT 这个宏用于对定义的变量进行双向指针的初始化:
C
#define LIST_HEAD_INIT(name) { &(name), &(name) }
1
#define LIST_HEAD_INIT(name) { &(name), &(name) }
现在我看可以看一下函数 misc_register 是如何进行设备注册的。首先是用 INIT_LIST_HEAD 对 miscdevice->list 成员变量进行初始化:
C
INIT_LIST_HEAD(&misc->list);
1
INIT_LIST_HEAD(&misc->list);
这个操作与 LIST_HEAD_INIT 宏一致:
C
static inline void INIT_LIST_HEAD(struct list_head *list){ list->next = list; list->prev = list;}
1
2
3
4
5
sta TI c inline void INIT_LIST_HEAD(struct list_head *list)
{
list->next = list;
list->prev = list;
}
接下来,在通过函数 device_create 进行设备创建,同时将设备添加到 Misc 设备列表中:
C
list_add(&misc->list, &misc_list);
1
list_add(&misc->list, &misc_list);
内核的 list.h文件提供向链表添加节点的 API,这里是添加操作的实现:
C
static inline void list_add(struct list_head *new, struct list_head *head){ __list_add(new, head, head->next);}
1
2
3
4
static inline void list_add(struct list_head *new, struct list_head *head)
{
__list_add(new, head, head->next);
}
函数实现很简单,就是入参转换为三个参数后调用内部 __list_add :
new – 新节点;
head – 新节点插入的双向链表头;
head->next – 链表头的下一个节点;
_list_add 函数的实现更加简单:
C
static inline void __list_add(struct list_head *new, struct list_head *prev, struct list_head *next){ next->prev = new; new->next = next; new->prev = prev; prev->next = new;}
1
2
3
4
5
6
7
8
9
static inline void __list_add(struct list_head *new,
struct list_head *prev,
struct list_head *next)
{
next->prev = new;
new->next = next;
new->prev = prev;
prev->next = new;
}
这里设置了新添加结点的 prev 与 next 指针,通过这些操作,就将先前使用 LIST_HEAD_INIT 所定义的 misc 链表的双向指针与 miscdevice->list 结构关联起来。
这里还有一个问题,就是如何获取链表中的数据,list_head 提供了一个特殊的宏用于获取数据指针。
C
#define list_entry(ptr, type, member) cont ai ner_of(ptr, type, member)
1
2
#define list_entry(ptr, type, member)
container_of(ptr, type, member)
这里有三个参数
ptr:list_head 结构指针
type:数据对应的 struct 类型
member:数据中 list_head 成员对应的成员变量名
举例如下:
C
const struct miscdevice *p = list_entry(v, struct miscdevice, list)
1
const struct miscdevice *p = list_entry(v, struct miscdevice, list)
接下来我们就够访问 miscdevice 的各个成员,如 p->minor、p->name 等等,我们看一下 list_entry 的实现:
C
#define list_entry(ptr, type, member) container_of(ptr, type, member)
1
2
#define list_entry(ptr, type, member)
container_of(ptr, type, member)
其实现非常简单,就是使用入参调用 container_of 宏,宏的实现如下:
C
#define container_of(ptr, type, member) ({ const typeof( ((type *)0)->member ) *__mptr = (ptr); (type *)( (char *)__mptr - offsetof(type,member) );})
1
2
3
#define container_of(ptr, type, member) ({
const typeof( ((type *)0)->member ) *__mptr = (ptr);
(type *)( (char *)__mptr - offsetof(type,member) );})
注意,宏使用了大括号表达式,对于大括号表达式,编译器会展开所有表达式,同时使用最后一个表达式的结果进行返回。
举个例子:
C
#include int main() { int i = 0; printf("i = %dn", ({++i; ++i;})); return 0;}
1
2
3
4
5
6
7
#include
int main() {
int i = 0;
printf("i = %dn", ({++i; ++i;}));
return 0;
}
输出结果为 2 。
另一个关键是 typeof 关键字,这个非常简单,这个正如它的名字一样,这个关键字返回的结果是变量的类型。当我第一次看到这个宏时,最让我觉得奇怪的是表达式 ((type*)0) 中的 0 值,实际上,使用 0 值作为地址这个是成员变量取得 struct 内相对偏移地址的巧妙实现,我们再来看个例子:
C
#include struct s { int field1; char field2; char field3;};int main() { printf("%pn", &((struct s*)0)->field3); return 0;}
1
2
3
4
5
6
7
8
9
10
11
12
#include
struct s {
int field1;
char field2;
char field3;
};
int main() {
printf("%pn", &((struct s*)0)->field3);
return 0;
}
输出结果为 0x5 。
还有一个专门用于获取结构体中某个成员变量偏移的宏,其实现与前面提到的宏非常类似:
C
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
1
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
这里对 container_of 宏做个综述,container_of 宏通过 struct 中的 list_head 成员返回 struct 对应数据的内存地址。在宏的第一行定义了指向 list_head 成员的指针 __mptr ,并将 ptr 地址赋给 __mptr 。从技术实现的角度来看,实际并不需要这一行定义,但这个对于类型检查而言非常有意义。这一行代码确保结构体( type )中存在 member 对应的成员。第二行使用 offsetoff 宏计算出包含 member 的结构体所对应的内存地址,就是这么简单。
当然 list_add 与 list_entry 并非是 中的全部函数,对于双向链表 list_head ,内核还提供了以下的 接口 :
list_add
list_add_tail
list_del
list_replace
list_move
list_is_last
list_empty
list_cut_position
list_splice
未了,需要说的是,内核代码中并不仅仅只有上述这些接口。