ext2文件系统

我们知道，一个磁盘可以划分成多个分区，每个分区必须先用格式化工具（例如某种
mkfs命令）格式化成某种格式的文件系统，然后才能存储文件，格式化的过程会在磁盘上写
一些管理存储布局的信息。下图是一个磁盘分区格式化成ext2文件系统后的存储布局。
文件系统中存储的最小单位是块（Block），一个块究竟多大是在格式化时确定的，
例如mke2fs的-b选项可以设定块大小为1024、2048或4096字节。而上图中启动块（Boot
Block）的大小是确定的，就是1KB，启动块是由PC标准规定的，用来存储磁盘分区信息和启
动信息，任何文件系统都不能使用启动块。启动块之后才是ext2文件系统的开始，ext2文
件系统将整个分区划成若干个同样大小的块组（Block Group），每个块组都由以下部分组
成。
超级块（Super Block）描述整个分区的文件系统信息，例如块大小、文件系统版本
号、上次mount的时间等等。超级块在每个块组的开头都有一份拷贝。
块组描述符表（GDT，Group Descriptor Table）由很多块组描述符组成，整个分区分
成多少个块组就对应有多少个块组描述符。每个块组描述符（Group Descriptor）存储一个
块组的描述信息，例如在这个块组中从哪里开始是inode表，从哪里开始是数据块，空闲的
inode和数据块还有多少个等等。和超级块类似，块组描述符表在每个块组的开头也都有一
份拷贝，这些信息是非常重要的，一旦超级块意外损坏就会丢失整个分区的数据，一旦块组
描述符意外损坏就会丢失整个块组的数据，因此它们都有多份拷贝。通常内核只用到第0个
块组中的拷贝，当执行e2fsck检查文件系统一致性时，第0个块组中的超级块和块组描述符
表就会拷贝到其它块组，这样当第0个块组的开头意外损坏时就可以用其它拷贝来恢复，从
而减少损失。
块位图（Block Bitmap）一个块组中的块是这样利用的：数据块存储所有文件的数
据，比如某个分区的块大小是1024字节，某个文件是2049字节，那么就需要三个数据块来
存，即使第三个块只存了一个字节也需要占用一个整块；超级块、块组描述符表、块位
图、inode位图、inode表这几部分存储该块组的描述信息。那么如何知道哪些块已经用来存
储文件数据或其它描述信息，哪些块仍然空闲可用呢？块位图就是用来描述整个块组中哪些
块已用哪些块空闲的，它本身占一个块，其中的每个bit代表本块组中的一个块，这个bit为
1表示该块已用，这个bit为0表示该块空闲可用。
为什么用df命令统计整个磁盘的已用空间非常快呢？因为只需要查看每个块组的块位图
即可，而不需要搜遍整个分区。相反，用du命令查看一个较大目录的已用空间就非常慢，因
为不可避免地要搜遍整个目录的所有文件。
与此相联系的另一个问题是：在格式化一个分区时究竟会划出多少个块组呢？主要的限
制在于块位图本身必须只占一个块。用mke2fs格式化时默认块大小是1024字节，可以用-b参
数指定块大小，现在设块大小指定为b字节，那么一个块可以有8b个bit，这样大小的一个块
位图就可以表示8b个块的占用情况，因此一个块组最多可以有8b个块，如果整个分区有s个
块，那么就可以有s/(8b)个块组。格式化时可以用-g参数指定一个块组有多少个块，但是通
常不需要手动指定，mke2fs工具会计算出最优的数值。
inode位图（inode Bitmap）和块位图类似，本身占一个块，其中每个bit表示一个
inode是否空闲可用。
inode表（inode Table）我们知道，一个文件除了数据需要存储之外，一些描述信息
也需要存储，例如文件类型（常规、目录、符号链接等），权限，文件大小，创建/修改/访
问时间等，也就是ls -l命令看到的那些信息，这些信息存在inode中而不是数据块中。每个
文件都有一个inode，一个块组中的所有inode组成了inode表。
inode表占多少个块在格式化时就要决定并写入块组描述符中，mke2fs格式化工具的默
认策略是一个块组有多少个8KB就分配多少个inode。由于数据块占了整个块组的绝大部分，
也可以近似认为数据块有多少个8KB就分配多少个inode，换句话说，如果平均每个文件的大
小是8KB，当分区存满的时候inode表会得到比较充分的利用，数据块也不浪费。如果这个分
区存的都是很大的文件（比如电影），则数据块用完的时候inode会有一些浪费，如果这个
分区存的都是很小的文件（比如源代码），则有可能数据块还没用完inode就已经用完了，
数据块可能有很大的浪费。如果用户在格式化时能够对这个分区以后要存储的文件大小做一
个预测，也可以用mke2fs的-i参数手动指定每多少个字节分配一个inode。
数据块（Data Block）根据不同的文件类型有以下几种情况
对于常规文件，文件的数据存储在数据块中。
对于目录，该目录下的所有文件名和目录名存储在数据块中，注意文件名保存在它所在
目录的数据块中，除文件名之外，ls -l命令看到的其它信息都保存在该文件的inode中。注
意这个概念：目录也是一种文件，是一种特殊类型的文件。
对于符号链接，如果目标路径名较短则直接保存在inode中以便更快地查找，如果目标
路径名较长则分配一个数据块来保存。
设备文件、FIFO和socket等特殊文件没有数据块，设备文件的主设备号和次设备号保存
在inode中。

目录中记录项文件类型

从上图可以看出，索引项Blocks[13]指向两级的间接寻址块，最多可表示(b/4)2+b/
4+12个数据块，对于1K的块大小最大可表示64.26MB的文件。索引项Blocks[14]指向三级
的间接寻址块，最多可表示(b/4)3+(b/4)2+b/4+12个数据块，对于1K的块大小最大可表示
16.06GB的文件。
可见，这种寻址方式对于访问不超过12个数据块的小文件是非常快的，访问文件中的任
意数据只需要两次读盘操作，一次读inode（也就是读索引项）一次读数据块。而访问大文
件中的数据则需要最多五次读盘操作：inode、一级间接寻址块、二级间接寻址块、三级间
接寻址块、数据块。实际上，磁盘中的inode和数据块往往已经被内核缓存了，读大文件的
效率也不会太低。