14 磁盘及文件系统管理详解

　　这一节内容我们一起来详细了解磁盘的工作原理；

磁盘管理

　　首先，我们知道计算机的三大组建：CPU、内存、和I/O设备；其中磁盘就是属于外部的I/O设备，用于永久的存储文件数据；相对于CPU和内存而言，当前使用较多的机械磁盘还是处于“上一个阶段”的产品，对比起CPU内存这样的电子产品而言，速度可想而知。

　　我们常见的外部存储设备有：U盘、光盘、软盘、磁盘、磁带等；其中U盘（闪存）为深圳朗科研发出来的，这些设备都是可以实现数据的永久存储的。

　　其中，我们着重介绍磁盘的工作原理。

磁盘的物理组成

　　巨磁电阻效应的发明：

　　1988年，费尔和格林贝格尔各自独立发现了“巨磁电阻”效应：非常弱小的磁性变化就能导致古大的电阻变化。

　　当硬盘体积不断变小，容量却不断变大时，势必要求磁盘上每一个被划分出来的独立区域越来越小，这些区域所记录的磁信号也就越来越弱。借助“巨磁电阻”效应，人们才得以制造出更加灵活的数据读出头，是越来越弱的磁信号依然能够被清晰读出，并且转换成清晰的电流变化。

　　1997年，第一个基于“巨磁电阻”效应的数据读出头问世，并很快引发了硬盘的“大容量、小型化”革命。

　　1、磁盘的大概结构：磁盘、轴与r/w head磁头中间

　　用于数据存储的为盘片（platters），盘片都是围绕着主轴（spindle）进行旋转，数据的读取与写入都是通过磁头（read/write head）来完成，而读写横向看来的磁盘结构（actuator arm assembly）如下图：

　　2、磁盘常见的几个基本概念

　　扇区（Sector），磁道（Track）、以及柱面（Cylinder）；

　　　　磁道（Track）：在一个盘片上，将其划分成n各同心圆，而这一个同心圆就叫做一个磁道；

　　　　扇区（Sector）：在一个磁道上，将其划分为多个512bytes大小的磁盘的扇形区域，这每一个扇形区域就叫做一个扇区；

　　　　柱面（Cylinder）：在多个磁盘上处于同一个地方的扇区的结合，就是柱面；

　　　　【数据存储，磁盘分区都是根据柱面来进行分区的】

　　------------------------

　　分区（partition）：在我们的windows系统上，C盘/D盘，这些概念实际上就是分区，而分区，实际上就是我们在磁盘上建立起一个逻辑边界，这就叫做分区（partition）。

　　分区是一个动作，分好的区我们需要为其写入文件系统，这个过程我们叫做格式化，只有写入文件系统的分区，才能够进行数据存储。格式化的内容我们在后面再进行介绍；

　　这里，我们了解一个最为特殊的区域--MBR（master boot record）主引导记录MBR也就是我们磁盘上的第一个分区，它是属于物理概念，它是我们磁盘上处于最外面的一个扇区，大小为512bytes，它的主要作用就是加载主引导程序；

　　　　在MBR上，446bytes的大小为BootLoader引导程序【主引导分区对于系统而言至关重要，如果主引导分区故障，系统是无法启动的】；

　　　　64byter大小为磁盘标识符，1个磁盘标识符为16bytes，所以Linux最多只能有4个磁盘标识符，而这里所说的是主分区标识符，如果将这四个标识符空间做一个扩展标识，则又能够添加多个逻辑分区，所以这里我们不必担心磁盘的分区不够的问题；

　　　　　　【这里需要记住：1、主分区加扩展分区最多有四个；2、扩展分区最多有一个；3、逻辑分区可以有任意个，前提是先划分一个扩展分区】

　　　　最后2bytes是作为魔数，magic number，它用来标记MBR分区是否有效；

　　-----------------------

　　这里，我们再介绍下系统的启动过程：

　　　　在系统启动的时候，内存为空，而CPU读取数据只能从内存中读取，此时，我们的电脑会将BIOS芯片中的一段启动程序自动加载到内存中来，完成如下两个工作：1、硬件设备的自检；2、自检无误，查找可以启动的系统。一般就是按照BIOS设置的查找顺序来查找系统，如果读取到的硬盘的系统文件，就会首先加载MBR分区中的BootLoader代码。通过读取BootLoader指定对应的分区信息，以及分区内容，找到操作系统加载到内存中来。内存再加载系统内核文件，内核文件关联具体程序，一步一步将所有需要的程序启动起来；

　　【BIOS-->1、自检；2、加载BootLoader-->读取分区，加载系统内核-->系统内核启动应用程序】

　　这就是我们系统启动的过程；

　　3、磁盘的读写延迟从屋里角度来说

　　磁盘分区是根据柱面来实现分区的。一般柱面越是靠外，则读取速度就越快。读取数据的时候，我们需要等待磁头到达对应的柱面，如果数据转过去了，就得等待数据再次转回来，而这个寻道时间，就是我们的延迟时间；

　　所以，如果盘片的转速越快，则延迟越小，这样的话读取数据的速度就越快；一般电脑磁盘的转速为5400rpm（转/分）或则是7200rpm，因为磁盘旋转速度太快，所以磁盘都要求在无尘的环境下进行工作；

文件系统

　　对磁盘做了分区以后，如何来进行数据存储呢？我们说，如果不对磁盘进行分区格式化，则这个分区是无法存储数据的，而格式化是做了什么操作呢？

　　格式化就是对分区做了文件系统的安装！！！

　　分好的区，就好像一个图书馆，如果没有人管理，直接就把一大堆的书任意放置在图书馆里，则当用户需要查找某一本书的时候，将会是一个非常困难的事，而文件系统，就是管理数据的一个系统；就类似于图书馆对于图书管理的整个系统体系！

　　文件系统：简单的来说，它就是一种软件，它并不是直接存储在这个分区上，我们可以将其理解为一个分区的管理软件，专门用来做数据管理；

文件系统结构

　　文件系统是如何来管理数据的呢？我们先看下图：

　　　　我们将分区分为两个部分，数据存储区和元数据存储区，数据存储区主要用来进行存储，而元数据存储区，则是用来存储数据的元数据，例如数据大小、数据类型、数据存储的时间等等！

　　　　元数据存储区：

　　　　　　1、iNode信息（index node）：通过 ls -i 我们可以查看到数据的iNode号，而这些iNode号，就与数据存储区的块信息对应，我们通过iNode信息来查找真实的数据所存储的位置，它就类似于书本的目录，包含了书本的所有类容；【同时，iNode信息也存放了数据的元信息，例如权限、属主与属组、时间戳等等信息，就是没有文件名】

　　　　　　2、iNode位图（bitmap）：iNode信息是有限的，我们如何知道哪些iNode信息没有被使用，哪些iNode的信息已经使用了呢？如果通过遍历元数据存储区来查找则会非常麻烦，所有我们就有了iNode位图，只需要通过iNode位图来判断iNode信息的使用情况；

　　　　　　3、块位图（block bitmap）：同理，如果想查找哪些块没有被使用，则不需要去遍历整个数据存储区，而是只需要查看块位图即可；

　　　　数据存储区：

　　　　　　在数据存储区中，我们会将空间大小分配为大小相等的块（block），而块的大小为2^n，一般为4096，可以自己调整为1024或者2048或者更大；

　　　　　　数据块一般用来存储普通数据，普通的文本文件“-”，使用数据块较多，另外一类则是目录文件“d”，使用数据块较多；“p”管道文件，“s”套接字文件，以及“d”“c”设备文件都不占用块的大小；目录文件的块的数据则存放的为，iNode信息和对应iNode信息的目录名或者文件名；

文件查找、新建、删除、复制与移动

　　*查找：例如查找 /etc/log/message 的过程

　　　　首先，根是自引用的；此时，我们从根开始查找，找到 / 所对应的块，这时候，在这个块下面存放的是 / 下的所有文件目录的名称以及iNode信息，此时就会看到 log 目录的 iNode 信息；第二步，通过查找 log 目录的iNode信息找到 log 对应的块，这个里面存放了 log 目录下对应的文件目录的名称和iNode信息，包括 message 文件；第三步，通过message 文件的iNode信息找到message文件对应的块，这时候就能找到message文件对应的数据了；

　　　　最后，在查找到数据以后，我们会将目录信息进行缓存，保存一份，再下次查找该文件的时候就可以直接查找缓存信息；

　　新建：新建文件，则会查看iNode位图与块位图，0表示该iNode位图或者块没有被占用，可以用来新建文件；

　　删除：同理，在删除文件的时候，则是将iNode位图和块位图对应的位置置位为0，则表示对应的块和iNode条目没有被使用；【所以，数据在磁盘存储的时候是没有被清除的，通过数据恢复工具是可以将数据恢复的；】

　　复制：在同一个分区下，不同的目录上的数据复制，会很快，因为这里我们只是将对应的iNode数据指向修改了，如果是不同的分区之间的数据复制，则会很慢，因为它将整个块中的数据都要进行复制；

　　移动：移动的原理和复制相同；

常见的文件系统类型

　　可以说，Linux几乎支持所有的文件系统类型；我们要知道，文件系统功能是属于内核功能，我们通过mkfs应用进程，将内核对应的文件系统功能写入到磁盘中，这就是格式化的过程；

　　格式化分为两种：1、低级格式化，这一般是在磁盘出厂的时候由厂家来为我们完成，它是用来创建磁道的；2、高级格式化，例如 mkfs -t ext3 /dev/sda3 ，这就是我们常见的格式化操作，用来为 /dev/sda3 这个磁盘分区写入文件系统；

　　常见的文件系统：

　　　　windows系统下常见的文件系统为fat32、NTFS、cifs（网络文件系统、网上邻居使用的）；

　　　　Linux下常见的文件系统ext2、ext3、ext4、xfs、reiserfs、jfs（IBM）、vfat（windows系统的fat32）、NTFS；集群文件系统ocfs2；网络文件系统nfs；全局文件系统gfs2；

　　既然有这么多文件系统，那么每一个文件系统对于存储上它上面的文件的操作是不尽相同的，这样的话，对于开发人员而言，就需要为每一种文件系统开发一套文件的处理方式，这是很不合理的！

　　为了避免这种情况，我们通过VFS，虚拟文件系统作为接口，来处理数据这样就避免了为每个文件系统开发不同的处理方式了；【虚拟文件系统VFS功能也是属于内核功能！】

链接文件与设备文件

　　在我们了解了文件系统以后，我们着重了解两类文件--链接文件和设备文件；

　　链接文件--l：链接文件分为两类，软链接与硬链接；

　　　　软链接：也叫做符号链接；这个类似于windows系统下的快捷方式，软链接的iNode详细指向其他文件的iNode信息，而不是指向数据存储区的块信息；

　　　　　　ln -s 参数为新建软连接，而 -v 参数表示显示创建链接的详细信息；

　　　　　　我们可以看到文件b.txt是以“l”开头，同时在原本为文件大小的地方，存放的是 a.txt 文件的字符长度；

　　　　　　如果删除原文件 a.txt 则 b.txt 的连接文件也会失效，但是如果从新有新建一个 a.txt 而这个 a.txt 已经不是原来的文件了（iNode号不同），则这个 b.txt链接文件是依然有效的；

　　　　【总结：1、软链接可应用于目录；2、可以跨越文件系统；3、不会增加文件被链接的次数；4、其大小为指定的路径所包含的字符个数；】　

　　　　硬链接：硬链接是将多个文件指向同一个block。只有在删除所有的链接文件后，这个文件才会被删除；

　　　　　　ln 不加 -s 即是创建硬链接文件；

　　　　　　我们可以看到在在权限后面有一个“2”，这里就表示文件的连接数，只有删除所有链接文件才会被删除；

　　　　　　硬链接的iNode信息是相同的，说明他们指向的就是同一个文件；

　　【总结：1、硬链接只能对文件创建，不能应用与目录；2、不能夸文件系统创建；3、创建硬链接会增加你文件链接数】

　　设备文件--b,c：b 表示块设备文件，是按照块为单位，随机访问的设备，例如硬盘；c 表示字符设备文件，是按照字符为单位，是线性设备，例如键盘；

　　　　/dev 主要就是用来存放设备文件的目录；

　　　　设备文件主要包含两个内容，主设备号（major number）和次设备号（minor number），主设备号用来表示设备类型，此设备号用来区分同种类型设备的不同设备；

　　　　我们可以通过mknod来创建设备文件，例如：

　　　　mknod [option] ... NAME TYPE [MAIOR MINOR]

　　　　　　-m MODE　　#指定设备权限 -m 640 就是指定设备权限为 rw-r-----

　　　　*这里我们有一个小技巧：可以通过重定向，将输入内容传递到其他终端，如下图：

　　　　w 命令查看有哪些终端连接在该系统上，在通过 >> 将对应的信息在别的 pts 终端上面输出；

磁盘管理操作

硬盘设备的命名

　　硬盘设备的设备名，首先判断是什么类型的磁盘：IDE、ATA的磁盘为 hd；SATA、SCSI、USB的磁盘为sd；

　　如果有多块磁盘，则用 a、b、c ... 来进行区分；

　　若果是同一块磁盘上的多个分区，则用 1、2、3 ... 来进行区分；

　　例如：sda 为第一个磁盘，sdb 则为第二个磁盘，sda1, 为第一个磁盘的第一个分区，sdb2 则为第二个磁盘的第二个分区；

　　【逻辑分区可以有多个，扩展分区只能有一个，主分区最多有四个】

磁盘分区--fdisk

　　fdisk命令用来对磁盘进行分区操作；

　　　　-l　　查看分区情况

fdisk还可以对磁盘进行管理，包括创建分区，删除分区等操作；

创建新的分区：

　　fdisk /dev/sda #开启一个交互式命令

　　m 获取帮助

　　p 显示当前硬盘上面的分区、包括没有保存的改动

　　n 创建新分区

　　e 扩张分区

　　p 表示主分区，去指定分区大小即可 +10G 它就会自动给我们指定柱面

　　d 删除一个分区

　　w 保存并退出

　　q 不保存退出

　　t 修改分区类型

　　L 显示所有支持的分区类型

　　l 显示所支持的所有类型

分区做好以后，可能内核还无法识别，我们通过查看 cat /proc/partitions 这个目录来判断内核是否识别我们新的磁盘信息。同时，如果没有识别，我们通过 partprobe 或者 partx [dev] 来让内核识别；

分区格式化（写入文件系统）--mkfs,mke2fs

　　mkfs　　make file system创建文件系统

　　　　/proc/partitions　　#查看系统所支持的文件系统；其中大部分为伪文件系统；

　　　　-t FSTYPE　　指定所需要创建文件系统的类型

　　　　　　例如：mkfs -t ext2 /dev/sdb1

　　　　这里我们要注意， -t 参数可以有对应的命令来替代；

　　　　　　例如：mkfs -t ext2 = mkfs.ext2； mkfs -t ext3 = mkfs.ext3

　　mke2fs　　make ext2 file system创建ext类型的文件系统

　　　　-j　　则是指定创建ext3的文件系统，不指定默认的ext2文件系统

　　　　　　例如：mke2fs -j /dev/sdb2

　　　　-b　　指定块大小，默认为4096，块大小只能为2^n；

　　　　-L　　指定卷标

　　　　-m NUMBER　　指定给root用户预留的磁盘空间百分比，默认为5%

　　　　-i BYTE　　用户指定为多少字节空间创建一个iNode，默认为8192；这里给出的这个数值应该为块大小的2^n倍；

　　　　　　例如：mke2fs -i 4096

　　　　-N NUMBER　　指定创建iNode的个数；

　　　　-F　　强制创建文件系统，一般如果问价系统已经被挂载，则无法写入文件系统，使用 -F 则表示强制创建文件系统，不管分区是否被挂载；

　　　　-E　　用户指定额外文件系统属性；

　　【这里提到的所有的参数，在mkfs命令下都能运行；】

　　blkid　　查询或者查看磁盘设备的相关属性

　　　　例如：blkid /dev/sdb1　　#查看/dev/sdb1的uuid、卷标、文件系统类型等基本信息

　　e2label　　为分区添加卷标

　　　　e2label 设备文件卷标

　　　　例如：e2label /dev/sdb1 Test-lvm

　　tune2fs　　调整文件系统的相关属性

　　　　-j　　将ext2文件系统转换为ext3类型的文件系统,ext2可以转ext3 但不可以转回,转回数据丢失；

　　　　　　例如：tune2fs -j ext3 /dev/sdb1　　#将原本的文件系统类型调整为ext3

　　　　-L　　为分区设定卷标；

　　　　-m　　调整root用户预留的空间百分比，用法与mke2fs相同；

　　　　-r　　指定root用户的预留空间的块数，不能和 -m 一起使用；

　　　　-o　　设定默认的挂载选项；

　　　　　　acl　　指定文件系统的acl功能，有点类似于setfacl文件的过滤功能；

　　　　-c　　指定挂载次数达到多少次后进行自检，0或者-1表示关闭此功能；

　　　　-i　　指定每隔多少天后进行自检，0或者-1表示关闭此功能；

　　　　-l　　显示超级块中的信息

　　　　　　例如：tun2efs -l /dev/sdb1

　　dumpe2fs　　显示文件属性

　　　　例如：dumpe2fs /dev/sdb1　　#这里显示了分区从哪个组到哪组，起始块是多少，结束块是多少，那些块里面是有备份的那些没有；

　　　　-h　　和tune2fs一样，也是显示超级块信息的

　　fsck　　检测并修复文件系统

　　　　-t fstype　　指定文件系统类型，也可以不指定，fsck能够自动识别文件系统，但是一定不能指错了；

　　　　-a　　进行文件系统的自动修复；

　　e2fsck　　专门用来检查并修复ext2和ext3的命令

　　　　-a　　自动修复，不用询问

　　　　-f　　强制检查

　　　　　　例如：e2fsck -f /dev/sdb1

　　　　-p　　也是自动修复，-a 是为了兼容fsck命令

磁盘分区挂载与卸载--mount,umount

　　挂载：将新的文件系统关联至当前根文件系统；这个动作就是为磁盘分区找一个接入入口，有了这个访问的入口后，就能够访问到这个分区上的所有文件内容；

　　卸载：将某文件系统与当前文件系统的关联关系移除掉；

　　mount　　挂载

　　　　用法：mount 设备名挂载点

　　　　设备名：可以是设备文件名，也可以是卷标（LABEL=""），也可以是UUID（UUID=""）；

　　　　挂载点：也就是一个目录

　　　　　　【但是，这个目录最好是一个空目录，同时，这个目录没有被任何进程调用，如果这个目录里面存在其他文件，当挂载设备后，这些原有的文件就会别隐藏；】

　　　　例如：mount /dev/sdb1 /mnt/test　　#这样，你在/mnt/test目录下编辑的所有文件，都保存于/dev/sdb1这个分区下，默认情况下会有一个lost+found目录；

　　mount　　直接回车，不带任何参数，就是查看系统的挂载情况；

　　　　参数以及用法：mount [option] [-o option] device mount_point

　　　　　　-a　　直接指定挂载 /dev/fstab 目录下的所有文件，这里是我们做开机自动挂载的默认目录；

　　　　　　-n　　默认情况下，mount命令没挂载一个设备，都会把挂载的设备信息保存至 /etc/mtab 文件下；使用 -n选项，就是说挂载设备后，不把信息写入到 /etc/mtab 这个文件里面来；

　　　　　　-t fstype　　指定正在挂载的设备上的文件系统的类型，不适用此选项，则mount命令能够自动识别；

　　　　　　-r　　只读挂载，一般在挂载磁盘的时候会使用到；

　　　　　　-w　　读写挂载，默认情况下，磁盘挂载的时候就是读写挂载；

　　　　　　-o　　指定额外的挂载选项，也可指定问价那系统启用的属性；

　　　　　　　　async　　异步写入（默认就是异步）

　　　　　　　　atime　　指定时间戳

　　　　　　　　auto　　自动挂载，can be mounted with the -a option

　　　　　　　　default　　使用默认参数挂载

　　　　　　　　dev　　指定固定设备文件

　　　　　　　　exec　　容许挂载二进制的文件

　　　　　　　　_netdev　　映射文件系统

　　　　　　　　owner　　容许普通用户挂载这个磁盘

　　　　　　　　remount　　从星挂载当前文件系统

　　　　　　　　　　例如：mount -o remount,ro /dev/sdb1　　#重新挂载/dev/sdb1同时指定为只读权限；

　　　　　　　　ro　　只读挂载

　　　　　　　　rw　　读写挂载

　　　　　　　　sync　　同步挂载

　　　　　　　　suid　　挂载的时候提供suid权限

　　umount　　卸载文件系统

　　　　用法：umount 设备名　　或者　　umount 挂载点　　

　　　　卸载要注意：挂载的设备没有被进程使用；

swap分区--mkswap,swapon/swapoff与dd

　　swap是系统的交换分区，是用来弥补内存不足的时候，占时顶替内存的分区空间；

　　free　　查看系统内存的使用情况

　　fdisk /dev/sdb2　　#先创建一个交换分区

　　　　注意，这里我们一定要将 /dev/sdb2 分区的分区类型修改为 82 Linux swap分区才行；

　　　　mkswap /dev/sdb2　　#创建swap磁盘分区

　　　　　　-L LABEL　　可以添加卷标

　　　　swapon /dev/sdb2　　启用这个磁盘分区，同理 swapoff /dev/sdb2 就是关闭这个磁盘分区，注意：交换分区是不用挂载的；

　　本地虚拟回环设备：

　　　　如果我们内存不够，可以通过将磁盘的空间划分为swap分区来临时解决，如果磁盘空间也不够了，又不能添加新的磁盘，这时候我们该如何解决这个问题呢？

　　　　我们可以创建一个镜像文件，比如：模拟一个100G的空间，这100G的空间就可以用来进行数据存储，但是这100G的空间实际上只占有1m甚至更小的物理空间；

　　　　dd　　convert and copy a file 装换或者复制一个文件

　　　　　　例如：dd if=/etc/inittab of=/root/inittab　　将文件/etc/inittab复制到/root/inittab

　　　　　　这里我们需要注意一下dd与copy的区别，他们都是用来对文件进行复制的，但是，dd是直接对磁盘上的内容进行操作，所以，它可以复制一个文件的部分内容；而copy则是将要复制的文件移动到内存中，再由cpu进行复制操作后，放回到对应的磁盘位置中；所以，dd的效率要高很多；

　　　　　　if=源数据　　　　#input file

　　　　　　of=目标数据　　#output file

　　　　　　bs=数值　　　　#一次复制多大的单位

　　　　　　count=数值　　　　#将复制的文件转换为多少个字节来进行存储

　　　　　　　例如：dd if=/dev/sdb of=/mnt/usb/mbr.backup bs=512 count=1

　　　　　　　　　　dd if=/mnt/usb/mbr.backup of=/dev/sdb bs=512 count=1

　　　　　　　　　　#这就是使用dd命令来做磁盘备份，备份MBR分区，又可以通过dd命令将MBR分区还原；

　　　　　　　　　　dd if=/dev/zero of=/var/swapfile bs=1M count=1024

　　　　　　　　　　#/dev/zero 文件叫做泡泡文件，可以凭空创建磁盘空间【/dev/null 黑洞设备，只要指向这个文件的内容都会被删除】