Linux 笔记

博客地址：http://www.moonxy.com

一、前言

rsync 命令是一个远程数据同步工具，可通过 LAN/WAN 快速同步多台主机间的文件，可以理解为 remote sync（远程同步）。rsync 使用所谓的 "rsync算法" 来使本地和远程两个主机之间的文件达到同步，这个算法只传送两个文件的不同部分，而不是每次都整份传送，因此速度相当快。rsync 不仅可以远程同步数据（类似于 scp），还可以本地同步数据（类似于 cp），但不同于 cp 或 scp 的一点是，rsync 不会覆盖以前的数据（如果数据已经存在），而是先判断已经存在的数据和新数据的差异，只有当源数据或目标数据出现不一致时，才会把不相同的部分覆盖。rsync 是一个功能非常强大的工具，其命令也有很多功能特色选项。如果没有安装 rsync 命令，可以使用 "yum install -y rsync" 安装。

二、rsync 的命令格式

rsync [OPTION]... SRC DEST

rsync [OPTION]... SRC [USER@]host:DEST

rsync [OPTION]... [USER@]HOST:SRC DEST

rsync [OPTION]... [USER@]HOST::SRC DEST

rsync [OPTION]... SRC [USER@]HOST::DEST

rsync [OPTION]... rsync://[USER@]HOST[:PORT]/SRC [DEST]

其中 SRC 表示源文件，DEST 表示目标文件。

对应于以上六种命令格式，rsync 有六种不同的工作模式：

1）拷贝本地文件。当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。如：rsync -a /data /backup

2）使用一个远程shell程序（如rsh、ssh）来实现将本地机器的内容拷贝到远程机器。当DST路径地址包含单个冒号":"分隔符时启动该模式。如：rsync -avz *.c foo:src

3）使用一个远程shell程序（如rsh、ssh）来实现将远程机器的内容拷贝到本地机器。当SRC地址路径包含单个冒号":"分隔符时启动该模式。如：rsync -avz foo:src/bar /data

4）从远程rsync服务器中拷贝文件到本地机。当SRC路径信息包含"::"分隔符时启动该模式。如：rsync -av root@192.168.78.192::www /databack

5）从本地机器拷贝文件到远程rsync服务器中。当DST路径信息包含"::"分隔符时启动该模式。如：rsync -av /databack root@192.168.78.192::www

6）列远程机的文件列表。这类似于rsync传输，不过只要在命令中省略掉本地机信息即可。如：rsync -v rsync://192.168.78.192/www

-a, --archive 归档模式，表示以递归方式传输文件，并保持所有文件属性，等于-rlptgoD。
-r, --recursive 对子目录以递归模式处理。
-v, --verbose 详细模式输出。
-u, --update 仅仅进行更新，也就是跳过所有已经存在于DST，并且文件时间晚于要备份的文件，不覆盖更新的文件。
-l, --links 保留软链接。
-L, --copy-links 想对待常规文件一样处理软链结。
-p, --perms 保持文件权限。
-o, --owner 保持文件属主信息。
-g, --group 保持文件属组信息。
-D, --devices 保持设备文件信息。
-t, --times 保持文件时间信息。
-e, --rsh=command 指定使用rsh、ssh方式进行数据同步。
-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件，用来排除那些不希望传输的文件。
--existing 仅仅更新那些已经存在于DST的文件，而不备份那些新创建的文件。
--delete 删除那些DST中有，SRC没有的文件。
-P 等同于 --partial。
--progress 显示备份过程。
-z, --compress 对备份的文件在传输时进行压缩处理。
--exclude=PATTERN 指定排除不需要传输的文件模式。
--include=PATTERN 指定不排除而需要传输的文件模式。
--exclude-from=FILE 排除FILE中指定模式的文件。
--include-from=FILE 不排除FILE指定模式匹配的文件。
--config=FILE 指定其他的配置文件，不使用默认的rsyncd.conf文件。
--port=PORT 指定其他的rsync服务端口。
--progress 在传输时现实传输过程。
--password-file=FILE 从FILE中得到密码。

这些还只是 rsync 的一部分选项，其中常用的有 a、v、L、--delete 和 --exclude 这几个，通常 -av 或 -avL 连用，其中 -a 选项等同于 -rlptgoD，-a 选项后面可以跟一个 --no-OPTION，表示关闭 -rlptgoD 中的某一个，比如 -a--no-l 等同于 -rptgoD。

三、rsync 应用实例

3.1 将本地的 test1 目录直接复制成 test2 目录

单机模式，直接将一个目录的文件备份到另外一个目录下，如下：

# rsync -avL test1/ test2/

以下为远程模式，将源端看做客户端，远端看做服务器。

3.2 通过 ssh 的方式备份

首先启动服务端的ssh服务：

# service sshd start

接下来就可以在客户端使用rsync命令来备份服务端上的数据了，SSH方式是通过系统用户来进行备份的，如下：

rsync -avL --progress -e ssh work@192.168.1.121:/www/* /databack/experiment/rsync
work@172.16.78.192's password:
receiving file list ...
5 files to consider
test/
a
0 100% 0.00kB/s 527:35:41 (1, 20.0% of 5)
b
67 100% 65.43kB/s 0:00:00 (2, 40.0% of 5)
c
0 100% 0.00kB/s 527:35:41 (3, 60.0% of 5)
dd
100663296 100% 42.22MB/s 0:00:02 (4, 80.0% of 5)
sent 96 bytes received 98190 bytes 11563.06 bytes/sec
total size is 100663363 speedup is 1024.19

上面的信息描述了整个的备份过程，以及总共备份数据的大小。

这个实例表示 pull（拉取），从服务器拉取文件到本地目录，同样也可以 push（推送），表示将本地文件推送到服务器上面来备份。如果不通过密钥，则像上面一样还要输入密码来交互。可以设置 ssh 密钥，生成公钥和私钥，这样在同步时，就不需要输入密码了，适合于 shell 脚本。

3.3 通过后台服务的方式

默认安装好rsync程序后，并不会自动创建rsync的主配置文件，需要手工来创建，其主配置文件为 "/etc/rsyncd.conf"。

配置文件 rsyncd.conf 由全局配置和若干模块配置组成。配置文件的语法为：

1）模块以 [模块名] 开始

2）参数配置行的格式是 name = value ，其中 value 可以有两种数据类型：

字符串（可以不用引号定界字符串）

布尔值（1/0 或 yes/no 或 true/false）

3）以 # 或 ; 开始的行为注释

4）为续行符

全局参数

在文件中 [module] 之外的所有配置行都是全局参数。当然也可以在全局参数部分定义模块参数，这时该参数的值就是所有模块的默认值。

模块参数

模块参数主要用于定义 rsync 服务器哪个目录要被同步。模块声明的格式必须为 [module] 形式，这个名字就是在 rsync 客户端看到的名字，类似于 Samba 服务器提供的共享名。而服务器真正同步的数据是通过 path 来指定的。可以根据自己的需要，来指定多个模块，模块中可以定义以下参数：

a. 基本模块参数

b. 模块控制参数

c. 模块文件筛选参数

d. 模块用户认证参数

rsync 认证口令文件的权限一定是 600，否则客户端将不能连接服务器。

rsync 认证口令文件中每一行指定一个用户名:口令对，格式为：username:passwd

一般来说口令最好不要超过8个字符。若您只配置匿名访问的 rsync 服务器，则无需设置上述参数。

e. 模块访问控制参数

客户主机列表定义可以是以下形式：

单个IP地址。例如：192.168.0.1

整个网段。例如：192.168.0.0/24，192.168.0.0/255.255.255.0

可解析的单个主机名。例如：centos，centos.bsmart.cn

域内的所有主机。例如：*.bsmart.cn

"*"则表示所有。

多个列表项要用空格间隔。

f. 模块日志参数

设置了"log file"参数时，在日志每行的开始会添加"%t [%p]"。

可以使用的日志格式定义符如下所示：

%a - 远程IP地址

%h - 远程主机名

%l - 文件长度字符数

%p - 该次 rsync 会话的 PID

%o - 操作类型：”send” 或 “recv”

%f - 文件名

%P - 模块路径

%m - 模块名

%t - 当前时间

%u - 认证的用户名（匿名时是 null）

%b - 实际传输的字节数

%c - 当发送文件时，记录该文件的校验码

创建该文件并添加如下内容：

vi /etc/rsyncd.conf

uid=root
gid=root
max connections=4
log file=/var/log/rsyncd.log
pid file=/var/run/rsyncd.pid
lock file=/var/run/rsyncd.lock
secrets file=/etc/rsyncd.passwd
hosts allow=192.168.1.0/24

[www]
comment= backup web
path=/www
read only = no
exclude=test
auth users=work

创建密码文件，采用这种方式不能使用系统用户对客户端进行认证，所以需要创建一个密码文件，其格式为 "username:password"，用户名可以和密码可以随便定义，最好不要和系统帐户一致，同时要把创建的密码文件权限设置为600，这在前面的模块参数做了详细介绍。

编辑 secrets file 并保存后赋予 600 权限，如果权限不对，则不能完成同步，如下：

echo "work:abc123" > /etc/rsyncd.passwd
chmod 600 /etc/rsyncd.passwd

启动 rsyncd 服务，如下：

# rsync --daemon --config=/etc/rsyncd.conf

启动后查看873端口是否启动，如下：

# netstat-lnp |grep 873

完成以上工作，现在就可以对数据进行同步了，如下：

rsync -avz --progress work@192.168.1.121::www /databack/experiment/rsync

Password:
receiving file list ...
6 files to consider
./ files...
a
0 100% 0.00kB/s 528:20:41 (1, 50.0% of 6)
b
67 100% 65.43kB/s 0:00:00 (2, 66.7% of 6)
c
0 100% 0.00kB/s 528:20:41 (3, 83.3% of 6)
dd
100663296 100% 37.49MB/s 0:00:02 (4, 100.0% of 6)
sent 172 bytes received 98276 bytes 17899.64 bytes/sec
total size is 150995011 speedup is 1533.75

发现此时也要输入密码才能进行数据同步，这次我们添加一个选项 --password-file=/tmp/rsync.password ，这时当我们以work用户登录 rsync 服务器同步数据时，密码将读取 /tmp/rsync.password 这个文件。这个文件内容只是work用户的密码。

# touch /tmp/rsync.password
# chmod 600 /tmp/rsync.password 
# echo "123456" > /tmp/rsync.password

然后执行如下同步命令时就不再需要输入密码了，适合于 shell 脚本：

# rsync -avzP  --password-file=/tmp/rsync.password work@172.16.1.135::www  /databack/experiment/rsync

综上

rsync采用主从式构架，在应用上可分为 PUSH 和 PULL 两种主要模式，以因应不同的环境因素，进而达到部署的目的。

PULL模式

在同一网段的环境下，由备份主机向服务器进行同步并将数据备份过来以完成备份工作。这种模式是最普遍被采用的部署方式。

如上，由备份主机启动备份工作，向被备份端要求备份。可将备份时的负载大部分由备份主机承受。当然，PULL模式也支持跨网段或远端进行同步备份工作，如下图：

PUSH模式

PUSH模式的执行方式刚好与PULL模式恰恰相反。如下图所示，在同一网段的环境下，由服务器主动发出同步要求并将数据同步至备份主机上，以完成备份的工作。

在实际中，这种模式通常被采用于较特殊的环境下，例如服务器被部署在防火墙内且无法由外部连入，因此必须改由服务器主动将数据送至备份主机上。如下图：

四、Linux 网络配置

网络知识包含的内容很多，此处只讲解常用的设置 ip、设置主机名和设置 DNS 的操作。

4.1 ifconfig 查看网卡 IP

ifconfig 类似于 Windows 中的 ipconfig，后面不加任何选项和参数时，只打印当前网卡IP的信息（如子网掩码、网关等）。也可以跟某一个网卡名称，如 eth0、eth1 等。使用 -a 选项，可以列出所有的网卡信息。

查看帮助后有如下显示：

If no arguments are given, ifconfig displays the status of the cur-rently active interfaces. If a single interface argument is given, it displays the status of the given interface only; if a single -a argu-ment is given, it displays the status of all interfaces, even those that are down. Otherwise, it configures an interface.

网卡的配置的文件为 /etc/sysconfig/network-scripts/ifcfg-eth0，如果是网卡 eth1，则配置文件是/etc/sysconfig/network-scripts/ifcfg-eth1。修改配置文件后可以使用 "service network restart" 来重启网卡。

4.2 给一个网卡设定多个 IP

在 Linux 系统中，网卡是可以设定多重 IP 的，一定要注意 DEVICE 要写成 "eth0:1"，如下：

[root@ryan ~]# cd /etc/sysconfig/network-scripts
[root@ryan network-scripts]# cp ifcfg-eth0 ifcfg-eth0:1

修改 ifcfg-eth0:1 的配置：

[root@ryan network-scripts]# vim ifcfg-eth0:1
DEVICE=eth0
HWADDR=00:0C:29:3C:83:B1
TYPE=Ethernet
UUID=56bf1079-0ba8-4227-ada7-b574493732f4
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=static
IPADDR=192.168.1.122
NETMASK=255.255.255.0
GATEWAY=192.168.1.1
DNS1=114.114.114.114
DNS2=8.8.8.8

然后重启网络服务：

[root@ryan network-scripts]# service network restart

再次查看网卡IP，如下：

[root@ryan network-scripts]# ifconfig
eth0      Link encap:Ethernet  HWaddr 00:0C:29:3C:83:B1
          inet addr:192.168.1.121  Bcast:192.168.1.255  Mask:255.255.255.0
          inet6 addr: fe80::20c:29ff:fe3c:83b1/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:15703 errors:0 dropped:0 overruns:0 frame:0
          TX packets:1800 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:1103283 (1.0 MiB)  TX bytes:247293 (241.4 KiB)

eth0:1    Link encap:Ethernet  HWaddr 00:0C:29:3C:83:B1
          inet addr:192.168.1.122  Bcast:192.168.1.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

lo        Link encap:Local Loopback
          inet addr:127.0.0.1  Mask:255.0.0.0
          inet6 addr: ::1/128 Scope:Host
          UP LOOPBACK RUNNING  MTU:65536  Metric:1
          RX packets:0 errors:0 dropped:0 overruns:0 frame:0
          TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:0
          RX bytes:0 (0.0 b)  TX bytes:0 (0.0 b)

可以看到多了一个 eth0:1。

4.3 查看网卡连接状态

[root@ryan network-scripts]# mii-tool eth0
eth0: negotiated 100baseTx-FD, link ok

"link ok" 说明网卡为连接状态。如果显示 "no link" 说明网卡坏了或者没有连接网线。

4.4 更改主机名

安装完系统之后，主机名默认为 localhost，使用 hostname 命令可以查看 Linux 的主机名。如下：

[root@ryan network-scripts]# hostname
ryan

CentOS 6.x 修改主机名的配置文件为 /etc/sysconfig/network：

[root@ryan network-scripts]# vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=ryan

CentOS 7.x 修改主机名的配置文件为 /etc/hostname。

4.5 设置 DNS

DNS 用来解析域名，Linux 下配置域名解析服务器的配置文件为 /etc/resolv.conf：

[root@ryan network-scripts]# cat /etc/resolv.conf
# Generated by NetworkManager
nameserver 114.114.114.114
nameserver 8.8.8.8

resolv.conf 有固定的格式，一定要写成 "nameserver IP" 的格式。

上面的是配置域名解析服务器，也可以在本地直接配置域名解析，配置文件为 /etc/hosts，手动添加 IP 和域名的映射关系，一般作为临时域名解析。如下：

[root@ryan ~]# cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.1.111　　www.baidu.com

保存文件之后，再 ping www.baidu.com 就会返回 192.168.1.111的地址了，表示已经映射成功了。

/etc/hosts 的格式很简单，每一行为一条记录，分成两部分，第1部分为 IP，第2部分是域名，可以配置多个域名，并用空格分开，如上四个域名：localhost localhost.localdomain localhost4 localhost4.localdomain4 都映射到 127.0.0.1。并且 /etc/hosts 文件的域名解析优先级高于配置的域名解析服务器文件 /etc/resolv.conf 的优先级。

附录：

参考如下：

rsync配置