Ansible系列(四):playbook应用和roles自动化批量安装示例

`playbook`是`ansible`实现批量自动化最重要的手段。在其中可以使用变量、引用、循环等功能,相比`ad-hoc`而言,其功能要强大的多。


### yaml简单示例
`ansible`的`playbook`采用`yaml`语法。以下是一个`yaml`格式的文件:

```
---
# Members in Bob's family
name: Bob
age: 30
gender: Male
wife: 
name: Alice
age: 27
gender: Female
children: 
- name: Jim
age: 6
gender: Male
- name: Lucy
age: 3
gender: Female
```


### ansible-playbook命令说明及playbook书写简单示例
以下是一个简单的`playbook`示例。该示例执行两个任务,第一个任务是执行一个`/bin/date`命令,第二个任务是复制`/etc/fstab`文件到目标主机上的`/tmp`下,它们分别使用了`ansible`的`command`模块和`copy`模块。

```
cat /tmp/test.yaml 
---
- hosts: centos7
tasks: 
- name: execute date cmd
command: /bin/date
- name: copy fstab to /tmp
copy: src=/etc/fstab dest=/tmp
```

书写好`playbook`后,使用`ansible-playbook`命令来执行。`ansible-playbook`命令的选项和`ansible`命令选项绝大部分都相同。但也有其特有的选项。以下是截取出来的帮助信息。


```
ansible-playbook --help
Usage: ansible-playbook playbook.yml

Options:
-e EXTRA_VARS,--extra-vars=EXTRA_VARS # 设置额外的变量,格式为key/value。-e "key=KEY",
# 如果是文件方式传入变量,则-e "@param_file"
--flush-cache # 清空收集到的fact信息缓存
--force-handlers # 即使task执行失败,也强制执行handlers
--list-tags # 列出所有可获取到的tags
--list-tasks # 列出所有将要被执行的tasks
-t TAGS,--tags=TAGS # 以tag的方式显式匹配要执行哪些tag中的任务
--skip-tags=SKIP_TAGS # 以tag的方式忽略某些要执行的任务。被此处匹配的tag中的任务都不会执行
--start-at-task=START_AT_TASK # 从此task开始执行playbook
--step # one-step-at-a-time:在每一个任务执行前都进行交互式确认
--syntax-check # 检查playbook语法
```

有以下几点需要注意下:
1. 默认情况下,`ansible-playbook`和`ansible`是一样的,都是同步阻塞模式,需要先在所有主机上执行完一个任务,才会继续下一个任务;
2. 在执行前会自动收集fact信息;
3. 从显示结果中可以判断出任务是否真的执行了,抑或者是因为幂等性而没有执行。
4. 每一个play都包含数个task,且都有响应信息play recap。

### playbook的内容

#### hosts和remoter_user
对于`playbook`中的每一个`play`,使用`hosts`选项可以定义要执行这些任务的主机或主机组,还可以使用`remote_user`指定在远程主机上执行任务的用户,实际上`remote_user`是`ssh`连接到被控主机上的用户,自然而然执行命令的身份也将是此用户。

例如:

```
---
- hosts: centos6,centos7,192.168.100.59
remote_user: root
tasks: XXXXXX
```

虽然在hosts处可以使用","分隔主机或主机组,但官方手册上并没有介绍该方法。除此之外,有以下几种指定主机和主机组的方式:

- all或*,表示inventory中的所有主机。
- :,取并集。例如"host1:host2:group1"表示2台主机加一个主机组。
- :&,取交集。例如"group1:&group2"表示两个主机组中都有的主机。
- :!,排除。例如"group1:!host1"表示group1中排除host1主机的剩余主机。
- 通配符,例如"web*.baidu.com"。
- 数字范围,例如"web[0-5].baidu.com"。
- 字母范围,例如"web[a-d].baidu.com"。
- 正则表达式以"~"开头。例如"~webd.baidu.com"。
此外,在`ansible`命令行或`ansible-playbook`命令行中,可以使用`-l`选项来限定执行任务的主机。例如:

```
ansile centos -l host[1:5] -m ping
```

表示`centos`主机组中只有`host1`到`host5`才执行`ping`模块。

还可以在某个task上单独定义执行该task的身份,这将覆盖全局的定义。

```
---
- hosts: centos6,centos7,192.168.100.59
remote_user: root
tasks: 
- name: run a command
shell: /bin/date
- name: copy a file to /tmp
copy: src=/etc/fstab dest=/tmp
remote_user: myuser
也支持权限升级的方式。

---
- hosts: centos6,centos7,192.168.100.59
remote_user: yourname
tasks: 
- name: run a command
shell: /bin/date
- name: copy a file to /tmp
copy: src=/etc/fstab dest=/tmp
become: yes
become_method: sudo
become_user: root # 此项默认值就是为root,所以可省
```

从上面的示例可以看出`remote_user`实际上并不是执行任务的绝对身份,它只是`ssh`连接过去的身份,只不过没有指定`become`的时候,它正好就用此身份来运行任务。

#### task list
1. 特性

每个play都包含一个hosts和一个tasks,hosts定义的是inventory中待控制的主机,tasks下定义的是一系列task任务列表,比如调用各个模块。这些task按顺序一次执行一个,直到所有被筛选出来的主机都执行了这个task之后才会移动到下一个task上进行同样的操作。

需要注意的是,虽然只有被筛选出来的主机会执行对应的task,但是所有主机(此处的所有主机表示的是,hosts选项所指定的那些主机)都会收到相同的task指令,所有主机收到指令后,ansible主控端会筛选某些主机,并通过ssh在远程执行任务。也就是说,如果查看ansible-playbook -vvvv的信息,将会发现临时任务文件会通过sftp发送到所有的被控主机上,但是只有一部分被筛选(如果进行了筛选)的主机才会ssh过去并远程执行命令。

当某一台被控主机执行某个任务出错或失败时,它将会被移除出任务轮询列表。也就是说,对于某主机来说,某任务执行失败,后续的所有任务都不会再去执行。当然,这不会影响其他的主机执行任务(除非主机的任务之间有依赖关系)。

最重要的是,ansible中的task是**幂等性**的,多次执行不会影响那些成功执行过的任务。另外幂等性还表现在执行失败后如果修正了playbook再次执行,将不会影响那些原本已经执行成功的任务,即使是不同主机也不会影响。仅这方面而言,ansible对于排错来说是极其友好的。当然,某些特殊的模块或者特殊定义的task并不一定总是幂等的,例如最简单的,执行一个command或者shell模块的命令,它会重复执行。但也有办法使其变得幂等,以command和shell模块为例,它们有两个选项:creates和removes,它们分别表示被控主机上指定的文件存在(不存在)时就不执行命令。

2. 定义task的细节

(1). 可以为每个task加上name项,也可以多个task依赖于一个name。

例如下面的两个例子。从两个示例中可以看出,两个task其实都是属于一个name的,第二个task无需再使用name命名。

示例一:
```
tasks: 
- name: do something to initialize mariadb
file: path=/mydata/data state=directory owner=mysql group=mysql mode=0755
- shell: /usr/bin/mysql_install_db --datadir=/mydata/data --user=mysql creates=/mydata/data/ibdata1
```

示例二:

```
tasks: 
- name: echo var passed by nginx 
shell: echo "{{ hi_var }}"
register: var_result
- debug: msg="{{ var_result.stdout }}"
```

实际上,name只是一种描述性语句,它可以定义在任何地方。例如,定义在play的顶端。

```
---
- name: start a play
hosts: localhost
tasks:
```

(2). 既然是task,那么必然会有其要执行的一个或多个任务,其本质是加载并执行ansible对应的模块。在playbook中,每调用的一个模块都称为一个action。
例如,定义一个确保服务是启动状态的task,有以下三种方法传递模块参数:

```
tasks: 
- name: be sure the sshd is running
service: name=sshd state=started # 方法一: 定义为key=value,直接传递参数给模块

service: # 方法二: 定义为key: value方式
name: sshd
state: started

service: # 方法三: 使用args内置关键字,然后定义为key: value方式
args: 
name: sshd
state: started
```

但要注意,ping模块、command和shell模块是不需要key=value格式的。对于ping命令,可以直接省略key=value。对于command和shell,只需要给定命令路径和要接上去的选项或参数即可,且无法使用上面的方法二。例如下面定义的是一个ntpdate命令,只需给定它的参数即可。

```
tasks: 
- name: execute command ntpdate
shell: /usr/sbin/ntpdate ntp1.aliyun.com
- name: ping host
ping:
```

对于command或shell模块来说,有时候要考虑命令的返回状态码。如果要忽略非0状态码继续执行任务,可以使用以下两种方式:

```
tasks: 
- name: ignore non_zero return code
shell: /usr/sbin/ntpdate ntp1.aliyun.com || /bin/true
```
或者
```
tasks: 
- name: another way to ignore the non_zero return code
shell: /usr/sbin/ntpdate ntp1.aliyun.com
ignore_errors: true
```
(3). 如果action的key=value太多,导致内容太长,可以在上一行的缩进级别基础上继续缩进表示续行。
例如,下面的owner比src多缩进了4个空格。

```
tasks:
- name: Copy ansible inventory file to client
copy: src=/etc/fstab dest=/tmp
owner=root group=root mode=0644
```

(4).在action的value部分,可以引用已经定义的变量,可以是已定义好的自定义的变量,也可以是内置变量。变量相关内容见后文。

(5).使用include指令,可以将其他的playbook文件包含到此playbook文件中。

### notify和handler
ansible中几乎所有的模块都具有幂等性,这意味着被控主机的状态是否发生改变是能被捕捉的,即每个任务的changed=true或changed=false。ansible在捕捉到changed=true时,可以触发notify组件(如果定义了该组件)。

notify是一个组件,并非一个模块,它可以直接定义action,其主要目的是调用handler。例如:

```
tasks: 
- name: copy template file to remote host
template: src=/etc/ansible/nginx.conf.j2 dest=/etc/nginx/nginx.conf
notify: 
- restart nginx
- test web page
copy: src=nginx/index.html.j2 dest=/usr/share/nginx/html/index.html
notify: 
- restart nginx
```

这表示当执行template模块的任务时,如果捕捉到changed=true,那么就会触发notify,如果分发的index.html改变了,那么也重启nginx(当然这是没必要的)。notify下定义了两个待调用的handler。handler主要用于重启服务或者触发系统重启,除此之外很少使用handler。以下是这两个handler的内容:

```
handlers: 
- name: restart nginx
service: name=nginx state=restarted
- name: test web page
shell: curl -I http://192.168.100.10/index.html | grep 200 || /bin/false
```

handler的定义和tasks的定义完全一样,唯一需要限定的是handler中task的name必须和notify中定义的名称相同。

注意,notify是在执行完一个play中所有task后被触发的,在一个play中也只会被触发一次。意味着如果一个play中有多个task出现了changed=true,它也只会触发一次。例如上面的示例中,向nginx复制配置文件和复制index.html时如果都发生了改变,都会触发重启apache操作。但是只会在执行完play后重启一次,以避免多余的重启。

### 标签tag
可以为playbook中的每个任务都打上标签,标签的主要作用是可以在ansible-playbook中设置只执行哪些被打上tag的任务或忽略被打上tag的任务。

```
tasks: 
- name: make sure apache is running
service: name=httpd state=started
tags: apache
- name: make sure mysql is running
service: name=mysqld state=started
tags: mysql
```

以下是ansible-playbook命令关于tag的选项。

```
--list-tags # list all available tags
-t TAGS, --tags=TAGS # only run plays and tasks tagged with these values
--skip-tags=SKIP_TAGS # only run plays and tasks whose tags do not match these values
```
### include和roles
如果将所有的play都写在一个playbook中,很容易导致这个playbook文件变得臃肿庞大,且不易读。因此,可以将多个不同任务分别写在不同的playbook中,然后使用include将其包含进去即可。而role则是整合playbook的方式。无论是include还是role,其目的都是分割大playbook以及复用某些细化的play甚至是task。


#### include
可以将task列表和handlers独立写在其他的文件中,然后在某个playbook文件中使用include来包含它们。除此之外,还可以写独立的playbook文件,使用include来包含这个文件。

也即是说,include可以导入两种文件:导入task、导入playbook。

1. 一种是任务列表式的文件(没有tasks或handlers指令),它只能在tasks或handlers指令的子选项处使用include包含。这种方式可以传递变量到被包含的文件中。

假设某个task列表文件/yaml/a.yaml内容如下:

```
---
- name: execute ntpdate
shell: /usr/sbin/ntpdate ntp1.aliyun.com
```

在同目录/yaml下有一个名为test.yaml的playbook(除了role,playbook中所有相对路径都是基于playbook的),在此playbook中使用include来包含它,如果使用相对路径将会包含同目录下的文件。

```
---
- hosts: centos7
tasks:
- include: a.yaml
```

可以在include的时候传递变量给对应的文件,这样在被包含的文件中就可以引用该变量的值。

```
---
- hosts: centos7
tasks:
- include: a.yaml sayhi="hello world"
```

或者

```
---
- hosts: centos7
tasks:
- include: a.yaml
vars: 
sayhi: "hello world"
```

然后可以在被包含的文件a.yaml中使用该变量。例如:

```
---
- name: execute ntpdate
shell: /usr/sbin/ntpdate ntp1.aliyun.com
- name: say hi to world
debug: msg="{{ sayhi }}"
```
2. 另一种是include整个playbook文件,即include的动作是加载一个或多个play,所以写在顶级列表的层次。

```
- name: this is a play at the top level of a file
hosts: all
remote_user: root

tasks:

- name: say hi
tags: foo
shell: echo "hi..."

- include: load_balancers.yml sayhi="hello world"
- include: webservers.yml
- include: dbservers.yml

any other operations
```

需要说明的是,在ansible 2.4版本中,添加了includes和imports两种导入的方式,它们对静态和动态导入支持的更细化,而ansible 2.3及以前的include语句已经废弃,但仍可用。

#### roles
roles意为角色,主要用于封装playbook实现复用性。在ansible中,roles通过文件的组织结构来展现。

对于一个role,它的文件组织结构如下图所示:
![ansible role_1](http://ot8956ufo.bkt.clouddn.com/ansible_role_1.png)

首先需要有一个roles目录。同时,在roles目录所在目录中,还要有一个playbook文件,此处为nginx.yml,nginx.yml文件是ansible-playbook需要执行的文件,在此文件中定义了角色,当执行到角色时,将会到roles中对应的角色目录中寻找相关文件。

roles目录中的子目录是即是各个role。例如,此处只有一个名为nginx的role,在role目录中,有几个固定名称的目录(如果没有则忽略)。在这些目录中,还要有一些固定名称的文件,除了固定名称的文件,其他的文件可以随意命名。以下是各个目录的含义:

- tasks目录:存放task列表。若role要生效,此目录必须要有一个主task文件main.yml,在main.yml中可以使用include包含同目录(即tasks)中的其他文件。
- handlers目录:存放handlers的目录,若要生效,则文件必须名为main.yml文件。
- files目录:在task中执行copy或script模块时,如果使用的是相对路径,则会到此目录中寻找对应的文件。
- templates目录:在task中执行template模块时,如果使用的是相对路径,则会到此目录中寻找对应的模块文件。
- vars目录:定义专属于该role的变量,如果要有var文件,则必须为main.yml文件。
- defaults目录:定义角色默认变量,角色默认变量的优先级最低,会被任意其他层次的同名变量覆盖。如果要有defaults文件,则必须为main.yml文件。
- meta目录:用于定义角色依赖,如果要有角色依赖关系,则文件必须为main.yml。

所以,相对完整的role的文件组织结构如下图:
![ansible role_2](http://ot8956ufo.bkt.clouddn.com/ansible_role_2.png)
如果是多个role,则在roles同级目录下定义多个入站(作用类似于C语言的main函数)文件(如上面的nginx.yml),并在roles目录下创建对应的role目录即可。
![ansible role_3](http://ot8956ufo.bkt.clouddn.com/ansible_role_3.png)

当然,如果不是使用相对路径,那么role的文件结构就无所谓了,但是roles功能开发出来,就是为了解决文件混乱和playbook臃肿问题的。所以如果可以,尽量使用推荐的role文件结构。

另外,如果role中出现的task、var、handler等和单独定义的对象同名冲突了,则优先执行role中的内容。

以下是nginx role的入站文件nginx.yml的内容。

```
---
- hosts: centos7
roles:
- nginx
```

原文地址:https://www.cnblogs.com/gushiren/p/9642338.html