SRE_ Google运维解密

# 第IV部分 管理

#系统可用性时间表

# 专用术语

SLO:服务等级目标

LCE(Land-Covered Earth):紧急检修登陆艇

# 紧急事故管理

 

 

一次流程管理良好的事故

# 东西早晚要坏的,这就是生活

# 值得警惕的是,理解一个系统应该如何工作并不能使人成为专家。只能靠调查系统为何不能正常工作才行。

    --Brian Redman

# 系统正常,只是该系统无数 异常情况下的一种特例。

    --John Allspaw

 

原文地址:https://www.cnblogs.com/linkenpark/p/10774716.html