系统运维哪些事儿之正常状态

为了有个宽松的开发环境,当年毕业时放弃了去IT公司打拼,而且选择相对安逸的公司做网络运维。其实网络运维是个比较好差事,只要网络不出问题,大部分时间都是你自己的。你想看电影,打游戏、刷微博,写字、看书等等,基本上是没人管你的。不过地位嘛,基本上和扫地大妈是一个level的。
这个工作很适合我,首先,专业实在是在对口,俺就是那个传说中“计算机科学与技术”。当年导师说过,你这个专业学的好就是科学,学的不好就是技术。目前,俺从事的就是技术工作。
因而,在网络正常的那段时间,我就写我想写的iOS和MacOSX程序。
正常状态就是我日常工作要保障的状态,然而网络时复杂的,人类是更复杂的。要维护好网络,我认为首先要了解你所在的网络正常时的一些了技术指标,以及设备正常时的链接方式和指示灯状态。
##状态要可重现
例如,假如我要判断一下网络带宽如何,或者是今天在主干上加入了一个新设备,我需要快速了解一下新设备对我网速的影响。那么我们就可以通过下载个文件进行带宽测试。不过拿什么测呢,我国使用迅雷测试,那必然会受到资源的影响。如果测试观看视频,但是不太好量化。这个时候,我们就需要一个稳定的测试源了。我采用的自己建立的一个FTP。测试如下:
我是千兆接入网络的,要从数据中心的FTP上下载一部电影,平时正常状态为20MB左右,是大B哟。如果测试时速度不是一个量级,例如200KB左右,那么网络应该是存在一些问题。
典型的案例就是,上周我们新采购了一台行为监控设备,简称AC。上了这个初期,网络一切正常。不过突然有一天网络突然变慢,后天反复排查,初步定位到AC和一台交换机上。最后只得通过跳开排查的方式。经过FTP下载测试,在AC上线时下载速度为240KB/s左右,而撤离该设备后,速度回复道20MB左右。
还有一个案例,最近网络我发现网络出口的出入流量与正常状态不太一致,这两天出流量大于入流量。最为一个对外没有太多服务的网络环境来说是不正常的。后来发现,我们有几台服务器可能感染木马了,从而造成流量异常。
好了,今天先介绍这些

原文地址:https://www.cnblogs.com/springday/p/4828134.html