分析网络故障慢慢来!一定要抓到真凶(有关arp)

近来我管理的网络中,有arp混乱情况,现在还不能解决,好痛苦啊。我限定自己在3天内一定要解决该问题。然后和大家一起分享.

事情发生在2008年9月11日下午4点左右,我的pc所在的一个vlan(其他vlan我不知道)没有网络信号,不能上internet了,通一vlan的同事报告说不能连上internet,我到总控机房看,光纤信号没有哦(我认为光纤信号是一入一出的,但原来城域网的信号不是这样的,是看光纤收发器的信号灯就可以了),于是我认为是城域网的出口问题,所以就等明天网络恢复吧.然后下班了。第二天,领导告诉我,城域网的出口没有问题,上级城域网管理员打来电话了。郁闷啊,我启用了后备的电信信号,只需要把路由器设置ip为防火墙ip,添加静态路由表就可以了。哈哈.我为自己的聪明小小骄傲了。学的到知识还是能用上的,等城域网的信号好了再算啦.因为手头好多野做啊。暂时放一放,迟两天再接城域网啦.

  谁知道问题出现了。好多pc 能上网,但有时候通有时候不通啊.真纳闷啊.我想,是不是有些pc不行啊。但想想不可能啊。因为好多pc我更新了防火墙和病毒库,因为不会有事啊.所以我对不能上internet的pc排查.确实好多pc连internet是时断时续哦。我想要么是木马类的病毒,如arp搞鬼,于是,我拿了anti arp(彩影)防火墙查杀,在我的pc上抓包,但没有什么特别的异常啊.哎呀!真糟糕,难道不是arp搞野.可能是pc中毒了。我重装一台pc,但最后能上internet的时间不超过10分钟.哇塞!!!!!什么回事,我陷入了沉思中.只有等它通internet的时候更新的防火墙和病毒库.

   星期五晚上(9月12日)我居然9点才下班,还没有搞好是什么回事啊。放假了,我期望放假中秋的三天回来上班,一切就正常,但心知道,网络状况一定不会改观,很现实,除非有奇迹啦.

   三天假期很快结束了。我上班问题依旧啊。真讨厌,我开始有小小讨厌自己了。但问题的基础上出现了一个有趣的现象,有几台pc是很顺畅的哦。如阿波的机,坤坤的机.我的pc也可以啊。基本上是稳定连接internet啊。真恶搞啦.证明internet是通的哦。其他pc就是有时候通有时候不通啊。于是我再次上网查找资料.发现有一些arp的防治办法.其中好多没有用,因为我用过了。还在网络没有查资料前,自己就写了一个静态绑定网关ip和mac的bat文件,放在测试pc的启动项里面。防止arp攻击.其实好简单的。@Echo off  

                       arp -d 

                       arp -s 网关ip   mac地址

使用方法:ARP-s-d-a

                -s——将相应的IP地址与物理地址的捆绑。

                 -d——删除所给出的IP地址与物理地址的捆绑。

          -a——通过查询Arp协议表来显示IP地址和对应物理地址情况
为什么我要这么做,我还是怀疑arp搞到我的vlan不行啊。叫arp欺骗罢.我做了一个测试,在我的pc上cmd输入 

arp -a  查看全部缓存表,有多条记录,正常来说,一般只有网关那条记录而已.所以我就想到静态绑定,但另我悲伤的是,还是不行啊。什么原因,能告诉我吗??

接下来的几天我在vlan中观察啊。看二级交换机有什么变化,灯是否有异常,发现有异常的就先拔下网线啊.但结果很惨,还是没有搞好,状况一点没有改观.呜呼!!!!

我到总控机房,又检查中心交换机和其他的vlan情况,有一个vlan的二级交换机就在总控机房.发现华为的e206交换机橙色灯(数据)和绿色灯(物理连接信号)齐齐长亮,没有闪烁.哎,全部网络瘫痪了。会不会是另外的vlan1影响到vlan2呢?我又沉思了。拔掉vlan1的交换机电源.我做了。认为,哦.没有问题了。于是,到vlan2一看,大家话可以了。欢呼雀跃,哈哈。真开心,谁知道,10分钟后,一切又不行了。arp -a好是混乱模式,一点没有改变.我想哭了。是心想哭,但又不哭给别人看的那种.

到底是什么问题,是不是硬件......(明天继续....)

接上,星期五晚上,经过小西介绍网络上认识了网络高手华哥哥,是佛山的一家大型公司的网管,跟他在qq上谈论了好多现象和情况,从他的话语知道,他做事是很规范的那种,解决问题很缜密,而且学习网络管理一块很精.哈哈。他给我提供了一个好的建议,就是中心交换机,和我的想法有了一个引证.我们谈论了应该有1个多小时,就是我的想法有了支持方了。我决定向中心交换机入手。

    该问题一天不解决,我就一天睡不好哦。星期天(9月21日)早上,我接到波波电话说网络不通,在总控机房打开关,重新启动所有设备也只有10分钟的网络连通时间。我当然想个究竟了,今天要解决它.我立刻放下其他事情。回到单位.

   先经过最后的通牒决定,我用telnet上中心交换机,进入system用户模式,dis arp发现没有中arp的征兆,哇,我凉了半截.然后我就进入dis logbuffer看日志,并下载来分析.好象也没有什么大的疑点啊。最后经过以中心交换机为据点,我拔掉所有vlan,哎,成功哦。如果只接vlan2就通哦。经过远程控制发现vlan2内的计算机一点问题也没有.哈哈。内心欢喜啊.这时候,阿head打来电话,话办公室的计算机已经叫电脑行(真系好巷噶)的人搞好了。其实我后来发现只是啊head的计算机改了ip地址,他们以为是ip冲突,笑到我要倒下了。不过,外行的人不要与他一般见识.

   我认为问题解决了.等我插上其他的vlan后,回到vlan2,网络又不通了。就连平时很容易通的几台计算机也不通上面的中心交换机了。呜呼!!!好惨啊。明明远程的时候见到顺畅啊。为什么现在。.....

   我再次返回中心机房,发现拔掉其中的vlan7的线的时候,网络一切正常。哦,原来是一个光纤设备坏了。导致网络风暴......,影响了中心交换机的运行。中心交换机是有容错性和冗余的功能的(我理解),所以,每次能运行10分钟左右便全不通,因为它要处理不断发来的数据包.而之前是光纤设备半坏状态(我理解),中心交换机还能支持,但vlan的部分计算机已经不能通过中心交换机出上一级的设备或网络了。哈哈,问题终于解决了。我也高兴了接下来的时间,,,直到国庆放假也要开心足7天。

再次感谢佛山华哥哥.

另:9月初发现一个点(pc网络接入信息点)不通,ping不通网关.查看交换机的情况,发现交换机的橙色灯和绿色灯一起快速闪烁.不停闪烁.于是我一步步测试:先测网络线路.就是pc到墙的模块一段.发现测线器显示正常啊.于是怀疑pc,但换一台正常的pc发现情况依旧啊。证明pc的网卡也没有坏啊。于是就怀疑到网络模块(rj45)到交换机的一段.我不怀疑交换机,是因为交换机的其他情况很正常,就这个点的问题,而且从配线架到交换机的跳线,我试过跳到另外的插口也不能解决问题,情况依旧,所以自然就怀疑到网络模块(rj45)到交换机的一段.我更换了墙上的模块,情况没有改变。啊.天啊。不要耍我了。我受不了啊.最后,我用手提测试,发现,从模块到交换机是通的,很正常啊.啊.就是pc到模块这一段的线路故障啊.我再用测线器,终于发现就上线路问题.关键的制作好些水晶头.好了。为什么当时我测试线路是正常的呢!!!!

原文地址:https://www.cnblogs.com/pyman/p/1294711.html