分享一则近期处理的一个园区网故障,希望可以帮助到遇到类似问题的朋友
故障说明:
前期做的一个园区网项目,项目设备挺多,但是网络拓扑是比较简单的,也就是常见的三层网络,接入交换机--核心交换机----出口FW

这个园区网项目做完后一直很好,就是上周收到客户电话说,最近一两周总是间歇性网络非常卡的情况,是整个园区网都卡。
初步怀疑有三
1.核心交换机故障
2.出口设备故障
3.局域网有病毒、环路导致
去到现场刚好有故障,立即登录核心交换机CPU 跟内存,发现资源使用率很低,才10%及
show proc cpu
show pro me
然后查看日志,show log ,发现没有什么异常日志,只是一些端口up down 的日志而已。一般环路的情况会有相关日志出现,这看起来不像是环路了。
接着客户说有测试拔掉3楼的交换机与核心交换机光纤网络就正常了,那就尝试登录到3楼交换机查看日志,cpu 内存的,也没有发现什么异常
既然故障初步怀疑是3楼设备导致,那么用排查法,通过shutdown 端口来排查,一个小技巧就是
interface range G0/1 to 24
shutdown
关闭一半端口测试网络,发现网络恢复正常, 然后按这个流程不断减半,最终是锁定了一个G0/19端口会导致整个网络故障
经过沿着网线找东西,查找到这个端口接了一台傻瓜交换机,下面接了两台设备。 跟客户沟通终端杀毒等操作看什么原因导致。
奇葩的是当客户把服务器下架查杀的时候,另外接一台刚装系统的服务器,接入网络后又出现故障,最终排查发现是这个傻瓜交换机的问题。
这就很奇怪了,后续然客户去尝试抓包分析,这种问题比较奇怪,也想看看大家遇到过这种情况的聊聊具体什么原因,我记得有一个是网卡有问题会导致,但是这个会影响其他vlan的网络也就很奇葩了。