取消
显示结果 
搜索替代 
您的意思是: 
cancel
1071
查看次数
2
有帮助
5
回复

无线AP突然批量断开注册几分钟后自动恢复

xunyou
Level 1
Level 1

最近遇到个很奇怪的现象。

思科的无线AP设备,会突发性的断开注册,一般断开3-5分钟后又恢复正常。

这种现象随机出现,目前没有发现规律。

通过WLC后台查询到AP在线时间是没有断开的,也就是说AP仅仅是断开了注册后又恢复正常。

AP型号有:C9115AXI-H,AIR-AP1832I-H-K9,AIR-AP1815W-H-K9等。

WLC:AIR-CT5520-K9,版本8.10.130.0。域恢复版本8.1.102.0。

AP在50网段,控制器在30网段。

授权数量是足够的,250台授权,已使用176台。

有没有高手遇到过这种情况的?最近被这个问题折腾的有点烦。

1 个已接受解答

已接受的解答

可以从以下几个方面来入手观察这个问题:

  • 从WLC上尝试直接观察:关于AP掉线的问题,可以在AP掉线的时候用show ap join stats detailed <Cisco AP Mac> 查看AP掉线的原因。
  • 掉线的规律:掉线的AP中,是否都是一起发生的,是否这些AP都是在一个区域或在某一个SW下连接的,可以确认AP连接的SW是否有问题,从另一个角度来说,即检查AP到WLC的路径上是否有丢包。
  • 软件版本问题:8.10.130不是当前建议的版本,不排除有软件bug的问题。

因为当前没有比较明确的信息和测试,很难判断问题的根本原因在哪里,建议还是进一步先排查看看。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Rps-Cheers | If it solves your problem, please mark as answer. Thanks !

在原帖中查看解决方案

5 条回复5

可以从以下几个方面来入手观察这个问题:

  • 从WLC上尝试直接观察:关于AP掉线的问题,可以在AP掉线的时候用show ap join stats detailed <Cisco AP Mac> 查看AP掉线的原因。
  • 掉线的规律:掉线的AP中,是否都是一起发生的,是否这些AP都是在一个区域或在某一个SW下连接的,可以确认AP连接的SW是否有问题,从另一个角度来说,即检查AP到WLC的路径上是否有丢包。
  • 软件版本问题:8.10.130不是当前建议的版本,不排除有软件bug的问题。

因为当前没有比较明确的信息和测试,很难判断问题的根本原因在哪里,建议还是进一步先排查看看。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Rps-Cheers | If it solves your problem, please mark as answer. Thanks !

目前观察了下问题现象。

WLC在30网段,部分AP在30网段,部分AP在50网段,1台AP在37网段。

AP掉线的那一刻,有线网络ping 控制器地址不通,时间来的太突然以至于忘记ping30的网关以及另外2个网段的网关了。

但是根据WLC后台APjoin的日志可看到,AP出现掉线的那一刻,50和37网段的均出现了重新join的日志。

30的没有,且WLC也处于30网段。

目前初步判断可能是跨网段故障,当然不排除WLC本身故障,WLC运行时长已经有将近1200天。

这种故障出现的太偶然了,就像是一个定时炸弹一样让人不安。

从你的描述来说,那就是和WLC同网段的AP没有发生该问题,那WLC故障的概率相对较小。故障的时候ping控制器的地址的终端(听起来也是和WLC不在同一个网段的吧),这样的话的确可能和我上面提到的第二点的相关性更强,建议可以先从AP到WLC路径上的丢包或者中间设备故障展开排查。另外,AP所在网段有没有发生什么变化(可以从AP自身的Log去观察一下),网段内大量的广播报文等,如果让AP去接收并处理了,AP恐怕也是会异常掉线甚至重启的(类似于对AP本身的攻击);所以下一步的综合建议:

  1. 对AP到WLC路径的网络进行排查;
  2. AP所在网段是否有异常报文的确认;
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Rps-Cheers | If it solves your problem, please mark as answer. Thanks !

目前还在观察,等待下一次问题复现后才能进一步确定到底是什么原因造成的。

也许是你说的版本BUG问题,希望如此。

新的发现:长pingWLC,30段网关,50段网关,以及其中的设备。

在突发的AP断开链接的状态下,pingWLC的有一小段时间的丢包,其余的均正常。

根据这个现象可以判断:出现AP掉线故障原因是,WLC与其它网段中断了链接,导致非当前WLC网段的AP注册失败引起的掉线。

不知道是版本问题还是长时间没重启导致的内存溢出?无从得知了。

快捷链接