取消
显示结果 
搜索替代 
您的意思是: 
cancel
公告

December 2020

December 2020

9976
查看次数
12
有帮助
16
回复
xy411381121
Participant

求助CPU使用率过高的警告

设备:cisco Nexus7000 C7010
iOS:n7000-s1-dk9-npe.6.1.2.bin
网管中心这里有个网络监控软件,通过snmp来监控N7K的状态。
现在出现个问题,基本上每月都会出现几次监控软件警告CPU使用率达到100%,但下一次检测时就恢复正常了。监测时间间隔为5分钟。但是我登陆交换机查看日志的时候,又并没有CPU使用率过高的警告。请问这可能是哪些原因造成的?会有风险隐患吗?
1 个已接受解答

已接受的解答
Fusen Huang
Cisco Employee

1. 楼主N7K 使用 SUP1,版本6.1.2,比较老,不排除软件 bug 的可能
2. 通过 show processes cpu history, 观察72 小时 CPU 利用率,找到 average # 位置,这个位置是 CPU 的 baseline;通常 maximum * 的位置会在100%,可忽略
3. nexus 软件底层是 Linux,抢占式 CPU 利用,所以间断性100%利用率,不需要担心。
4. 如果 average# 处于 90% 以上,需要 show system internal resource, show processes cpu sort 去排查具体问题
5. 公开文档 Nexus 7000 High CPU
如果还有疑问,比较着急,欢迎开 TAC case。
如果并不急,可以在这里回复

在原帖中查看解决方案

16 条回复16
Fusen Huang
Cisco Employee

1. 楼主N7K 使用 SUP1,版本6.1.2,比较老,不排除软件 bug 的可能
2. 通过 show processes cpu history, 观察72 小时 CPU 利用率,找到 average # 位置,这个位置是 CPU 的 baseline;通常 maximum * 的位置会在100%,可忽略
3. nexus 软件底层是 Linux,抢占式 CPU 利用,所以间断性100%利用率,不需要担心。
4. 如果 average# 处于 90% 以上,需要 show system internal resource, show processes cpu sort 去排查具体问题
5. 公开文档 Nexus 7000 High CPU
如果还有疑问,比较着急,欢迎开 TAC case。
如果并不急,可以在这里回复

在原帖中查看解决方案

bo chen
Beginner

在CPU高的时候查看一下哪项进程高。然后再有针对性的进行排查。
xy411381121
Participant

CSCO12178277 发表于 2018-5-18 09:43
在CPU高的时候查看一下哪项进程高。然后再有针对性的进行排查。

问题在于我去检查的时候又一切正常。日志也没有任何CPU过高的警告
使用show processes cpu也只有netstack达到了5.9%,其他都是0.0%
使用show processes cpu history,平均值最高也才20%,基本稳定在10%
我在想是不是只是一个瞬间的CPU过高,正好这时监控软件从SNMP获取了设备状态,所以监控软件才有一个cpu过高的报警?
Rockyw
Advisor

用的是什么监控软件?没提示具体原因吗?
Rockyw
Advisor

楼主可以参考一下下面的文档
对 Cisco 路由器上的 CPU 使用率过高进行故障排除
https://www.cisco.com/c/zh_cn/support/docs/routers/10000-series-routers/15095-highcpu.html
xy411381121
Participant

Rocky 发表于 2018-5-21 15:47
用的是什么监控软件?没提示具体原因吗?

不知道用户使用的是什么软件,只知道是通过SNMP,没5分钟从设备获取一次各项状态信息
xy411381121
Participant

Rocky 发表于 2018-5-21 15:48
楼主可以参考一下下面的文档
对 Cisco 路由器上的 CPU 使用率过高进行故障排除
https://www.cisco.com/c/ ...

我研究一下,谢谢了
Rockyw
Advisor

xy411381121 发表于 2018-5-21 15:53
不知道用户使用的是什么软件,只知道是通过SNMP,没5分钟从设备获取一次各项状态信息

如果监控软件报警里面有更详细的信息就更好了。
xy411381121
Participant

Rocky 发表于 2018-5-21 16:18
如果监控软件报警里面有更详细的信息就更好了。

没有,这个监控软件自告警提示了CPU达到100%,但是下一次通过SNMP获取设备状态信息时又是正常的,目前怀疑是不是瞬间峰值,正好这个时候被监控软件检测到了,所以告警了
bo chen
Beginner

xy411381121 发表于 2018-5-21 09:42
问题在于我去检查的时候又一切正常。日志也没有任何CPU过高的警告
使用show processes cpu也只有netstac ...

i think so.那排查工程可能就会繁琐些,在N7K上做一个端口镜像,事实去抓一下包,然后根据SNMP显示的CPU高的时间同时去查抓包结果。然后在进行分析。不过我觉得不影响业务的话可以慢慢排查。{:2_31:}
xy411381121
Participant

CSCO12178277 发表于 2018-5-21 21:01
i think so.那排查工程可能就会繁琐些,在N7K上做一个端口镜像,事实去抓一下包,然后根据SNMP显示的CPU ...

主要目前这监控软件监测到的CPU高占用的时间是不规律的,而且大概也就一月一次,每次监测到后,等我们登录到交换机时又是正常的,而且软件5分钟后的下一次监测也恢复正常了,所以现在怀疑是不是只是一个瞬间峰值,正好又在这个时候监控软件通过snmp收集交换机数据,所以才告警的
fortune
VIP Expert

一般CPU 高到100%会有日志出现的,你这个没有日志? 多登陆上去看看会不会出现100%的情况,会的话立即看process ,如果日志没有,进程没有很难判断
xy411381121
Participant

vsop5207 发表于 2018-5-22 13:29
一般CPU 高到100%会有日志出现的,你这个没有日志? 多登陆上去看看会不会出现100%的情况,会的话立即看pr ...

日志没有告警,查看CPU进程和历史状态这些,也都是正常的。网络监测软件也仅仅是当时检测是有告警,5分钟后的下一次检测就是正常的了
bo chen
Beginner

我觉得可以换新设备了!
Content for Community-Ad


不能显示该小部件。