发布时间 04-27-2024 09:44 AM
机房在3.30日空调出现问题,设备因为温度过高自动重启过。然后设备就出现告警。通过命令:show environment查看,有个CPU告警,如下:
然后今日手工软重启一下,重启后查看,告警消失。然而过一会,设备再次 出现相同的告警,重启后查看日志,显示如下:
这是种情况要怎么查看是否是硬件问题,怎么排查解决问题,请大佬指点迷津。
已解决! 转到解答。
发布时间 04-28-2024 12:20 AM
你那air inlet都30多度了吧?进风口这个温度能叫正常?这个温度已经偏高了,先把进风口的温度降到26左右再看。
在原帖中查看解决方案
发布时间 04-27-2024 08:26 PM
show env里面显示的告警就是cpu的问题超过阈值了,应该没什么其他可以说的,将机房的温度降下来应该就可以了
第二个图像是cpu内存的调试信息,看看是否配置了debug的命令吧,可以使用#undebug all关闭所有debug的调试,另外可以将log buffer的日志级别设置成information或者更高的等级(调整日志设置会清空当前log buffer中的所有日志,如有需要需提取保存)
发布时间 04-27-2024 10:01 PM
机房的温度目前是正常的
发布时间 04-30-2024 06:02 AM
把进风口用吸尘器清灰后,恢复正常。
发布时间 04-29-2024 07:59 PM
热积累导致的吧,还需要继续散热降温
发现并保存您最喜欢的想法。 返回专家解答、分步指南、最新主题等。
社区新手? 从这些帮助提示开始。 如何使用社区 新用户指南
登录社区
浏览社区快速链接并以您的母语获取个性化内容: