2018年1月24日 (初版)
xxxx年x月x日 (アップデート)
TAC SR Collection |
主な問題 |
ACI mode の Nexus9000 で stats_manager プロセスで memory leak が発生し、Nexus9000 の再起動が発生する問題があります。 本事象が発生した場合、再起動後以下のコマンドで "stats_manager hap reset"が表示されます。
leaf1# show system reset-reason *************** module reset reason (1) ************* 0) At 2018-01-13T09:31:35.312+09:00 Reason: reset-triggered-due-to-ha-policy-of-reset Service:stats_manager hap reset Version: 12.0(2h)
|
原因 |
以下の S/W 不具合に該当しています。 CSCvb42851 : memory leakage in stats manager on addition/deletion of AAEp
|
解決策 |
メモリーが上限に達する前に再起動することで、意図しないタイミングで再起動が発生する事を避ける事が出来ます。 以下のコマンド出力の左から5個目の値が 4194304 に達する前に再起動する。
leaf1# ps aux | grep stats_manager | grep -v grep
root 8869 2.3 1.6 1884628 263536 ? Ss 2017 844:25 /isan/bin/stats_manager
また stats_manager 自体では上限に達していない場合でも、他のプロセスでもメモリを消費しており、 Nexus9000全体のメモリが枯渇する状況が発生した場合、Kernel Panic が発生する場合があります。 以下のコマンド等でSwitch全体のメモリ使用率を確認し、85%以上の場合は、再起動を検討ください。 以下の例では 12353268(used) / 24500980(total) * 100 = 50.4% の使用率となります。
leaf1# show system resources
Load average: 1 minute: 1.34 5 minutes: 1.46 15 minutes: 1.51
Processes : 608 total, 1 running
CPU states : 6.9% user, 3.0% kernel, 90.1% idle
Memory usage: 24500980K total, 12353268K used, 12147712K free
Current memory status: OK
恒久対策は同不具合の修正 version に upgrade することです。
|