2020年4月22日 (初版)
2022年4月28日 (アップデート)
TAC SR Collection |
主な問題 |
Cisco Digital Network Architecture Center (DNA Center) で、InfluxDB の再起動が頻繁に繰り返される問題です。
InfluxDB の再起動回数は、DNA Center に SSH アクセスして、"magctl appstack status" コマンドを実行して出力される Pod ステータスの一覧から確認できます。InfluxDB のみ確認したいときは、"grep" コマンドで指定してください。
以下は、本事象が発生している環境下で取得したコマンド出力の一例です。6 日間で 1243 回再起動していることが分かります。 (※ status は、例にある CrashLoopBackOff 以外にも、Running などいくつかのパターンがあります。)
$ magctl appstack status | grep influx
maglev-system influxdb-0 2/3 CrashLoopBackOff 1243 6d 10.1.1.1 192.0.2.1 <none>
|
原因 |
定期的な pruning がデータの蓄積に追いつかず InfluxDB のサイズが肥大化した結果、Out Of Memory によって InfluxDB の crash を引き起こします。本事象は複数の既知不具合として報告されています。
CSCvq09974 CSCvq81180 CSCvy83860 CSCvy91515
|
解決策 |
CSCvy91515, CSCvq09974, CSCvq81180, CSCvy83860 の修正されたバージョンにアップグレードします。 修正バージョンへアップグレード後、数日程度経過をみても事象が改善しない場合は、調査のため TAC にケースをオープンします。
アップグレードによる対応が難しい場合、Field Notice: FN - 72247 - Cisco DNA Center Controller InfluxDB Service Might Fail with a Continuous Restart 記事の Workaround を適用します。
|
備考
本不具合は、Bug Search Tool でも確認できます。
各製品の TAC SR Collection の一覧は、よくある質問と解決方法 (TAC SR Collection) から確認できます。