本ドキュメントでは C-Series の System Event Log (SEL) についてご説明いたします。
M5からは System Event Log (SEL) の仕様が大きく変わっております。相違点は主に2方面であります。
【相違点】
・最大容量
・SELログのロテーション
本ドキュメントではM5のSystem Event Log (SEL)とM4の場合を比較しながら、説明させて頂きます。
M4までのSELは最大で 3008エントリまで保存することが出来ます。スペースが一杯になるとそれ以上の SEL を保存することが出来なくなってしまいます。古いSELが削除されないのは、該当のシステムがリブートを繰り返すなどの障害に陥った場合に、最初のトリガーを記録するためです。
M5からは保存されるSELの総容量が131068 エントリとなっており、そのうち、最新の 3008システムイベントのみが表示されます。SELの最大容量(131068 エントリ)に達すると、最も古いエントリが最新のエントリで上書きされます。
仕様の変更に伴い、下記留意点があります。
●M5の場合、GUI上の容量バーは、表示用バッファ3008行に対しての比率を表しており、実際のSEL記録領域の使用分を示したものではありません。/tmp/tech_supportのSEL_FULLNESS表示Reading 値はSEL記録領域の使用分を示したものであります。
SEL_FULLNESS Reading値の算出方法:
SEL_FULLNESS Reading % = (エントリ数x100) / サイズ
例:
M4 サーバで676 エントリのシステムイベントが発生した場合、
(676 x100) / 3008 = 22% (四捨五入後の結果)
M5 サーバで676 エントリのシステムイベントが発生した場合、
(676 x100) / 131068 = 1% (四捨五入後の結果)
※説明:
SELが676 エントリ出力された場合を例としています。Reading 値の%表示は出力エントリ数を分子、総容量を分母にして計算しております。そのため、M5の場合、SEL容量バーは表示用バッファの3008に対するもののため、容量バーは100%になっていてもSEL_FULLNESS Reading値は非常に低い可能性があります。
●上記仕様が搭載されたのは、M5のCIMC Release 3.1(1)からです。M4の場合、バージョンがRelease 3.1(1)以降であっても旧仕様で動作します。
●M5の場合、Clear Logを実行することで、表示用バッファと実バッファの両方がクリアになります。実際のところ、FaultイベントとしてSEL_FULLNESSのイベントLow/VeryLow/Fullが記録されるまでは、アクション不要だと想定されます。また、M4以前とは異なり、容量バーが100%になっても容量バーの色は赤くなりません。
●M5サーバーで実SEL容量が一杯になった場合のログ出力例及びクリア後の出力例は下記通りです。
[SEL_FULL時のログ]
IPMI Sensors
SEL_FULLNESS | 100.000 | unspecified | UNR | na | na | na | 80.000 | 90.000 | 99.000 |
[SELクリア後のログ]
IPMI Sensors
SEL_FULLNESS | 0.000 | unspecified | OK | na | na | na | 80.000 | 90.000 | 99.000 |
[SEL_Low/VeryLow/Fullのエラー]
02/27/2020 13:12:19 UTC | CIMC | System Event SEL_FULLNESS #0xc0 | Upper Non-critical - going high | Asserted | Reading 100 >= Threshold 80 unspecified
02/27/2020 13:12:19 UTC | CIMC | System Event SEL_FULLNESS #0xc0 | Upper critical - going high | Asserted | Reading 100 >= Threshold 90 unspecified
02/27/2020 13:12:19 UTC | CIMC | System Event SEL_FULLNESS #0xc0 | Upper Non-recoverable - going high | Asserted | Reading 100 >= Threshold 99 unspecified
※このSEL容量閾値超過のメッセージはGUI上の3008件ではなく、tech_support上(実総容量131068エントリ)のうち80、90、100%で上がるメッセージであります。
【SELクリア方法】
M4の場合、運用監視等で SEL をご使用の際には、定期的に SEL をクリアする必要があります。また、M5の場合でも、必要に応じて SEL をクリアする必要があります。SELをクリアする方法は基本共通しており、主に下記2つの方法があります。
[GUI でのクリア方法]
1. CIMCの[Navigation]から[chassis]タブをクリックし、[Faults and Logs]メニューを選択します。右画面から[System Event Log]タブを選択して、現在発生しているEvent及び容量を確認できます。
2. 容量バーの左にある[clear log]ボタンをクリックし、OKを押しますとEventログがクリアされます。
M5の場合、容量バーの100%は表示用の3008エントリに対する表示となり、赤ではなく黄色表示になります。
[CLI でのクリア方法]
CIMCにSSH接続後、下記コマンドを実行し、YES(y)を選択しますとEventログがクリアされます。
⇒Server# scope sel
⇒Server /sel # clear
【参考情報】
M4
Cisco UCS C-Series Servers Integrated Management Controller CLI Configuration Guide, Release 3.1
⇒Clearing the System Event Log
https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c/sw/cli/config/guide/3_0/b_Cisco_UCS_C-Series_CLI_Configuration_Guide_31/b_Cisco_UCS_C-Series_CLI_Configuration_Guide_40_chapter_01111.html
Cisco UCS C-Series Integrated Management Controller GUI Configuration Guide, Release 3.1
⇒Clear Log button
https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c/sw/gui/config/guide/3_1/b_Cisco_UCS_C-series_GUI_Configuration_Guide_31/b_Cisco_UCS_C-series_GUI_Configuration_Guide_31_chapter_010000.html?bookSearch=true
M5
Cisco UCS C シリーズ Integrated Management Controller リリース 4.0 GUI コンフィギュレーション ガイド
https://www.cisco.com/c/ja_jp/td/docs/unified_computing/ucs/c/sw/gui/config/guide/4_0/b_Cisco_UCS_C-series_GUI_Configuration_Guide_40/b_Cisco_UCS_C-series_GUI_Configuration_Guide_40_chapter_010000.html#d37615e1030a1635
Release Notes for Cisco UCS C-Series Software, Release 3.1(1) - Cisco
https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/release/notes/b_UCS_C-Series_Release_Notes_3_1_1.html