はじめに
本ドキュメントでは、CPU温度センサーのしきい値について説明します。
CPU温度のしきい値について
UCSではCPUの温度センサーのしきい値が決められており、しきい値を越えた際にはアラートが発生する場合がございます。
- UNC (Upper Non Critical) の温度に達した場合
- UC (Upper Critical) の温度に達した場合
- UNR (Upper Non Recoverable) の温度に達した場合
※UCSMのバージョンによっては、UNCでアラートが発生しないよう修正がされております。
詳しくは CSCve72833 をご参照ください。
上記アラートが発生する原因として、エアーフローの妨害、電力消費量の増加、ハードウェアの不具合、fw側の誤認識などを含め、様々なケースが考えられます。
UNC, UC の温度を越えるとFanの回転速度が上がり、UNRに達する前に自動で温度を下げようとする実装になっております。
Faultが発生しクリアされない場合の対応方法につきましては、以下のGuideの該当Fault番号をご参照ください。
Cisco UCS Faults and Error Messages Reference Guide
https://www.cisco.com/c/en/us/support/servers-unified-computing/ucs-manager/products-system-message-guides-list.html
しきい値の確認方法
UNC, UC, UNRのしきい値は、ご使用のCPUの型番により異なります。
これらのしきい値はプロセッサーベンダーによって定義され、変更することはできません。
確認方法は下記の通りです。
1, UCSMにSSHでログインし、下記コマンドを実施。
# connect cimc [chassis番号]/[server番号]
# sensors
2, P1, P2_TEMP_SENS の行の UNC, UC, UNRの値を確認
(例)
Sensor Name | Reading | Unit | Status | LNR | LC | LNC | UNC | UC | UNR |
=================|=========|==============|========|=========|=========|=========|=========|=========|=========|
P1_TEMP_SENS | 54.000 | degrees C | OK | na | na | na | 88.000 | 93.000 | 98.000 |
P2_TEMP_SENS | 67.500 | degrees C | OK | na | na | na | 88.000 | 93.000 | 98.000 |
UNC: 88度
UC: 93度
UNR: 98度