2017年1月27日(初版)
TAC SR Collection |
主な問題 |
ASR 9000 シリーズルータの RSP/RP/SFC/LC 各モジュールには、起動時にモジュール内の電源の ON/OFF を制御するパワーシーケンサ IC が搭載されています。
パワーシーケンサ IC の動作イメージは、各モジュール上の EEPROM 内に保存されていますが、何らかの理由で EEPROM 内のイメージが破損した場合は、物理的に破損していないにもかかわらずモジュールの交換が必要でした。
Power Sequencer Failure 検知時に出力されるログの例
RP/0/RP0/CPU0:Jan 10 02:38:46.882 JST: canb-server[152]: %PLATFORM-CANB_SERVER-7-CBC_PRE_RESET_NOTIFICATION : Node 0/0/CPU0 , Power Sequencer Failure (0x09000000) RP/0/RP0/CPU0:Jan 10 02:38:46.894 JST: canb-server[152]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC in slot 0/0/CPU0, alarm code CBC_ALRM_PWR_SEQ_FAILED
|
原因 |
この問題に対処する為に、IOS-XR 内にパワーシーケンサ IC の動作イメージと、問題検知後のリプログラム処理を追加することで、EEPROM 破損による Power Sequencer Failure からの自動復旧が可能にするエンハンスメントが実装されました。
このエンハンスメントは、モジュール別に報告されています。
CSCux24553: Reprogram power sequencers on failed card 対象: RSP440, RP, SFC110, Typhoon LC, Tomahawk LC
CSCuz52900: CBC_ALRM_PWR_SEQ_FAILED Reason: OUTPUT VOLTAGE FAULT Bus:0x2 ※ CSCux24553 により A9K-8X100GE/A9K-4X100GE で発生する問題の修正
CSCuz37352: Power sequencer programming for PPC based cards 対象: ASR9001-LC, A9K-RSP-4G/8G 使用時の Typhoon LC
CSCuz27941: RSP4 power sequencer programing up on EEPROM CML fault 対象: A9K-RSP880-TR/A9K-RSP880-SE
CSCuz89058: RP2 power sequencer programming 対象: A99-RP2-TR/A99-RP2-SE
CSCva98430: FC2 power sequencer programming support 対象: A99-SFC2
|
解決策 |
問題の解決には CSCux24553/CSCuz52900/CSCuz37352/CSCuz27941/CSCuz89058/CSCva98430 の修正されたバージョンを使用する必要があります。 ただし、パワーシーケンサ IC や電源系統に物理的な問題が発生している場合は復旧できません。
なお、CSCuz37352/CSCuz27941/CSCuz89058/CSCva98430 については個別の SMU はありませんが、CSCvb55828 に統合して提供されています。
問題を検知し、自動復旧の開始時に出力されるログの例
RP/0/RSP0/CPU0:Jan 8 00:41:32.768 : envmon[208]: %PLATFORM-ENVMON-6-CBC_REFRESH_PWR_SEQ : CBC is updating the power sequencer image on 0/1/CPU0 for rail 0xc0 0x2. Please do not power off card
復旧成功時に出力されるログの例
RP/0/RSP0/CPU0:Jan 8 00:41:45.066 : envmon[208]: %PLATFORM-ENVMON-6-CBC_REFRESH_PWR_SEQ_COMPLETED : CBC completed successfully the update of the power sequencer image on 0/1/CPU0 for rail 0xc0 0x2. RP/0/RSP0/CPU0:Jan 8 00:41:49.636 : canb-server[155]: %PLATFORM-CANB_SERVER-7-CBC_POST_RESET_NOTIFICATION : Node 0/1/CPU0 , Power Cycle (0x05000000) clear alarm is suppressed and not shown
復旧失敗時に出力されるログの例
RP/0/RSP0/CPU0:Apr 8 00:41:45.139 : envmon[208]: %PLATFORM-ENVMON-3-ALARM_RAISED : Raise alarm from CBC in slot 0/1/CPU0, alarm code CBC_ALRM_PWR_SEQ_FAILED Reason: MEMORY FAULT Bus:0x8 Addresss:0xc0 Chan:0x0 STATUS_CML 0x10
※自動復旧に失敗した場合はハードウェア不良の可能性が高いですが、OIR もしくは電源 Off/On によるモジュール全体の初期化を実施し、同じ問題が再発した場合は、ハードウェア不良として RMA 申請をしてください。
|
備考
本不具合は、Bug Search Tool でも確認できます。