Trident LC の NP には TCAM の他に以下の4種類のメモリが使用されています。
・Stats Memory
・Search Memory
・Frame Memory
・Control Memory
これらのメモリで修復不可能な ECC Error(Multibit Error) が発生した場合は、
以下のログと共に、LC のリロードが発生します。
Double ECC Error によるリロードの例 |
---|
LC/0/3/CPU0:Dec 3 22:10:33.881 : pfm_node_lc[226]: %PLATFORM-NP-0-HW_DOUBLE_ECC_ERROR : Set|prm_server[262222]|Network Processor Unit(0x1007000)|NP DOUBLE ECC ERROR, NP=0, memId=17, subMemId=0x1 LC/0/3/CPU0:Dec 3 22:10:33.902 : pfm_node_lc[226]: %PLATFORM-PFM-0-CARD_RESET_REQ : pfm_dev_sm_perform_recovery_action, Card reset requested by: Process ID: 262222(prm_server), Fault Sev: 0, Target node: 0/3/CPU0, CompId: 0x1f, Device Handle: 0x1007000, CondID: 1001, Fault Reason: NP DOUBLE ECC ERROR, NP=0, memId=17, subMemId=0x1 LC/0/3/CPU0:Dec 3 22:10:33.904 : sysmgr[87]: %OS-SYSMGR-2-REBOOT : reboot required |
Double ECC Error(Multi bit error) は、Single Bit Error と同様に、以下の2種類に分類されます。
Soft Parity Error: ノイズや宇宙線等の理由により偶発的に発生する一過性の問題
Hard Parity Error: ハードウェア障害により発生する恒久的な問題
よって、問題が繰り返し再現する場合以外は、Soft Parity Error の可能性が高い為、1回目の発生
では H/W 不具合と判断することができませんので様子見での対応をお願いします。
LC には複数のメモリが使用されておりますので、同じ NP の同種類のメモリにて短期間に2回以上
Double ECC Error が検知された場合は H/W 不具合の可能性が高い為、H/W 交換にて対応させて頂きます。
メモリの種類は、リロード時のログに含まれてる Memory ID から確認可能です。
MemId=16 "Stats Memory"
MemId=17 "Search Memory"
MemId=18 "Frame Memory"
MemId=19 "Control Memory"
参考リンク
ASR9000: NP(Trident LC) の外部メモリ
https://supportforums.cisco.com/docs/DOC-28482
ASR9000: Line Card と Network Processor の関係
https://supportforums.cisco.com/docs/DOC-27562