2013年4月26日(初版)
TAC SR Collection |
主な問題 |
Nexus 7000 シリーズスイッチの F2 ラインカードにおける MTM プロセスのリスタートおよびそれに伴うリロードが発生します。
MTMプロセスのリスタート中には、通信の一部が遅延や破棄などの影響を受ける可能性があります。
|
原因 |
F2 ラインカード(N7K-F248XP-25)における MTM プロセスのリスタートには主に下記2つの不具合が原因として考えられます。
(1) CSCtn64672 : l2fm crash if too many MAC address move over vpc peer link
vPC 構成の片方のpeerで大量のMAC flap等が発生すると、もう片方のpeerにそれを通知する大量の内部メッセージがpeer-linkを介して送信されます。それにより大量のメッセー ジが内部バッファに蓄積されL2FMがbusy状態となります。その結果、L2FMまたはMTMプロセスのリスタートやシステムの再起動が発生することが あります。
(2) CSCtx46109 : Clipper KLM Interrupt Throttling trigger MTM FE timer expired
F2 ラインカード上にはL2/L3 Forwarding Engine(FE)の役割を担うClipperと呼ばれるASICが12個実装されています。
本 不具合では、通常運用において何らかの要因でこのASIC上の何れかのinstanceに対するinterrupt(アクセス)がマスクされます。その結 果、関連するプロセス(MTMやclp_fwd等)のメモリリークが発生し、場合によってはプロセスのリスタートやシステムの再起動に至ることがありま す。
本不具合により下記メッセージが出力されます。
%MTM-SLOT4-0-FE_TIMER_EXPIRED: FE timer expired for fe x!
FE x はマスクされたASIC instanceへのアクセスに失敗したinstanceを示します。マスクされているASIC instanceは下記コマンドから確認可能です。
`show logging onboard internal kernel`
Fri Apr 19 07:11:29 2013 (549791 us) clpk_isr: Warning Instance 7 interrupts maske
もしくは、下記出力をご確認下さい。
`show hardware internal clipper-klm interrupt-status`
----------------------------------------------------------------- | Inst | Interrupt Stat[0-1] | Masked By | Status | Version | ----------------------------------------------------------------- | 0 | 00000000, 00000000 | None | 00000736 | 00000004 | 1 | 00000000, 00000000 | None | 00000536 | 00000004 | 2 | 00000000, 00000000 | None | 00000536 | 00000004 | 3 | 00000000, 00000000 | None | 00000536 | 00000004 | 4 | 00000000, 00000000 | None | 00000536 | 00000004 | 5 | 00000000, 00000000 | None | 00000536 | 00000004 | 6 | 00000000, 00000000 | None | 00000536 | 00000004 | 7 | 00000000, 02000000 | K | 00000536 | 00000004 =====>K bit | 8 | 00000000, 00000000 | None | 00000536 | 00000004 | 9 | 00000000, 00000000 | None | 00000536 | 00000004 | 10 | 00000000, 00000000 | None | 00000536 | 00000004 | 11 | 00000000, 00000000 | None | 00000736 | 00000004
これらの不具合発生時には、L2FMプロセスがbusy状態となりETHPMプロセスとの通信の整合性が取れなくなった結果、下記ログメッセージが出力されることもあります。
%ETHPORT-5-IF_SEQ_ERROR: Error ("sequence timeout") communicating with MTS_SAP_L2FM for opcode MTS_OPC_ETHPM_PORT_PHY_CLEANUP (RID_PORT: Ethernet2/25)
|
解決策
|
(1) CSCtn64672 : l2fm crash if too many MAC address move over vpc peer link
恒久的な対策としては、修正済みバージョンへのNX-OSアップグレードをお願い致します。
影響を受ける NX-OS バージョンの使用を継続する場合には、発生条件である多量の MAC flap 解消をお願い致します。
(2) CSCtx46109 : Clipper KLM Interrupt Throttling trigger MTM FE timer expired
恒久的な対策としては、修正済みバージョンへのNX-OSアップグレードをお願い致します。
アップグレードされる前にまずF2 ラインカードのリロードが必要となります。
|
|
|
備考:
L2FM:スーパーバイザ上にあるMac AddressなどLayer 2に関わるプロセス
MTM:L2FMとやり取りを行う各ラインカード上にあるプロセス