2023年10月27日 (初版)
TAC SR Collection |
主な問題 |
APIC1 で Storage に関する F0101 fault が上がって、解消される状況が繰り返される場合があります。
[F0101][soaking][equipment-failed][major][topology/pod-1/node-1/sys/ch/p-[/dev/sdc]-f-[/dev/sdc]/fault-F0101]
この問題はファブリック内 (Infra VRF) で使用される TEP アドレス用のプール を default の 10.0.0.0/16 から変更している場合に発生する可能性があります。default の 10.0.0.0/16 から変更された場合、show controller コマンドで APIC1 の Address が 10.0.0.1 ではなくなっていることを確認できます。
apic1# show controller
Fabric Name : fabric1
Operational Size : 3
Cluster Size : 3
Time Difference : 5241637362
Fabric Security Mode : PERMISSIVE
ID Pod Address In-Band IPv4 ... Health
---- ---- --------------- --------------- ... ------------
1* 1 10.0.0.1 <=== 192.168.1.1 ... fully-fit
2 1 10.0.0.2 192.168.1.2 ... fully-fit
3 2 10.0.0.3 192.168.1.3 ... fully-fit
Flags - c:Commissioned | r:Registered | v:Valid Certificate | a:Approved | f/s:Failover fail/success
(*)Current (~)Standby (+)AS
|
原因 |
この問題は、以下の不具合に該当している可能性があります。 CSCwd93306:ACI 5.2.6e :: APIC1 ae sends invalid queries to tcp port 8989 この問題は default の TEP アドレス用のプールが 10.0.0.0/16 から変更されている環境で、APIC1 の svc_ifc_ae プロセスが存在しない 10.0.0.1:8989 宛への通信を行おうとすることでメモリリークが発生し、メモリ割り当て上限に達すると svc_ifc_ae が oom-killer により再起動される事象です。 svc_ifc_ae プロセスがメモリ上限近くに達しメモリ割り当てが出来ない状態の際に、svc_ifc_ae がストレージのステータスを取得しようとして失敗する為 F0101 fault が発生します。
|
回避方法 |
この不具合は、svc_ifc_ae プロセスの再起動の前後にステータスが取れないこと以外の影響はありません。 恒久対策は、CSCwd93306 の修正 version へのアップグレードとなります。
|
備考
本不具合は、Bug Search Tool でも確認できます。
各製品の TAC SR Collection の一覧は、よくある質問と解決方法 (TAC SR Collection) から確認できます。