はじめに
Cisco ACIでは様々な異常状態をFaultsやEventsとして検知することができます。Faults、Events正しくハンドルし、モニターすることで、障害時に迅速な対応が可能となります。例えば、通常時Faultsのカウントを0件としておけば、障害時にFaultsが発生した際に迅速に対応することができます。
ただし、実運用においては、APICの管理ポートのNIC冗長をしていない、Leafスイッチの電源冗長をしていないなど、運用には支障がない場合でも、FaultsやEventsが発生するケースもあると思います。このような場合において、Faults、Eventsを発生させないようにしておくと、本当に対処が必要なFaults、Eventsだけを表示できるため、運用が効率化できます。
また、一般的な監視システムで使われているSNMP Trapは、Eventsに紐づいているため、Eventsをチューニングすることで、SNMP Trapも抑制することができるようになります。
本記事において、Faults、Eventsの抑制方法、およびSNMP Trap抑制の例として、特定ポートにおけるLink up/downのSNMP Trapの無効化の実装方法についてご紹介します。
Faults、Events一覧と対応SNMP Trap
ACIにおけるFaults、Eventsには様々なものがあり、こちらのガイドに内容が記載されています。
ACI System Messages Reference Guide
また、Cisco ACIでサポートしているSNMPの一覧はこちらのガイドに記載されています。
ACI SNMP MIB一覧
EventsとSNMP Trapの対応を記載した公式ガイドは存在しないのですが、一般的に使用頻度が高いSNMP TrapのEventsとSNMP TrapのOIDの対応表を以下に記載します。
対象機器 |
内容 |
MIB |
MIB OID |
Event ID |
Leaf/Spine |
Link Up |
IF-MIB |
1.3.6.1.6.3.1.1.5.4 |
E4215670 |
Leaf/Spine |
Link Down |
IF-MIB |
1.3.6.1.6.3.1.1.5.3 |
E4215671 |
Leaf/Spine |
Interface Up |
CISCO-IF-EXTENSION-MIB.mib |
1.3.6.1.4.1.9.9.276.0.2 |
E4205125 |
Leaf/Spine |
Interface Down |
CISCO-IF-EXTENSION-MIB.mib |
1.3.6.1.4.1.9.9.276.0.1 |
E4205126 |
Leaf/Spine |
OSPF Neighbor Status Change |
OSPF-TRAP-MIB.mib |
1.3.6.1.2.1.14.16.2.2 |
E4205067 |
Leaf/Spine |
Environment |
追記予定 |
追記予定 |
追記予定 |
発生Faultの抑止方法
すでに発生しているFaultの抑制方法を説明します。
(1) 発生しているFaultの一覧は、[System] -> [Faults] から確認ができます。
今回は、Leafに冗長電源がないというFaultを抑止してみます。
(2) 該当Faultを選択し、右クリックし、[Ignore Fault]を選択します。
(3) 確認画面が表示されるため、[Ignore Fault]を選択します。
(4) Ignoreを実施するとFaultから非表示となります。以下の例では、先ほどのF0413のFaultが表示されていないことが分かります。
このFault IDは別の機器などで新たに発生したとして、すべてIgnoreされることになります。
(5) 仮に誤って設定した場合や一度元に戻したいは、(3)で表示されているリンクに、無視する(Squelch)としてポリシーが新たに追加されています。こちらを削除することで、元の状態に戻すことができます。
この例では、[Fabric] -> [Fabric Policies] -> [Policies] -> [Monitoring] -> [Common Policy] -> [Fault Severity Assignment Policies]にSquelchのポリシーが作成されています。このポリシーを削除することで、再度F0413の監視を行うことになります。
ポート単位でのLinkup、Linkdown SNMP Trapの抑制方法
ACIの接続機器によってSNMP TrapのLink Down、Link Upを発生させたくないという要件はあると思います。
例えば、NW機器が接続されているポートにおいてはLink Down、Link Upの監視を行うものの、サーバー接続機器においては、定期的なメンテナンスなどで再起動されるためにLink Down、Link Upの監視を行いたくないというような場合です。
このような場合は、あらかじめEventsをSquelch設定することにより、Trapの発生を抑止することができます。
SNMP Trap(Linkup/Linkdown)のデフォルト動作
ACIにおいてSNMPを設定する方法は、以下のマニュアル等を参考に設定ください。この設定がなされた状態でデフォルトの動作を説明します。
APIC での SNMP の設定 (cisco.com)
(1) Interface 1/15を無効化することでSNMP Trapを発生させます。
Interfaceの無効化は、APICのGUIから実施することができます。
[Fabric] -> [Inventory] - [Leafxx] - [Interface]の画面から対象インターフェース(ここでは1/15)をクリックし、[Disable]を選択します。
(2)確認が表示されるので [submit]を指定すると、1/15がグレーアウトされることが確認できます。
(3) この環境の機器は、ZabbixにてTrap監視を行っており、Zabbix側の画面は以下のように2つのTrapを受信していることがわかります。
以下の2つ。
内容 |
MIB |
MIB OID |
Link Down |
IF-MIB |
1.3.6.1.6.3.1.1.5.3 |
Interface Down |
CISCO-IF-EXTENSION-MIB.mib |
1.3.6.1.4.1.9.9.276.0.1 |
(4) (1)と同様の方法で、今度はLinkを有効させます。
(5) Zabbix側では、このタイミングで2つのTrapを受信していることがわかります。
以下の2つ。
内容 |
MIB |
MIB OID |
Link Up |
IF-MIB |
1.3.6.1.6.3.1.1.5.4 |
Interface Up |
CISCO-IF-EXTENSION-MIB.mib |
1.3.6.1.4.1.9.9.276.0.2 |
特定インターフェースにおいてSNMP Trapの抑止を行うポリシーの作成
上の状態から、IF-MIBに対応するLink DownおよびLink Upを1/15ポートに抑止する方法を説明します。
(1) [Fabric] -> [Access Policies] -> [Policies] -> [Monitoring] において右クリックをし、[Create Monitoring Policy]を選択します。

(2) Monitoring Policyの名前(ここではDisable_LinkTrap)を指定し、[Submit]を選択します。
(3) Monitoring Policyが作成されるので、こちらを選択し、[Event Severity Assignment Policy]を選択します。
そのあと画面右のツールアイコンをクリックし、[Modify Event Severity Assignment Policies]を選択します。
(4) [Monitoring Object]右にあるペンアイコンをクリックし、物理インターフェースに関連するモニタリング項目を追加します。
(5) 物理インターフェースに関連するモニタリング項目は、[Physical Interface Runtime State]であるため、こちらをチェックし、Submitします。

(6) (5)が終わると、[Monitoring Object]右側の[v]ボタンから[Physical Interface Runtime State]が選択できるようになるため、こちらを選択します。
(7)右側の[+]ボタンを選択し、CodeおよびSeverityに以下の値を入力します。
内容 |
Event ID(Code) |
Severity |
Link Up |
E4215670 |
squelch |
Link Down |
E4215671 |
squelch |
(8) 以下のように2つの設定が追加されていればOKです。
作成したポリシーをインターフェースに適用
作成したポリシーは、Policy Groupにマッピングし、Interface Profileに該当のPolicy Groupを割り当てることで、特定のインターフェースのみに、該当のSNMP Trapを抑制したポリシーを適用できます。
(1) SNMP Trapを抑止するPolicy Groupを作成し、Monitoring Policyに先ほど作成したDisable_LinkTrapを指定します。
(2) 該当のPolicy Groupを1/15を使用しているInterface Profileに指定します。
確認
(1) 先ほどと同じ手順で1/15をダウンさせ、SNMP Trapを発生させます。監視サーバー側では、抑止したTrapを受信しない事を確認できます。
以下の例の通り、抑止していないCISCO-IF-EXTENSION-MIB.mibのTrapのみを受信。
まとめ
ACIにおけるFaults、Eventsを適切に管理、運用する事で、ACIの運用性が向上します。
本投稿に記載の内容を用いることで、発生したFaults、Eventsを要件に応じて抑制したり、IDを知っているFaults、Eventsを抑制できるようになります。
Cisco Customer SuccessではCisco Communityを通じて様々なベストプラクティス情報の提供を進めています。
こちらを、設計検討、運用検討の際にご活用ください。