キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel
648
閲覧回数
4
いいね!
0
コメント
takasano
Cisco Employee
Cisco Employee

はじめに

本稿では Cisco ACI における Platform Insights Engine (PIE) について、その概要を紹介します。

 

Platform Insights Engine について

Platform Insights Engine (PIE) は Switch 上で実行されるリアルタイムに根本原因を解析するためのアプリケーションです。
この機能は ACI Version 5.2(3e) 以降 (Switch 上で動作するため 15.2(3e) 以降) で利用可能です。
Switch 上で実行され、定期的あるいは障害発生中のデータ収集や収集されたデータの解析、問題の根本原因の発見、それによる問題解消までの時間の短縮を目的としています。

 

注意点

PIE には下記のような注意点があります。
なお、この内容は 2023 年 7 月 27 日現在の「Cisco APIC and Platform Insights Engine 」の「Guideline and Limitations for the Platform Insights Engine」の内容に基づいています。
詳しくはそちらも確認してください。

  • Modular 型 Spine (N9K-C9504, N9K-C9508, N9K-C9516) には対応していません。
  • Fabric Extender (FEX) には対応していません。
  • PIE の Event DB に収集されたデータは永続ストレージに書き込まれないため、再起動や電源断などで消失します。

 

Platform Insights Engine の機能について

PIE は独立したプロセスとして動作し、監視対象毎に Insight Engine と呼ばれるものが情報収集・解析を実施します。
Insight Engine は対象とするコンポーネント毎にそれぞれ分かれており、下記のようなものがあります。

  • Link flap PIE: Link Flap Event を分析して、その根本原因の特定を行います。ASIC などから関連データを収集し、最も可能性の高い根本原因を提示します。
  • Link down PIE: Link が Up しない根本原因の特定を行います。Interface が Up になるように設定されているものの、状態が Up にならない場合にデータ収集し、解析を行います。
  • Optics PIE: 光 Transceiver の DOM の情報を収集して、その健全性を監視する機能を提供します。
  • SSD PIE: SSD の過剰な使用に関して調査する仕組みを提供します。
  • CPU PIE: CPU の過剰な使用に関して調査する仕組みを提供し、定期的に取得したデータから CPU 使用率上位 10 位の Process の情報を提供します。
  • Sensor PIE: 温度 Sensor の履歴から温度 Sensor に関して調査する仕組みを提供します。
  • Memory PIE: 筐体の Memory 使用率を監視し、使用率上位 10 位までのプロセスの情報などを提供します。
  • PSU PIE: PSU から定期的に HW の状態を取得し、電力、電圧、電流などのデータを分析し PSU の状態を監視します。
  • Fan PIE: パルス幅変調 (PWM) や回転数などのデータを取得し、Fan の状態を監視します。

 

使用方法

PIE の結果は確認したい Switch の CLI にログインして各種コマンドを実行することで確認できます。
コマンド一覧については「Platform Insights Engine CLI Commands」を確認してください。
この例では Switch の Link Flap 事象の解析と Link Down 状態に留まっている理由、Fan の状態を確認してみようと思います。
なお、ほとんどのコマンドで "count X" のオプションを付けることで最新 X 件の情報を表示でき、"detail" のオプションを付けることでより詳細な情報を確認できます。
まずは Link Flap 事象を確認するため、"show pie eventdb link-flap-rca" コマンドを実行してみます。

leaf# show pie eventdb link-flap-rca
2023-07-21 22:38:07   Event Id: 00120423     Ethernet1/2                Source Id: 436215808     RCA Code: 41
        Reason:  Link flapped/down due to Local Fault, check peer

1 件の Link Flap が発生しており、Reason を見ると Local Fault を検知、すなわちその機材が対向機器からの信号を検知できなくなったため、Link Down が一時的に発生したことが分かります。
更に "show pie eventdb link-flap-rca detail" コマンドを実行して、そのポートと事象の詳細な情報を確認することが出来ます。

leaf# show pie eventdb link-flap-rca detail
2023-07-21 22:38:07   Event Id: 00120423     Ethernet1/2                Source Id: 436215808     RCA Code: 41
        Reason:  Link flapped/down due to Local Fault, check peer

                Link flap Reason :      Link flapped/down due to Local Fault, check peer

                Source Event id  :      120422

        *************** Meta Details*************************
                ifindex                    :    0x0
                port_no                    :    1
                phy_port_no                :    0
                link_event_type            :    0
                link_status                :    0
                retimer_port               :    0
                asic_type                  :    0
                phy_type                   :    0
                phy_mode                   :    0
                link_down_rca              :    0
                xcvr_supported             :    1
                is_phy_port                :    0
                is_copper                  :    0

        *************** SW Admin Details*************************
                sw_port_admin_state        :    1
                sw_port_oper_state         :    2
                sw_port_autoneg            :    1
<snip>

次に Link Down 状態を確認するために "show pie eventdb link-down-rca" コマンドを実行します。
Reason を見ると、どれも対向機器からの信号を検出出来ないために Link Up しないことが分かります。

leaf# show pie eventdb link-down-rca
2023-07-26 17:54:51   Event Id: 00027771     Ethernet1/4                Source Id: 436219904     RCA Code: 1
        Reason:  No Signal from peer is detected .Please check peer configuration.
2023-07-26 17:54:51   Event Id: 00027770     Ethernet1/3                Source Id: 436215808     RCA Code: 1
        Reason:  No Signal from peer is detected .Please check peer configuration.
2023-07-26 17:40:34   Event Id: 00027747     Ethernet1/49               Source Id: 436404224     RCA Code: 1
        Reason:  No Signal from peer is detected .Please check peer configuration.
<snip>

ここで最新 1 件の詳細を確認するために "show pie eventdb link-down-rca detail count 1" コマンドを実行します。
その Link の詳細な情報を確認出来ます。

leaf# show pie eventdb link-down-rca detail count 1
2023-07-26 17:54:51   Event Id: 00027771     Ethernet1/4                Source Id: 436219904     RCA Code: 1
        Reason:  No Signal from peer is detected .Please check peer configuration.
                Link Down Reason     :No Signal from peer is detected .Please check peer configuration.
                Link Down Event id   :27769
                Source Event id      :27769

        *************** Meta Details*************************
                ifindex                    :    0x1a003000
                port_no                    :    3
                phy_port_no                :    0
                link_event_type            :    0
                link_status                :    0
                retimer_port               :    0
                asic_type                  :    0
                phy_type                   :    0
                phy_mode                   :    0
                link_down_rca              :    0
                xcvr_supported             :    0
                is_phy_port                :    0
                is_copper                  :    0

        *************** SW Admin Details*************************
                sw_port_admin_state        :    1
                sw_port_oper_state         :    2
                sw_port_autoneg            :    1
<snip>

最後に Fan の状態を見てみようと思います。
ここでは "show pie envmon fan count 5" で最新 5 件の Fan の insight を確認してみます。

leaf# show pie envmon fan count 5
2023-07-22 11:34:44   Event Id: 00121311  Event Class:  Fan insights event        Source Id: 0258
        fan_health        :     PIE_ENTITY_HEALTH_GOOD
2023-07-22 10:34:44   Event Id: 00121247  Event Class:  Fan insights event        Source Id: 0258
        fan_health        :     PIE_ENTITY_HEALTH_GOOD
2023-07-22 10:04:44   Event Id: 00121210  Event Class:  Fan insights event        Source Id: 0258
        fan_health        :     PIE_ENTITY_HEALTH_GOOD
2023-07-22 09:34:44   Event Id: 00121176  Event Class:  Fan insights event        Source Id: 0258
        fan_health        :     PIE_ENTITY_HEALTH_GOOD
2023-07-22 09:04:45   Event Id: 00121137  Event Class:  Fan insights event        Source Id: 0258
        fan_health        :     PIE_ENTITY_HEALTH_GOOD

fan_health は PIE_ENTITY_HEALTH_GOOD になっていて、特に問題無いことが分かります。
更に最新 1 件の詳細情報を "show pie envmon fan detail count 1" で確認してみます。

leaf# show pie envmon fan detail count 1
2023-07-22 11:34:44   Event Id: 00121311  Event Class:  Fan insights event        Source Id: 0258
        fan_health        :     PIE_ENTITY_HEALTH_GOOD
        ****** Module: 1 fan Insights ******
        fan_all_noise     :     60
        fan_health        :     PIE_ENTITY_HEALTH_GOOD
        fan_prediction    :     PIE_ENTITY_PREDICTION_WONT_FAIL

        ****** Module: 1 FAN ******
        ev_reason                :      Fan module periodic health check
        num_fans                 :      4

        FAN_ID                   :      0
        MANUFACTURER             :      N/A
        PID                      :      NXA-FAN-30CFM-B
        SERIAL_NUM               :      N/A
        status                   :      1
        sprom_status             :      0
        sub_status               :      0
        dir                      :      front-to-back (0)
        fan_prsnt                :      1
        fan_noise                :      60 dB

        FAN_ID                   :      1
        MANUFACTURER             :      N/A
        PID                      :      NXA-FAN-30CFM-B
        SERIAL_NUM               :      N/A
        status                   :      1
        sprom_status             :      0
        sub_status               :      0
        dir                      :      front-to-back (0)
        fan_prsnt                :      1
        fan_noise                :      60 dB

        FAN_ID                   :      2
        MANUFACTURER             :      N/A
        PID                      :      NXA-FAN-30CFM-B
        SERIAL_NUM               :      N/A
        status                   :      1
        sprom_status             :      0
        sub_status               :      0
        dir                      :      front-to-back (0)
        fan_prsnt                :      1
        fan_noise                :      60 dB

        FAN_ID                   :      3
        MANUFACTURER             :      N/A
        PID                      :      NXA-FAN-30CFM-B
        SERIAL_NUM               :      N/A
        status                   :      1
        sprom_status             :      0
        sub_status               :      0
        dir                      :      front-to-back (0)
        fan_prsnt                :      1
        fan_noise                :      60 dB

4 つの Fan が搭載されていて、それぞれの Noise などの情報も確認出来ています。
これ以外の実行例のについても「Platform Insights Engine CLI Commands」の下部に記載があるため、確認してください。

以上で本稿は終了となります。

 

参考資料

Cisco APIC and Platform Insights Engine

Getting Started

検索バーにキーワード、フレーズ、または質問を入力し、お探しのものを見つけましょう

シスコ コミュニティをいち早く使いこなしていただけるよう役立つリンクをまとめました。みなさんのジャーニーがより良いものとなるようお手伝いします