キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel
750
閲覧回数
2
いいね!
0
コメント
michioka
Cisco Employee
Cisco Employee

著者 / 共著者 

Miguel Cervantes / Jose Manuel Huerta(Pepe Huerta)

 

概要 

この投稿では、ThousandEyes のアラートについて、Cloud AgentEnterprise Agent で重要度の低い通知を低減するという課題に焦点を当てます。 

すでにアラートルールを設定しているにもかかわらず、絶え間ない通知に悩まされていませんか?より円滑なモニタリングと生産性向上に向けてアラート設定を微調整できるよう、実践的なヒント、ベストプラクティス、わかりやすい戦略を提供します。 

 

バックグラウンド 

アラートルールには、グローバルアラート条件とロケーションアラート条件という 2 つのタイプがあります。 

グローバルアラート条件は、アラートで指定されたすべての条件が満たされた場合にトリガーされます。 

逆に、ロケーションアラート条件は、一部の条件のみが満たされているものの、グローバルイベントの一部でもある場合にトリガーされます。 

以下の画面では、グローバルアラートとロケーションアラートの両方を管理できます。 

michioka_0-1717021597359.png

 

 

以上を念頭に置いて、重要度の低い通知を減らすための一般的なトリガーと推奨される手法についてご説明します。

 

グローバルアラート条件のパラメータ 

以下に、重要なパラメータについて解説します。 

michioka_1-1717021597364.png

 

 

1)[すべて(All)] と [いずれか(Any)] 

 

michioka_2-1717021597364.png

 

アラートに複数の条件が存在する場合、[すべて(All)] を選択することをお勧めします。これにより、テスト構成に割り当てられたすべてのエージェントがアラートルールに対して評価され、すべてのロケーションアラート条件が満たされているか確認されます。 

 

2)[いずれか(any of)] と [同じ(the same)] 

 

michioka_3-1717021597365.png

 

設定を [いずれか(any of)] から [同じ(the same)] に調整することを検討してください。この変更により、エージェント設定が「スティッキー」(設定が頻繁に変更されることなく、その状態を維持すること)になり、アラートノイズが減少する可能性があります。 

設定を [いずれか(any of)] のままにすると、通知アラートの頻度が高くなる可能性があります。 

 

3)[エージェントの%(% of agents)] と数値([エージェント(agent)]) 

 

michioka_4-1717021597333.png

 

 

論理パラメータを評価する際や、テストに割り当てられたエージェント数の変化を考慮する際には、特定の数値のみに頼るのではなく、[エージェントの%(% of agents)] に基づいた条件値を採用することを推奨します。 

 

固定された数値を使用すると、特にテストへのエージェントの割り当てに変動がある場合、頻繁な調整が必要になる可能性があります。 

 

逆にパーセントベースのしきい値を選択すると、柔軟性と適応性が向上し、エージェント数の変動に対して自動的に調整されるため、手動で調整する必要がありません。 

 

4)[<>回中<>回連続(<> out of <> times in a row)] 

これは主に、短い間隔(例:1、2、5 分)で実行されるテストに割り当てるアラート用です。 

アラートがトリガーされる前に複数回待機することを確認するために、少なくとも3 回中 3 回連続を検討することをお勧めします。 

より長い間隔で実行されるテストについては、以下を推奨します。 

 

テスト間隔 

推奨値 

10 分 

3 回中 2 回 

15 分 

3 回中 2 回 

30 分 

2 回中 2 回 

1 時間 

2 回中 1 回 

 

ロケーションアラート条件のパラメータ:

このセクションに記載されている画像例は、推奨されるベストプラクティスを示すための例示的な構成であることにご留意ください。 

グローバルアラート条件とローカルアラート条件は異なる場合があり、個々のお客様の要件に基づいて構築されます。特定のユースケースに合わせたアラート戦略については、ThousandEyes のドキュメントを参照するか、ThousandEyes の担当者にお問い合わせください。

 

 

「動的」基準のみを使用: 

標準偏差を使用した動的基準アラートでは、平均が小さいか非常に安定しているメトリックに対して大きなノイズが生成される可能性があります。 

動的基準を使用する場合は、以下に示す例(パケット損失と遅延のロケーション条件を追加)のように、他の特定の条件で補完するようにしてください。 

michioka_5-1717021597362.png

 

 

調整なしのデフォルトアラートルールを使用: 

ほとんどのデフォルトアラートは、このドキュメントで概説されている「標準」パラメータに準拠していますが、お客様ごとに要件は異なります。デフォルトのアラートルールをより詳細に設定するには、これらのルールを複製し、それに応じて各ロケーションアラート条件をカスタマイズすることを強くお勧めします。 

さらに、現在のサービスレベル契約(SLA)と、個々のニーズに合わせて調整された各ユースケースに固有の重要業績評価指標(KPI)を把握することが重要です。 

  1. アラートが割り当てられるテストタイプ 
  • 誤検出(FP)アラートの原因となるメトリック 

 

ヒント:特定の基準が以前に確立されていない場合、過去数日間のローカルアラート条件について、対象メトリックの平均値を分析することを推奨します。

 

逆に、複数のテストを同じアラートルールに含める場合は、グループ化されたテスト間で共有される、追加の共通条件を組み込むことができます。以下に例を示します。 

 

遅延 > 100 ms(オリジナルで固有の条件) 

 

アラートの「感度」を下げるために、以前のロケーション条件と一緒に満たす必要がある新しい条件を追加できます。2 番目の条件を追加する例を以下に示します。 

 

michioka_6-1717021597365.png

 

 

 

 

追加の推奨事項

定期的にアラートの「クリーンアップ」タスクを実行し、アラートの重複を避ける 

一致する条件やしきい値が重複しているアラートをチェックしてください。この確認により、不要な繰り返しを特定して修正し、アラートプロセスの効率を高めることができます。 

 

アラート抑制を使用する 

ThousandEyes のアラート抑制ウィンドウでは、設定された期間中、指定された条件やイベントのアラートをミュートすることができます。メンテナンス中やアラートを受信する必要がない場合に、不要なアラートを回避するのに便利です。 

 

適切な受信者を割り当てる 

アラートを特定の受信者(電子メール、ウェブフック、統合など)に割り当てることで、関連する関係者のみが通知を受け取れるようになり、問題の解決に直接関与していない個人の不要な中断を防ぐことができます。 

 

割り当てられたテストと SLA/KPI に応じて、リージョン/エージェントごとにアラートをセグメント化する

離れた場所や地域に存在する複数のエージェントを割り当てたテストにアラートを追加する場合、各エージェントの場所固有の条件に合わせた、異なるアラートを設定することをお勧めします。SLA/KPI は、監視ポイントによって異なる可能性があるため、このアプローチが不可欠です。

たとえば、テストにさまざまな大陸に存在するエージェントが含まれる場合は、シナリオごとに場所固有の条件をセグメント化して作成する必要があります。その後、これらの特定のアラートをテストに適用することができます。以下に例を示します。

 

michioka_7-1717021597329.png

 

 

 

この状況では、北米とアジアの両方のエージェントを対象としたテストと、要件に合わせた個別の SLA/KPI があります。以下は、上記のテストを地域別に構成したアラート例です。

 

<Snippets>

 

michioka_8-1717021597334.png

 

 

 

 

 

michioka_9-1717021597367.png

 

 

 

 

参考資料: 


 

Getting Started

検索バーにキーワード、フレーズ、または質問を入力し、お探しのものを見つけましょう

シスコ コミュニティをいち早く使いこなしていただけるよう役立つリンクをまとめました。みなさんのジャーニーがより良いものとなるようお手伝いします