キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel
625
閲覧回数
0
いいね!
0
コメント
Yutaka Takahashi
Cisco Employee
Cisco Employee
 

 

はじめに

Bosun Alert に、特定のホストに対する"Disk usage high" がレポートされ、Service status に以下のようなディスク使用率警告によりサービスダウンが記録されることがあります。
 
[down] --> DiskUsageWarning [1 of 1 up]
 
どのファイルを排除する必要があるかをExploreより確認していく必要があります。
以下、その手順について記載します。

 

(1) dfコマンド

まず、どのファイルシステムが問題であるかを確認します。
以下の例では、/local が異常と確認できます。
 
(例)

POST | datanode-3 | df?args-h

Filesystem 1K-blocks Used Available Use% Mounted on
/dev/mapper/vg_01-lv_root 8093624 2034768 5641064 27% /
tmpfs 198453056 0 198453056 0% /dev/shm
/dev/vda1 499656 28820 444624 7% /boot
/dev/mapper/vg_01-lv_tmp 3997376 9552 3778112 1% /tmp
/dev/mapper/vg_01-lv_var_log 1998672 149352 1744464 8% /var/log
/dev/vdd 3691023504 28772240 3662251264 1% /disks/2
/dev/vdb 65924860 65924860 0 100% /local <<<<
/dev/vdc 3691023504 30774816 3660248688 1% /disks/1
/dev/vde 3691023504 30278412 3660745092 1% /disks/3

    

(2) duコマンド 

次に、対象マウントディレクトリ以下の対処が必要なファイルを取得ください。
 
(例)
POST | datanode-3 | du?args=-ah /local
8.0K /local/release-manifest/tetration_manifest.yml
4.0K /local/release-manifest/Makefile
4.0K /local/release-manifest/test/parse_manifest.py
4.0K /local/release-manifest/test/parse_manifest.pyo
12K /local/release-manifest/test
4.0K /local/release-manifest/README.md
...
32M /local/deploy-ansible
16K /local/lost+found
14G /local

  

(3) psコマンド

プロセスに問題があり不要なフィルを作成している場合があるため、プロセスの状態を確認してください。
(例)
POST | datanode-3 | ps?args=-ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 Aug30 ? 00:17:11 /sbin/init
root 2 0 0 Aug30 ? 00:00:00 [kthreadd]
root 3 2 0 Aug30 ? 00:00:29 [migration/0]
root 4 2 0 Aug30 ? 00:00:58 [ksoftirqd/0]
root 5 2 0 Aug30 ? 00:00:00 [stopper/0]
...
yarn 36533 36465 9 13:49 ? 00:02:09 ...

 

最後に、(1) (2) (3) の出力をテキストファイルへコピー&ペーストし、ファイルをSRへアップロードください。
Getting Started

検索バーにキーワード、フレーズ、または質問を入力し、お探しのものを見つけましょう

シスコ コミュニティをいち早く使いこなしていただけるよう役立つリンクをまとめました。みなさんのジャーニーがより良いものとなるようお手伝いします