キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel
232
閲覧回数
0
いいね!
0
コメント
JapanTAC_CSC
Level 7
Level 7

2017年12月15日 (初版)

TAC SR Collection
主な問題

LB のリスタートを行う際、corosync のリスタートを行いますがリスタートコマンド実行時に応答が返らないことがあります。
通常、以下のようなログ出力となるのが正常です。

[root@lb01 ~]# service corosync restart
Signaling Corosync Cluster Engine (corosync) to terminate: [  OK  ]
Waiting for corosync services to unload:.                  [  OK  ]
Starting Corosync Cluster Engine (corosync):               [  OK  ]
[root@lb01 ~]#

しかしながら、以下のようなログ出力となりコマンド応答が返らない状況となることがあります。

[root@lb01 ~]# service corosync restart 
Signaling Corosync Cluster Engine (corosync) toterminate: [  OK  ] 
Waiting for corosyncservices to unload:..............................
原因

corosync のリスタートと monit による監視および復旧処理が競合する事があるため発生します。

"service corosync restart"コマンドで corosync の process を落としますが、完了を待つ間に monit プロセスがcorosync の停止を検知し復旧のため start を行っております。そのため、完了待ちをしている "service corosync restart " では corosync の停止が確認できないためプロンプトが返らない状況となります。

対象 LB 配下の /var/log/messages 上では以下のように monit プロセスが corosync の停止を検知し start 処理を行っていることが確認できます。

2017-08-14T15:22:30.981544+09:00 lb01 monit[6054]: 'corosync' process is not running
2017-08-14T15:22:30.981577+09:00 lb01 monit[6054]: 'corosync' trying to restart
2017-08-14T15:22:30.981597+09:00 lb01 monit[6054]: 'corosync' start: /etc/init.d/corosync
解決策

本件は monit の監視タイミングによって発生しえる事象です。事象発生時は corosync の再起動は行われるので運用上問題はなく、システムへの影響もありません。応答が返らないコマンドについては Ctrl +C でコマンドを終了して問題ありません。

 
Getting Started

検索バーにキーワード、フレーズ、または質問を入力し、お探しのものを見つけましょう

シスコ コミュニティをいち早く使いこなしていただけるよう役立つリンクをまとめました。みなさんのジャーニーがより良いものとなるようお手伝いします