2024年1月26日 (初版)
TAC SR Collection |
主な問題 |
eXR で動作するルータにおいて、rollback configuration や install activate の実行中にファイルの複製に関連する rdsfs_svr プロセスとそのクライアントプロセスによる処理中にデッドロックが発生し、実行した処理が完了しない問題が報告されています。
rollback configuration の実施時に発生した場合 rollback configuration の実施時にこの問題が発生した場合は、コマンドを実行したセッションではルータからの応答がなくなります。 この際、別セッションからルータへアクセスし、実行中のプロセスを確認すると config 関連のプロセスが “ D ”(uninterruptible sleep) 状態でスタックしていることを確認でき、そのため元のセッションで応答が得られなかったことが分かります。
RP/0/RP0/CPU0:Router#run ps -el | grep ' D ' -- 省略 -- 4 D 0 1340 1 0 80 0 - 2143343 unlink ? 00:00:01 config_rollback 4 D 0 3268 1 0 80 0 - 2143343 unlink ? 00:00:01 config_rollback 4 D 0 8179 1 0 80 0 - 2170624 fuse_r ? 00:00:01 config 4 D 0 12916 8427 0 80 0 - 2144081 unlink pts/6 00:00:00 config_rollback -- 省略 --
Install activate の実施時に発生した場合 install activate の実施時にこの問題が発生した場合は、最終的にインストール処理が aborted となり失敗します。 既知事例では、show install log コマンドにて確認できる失敗理由については、以下の2つのパターンがあります。
// 1) Timeout により aborted となるパターンの出力例 //
RP/0/RSP0/CPU0:Router#show install log 27 Mon Sep 11 10:38:41.272 JST Sep 10 08:13:41 Install operation 27 started by root: install activate Sep 10 08:13:42 Action 1: install activate action started Sep 10 08:13:42 The software will be activated with system reboot Sep 10 08:13:42 This install operation will reboot the sdr, continue? [yes/no]:[yes] yes
Sep 10 08:13:46 Install operation will continue in the background Sep 10 08:13:48 Packages will be activated in the following sequence: -- 略 -- Sep 10 09:13:48 Timeout for agent on lead while performing local software change Sep 10 09:13:48 Action 1: install activate action aborted Sep 10 09:23:56 Ending operation 27
// 2) 'SCONBKUP' detected the 'warning' condition により aborted となるパターンの出力例 //
RP/0/RSP0/CPU0:Router#show install log Thu May 11 08:15:53.829 JST -- 略 -- May 10 00:54:36 Install operation 14 started by root: install activate May 10 00:54:37 Action 1: install activate action started May 10 00:54:37 The software will be activated with reload upgrade May 10 00:54:38 This install operation will reload the system, continue? [yes/no]:[yes] yes May 10 00:54:59 Install operation will continue in the background May 10 00:55:00 Following nodes are available for System Upgrade activate: May 10 00:55:00 0/0 0/RSP0 May 10 00:57:48 Action 1: install activate action completed successfully May 10 01:58:52 Failed to save the configuration: Error('SCONBKUP' detected the 'warning' condition 'Error encountered during System Configuration Backup inititate_backup API.') May 10 01:58:52 Action 2: install activate action aborted May 10 01:58:52 Install operation failed after point-of-no-return, system might be in an inconsistent state. Please reload the system which will rollback to committed software before you proceed with next Install operation. May 10 01:58:54 Install operation 14 aborted May 10 01:58:54 Ending operation 14
また、install activate の実施時にこの問題が発生した場合には、misc/config/config/running/alternate_cfg 配下に nvgen_file が名前に付くファイルが存在することを確認でき、このことからも今回の問題に該当しているかの判断が可能です。
RP/0/RP0/CPU0:Router#run ls -lLR /misc/config/config/running/alternate_cfg -- 省略 -- /misc/config/config/running/alternate_cfg: total 92 -rwxr-xr-x. 1 root root 0 Mar 18 2021 nvgen_file17886 -rwx------. 1 root root 91127 Mar 23 09:42 router.cfg -rwxr-xr-x. 1 root root 0 Mar 29 19:44 router_early.cfg
|
原因 |
この問題は CSCvv62937 として報告されています。
CSCvv62937 Deadlock in 'rdsfs_svr' Process
|
解決策 |
Active RP にて rdsfs_svr プロセスをリスタートすることにより、デッドロック状態を解消することができます。 デッドロック状態の解消後、トリガーとなった操作は再度実施いただく必要がある場合があります。
# process restart rdsfs_svr
恒久的な対策としては CSCvv62937 の修正されたバージョンを使用する必要があります。
|
備考
本不具合は、Bug Search Tool でも確認できます。
各製品の TAC SR Collection の一覧は、よくある質問と解決方法 (TAC SR Collection) から確認できます。