2024年4月21日 (初版)
TAC SR Collection |
主な問題 |
「DCOS process error ( Reset reason 3#012)」によるIOM のリブートが発生する場合があります。
【ログ抜粋】
/UCSM_A_TechSupport.tar.gz/sw_techsupportinfo もしくは /UCSM_B_TechSupport.tar.gz/sw_techsupportinfo ーーー OBFL:0:process_check:IOM REBOOT in 10 seconds: DCOS process error ( Reset reason 3#012) EMERG:0:process_check:IOM REBOOT in 10 seconds: DCOS process error ( Reset reason 3#012) ーーー
|
原因 |
長期稼働している IOM にてメモリリークが発生し、IOM がリブートされます。
本事象は下記不具合に該当する可能性があります。
CSCwd56475:IOM REBOOT in 10 seconds: DCOS process error ( Reset reason 3#012) https://bst.cloudapps.cisco.com/bugsearch/bug/CSCwd56475
|
解決策 |
[暫定対策]
下記のコマンドにより、統計情報のリセットを実施してください。 ----------------------------------------------------------- #connect iom x (x は該当シャーシの番号) #system statistics reset -----------------------------------------------------------
暫定対策のコマンドを実行する際には下記手順を事前に実行することを推奨します。 ------------------------------------------------------------------------------
1. UCSM より Techsupport ファイルを作成 2. Techsupport ファイル内部の各シャーシのログより下記パスのファイルを開く techsupport_detailed_iocard1(2)/nxos/show-tech-support-iom-nxos.out
3. 上記ファイルの"show system uptime"より稼働時間を確認する 4. 長期稼働している(4年など) IOM と接続しているFI(IOM x/1 であればFI-A、IOM x/2 であればFI-B)に SSH 接続する 5. 暫定対策のコマンドを実行する ------------------------------------------------------------------------------
上記コマンドは統計情報のリセットですので、サービスへの影響はありません。 下記の例は上記に記載された手順に基づいて、具体的な手順を説明します。 シャーシ4の IOM 2 を長期稼働していると想定されています。
【実行例】
1. UCSM より Techsupport ファイルを作成 -> こちらの手順は割愛します 2. /IOCard2_TechSupport.tar.gz/techsupport_detailed_iocard2/nxos/show-tech-support-iom-nxos.outを開く 3. 上記ファイルの"show system uptime"より稼働時間を確認
show-tech-support-iom-nxos.out ログの例:
ーーー `show system uptime` System start time: Fri Sep 20 23:14:04 2019 System uptime: 1606 days, 14 hours, 41 minutes, 10 seconds <<< 1577日以上稼働しているIOMを確認 Kernel uptime: 1606 days, 15 hours, 0 minutes, 50 seconds ーーー
1. ssh ユーザ名@FI-BのIPアドレスに接続 (IOM 2なので、FI-BへSSH) 例:ssh admin@x.x.x.x 2. 下記のコマンドを実行 ーーー #connect iom 4 (4: はシャーシの番号。IOM番号ではないので注意) # show platform software cmcctrl process meminfo (MemFreeの部分を確認) #system statistics reset # show platform software cmcctrl process meminfo (MemFreeの部分を確認) ーーー
※show platform software cmcctrl process meminfoをリセット実行前後で実行し、実行後にMemFreeの値が増加することを確認してメモリが解放されたことを確認します。
[解決策] CSCwd56475 に記載の修正バージョン以上のバージョンをお使いください。
|
備考
本不具合は、Bug Search Tool でも確認できます。
各製品の TAC SR Collection の一覧は、よくある質問と解決方法 (TAC SR Collection) から確認できます。