キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel
738
閲覧回数
3
いいね!
0
コメント
JapanTAC_CSC
Level 7
Level 7

2023 年 10 月 18 日 (初版)
2023 年 11 月 14 日 (アップデート)

TAC SR Collection
事象

Nexus9K Module 型 Switch の Spine を APIC GUI あるいは Auto Firmware Updateで Upgrade した後にその Spine の Supervisor Module (SUP) が起動しなくなりました。
手動でその Nexus9K Switch の電源 Off/On(電源ケーブルの抜き差し)を実施しても回復しません。

原因

この事象は CSCwb86706 に該当している可能性があります。
(注:CSCwb86706 は Field Notice である FN74050 の一部として報告されています。)
Spine Switch の ACI OS Version 変更時に SUP の FPGA Image の更新が必要ない場合でも、OS Image にバンドルされている FPGA Image に変更されてしまうため、SUP が起動しなくなるものです。
Nexus9K Module 型 Switch の Spine の Upgrade や新たに Fabric に組み込む際には続く部分に記載されている条件に該当するか、確認してください
なお、この不具合は Software 不具合であり、Hardware の問題ではないため RMA などによって本質的に解決するものではありません。
下記の全ての条件に該当すると、この不具合の影響を受け SUP が起動しなくなります

(1) APIC GUI あるいは Auto Firmware Update による Version 変更 (いわゆる Policy-based upgrade) を実施した場合。
     (SUP 交換時に交換前と異なる ACI OS Version の SUP で起動し、以下の (2) に該当する Auto Upgrade による Version 変更がある場合も含む)

(2) CSCwb86706 の修正を含まない Version 15.2(x) から CSCwf44222 の修正を含まない Version に Version 変更した場合。
(3) CSCwb86706 の Conditions に記載の SUP を使用した場合。

上記の条件は Upgrade 前の確認に活用することが出来る ACI Pre-Upgrade Validation scriptVersion 1.6.0 以降で該当有無を確認出来ます。

解決策

恒久的な解決策としては CSCwf44222 を含む Version への Upgrade です。
( 注:CSCwb86706 の Conditions に記載されている Part Number の SUP のための FPGA Image は CSCwf44222 の修正を含む Version で提供されます。)
上記解決策を適用できない場合の回避策としては、変更先の OS Image を手動で Spine に Copy して手動で起動した場合には発生しません。
具体的には SUP が 1 台搭載されている場合と 2 台搭載されている場合で手順はそれぞれ下記のようになります。

< SUP が 1 台搭載されている場合 >
SUP の CLI にアクセスし、下記のコマンドを実行してください。

# touch /tmp/install_in_progress

変更先の OS Image を SUP の /bootflash にコピーして md5 hash を確認してください。
ここでは scp を用いて OS Image をコピーする場合を考えます。
<user> にはコピー元サーバの user 名、<server-ip> にはサーバの IP Address、 <image-path> にはサーバに保存されている OS Image の scp で取得する際の path、<image-name> には OS Image のファイル名をそれぞれ入力してください。

# scp <user>@<server-ip>:<image-path> /bootflash
# cd /bootflash
# md5sum <image-name> 

下記のコマンドを実行し boot variable を設定します。
<image-name> には OS Image のファイル名を入力してください。

# setup-bootvars.sh <image-name>

下記のコマンドを実行し、SUP の持つ configuration file を消します。

# setup-clean-config.sh
# sync

下記のコマンドを実行して機材を再起動します。

# reload
This command will reload the chassis, Proceed (y/n)? [n]: y

 

< SUP が 2 台搭載されている場合>
まず、standby SUP の Console Port からアクセス出来るかを確認してください。
どちらが standby であるかは該当機材の CLI にログインして下記のコマンドを実行することで確認できます。
下記では module 27 が standby です。

# show module | grep SUP
27   0      Supervisor Module                   N9K-SUP-A+         standby
28   0      Supervisor Module                   N9K-SUP-A+         active

active SUP の CLI にログインして下記のコマンドを実行します。

# touch /tmp/install_in_progress

acitive SUP で変更先の OS Image を /bootflash にコピーして md5 hash を確認してください。
ここでは scp を用いて OS Image をコピーする場合を考えます。
<user> にはコピー元サーバの user 名、<server-ip> にはサーバの IP Address、 <image-path> にはサーバに保存されている OS Image の scp で取得する際の path、<image-name> には OS Image のファイル名をそれぞれ入力してください。

# scp <user>@<server-ip>:<image-path> /bootflash
# cd /bootflash
# md5sum <image-name> 

active SUP で下記のコマンドを実行し boot variable を設定します。
<image-name> には OS Image のファイル名を入力してください。

# setup-bootvars.sh <image-name>

active SUP で下記のコマンドを実行し、Switch の持つ configuration file を消します。

# setup-clean-config.sh
# sync

standby SUP の Console Port からログインしてください。

User Access Verification 
(none) login: admin
******************************************************************************** 
     Fabric discovery in progress, show commands are not fully functional 
     Logout and Login after discovery to continue to use show commands. 
     Run show discoveryissues for more details.
********************************************************************************

standby SUP で下記のコマンドを実行してください。

# touch /tmp/install_in_progress

standby SUP で下記のコマンドを実行して、active SUP から OS Image を /bootflash にコピーしてください。
<mod number> には active SUP の module number を、<image-name> には OS Image のファイル名をそれぞれ入力してください。
(注: active SUP の内部 IP Address は moudle number が 27 なら 127.1.1.27、28 なら 127.1.1.28 になります)

scp admin@127.1.1.<mod number>:/bootflash/<image-name> /bootflash/

standby SUP で boot variable を下記のコマンドで設定してください。
<image-name> には OSI Image のファイル名を入力してください。

# setup-bootvars.sh <image-name>

standby SUP で下記のコマンドを実行し、SUP の持つ configuration file を消します。

# setup-clean-config.sh
# sync

active SUP の CLI に戻り、下記のコマンドを実行して機材を再起動します。

# reload
This command will reload the chassis, Proceed (y/n)? [n]: y


回避策の手順は以上になります。
なお、有効な保守契約がある場合には意図せずこの問題により起動しなくなってしまった SUP については RMA により HW 交換します。

加えて、CSCwf44222 の修正を含む Version に一度 Upgrade したとしても、CSCwb86706 の修正を含まない Version に Downgrade するとこの問題は再発します
例えば、15.2(6e) (これは CSCwb86706 の修正を含まない) から 15.2(8f)  (CSCwf44222 の修正を含むに Upgrade した後、再度 15.2(6e) に Downgrade して、発生条件の (1) (3) を実施した場合、CSCwb86706 は再発します。

備考
本不具合は、Bug Search Tool でも確認できます。
各製品の TAC SR Collection の一覧は、よくある質問と解決方法 (TAC SR Collection) から確認できます。

Getting Started

検索バーにキーワード、フレーズ、または質問を入力し、お探しのものを見つけましょう

シスコ コミュニティをいち早く使いこなしていただけるよう役立つリンクをまとめました。みなさんのジャーニーがより良いものとなるようお手伝いします