キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel
540
閲覧回数
0
いいね!
1
コメント
minghaol
Cisco Employee
Cisco Employee
本ドキュメントでは C220 M6 の GPU カードの交換手順についてご説明致します。

[交換対象パーツ]
搭載されている GPU カードの PID は以下となります。
Product ID (PID)
PID Description
Card Size 
Maximum cards
UCSC-GPU-T4-16
NVIDIA T4 PCIE 75W 16GB
HHHL, single-wide(ハーフハイト、ハーフレングス、シングル幅)
3

[作業前確認]
- FE作業
 CIMC の[シャーシ]タブで[障害とログ]メニューを選択し、右画面の[障害の概要]を確認して、発生している Fault を確認します。こちらの Fault については後ほど確認するため、念のためメモしておいて下さい。
minghaol_0-1689847217109.png


[作業手順]
- お客様作業 (FE 作業前)
1. OS をシャットダウンしてください。
2. 作業対象特定のために、以下のメニューで Locator LED を点灯してください。
minghaol_0-1689847445153.png


- FE 作業
< GPU カードの取り外し>
3.取り外す電源ケーブル、その他のケーブル(ネットワーク、 FC、Twinax 等)を、作業後に確実に戻せるよう、ラベリングします。

4.サーバ電源が off であることを確認し、電源ケーブルと必要であればその他のケーブルをサーバから抜きます。
5.下記の図のようにトップカバーを外せるよう、十分に手前に引き出します。

Untitled picture4.png
6.下記の図を参考にロックを開放し、サーバのトップカバーを取り外します。

(a) まずカバーラッチのロックを横にスライドさせてロックを解除します。
(b) ラッチのロックが解除されると、ハンドルが持ち上がり、ハンドルをつかむことができます
(c) 同時に、カバーを背後方向にスライドさせ、上部カバーをサーバからまっすぐ持ち上げ、横に置きます。
top1.jpg
1
カバー ロック
2
 カバー ラッチ ハンドル

7.<既存の GPU カードの取り外し> (下記図を参考)
下記の図が示すように、3 つの HHHLライザーを備えたサーバーの場合、3 つのソケットと 3 つの位置合わせ機能を使用できます。C220 M6 では HHHL、single-wide の GPU しかサポートしませんので、HHHL ライザーに取り付けて使用します。
309836.jpg
1
シャーシのライザーの位置合わせ機能(非脱落型ねじ)
 図:PCIe ライザー アセンブリ、3 HHHL(ハーフハイト、ハーフレングス)
309584.jpg
(注)簡単に識別できるように、各ライザー ケージの上部にある板金にライザー番号が刻印されています。

8.< GPU カードの取り外し> (下記図を参考)

(a) #2 のプラス ドライバを使用して非脱落型ねじを緩めます。
(b) まっすぐ持ち上げて、マザーボードからライザーを外します。ライザーを上下逆にして静電気防止シートの上に置きます。
(c) GPU カードの両端を均等に引いて、PCIe ライザーのソケットからカードを引き出し、外します。
GPU カードを外す際は、下記の図の矢印とは反対側方向に引き出します。
 
309569.jpg

9.<新しい GPU カードの取り付け> (上記図を参考)

(a) 新しい GPU カードをPCIe ライザーの空のソケットに合わせ、両端を保持クリップにスライドさせます。
(b) カードの両端を均等に押して、ソケットにしっかりと装着します。
(c) カードの背面パネル タブが、ライザーの背面パネルの開口部に対して水平になっていることを確認します。
(d) PCIe ライザーを、マザーボード上のソケットとシャーシの該当する位置合わせチャネルの上に配置します。
下記イメージ図の接触部分を損傷しないように気をつけます。

PCIe 4.jpg

PCIe 5.jpg

(e) PCIe ライザーの両端を慎重に押し下げて、2 つのコネクタをマザーボード上の 2 つのソケットにしっかりと差し込みます。
(f) ライザーが水平になり、完全に装着されたら、#2 プラス ドライバーを使用してライザーをサーバー シャーシに固定します。

309836.jpg


10.サーバに上部カバーを戻します。

11.サーバを一旦ストップするまでラックに押し込みます。

12.以下の図の両サイドにある ② のプラスチックリリースクリップを押しながらサーバを更に押し、ラックに収納します。
Untitled picture4.png
13.外したケーブル類を元通りに繋ぎ直します。

14.Host Upgrade Utilityを用いて、GPU カードの firmware を交換前の version と合わせます。

UCS C-Series HUU によるアップグレード方法 (M6 サーバ)
https://community.cisco.com/t5/-/-/ta-p/4697342


[作業後の確認手順]

- FE 作業
1.CIMC の[シャーシ]タブで[障害とログ]メニューを選択し、右画面の[障害の概要]を確認して、Fault が消えたかを確認します。
2.[インベントリ] メニューを選択し、右画面の [GPU インベントリ] で交換したGPU カードが正常に認識されているかを確認します。
※(注)CIMC では、GPU の Firmware version 表示には対応しておりません。
Firmware version は、HUU にてご確認ください。
※(注)実際 GPU が搭載された環境では、下記図の箇所から GPU 情報を確認可能です。
minghaol_0-1689852148469.png
- お客様作業 (FE 作業後)
3.OS を起動させ、動作に問題ないことを確認します。

[参考資料]

[Cisco UCS C220 M6 ラック サーバ スペック シート]
https://www.cisco.com/c/dam/global/ja_jp/products/collateral/servers-unified-computing/ucs-c-series-rack-servers/c220m6-sff-specsheet.pdf

[Cisco UCS C220 M6 サーバ設置およびサービス ガイド]
GPU カードの取り付け
https://www.cisco.com/c/ja_jp/td/docs/unified_computing/ucs/c/hw/c220m6/install/c220m6/m_gpu_installation.html

 
コメント
Hide-San
Level 1
Level 1
※(注)CIMC では、GPU の Firmware version 表示には対応しておりません

これについて、C series で UCSM managed の場合は、UCSM 上で GPU Firmware は確認できるものでしょうか。

スタンドアロンの場合と同様に確認できないでしょうか。

Getting Started

検索バーにキーワード、フレーズ、または質問を入力し、お探しのものを見つけましょう

シスコ コミュニティをいち早く使いこなしていただけるよう役立つリンクをまとめました。みなさんのジャーニーがより良いものとなるようお手伝いします