はじめに
本ドキュメントでは、Intersight を使用して HyperFlex のノード再構築を行う際の要件や手順を紹介します。
ノード再構築を行うケースとしては、以下を想定しております。
- ESXi を再インストールするケース(SCVMの再インストールも含む)
- Hypervisor の破損
- ブートドライブの故障(ESXi がインストールされている M.2 SSD ドライブ)
- Storage Controller VM(SCVM) のみを再インストールするケース
- SCVM OS の破損
- 意図しない SCVM の削除
要件
- HXDP 5.0(2b) 以降
- Edge Cluster および FI-based Cluster に対応(M5/M6)
- 1GbE Edge Cluster と Stretch Cluster は未サポート
- M6 Cluster では、UCS F/W が 4.2(1i) 以降をサポート
- Converged ノードのみサポート
- License
- Intersight: Essentials 以上
- HyperFlex: Edge Advantage か Datacenter Advantage 以上
- Intersightユーザの役割として HyperFlex Cluster Administrator または Account Administrator であること
- HX InstallerVM でデプロイし、Intersight にインポートした HX Cluster は未サポート
※詳細は、ヘルプセンターをご参照ください。
前提条件
- 対象 Cluster は Intersight に接続されており、Online ステータスであること
- 再構築の対象ノードには、Cluster 内の他ESXiと同じバージョンのESXiが再インストールされていること(SCVMのみ再構築時は除く)
- 2 Node Edge の場合、1台は Healthy 状態であること
- Fabric Interconnect 接続構成の Cluster サイズが最小の 3 台の場合は、Unhealthy 状態となりますが、4 台以上の Cluster の場合は、Healthy 状態であること
- 再構築が必要な Offline ノードは、あらかじめ vCenter から削除する必要があります。
- マザーボード交換を伴ってのノード再構築については未サポートのため、その際は TAC までお問い合わせください。
事前準備
- ESXi 再インストールのための ESXi インストール ISO イメージ
クラスタ内の ESXi は全て同一バージョンである必要があるため、当該バージョンの ESXi インストール ISO イメージを以下から取得し用意します。
https://software.cisco.com/download/home
Browse all > Hyperconverged Infrastructure > HyperFlex HX-Series > 対象の筐体 > VMware ESXi for Cisco HX
※VMware のバージョンは、vCenter 上で確認できますが、ESXi の CLI からも「vmware -vl」コマンドで確認可能です。
事前の状態確認
Intersight UI での確認
Infrastructure Service > HyperFlex クラスタ > 対象クラスタ > 概要 > イベント より、
対象 Cluster が Unhealthy 状態、また対象ノードが Offline となっていることを確認します。
![higoto_0-1698295075378.png higoto_0-1698295075378.png](/t5/image/serverpage/image-id/200805i693B3BA90A870432/image-size/large?v=v2&px=999)
vCenter での確認
vCenter からも Cluster が Unhealthy であることが確認できます。
SCVM CLI での確認
以下は、SCVM の CLI で確認した際の出力例となります。
$ hxcli cluster status
Cluster UUID : 8341272222857186306:5655771090749354588
Cluster Ready : Yes
Resiliency Health : WARNING
Operational Status : ONLINE
ZK Quorum Status : ONLINE
ZK Node Failures Tolerable : 0
$ hxcli cluster info
Cluster Name : HXAF220M6
Cluster UUID : 8341272222857186306:5655771090749354588
Cluster State : ONLINE
Cluster Access Policy : Lenient
Space Status : NORMAL
Raw Capacity : 15.7 TiB
Total Capacity : 4.8 TiB
Used Capacity : 53.8 GiB
Free Capacity : 4.8 TiB
Compression Savings : 0.00%
Deduplication Savings : 0.00%
Total Savings : 0.00%
# of Nodes Configured : 3
# of Nodes Online : 2
Data IP Address : 169.254.6.1
Resiliency Health : WARNING
Policy Compliance : NON_COMPLIANT
Data Replication Factor : 3 Copies
# of node failures tolerable : 0
# of persistent device failures tolerable : 1
# of cache device failures tolerable : 1
Zone Type : Unknown
All Flash : Yes
再構築手順
ESXi の再インストール(※SCVMのみの再構築時は、本ステップは不要です)
- UCSM UI 、対象サーバの vKVM を起動し、KVM コンソールを開きます。
![higoto_0-1698295625880.png higoto_0-1698295625880.png](/t5/image/serverpage/image-id/200807i588868A401388025/image-size/large?v=v2&px=999)
- 仮想メディアを有効にし、ESXi ISO イメージをマウントします。
![higoto_1-1698295682001.png higoto_1-1698295682001.png](/t5/image/serverpage/image-id/200808i563F9DA92B1BC835/image-size/large?v=v2&px=999)
![higoto_4-1698296043566.png higoto_4-1698296043566.png](/t5/image/serverpage/image-id/200811i4BE91575ABC52492/image-size/medium?v=v2&px=400)
- 対象サーバの電源をリセットし、再起動します。
![higoto_5-1698296145395.png higoto_5-1698296145395.png](/t5/image/serverpage/image-id/200812i0B87DD808272390B/image-dimensions/343x341?v=v2)
起動直後、F6 でブートメニューを表示し、Cisco vKMV-Mapped vDVD2.00 を選択し、Enter を押下します。
![higoto_6-1698296251055.png higoto_6-1698296251055.png](/t5/image/serverpage/image-id/200813i611B2126CA0818FE/image-size/large?v=v2&px=999)
- Installer が起動したら、「I have read the above notice and wish to continue」を選択し、Enter を押下します。
![higoto_7-1698296292622.png higoto_7-1698296292622.png](/t5/image/serverpage/image-id/200814i860BE9EAC25B088D/image-size/large?v=v2&px=999)
- Install Option では、「HyperFlex Converged Node - HX PIDs Only」を選択し、Enter を押下します。
![higoto_8-1698296337388.png higoto_8-1698296337388.png](/t5/image/serverpage/image-id/200815iEB2066030414E084/image-size/large?v=v2&px=999)
- プロンプトが表示されるので、username、passwordともに「erase」とタイプし、Enter を押下します。
![higoto_9-1698296414636.png higoto_9-1698296414636.png](/t5/image/serverpage/image-id/200816i277DFAD39C49478C/image-size/large?v=v2&px=999)
- インストールが開始されます。
![higoto_11-1698296498932.png higoto_11-1698296498932.png](/t5/image/serverpage/image-id/200818i7B281D0FEC05ADA9/image-size/large?v=v2&px=999)
途中、入力を求められる画面が表示されたり、自動で再起動されますが、特に対応不要でそのままとします。
最終的に以下の画面となれば再インストールは完了です。
![higoto_12-1698296547560.png higoto_12-1698296547560.png](/t5/image/serverpage/image-id/200819i68A62B782C8299FF/image-size/large?v=v2&px=999)
- 対象サーバを Shutdown します。
ノードの再構築
- Infrastructure Service > Hypeflex クラスタ > 対象 HX クラスタ > アクション > Redeploy Node を選択します。
※SCVM のみの再構築時は、事前に対象サーバを Shutdown し、Host Status が Offline の状態にしておく必要があります。
![higoto_0-1698297034129.png higoto_0-1698297034129.png](/t5/image/serverpage/image-id/200820i7868BADF4ABD36F0/image-size/large?v=v2&px=999)
- 対象のノードを選択し、「続行」をクリックします。
![higoto_1-1698297075945.png higoto_1-1698297075945.png](/t5/image/serverpage/image-id/200821i3D75BE19FAD95654/image-size/large?v=v2&px=999)
- Software Configuration 画面では、Security、vCenter、Proxy Settings の各ポリシーが対象 Cluster に対応していることを確認し、「次へ」をクリックします。
![higoto_2-1698297399737.png higoto_2-1698297399737.png](/t5/image/serverpage/image-id/200826i8C306E5C917F6B25/image-size/large?v=v2&px=999)
※SCVM のみの再構築時は、Security Policy の オプション「このノードのハイパーバイザは工場出荷時のパスワードを使用しています」のチェックを外したうえで、現在の ESXi パスワードを入力してから、「次へ」をクリックします。
![higoto_3-1698297451564.png higoto_3-1698297451564.png](/t5/image/serverpage/image-id/200831iF2A3D4335DE6D384/image-size/large?v=v2&px=999)
- Summary 画面で、「Validate and Redeploy」をクリックすると、再構築が開始されます。
![higoto_4-1698297594345.png higoto_4-1698297594345.png](/t5/image/serverpage/image-id/200832i403F8D91AC88D8A4/image-size/large?v=v2&px=999)
- 処理が完了するのを待ちます。 ※途中、Validation Check 等でユーザの介入が必要なケースがあります。
![higoto_5-1698297648436.png higoto_5-1698297648436.png](/t5/image/serverpage/image-id/200833i08FC48420265E5DA/image-size/large?v=v2&px=999)
処理の進捗は、リクエストからも確認できます。 以下は正常完了時の例です。
※尚、処理の途中でエラーとなる場合は、TAC までお問い合わせください。
![higoto_0-1698306882905.png higoto_0-1698306882905.png](/t5/image/serverpage/image-id/200881i9193E9E38F146105/image-size/large?v=v2&px=999)
![higoto_7-1698297791321.png higoto_7-1698297791321.png](/t5/image/serverpage/image-id/200835iE1B30E5E9F9C2B2F/image-size/large?v=v2&px=999)
再構築後のステータス確認
Intersight UI での確認
Infrastructure Service > HyperFlex クラスタ > 対象クラスタ > 概要 より、Healthy 状態であることを確認します。
![higoto_0-1698298441131.png higoto_0-1698298441131.png](/t5/image/serverpage/image-id/200836iEA6A62FA295CB5E8/image-size/large?v=v2&px=999)
HyperFlex Connect での確認
HyperFlex Connect からも Cluster が Healthy であることを確認します。
![higoto_1-1698298514680.png higoto_1-1698298514680.png](/t5/image/serverpage/image-id/200837iA19543CC33502825/image-size/large?v=v2&px=999)
![higoto_2-1698298574742.png higoto_2-1698298574742.png](/t5/image/serverpage/image-id/200838i0112047AB1DBC9D0/image-size/large?v=v2&px=999)
SCVM CLI での確認
以下は、SCVM の CLI で確認した際の出力例となります。
(確認用コマンド例:hxcli cluster status, hxcli cluster info, hxcli cluster health, hxcli node list)
$ hxcli cluster status
Cluster UUID : 8341272222857186306:5655771090749354588
Cluster Ready : Yes
Resiliency Health : HEALTHY
Operational Status : ONLINE
ZK Quorum Status : ONLINE
ZK Node Failures Tolerable : 1
$ hxcli cluster info
Cluster Name : HXAF220M6
Cluster UUID : 8341272222857186306:5655771090749354588
Cluster State : ONLINE
Cluster Access Policy : Lenient
Space Status : NORMAL
Raw Capacity : 15.7 TiB
Total Capacity : 4.8 TiB
Used Capacity : 53.8 GiB
Free Capacity : 4.8 TiB
Compression Savings : 0.00%
Deduplication Savings : 0.00%
Total Savings : 0.00%
# of Nodes Configured : 3
# of Nodes Online : 3
Data IP Address : 169.254.6.1
Resiliency Health : HEALTHY
Policy Compliance : COMPLIANT
Data Replication Factor : 3 Copies
# of node failures tolerable : 1
# of persistent device failures tolerable : 2
# of cache device failures tolerable : 2
Zone Type : Unknown
All Flash : Yes
参考
以上