スピーカー紹介
吉田 早希子(ヨシダ サキコ)
2009年入社。
カスタマーサポートエンジニアとしてシスコ テクニカルアシスタンスセンタ(TAC)データセンタネットワークチーム所属。
入社以降、UCS、Nexusシリーズのサポートを担当。
保有資格: Cisco Data Center Unified Computing Support Specialist, RHCE,VCP,VCAP,MCITP
セミナーの録画ビデオはこちらから。
4月8日(日)までエキスパートに質問で、引き続き質問を受け付けています。
質問
Q1. show_TechSupportファイルのサイズ上限を増やすなど、設定を行うことは可能でしょうか。
A1. show techsupport 自体のサイズを変更する様な実装は現状ではございません。
Q2. Show Tech取得時の機器への負荷はありますか?お客様の通信に影響が出ることを懸念しています。
A2. 原則として、ございません。このshow tech情報の収集は、あらゆるUCSでの事象調査の都度、ワールドワイドで収集されているものであり、実績も多数ございますが、この収集でお客様の通信やサービスへ影響が発生したという情報は 現在までにございません。
Q3. UCS CシリーズのR2XX-PL003(LSI MegaRAID SAS 9261-8i のOEM品)ですが、RAID Controllerのファームウェアのアップデートに関するIBM社のドキュメントは有りますか?R2XX-PL003 (RAID Controller) のファームウェアのバグに関するドキュメントの所在を知りたいです。(MegaRAID社のRAID Controllerのファームウェアのバグを記載したドキュメントを知りたいです。 )
A3.IBM社のドキュメントに相当するものはなく、また、RAID Controllerのバグに関するドキュメントも、Ciscoのホームページ上にはございません。
MegaRAIDのバグに関するドキュメントは、以下のLSI社のホームページで確認可能です。
http://www.lsi.com/downloads/Public/MegaRAID%20Common%20Files/12.12.0-0090_SAS_2108_FW_Image_APP-2.120.243-1482.txt
Q4. ハードウェアの障害箇所が起因でshow tech supportが採取できないということもありますでしょうか。
A4. UCSM自体に障害が発生してしまった場合は、そのようなことも発生するかもしれませんが、HA構成の場合は正常なUCSM側にFailoverして、show tech supportは取得できると考えられます。
例外として、ログ収集の対象のコンポーネントが全く応答を返さないような障害状況であれば、そのコンポーネントの情報が収集できない場合も考えられます。
Q5. show tech-supportで出力されるファイルのサイズを変更出来ないとの事ですが、出力される各ログファイルのサイズ(MAX値)が記載されたドキュメントなどはありますでしょうか。 また、各ログファイルのサイズ(MAX値)が記載されたドキュメントがない場合、箇条書きで結構ですのでご教示願えますでしょうか。
A5. show techsupport で取得出来るログファイルは多数あり、また通常 UCSM 等からアクセスすることの出来ない 各コンポーネントの内部のログがほとんどということもあり、公開しているドキュメント等はございません。個別のログファイルについてのご質問がございましたら、別途 SR にてお問い合わせいただけますでしょうか。
Q6. SEEPROMは何に使われますか?
A6. Chassis backplaneに搭載されており、Fabric Interconnect 間の第一ハートビートで使用されている、両リンク(L1,L2)が切断された時などに、第二ハートビートとして、生死確認の手段として使われます。また、Fabric interconnect障害後の起動時に どちらが最新の設定情報を保持しているかを判断するためのバージョン情報を保持しています。この情報のUpdateのために、各Fabric interconnectは毎分1回 SEEPROMへアクセスをし続けています。
Q7. show tech-support は出来るだけ早く取得する、とのことですが、障害発生からどれ位期間が経過すると意味がなくなってしまう、等ありますか?
A7. それぞれのコンポーネント、それぞれのログで、保持できるログの量は異なります。また、その増加状況もシステム規模や運用状態で異なります。例として、4ヶ月間分保持しているものもある一方で、2日前のログが保持できていないものもあります。また、システムAでは2日だが、システムBでは4日保持できる場合もございます。
そのため、どれくらい経過すると意味がなくなる、という一般的な指標はございません。
同じシステムでも稼働状況で変わってきますので、一概に目安とはできないかもしれませんが、一度取得いただき、どれくらいの頻度で書き変わっているかを各ログで確認いただくことで、おおよその目安としていただくことも有効かと思います。
いずれにしましても、事象発生後できるだけ早くとっていただくことに越したことはございません。
Q8. SNMP Trapで障害を検知することも可能ですか?
A8. 可能ですが、内容が判りにくいことが多いので、Trapを検知した場合は Trap の内容だけで判断せず、 UCSM で Fault イベントを確認することをお勧めします。
Q9. ディスクのステータスが UCSM から見られる様になったとのことですが、RAID Controller 配下情報(論理ディスクの RAID レベル等)も見られますか?
A9. RAID controller配下のLogical diskのRAIDレベルや RAIDステータスは、UCS Managerからは確認することはできません。
LSIユーティリティご使用いただき、ご確認いただく必要がございます。
Q10. 障害原因がRaid Controllerにあった場合、Raid Controllerを交換しても、ディスクデータは保持されますか?
A10. はい、保持されます。RAIDの構成情報はディスク側でも保持しており、その構成情報を使用してRAID構成がリストアされ、交換前と同様にディスクデータにアクセスできるようになります。