キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel
8895
閲覧回数
0
いいね!
4
コメント
JapanTAC_CSC
Level 7
Level 7

2018年1月25日 (初版)
2018年11月5日 (Update)

 

TAC SR Collection
主な問題

C220/C240 M4で稼働中にOSがクラッシュ(ハングアップ/PSOD/BSOD)します。

サーバの再起動で暫定的に復旧します。   

UCS側のSELログにDMI TimeoutPROCHOTMEMHOTFaultが記録されます。                                                          

:
  FW Status PECI over DMI interface error DMI timeout of PECI request | Asserted
   Processor P1_PROCHOT #0x20 | Limit Exceeded | Asserted
   Processor P1_MEM01_MEMHOT #0x24 | Limit Exceeded |
   Processor P1_MEM23_MEMHOT #0x25 |Limit Exceeded | Asserted

                                                                                                                                             

原因

CPU と PCIe で I/O のやり取りをする際、DMI interface 上で I/O のタイムアウトが発生し、CPU がクラッシュします。

I/O タイムアウトの根本原因は、ASPM や Package C state の CPU 省電力機能により引き起こされます。

解決策

この問題の修正は以下の二つの DDTS にて報告しております。   

    < ASPM transitions may result in system crash >

    https://bst.cloudapps.cisco.com/bugsearch/bug/CSCvd86049

    < Package C-state transitions may result in system crash >

    https://bst.cloudapps.cisco.com/bugsearch/bug/CSCvf78458

 

CSCvd86049 と CSCvf78458 で案内しているバージョンリリース以降にアップデートを実施後、BIOS Setup Utility で以下のように設定変更を実施して下さい。

  1. サーバ起動時に F2 キーを押して、BIOS Setup Utility を起動する。
  2. [Advanced] タブ を選択する。
  3. [Processor Configuration] を選択する。
  4. [Processor Power Management Configuration]を選択してから、[Power Technology]をDefaultの[Performance]から[Custom]に設定する。
  5. [CPU C State Control]を選択してから、[Package C State limit] を [C0/C1 state] に変更する。
コメント
e32903001
Level 1
Level 1

大変有用な情報ありがとうございます。以前同事象について何度か確認を行なったことがあります

- CSCvc06842に記載されている通り2.0(13)各バージョンおよび3.0(3e)以降ではCIMC(Web/CLI)およびBIOS Setup UtilityにASPM Supportメニューは存在しません。3.0(3e)以降への更新が行えない環境では一旦2.0(10)や3.0(3a)などのバージョンでASPMを変更する必要があります。またBIOS Setup UtilityでC-stateを変更するためには事前にAdvanced/Processor Configuration/Advanced Power Management Configuration内Power TechnologyをDefaultのPerformanceからCustomに設定する必要があります

ptech.png

C-State,ASPMパラメータの変更を行うのみであればCIMC Webで行うのが簡単です

222.png

v2 CIMC:Serverタブ->BIOS->Configure BIOS-> Advancedタブ内

3.1x.png

v3 CIMC:左ペインCompute->BIOSタブ->Configure BIOSタブ->Advancedタブ内

- 元々CSCvc06842はBCM5709搭載時に発生するDMI timeoutとして記載されておりましたが、修正されたものと思われます

CSCve10234に記載のようにDMI timeout/PROCHOT/MEMHOT発生時にはdriver/firmwareのInterOperabilityも問題発生時の切り分けに必要となるようです

- Firmware versionおよびInteroperabilityいずれも前提を満たしており、かつ被疑箇所を洗い出しが必要な際には各プロダクトのSpecsheet内Block Diagramが役に立つかと思われます

H N
Level 1
Level 1

修正バージョン以降にアップグレード後に実施しする設定変更ですが、購入時に既に修正バージョン以降であれば、設定変更は不要の認識で正しいでしょうか?

H N様

 

サポートコミュニティのご利用ありがとうございます。
ご質問いただいたボードはドキュメントボードとなりますので、データセンタのディスカッションボードにて再度投稿いただけます様よろしくお願いいたします。

サポートコミュニティ事務局

お世話になっております。

本件の対策として「プロセッサC6のレポートを「disable」にする」も必要であるように存じます。

つきましては「解決策」への追記をご検討いただけないでしょうか。

以上、よろしくお願い申し上げます。

Getting Started

検索バーにキーワード、フレーズ、または質問を入力し、お探しのものを見つけましょう

シスコ コミュニティをいち早く使いこなしていただけるよう役立つリンクをまとめました。みなさんのジャーニーがより良いものとなるようお手伝いします