シスコサポートコミュニティ
キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
cancel

[UCS B]VIC1340のeCPUsが無応答になり、CATERRエラーが発生する

2017年1月17日(初版)

TAC SR Collection
主な問題

 -VIC1340を搭載したUCS Bシリーズにおいて、Server及びOS が無応答になったり、

   ハングアップすることがあります。

 -VIC Adapter がアクセス不能になり、VICのログが取得出来なくなります。

原因

 DDTS:CSCuz69373に起因し、問題が発生する可能性があります。

 https://bst.cloudapps.cisco.com/bugsearch/bug/CSCuz69373

以下の四つの条件が揃う場合、上記DDTSに該当すると判断します。

 1. Adapter が VIC 1340 である。

 2. VIC 1340 のファームウェアが 「4.1(1d)」 である。

 3. System Event Log に CATERR エラーが記録される。

   例:
   CIMC | Processor CATERR_N #0x81 | Predictive Failure asserted | Asserted
  CIMC | Processor CATERR_N #0x81 | Predictive Failure deasserted | Asserted

  CIMC | Processor CATERR_N #0x81 | Predictive Failure asserted | Asserted
  CIMC | Processor CATERR_N #0x81 | Predictive Failure deasserted | Asserted


 4. VIC1340 のdebugdump ログにTime Out を示すログが記録される。

  例:「pcietrace -n 100」の出力
  int_err: TAR_REQ_STALL_TIMER_EXCESS_HALT
  int_err: TAR_REQ_STALL_TIMER_EXCESS_HALT

 注:上記4番のログはサーバを再起動すると消える可能性があるため、

   事象発生時のtechsupportログを確認する必要があります。

解決策

【暫定対策】

  サーバを再起動することにより、事象が一時的に復旧します。

【恒久対策】

  以下のDDTSをご参照頂き、「Known Fixed Releases」に記載されるバージョン以上へ

  ファームウェアを更新してください。

  https://bst.cloudapps.cisco.com/bugsearch/bug/CSCuz69373

220
閲覧回数
0
いいね!
0
コメント