概要
本ドキュメントでは ASR9K ルータ上にて、Linecard (LC) 上の Network Processor (NP) の内部メモリにてビットエラーが発生した際の取得依頼ログについて記載しています。
ビットエラー発生時の syslog メッセージ
NP の内部メモリにてビットエラーが発生した場合、下記のようなメッセージが出力されます。
LC/0/1/CPU0:Mar 7 15:41:36.315 JST: prm_server_ty[295]: %PLATFORM-NP-3-ECC : prm_ser_check: Single-bit ECC error detected: NP 0, block 0xb (SRCH), offset 77, memid 557, name Cache Group 2, addr 0x00000026, bit 39, ext info 0xffffffff 0xffffffff 0xffffffff 0xffffffff, action 1 (Ignore)
なお、5.3.3 以降は上記メッセージ形式は下記のように変更されております。
LC/0/1/CPU0:Mar 7 15:41:36.315 JST: prm_server_ty[305]: %PLATFORM-NP-3-ECC : prm_ser_check: Single-bit ECC error detected: SN FOC155081EP, NP 0, Rev 2, block 0xb (SRCH), offset 77, memid 557, name Cache Group 2, addr 0x00000026, bit 39, ext info 0xffffffff 0xffffffff 0xffffffff 0xffffffff, single count 0, double count 0, flags 0x0, action 1 (Ignore)
上記メッセージは以下のような意味となっております。
メッセージ出力 | 意味 |
LC/0/1/CPU0 | ビットエラーが検出された Linecard |
prm_server_ty | ビットエラーを検出した NP ドライバプロセス名 - prm_server: Trident LC
- prm_server_ty: Typhoon LC
- prm_server_to: Tomahawk LC
|
Single-bit ECC error | 検出されたビットエラー種別 - Parity エラー
- Single-bit ECC エラー
- Double-bit ECC エラー
|
NP 0 | ビットエラーが検出された NP (Network Processor) 番号 |
block 0xb (SRCH) | ビットエラーが検出された NP メモリのブロック番号とブロック名 |
memid 557, name Cache Group 2 | ビットエラーが検出された NP メモリのブロック内のメモリIDとメモリ名 |
Ignore | ビットエラーが検出された際に取られるアクション - Fix: ビットエラーを自動的に修正した
- Ignore: 無視できるビットエラー
- Fix then Fast Reset: ビットエラーを自動的に修正したが、影響のあった NP を個別に Fast Reset する
- Fast Reset: 影響のあった NP を個別に Fast Reset する
- Reset: 修正不可能なビットエラーであるため、Linecard を再起動する
|
ビットエラー発生時の取得依頼ログ
NP 内部メモリにてビットエラーが発生した場合は、下記ログを定期的に複数回取得して下さい。(例: 30 秒おきに 3 回取得)
show controllers np soft-errors all all location <LC>
show controllers np interrupts all all location <LC>
最後に下記 NP 内部トレースログも取得して下さい。
show prm server trace error location <LC>
show prm server trace event location <LC>
(*) 上記 <LC> はビットエラーの発生した Linecard 名を指定して下さい (例: 0/1/CPU0)
また、LC 再起動後でも解析用ログファイルが保存されている場合もあるため、下記ディレクトリの事象発生時の時刻付近のログを全て取得して下さい。
dir harddisk:/np/