2018年 6月20日 (初版)
TAC SR Collection |
主な問題 |
ACI image で稼働している 第一世代 の Nexus9000 において、ASIC の Diagnostics failure を検知する場合があります。
この問題では、"show diagnostic result module all" の出力で、asic-scratch の項目が fail となります。
fab3-spine1# show diagnostic result module all
...
22) cpu-cache----------------------> .
23) mem-health---------------------> .
24) ssd-acc------------------------> .
25) act2-acc-----------------------> .
26) ge-eeprom----------------------> .
29) usb-bus------------------------> .
30) cons-dev-----------------------> .
31) obfl-acc-----------------------> .
32) nvram-cksum--------------------> .
33) fpga-reg-chk-------------------> .
34) asic-scratch-------------------> F <=====
40) rtc-test-----------------------> .
41) pcie-bus-----------------------> .
43) tahoe-mem----------------------> .
|
原因 |
この問題は以下の既知の不具合に該当する可能性があります。
CSCvj55815:Suppress Diagnostic failures when false Parity error is received from BCM
この不具合に該当する場合、diagnostic failure は誤検知であり、実際の動作には影響はありません。 asic-scratch の diag が fail している module の obfl log に以下のログがあれば、この問題に該当します。
"error = 9(DATA_ERROR_FAILEDTOCORRECT), address 0x9, cause bit 0x64001035, mmu_id=0x4000003"
fab3-spine1# vsh
fab3-spine1# attach module 22
module-22# show logging onboard
...
Mon Mar 12 02:02:48 2018 (398664 us)
bcm_usd_isr_switch_event_cb:524: *MEM EVENT: unit 0, error = 9(DATA_ERROR_FAILEDTOCORRECT),
address 0x9, cause bit 0x64001035, mmu_id=0x4000003
...
|
解決策 |
この問題自体は、実際に動作には影響はありませんが、事象が発生している module を再起動することで、 一旦 asic-scratch のfail を解消することが出来ます。但し再発する可能性もあります。
解決策は CSCvj55815 の修正 version への upgrade です。
|
備考
本不具合は、Bug Search Tool でも確認できます。