シスコサポートコミュニティ
キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

F2 ラインカードにおける MTMプロセスのリスタート

2013年4月26日(初版)

TAC SR Collection
主な問題

Nexus 7000 シリーズスイッチの F2 ラインカードにおける MTM プロセスのリスタートおよびそれに伴うリロードが発生します。

MTMプロセスのリスタート中には、通信の一部が遅延や破棄などの影響を受ける可能性があります。

原因

F2 ラインカード(N7K-F248XP-25)における MTM プロセスのリスタートには主に下記2つの不具合が原因として考えられます。


(1) CSCtn64672 : l2fm crash if too many MAC address move over vpc peer link

vPC 構成の片方のpeerで大量のMAC  flap等が発生すると、もう片方のpeerにそれを通知する大量の内部メッセージがpeer-linkを介して送信されます。それにより大量のメッセー ジが内部バッファに蓄積されL2FMがbusy状態となります。その結果、L2FMまたはMTMプロセスのリスタートやシステムの再起動が発生することが あります。

(2) CSCtx46109 : Clipper KLM Interrupt Throttling trigger MTM FE timer expired

F2 ラインカード上にはL2/L3 Forwarding Engine(FE)の役割を担うClipperと呼ばれるASICが12個実装されています。

本 不具合では、通常運用において何らかの要因でこのASIC上の何れかのinstanceに対するinterrupt(アクセス)がマスクされます。その結 果、関連するプロセス(MTMやclp_fwd等)のメモリリークが発生し、場合によってはプロセスのリスタートやシステムの再起動に至ることがありま す。

本不具合により下記メッセージが出力されます。

%MTM-SLOT4-0-FE_TIMER_EXPIRED: FE timer expired for fe x!

FE x はマスクされたASIC instanceへのアクセスに失敗したinstanceを示します。マスクされているASIC instanceは下記コマンドから確認可能です。

`show logging onboard internal kernel`

Fri Apr 19 07:11:29 2013 (549791 us)
clpk_isr: Warning Instance 7 interrupts maske

もしくは、下記出力をご確認下さい。

`show hardware internal clipper-klm interrupt-status`

-----------------------------------------------------------------
| Inst | Interrupt Stat[0-1] | Masked By | Status | Version |
-----------------------------------------------------------------
| 0 | 00000000, 00000000 | None | 00000736 | 00000004
| 1 | 00000000, 00000000 | None | 00000536 | 00000004
| 2 | 00000000, 00000000 | None | 00000536 | 00000004
| 3 | 00000000, 00000000 | None | 00000536 | 00000004
| 4 | 00000000, 00000000 | None | 00000536 | 00000004
| 5 | 00000000, 00000000 | None | 00000536 | 00000004
| 6 | 00000000, 00000000 | None | 00000536 | 00000004
| 7 | 00000000, 02000000 | K | 00000536 | 00000004   =====>K bit
| 8 | 00000000, 00000000 | None | 00000536 | 00000004
| 9 | 00000000, 00000000 | None | 00000536 | 00000004
| 10 | 00000000, 00000000 | None | 00000536 | 00000004
| 11 | 00000000, 00000000 | None | 00000736 | 00000004


これらの不具合発生時には、L2FMプロセスがbusy状態となりETHPMプロセスとの通信の整合性が取れなくなった結果、下記ログメッセージが出力されることもあります。

%ETHPORT-5-IF_SEQ_ERROR:  Error ("sequence timeout") communicating with MTS_SAP_L2FM for opcode  MTS_OPC_ETHPM_PORT_PHY_CLEANUP (RID_PORT: Ethernet2/25)

解決策

(1) CSCtn64672 : l2fm crash if too many MAC address move over vpc peer link

恒久的な対策としては、修正済みバージョンへのNX-OSアップグレードをお願い致します。

影響を受ける NX-OS バージョンの使用を継続する場合には、発生条件である多量の MAC flap 解消をお願い致します。


(2) CSCtx46109 : Clipper KLM Interrupt Throttling trigger MTM FE timer expired

恒久的な対策としては、修正済みバージョンへのNX-OSアップグレードをお願い致します。

アップグレードされる前にまずF2 ラインカードのリロードが必要となります。

備考:

L2FM:スーパーバイザ上にあるMac AddressなどLayer 2に関わるプロセス

MTM:L2FMとやり取りを行う各ラインカード上にあるプロセス

434
閲覧回数
0
いいね!
0
コメント