Cisco Support Community
отмена
Отображаются результаты для 
Вместо этого искать 
Вы имели в виду: 
Объявления
Добро пожаловать в Сообщество Технической поддержки Cisco. Мы рады получить обратную связь .
New Member

Проблема с VSS на 4500

Добрый день, коллеги.

Столкнулся со странной проблемой, которая пока не поддается ни решению, ни гуглению.

Имеется пара 4503 с Sup 7-E в VSS. Общий Uptime у VSS системы больше года. Переодически для проведения профилактики проводим redundancy force-switchover. Так вот после последнего force-switchover SLAVE коммутатор не подцепился к VSS.

 

В логах слейва:

*Apr  3 13:49:10.405: %C4K_IOSINTF-5-LMPHWSESSIONSTATE: Lmp HW session UP on slot 11 port 1.
*Apr  3 13:49:12.448: %C4K_IOSINTF-5-LMPHWSESSIONSTATE: Lmp HW session UP on slot 11 port 2.
*Apr  3 13:49:26.404: %VSLP-5-VSL_UP:  Ready for control traffic

*Apr  3 13:49:29.404: %VSLP-5-RRP_ROLE_RESOLVED: Role resolved as STANDBY by VSLP
*Apr  3 13:50:04.413: %C4K_REDUNDANCY-2-IOS_VERSION_CHECK_FAIL: STANDBY:IOS version mismatch. Active supervisor version is 15.1(2)SG (cat4500e-UNIVERSALK9-M). Standby supervisor version is 15.1(2)SG (cat4500e-UNIVERSALK9-M). Redundancy feature may not work as expected.
*Apr  3 13:50:04.413: %C4K_REDUNDANCY-2-NON_SYMMETRICAL_REDUNDANT_SYSTEM: STANDBY:STANDBY supervisor will operate in fallback redundancy mode rpr.
*Apr  3 13:50:07.477: %C4K_REDUNDANCY-3-COMMUNICATION: STANDBY:Communication with the peer Supervisor has been established
*Apr  3 13:50:08.466: %C4K_REDUNDANCY-2-VS_REBOOT_ON_RPR_FALLBACK: STANDBY:Supervisor in virtual-switch configuration cannot operate in redundancy mode RPR, will be reset
*Apr  3 13:50:08.852: %RF-5-RF_RELOAD: STANDBY:Self Reload. Reason: Virtual-switch fallback to RPR
*Apr  3 13:50:08.864: %VSLP-3-VSLP_LMP_FAIL_REASON: STANDBY: 1/2 : Link down
*Apr  3 13:50:08.876: %VSLP-3-VSLP_LMP_FAIL_REASON: STANDBY: 1/1 : Link down
*Apr  3 13:50:08.876: %VSLP-2-VSL_DOWN: STANDBY:  All VSL links went down while switch is in Standby role

*Apr  3 13:50:08.876: %C4K_REDUNDANCY-3-NOT_READY_FOR_SWITCHOVER: STANDBY:The active Supervisor failed but standby supervisor cannot initiate Switchover activity. Resetting standby Supervisor.
*Apr  3 13:50:09.264: %RF-5-RF_RELOAD: STANDBY:Self Reload. Reason: Standby not ready for switchover
*Apr  3 13:50:09.447: %SYS-5-RELOAD: STANDBY:Reload requested by Platform redundancy manager. Reload Reason: Virtual-switch fallback to RPR.

Switchover activity can not be initiated. Resetting...

 

После чего коммутатор вываливается в rommon

 

На ACTIVE свитче в это время:

Apr  3 17:49:27.384: %VSLP-5-VSL_UP:  Ready for control traffic

Apr  3 17:49:30.389: %VSLP-5-RRP_ROLE_RESOLVED: Role resolved as ACTIVE  by VSLP
Apr  3 17:49:30.389: %EC-5-BUNDLE: Interface TenGigabitEthernet1/1/1 joined port-channel Port-channel5
Apr  3 17:49:30.399: %EC-5-BUNDLE: Interface TenGigabitEthernet1/1/2 joined port-channel Port-channel5
Apr  3 17:49:31.021: %C4K_REDUNDANCY-6-DUPLEX_MODE: The peer Supervisor has been detected
Apr  3 17:49:31.399: %LINEPROTO-5-UPDOWN: Line protocol on Interface TenGigabitEthernet1/1/1, changed state to up
Apr  3 17:49:31.400: %LINEPROTO-5-UPDOWN: Line protocol on Interface TenGigabitEthernet1/1/2, changed state to up
Apr  3 17:49:32.388: %LINK-3-UPDOWN: Interface Port-channel5, changed state to up
Apr  3 17:49:33.388: %LINEPROTO-5-UPDOWN: Line protocol on Interface Port-channel5, changed state to up

Apr  3 17:50:01.418: %ISSU-3-PEER_IMAGE_INCOMPATIBLE: Peer image (cat4500e-UNIVERSALK9-M), version (03.04.00.SG) on peer uid (11) is incompatible
Apr  3 17:50:01.418: %ISSU-3-PEER_IMAGE_INCOMPATIBLE: Peer image (cat4500e-UNIVERSALK9-M), version (03.04.00.SG) on peer uid (11) is incompatible
Apr  3 17:50:08.458: %C4K_REDUNDANCY-2-IOS_VERSION_CHECK_FAIL: IOS version mismatch. Active supervisor version is 15.1(2)SG (cat4500e-UNIVERSALK9-M). Standby supervisor version is 15.1(2)SG (cat4500e-UNIVERSALK9-M). Redundancy feature may not work as expected.
Apr  3 17:50:08.462: %C4K_REDUNDANCY-6-MODE: ACTIVE supervisor initializing for rpr mode
Apr  3 17:50:09.062: %C4K_REDUNDANCY-3-COMMUNICATION: Communication with the peer Supervisor has been established
Apr  3 17:50:10.146: %EC-5-UNBUNDLE: Interface TenGigabitEthernet1/1/2 left the port-channel Port-channel5
Apr  3 17:50:10.158: %VSLP-3-VSLP_LMP_FAIL_REASON: Te1/1/2: Link down
Apr  3 17:50:10.230: %VSLP-3-VSLP_LMP_FAIL_REASON: Te1/1/1: Link down
Apr  3 17:50:10.231: %VSLP-2-VSL_DOWN:   All VSL links went down while switch is in ACTIVE role
Apr  3 17:50:10.231: %EC-5-UNBUNDLE: Interface TenGigabitEthernet1/1/1 left the port-channel Port-channel5
Apr  3 17:50:10.238: %C4K_IOSINTF-5-LMPHWSESSIONSTATE: Lmp HW session DOWN on slot 1 port 1.
Apr  3 17:50:11.059: %C4K_REDUNDANCY-3-COMMUNICATION: Communication with the peer Supervisor has been lost
Apr  3 17:50:11.085: %C4K_REDUNDANCY-3-SIMPLEX_MODE: The peer Supervisor has been lost
Apr  3 17:50:11.144: %LINEPROTO-5-UPDOWN: Line protocol on Interface TenGigabitEthernet1/1/2, changed state to down
Apr  3 17:50:11.232: %LINEPROTO-5-UPDOWN: Line protocol on Interface TenGigabitEthernet1/1/1, changed state to down
Apr  3 17:50:11.233: %LINEPROTO-5-UPDOWN: Line protocol on Interface Port-channel5, changed state to down
Apr  3 17:50:12.144: %LINK-3-UPDOWN: Interface TenGigabitEthernet1/1/2, changed state to down
Apr  3 17:50:12.235: %LINK-3-UPDOWN: Interface Port-channel5, changed state to down
Apr  3 17:50:12.636: %LINK-3-UPDOWN: Interface TenGigabitEthernet1/1/1, changed state to down

 

Подскажите, в какую сторону копать? Может кто сталкивался с подобным?

 

P.S.

из подозрительного на АКТИВ свитче в sh redundancy config-sync failures mcl
Mismatched Command List
-----------------------
-line con 2

 

Октуда взялся line con 2 без малейшего понятия.

9 ОТВЕТ.
New Member

может вам сюда? http://www

может вам сюда? http://www.cisco.com/c/en/us/support/docs/field-notices/637/fn63746.html

New Member

Не похоже на аппаратную

Не похоже на аппаратную проблему, да и парт-номера не проблемные.

Попробовали отключить от сети STANDBY: он нормально загрузился и заработал. Включили обратно - та же ерунда. Есть мнение попробовать перезагрузить ACTIVE, но это приведет к простою и подготовка к такой процедуре не быстрая, и опять же вдруг с ним что-то и остаться без сети не хочется.
 

Статические маки не настроены

Статические маки не настроены? Есть очень похожий баг:

https://tools.cisco.com/bugsearch/bug/CSCuj34359

 

И покажите конфигурацию line con 0. А лучше верните ее к дефолту.

New Member

Статических маков нет, кроме

Статических маков нет, кроме тех что прописывает сам VSS в module provision switch и mac access-list extended VSL-*

про консоль: было

line con 0

 stopbits 1

 logging synchronous

 

Все убрал. Стал чистый con 0. Сравнил оба start конфига diff`ом - различий нет. Скопировал startup-config с Активного на Резервный прям файлом по tftp и загрузил с него - результата нет. Все так же: IOS version mismatch.

 

Похоже на новый баг. Кейс

Похоже на новый баг. Кейс завести можете?

New Member

К сожалению, TAC на данное

К сожалению, TAC на данное оборудование закончился sad

Это печально... 0)

Это печально...

 

0) Запланируйте и согласуйте даунтайм под описанное ниже минимум на пару часов, убедитесь в работоспособности консоли.

1) Убедитесь, что в show diag result module all нет ошибок, и в логах нет ничего что свидетельствовало бы об аппаратных проблемах.

2) Если у вас нет причин пользоваться софтом 3.4.Х, то загрузите 3.2.8GS на оба супа (вроде MD, достаточно много ребилдов было, и указанного мной выше бага там вроде нет), и обновите оба шасси. Так как даунгрейд - ISSU нет, и ладно, лучше обходиться без него, пока можно.

New Member

0) Запланировали на этот

0) Запланировали на этот weekend. Попробую обновить до 03.04.03.SG или 03.05.02. Странно, хоть в текущих контрактах TAC этого оборудования нет и для кейса его в выборе нет, но скачивать софт для него не закрыто. Может просто я не до конца понимаю правила пользования TAC.

1) show diag result module all - нет такой команды. Помоему, она только в 6500 была. Логи чистые, тест при загрузке вторая голова проходит нормально. Активную посмотрим в выходные.

2) В кофиг гайде по 4500 в требованиях для VSS указан IOS не меньше 3.4.0. (Cisco Release IOS XE 3.4.0SG and later releases support VSS.)

А разве ISSU мне поможет если система не собирается в VSS?

p.s. по результатам отпишусь.

New Member

Залил не обе головы по 03.05

Залил не обе головы по 03.05.02. Загнал обе в rommon и поочередно поднял. VSS собрался, ошибка в sh redundancy config-sync failures mcl ушла.

Передернул redundancy force-switchover туда/обратно пару раз - вроде все в норме.

sh switch virtual

Executing the command on VSS member switch role = VSS Active, id = 1


Switch mode                  : Virtual Switch
Virtual switch domain number : 10
Local switch number          : 1
Local switch operational role: Virtual Switch Active
Peer switch number           : 2
Peer switch operational role : Virtual Switch Standby

Executing the command on VSS member switch role = VSS Standby, id = 2


Switch mode                  : Virtual Switch
Virtual switch domain number : 10
Local switch number          : 2
Local switch operational role: Virtual Switch Standby
Peer switch number           : 1
Peer switch operational role : Virtual Switch Active

 

sh redundancy states
         my state = 13 -ACTIVE
       peer state =  8 -STANDBY HOT
             Mode = Duplex
             Unit = Primary
          Unit ID = 1

  Redundancy Mode (Operational) = Stateful Switchover
   Redundancy Mode (Configured) = Stateful Switchover
               Redundancy State = Stateful Switchover
                      Manual Swact = enabled

   Communications = Up

     client count = 81
   client_notification_TMR = 240000 milliseconds
            keep_alive TMR = 9000 milliseconds
          keep_alive count = 0
      keep_alive threshold = 9
             RF debug mask = 0

 

Вероятно всего, проблема была чисто софтовая и после перезагрузки обоих голов даже на старом софте ушла бы. Жаль только что, не удалось её продиагностировать, и не выплывет она снова когда-нибудь.

Всем кто откликнулся огромное спасибо! 

208
Просмотры
0
Полезный материал
9
Ответы
СоздатьДля создания публикации, пожалуйста в систему