Reemplazo de supervisora defectuosa en VSS

 

Reemplazo de una

 

Supervisora en un Sistema

 

de Conmutación Virtual

 

(VSS)

 

por

 

Haihua Rong

 

 

 

Introducción
============

 

           Como todos sabemos VSS es una tecnología que permite que dos chasis se integren como una entidad virtual y permite escalabilidad, administración y alta disponibilidad.

Dicha tecnología busca de alguna forma reducir un alto impacto a las operaciones de una compañía cuando sufre una falla nuestro núcleo al no tener una buena redundancia en la red. Sin embargo no siempre se puede prever situaciones que están fuera de nuestro control o situaciones inesperadas que causan una falla en el núcleo con nuestro dos 6500 en VSS.

Por ello este documento viene de alguna forma a mostrar algunos posibles escenarios de falla en el equipo y como reemplazar dicho hardware defectuoso de una forma práctica y sencilla sin causar una mayor ruptura en las operaciones.

En este documento no se va tratar reemplazos de chasis con doble supervisora o problemas de redundancia cuando hay una diferencia entre la configuración del activo y standby.

Escenarios
=========

 

Escenario 1: Falla Chasis standby

 

Este escenario es el más fácil de todos. Se tiene VSS con una supervisora en cada chasis y uno de ellos falló

                    
                       Activo                                             Standby

                     | -------------|                                       | -------------|
                     |                |     Enlace VSL               |    Falla     |
                     |                |                                       |                |
                     |--------------|                                       |--------------|

 

En este escenario la supervisora en el standby chasis sufre una falla y se ocupa un reemplazo.  Los pasos son muy sencillos y se requieren 3 no obstante lo relevante de este escenario es tener BIEN claro los siguientes aspectos:

  • Tener total seguridad/conocimiento del chasis que fallo (activo o standby)
  • Tener claro que número del identificador del switch que falló (1 o 2)
  • Se ocupa la configuración mas reciente del 6500 en VSS

 

Al tener claro los puntos antes mencionados se procede a realizar el remplazo de la supervisora que falló y de las cuales detallo paso a paso y para este escenario se utilizará switch id 1 para el standby y switch id 2 para el activo (COMO un simple ejemplo, no necesariamente va a ser en todos los caso)

 

Paso 1:

Verificar en el chasis activo el identificador del switch (switch_id):

 

VSS#switch read switch_num local

Read switch_num from Active rommon is 2

 

Como se puede observar el chasis activo tiene un identificador de 2 y por ende nuestro chasis standby tiene como id 1.

Sabiendo cual es el número de identificador de mi chasis activo continuamos con el paso 2

Paso 2

Para una mejor práctica (no indispensable ) se debe de remover el VSL link. Se remueve la supervisora defectuosa y se introduce la de reemplazo.

Se debe de copiar la imagen existente y la configuración más reciente de mi 6500 VSS. Para ello se ocupa una tarjeta compacta Cisco para pasar dicha información a la supervisora de reemplazo si no se tiene se configura un routed port en el chasis que fallo para poder conectar una laptop/pc con un servidor de TFTP y así transferir  el IOS y la configuración.

VSS#copy run disk0:

VSS#copy sup-bootdisk:<IOS> disk0:

 

Paso 3

Se debe de transferir la image en la misma memoria que el activo, ya sea en el sup-bootdisk, disk0, disk1, etc y la configuración en la NVRAM y no en la running-config. Esto debido a que el switch de reemplazo no está en modo virtual y por ende nos va a dar error toda la configuración cuando se pasa por error en la memoria volátil.

Con tarjeta compacta:

SupervisoraReemplazo#copy disk0:<IOS>  <sup-bootdisk>

SupervisoraReemplazo#copy disk0:<VSS_config>  startup-config

 

Paso 4

Después de darle un reload se debe de conectar el VSL link. Se procede a reiniciar la supervisor de reemplazo sin salvar los cambios que se han hecho esto debido a que vamos le vamos a caerle encima la running-config en blanco a la startup y por consiguiente el VSS no se va a formar.

SupervisoraReemplazo #reload

System configuration has been modified. Save? [yes/no]: no

A este punto la supervisora de reemplazo va a detectar la configuración virtual y va a iniciarse como chasis standby esto debido a que ya existe un chasis activo para nuestro ambiente VSS. El activo detecta el standby e inicia los 3 pasos para la inicialización del VSL.

 

Escenario 2: Falla Chasis Activo

 

Se tiene VSS con una supervisora en cada chasis y uno de ellos falló pero el que fallo tenía como switch_id 2

 

                       Activo                                             Standby

                     | -------------|                                       | -------------|
                     |   Falla      |     Enlace VSL               |                |
                     |                |                                       |                |
                     |--------------|                                       |--------------|

 

En este escenario la supervisora en el chasis activo sufre una falla y se ocupa un reemplazo.  Igual se debe de tener BIEN claro los siguientes aspectos:

  • Tener total seguridad/conocimiento del chasis que fallo (activo o standby)
  • Tener claro que numero del identificador del switch que falló (1 o 2)
  • Se ocupa la configuración mas reciente del 6500 en VSS

 

Para ejemplo el chasis activo tiene identificador de switch 2.

 

Paso 1:

Verificar en el chasis activo el identificador del switch (switch_id):

 

VSS#switch read switch_num local

Read switch_num from Active rommon is 1

 

Como se puede observar el chasis activo tiene un identificador de 1.

Sabiendo cual es el número de identificador de mi chasis activo continuamos con el paso 2

 

Paso 2

Para una mejor práctica (no indispensable) se debe de remover el VSL link. Se remueve la supervisora defectuosa y se introduce la de reemplazo.

Se debe de copiar la imagen existente y la configuración más reciente de mi 6500 VSS. Para ello se ocupa una tarjeta compacta Cisco para pasar dicha información a la supervisora de reemplazo si no se tiene se configura un routed port en el chasis que fallo para poder conectar una laptop/pc con un servidor de TFTP y así transferir  el IOS y la configuración.

VSS#copy run disk0:

VSS#copy sup-bootdisk:<IOS> disk0:

 

Paso 3

Se debe de transferir la imagen en la misma memoria que el activo, ya sea en el sup-bootdisk, disk0, disk1, etc y la configuración en la NVRAM y no en la running-config. Esto debido a que el switch de reemplazo no está en modo virtual y por ende nos va a dar error toda la configuración cuando se pasa por error en la memoria volátil.

Con tarjeta compacta:

SupervisoraReemplazo#copy disk0:<IOS>  <sup-bootdisk>

SupervisoraReemplazo#copy disk0:<VSS_config>  startup-config

 

Paso 4

Se procede a cambiar el identificador del switch (switch_id) esto debido a QUE TODA SUPERVISORA VIENE POR DEFECTO con identificador 1 y el chasis que fallo tenía número 2

SupervisoraReemplazo #switch read switch_num local

Read switch_num from Active rommon is 1

Nota: Se debe de configurar el identificador del switch si no muestra número alguno.

SupervisoraReemplazo # switch set switch_num 2 local    (el local se puede omitir)

Set rommon's switch_num to 2

Confirmar el cambio:

SupervisoraReemplazo #switch read switch_num local

Read switch_num from Active rommon is 2

 

Paso 5

Se reinicia la supervisora de reemplazo e igual NO SE SALVA LA CONFIGURACIóN

System configuration has been modified. Save? [yes/no]: no

Después de darle un reload se debe de conectar el VSL link. A este punto la supervisora de reemplazo va a detectar la configuración virtual y va a iniciarse como chasis standby porque el activo tiene identificador numero 1 . Si no se hubiera cambiado el identificador lo que va a pasar es que va a haber un  escenario activo doble y para resolverlo SE DEBE de desconectar el VSL link y mandar la supervisora en rommon y cambiar el identificador y reload de nuevo.

 

Escenario 3: Falla en Ambos Chasis

 

Se tiene VSS con una supervisora en cada chasis y ambos fallaron. Podemos utilizar dos posibles soluciones.

 

                       Activo                                             Standby

                     | -------------|                                       | -------------|
                     |   Falla      |     Enlace VSL               |   Falla      |
                     |                |                                       |                |
                     |--------------|                                       |--------------|

   

En este escenario es un poco complicado pero poco posible. Ambas supervisoras fallaron y se deben de reemplazar. Ya teniendo las supervisoras nuevas se procede con los siguientes pasos.

Nota: Debemos de tener una configuración de respaldo o al menos la más actual de lo contrario debemos de crear todo el VSS desde cero y de ser necesario configurar todo el VSS 6500 por la cual nos va a tomar mucho tiempo. Además el IOS que estaba corriendo el 6500 VSS.

 

Paso 1

Teniendo la configuración de respaldo debemos de tener claro cual era el chasis activo para mantener de ser necesario un requerimiento de la compañía.

Teniendo la configuración y el IOS se debe de desconectar (mejor práctica no necesario) el VSL link y reemplazar las supervisoras dañadas.

                                                                      

Paso 2

 

Siguiendo un estándar del cliente se debe de transferir la imagen y configuración al que va a ser el chasis activo.

Como se ha estado mencionando es muy importante tener muy claro el número de identificador de la supervisora del que fuera el chasis activo de lo contrario de debe de cambiar la misma no obstante como ejemplo vamos a decir que el que el chasis activo tenía el switch_id 1.

 

 Paso 3

Teniendo la imagen, configuración  e identificador correcta del switch se procede a reiniciar la supervisora sin salvar los cambios. Cabe resaltar como se mencionó que la CONFIGURACIóN se debe de guardar en la startup-config y el IOS debe de estar en la misma localidad de memoria que la configuración de respaldo.

Cuando esa supervisora inicie va a detectar la configuración de VSS y va a funcionar como chasis activo esto debido a la configuración preliminar.  

Ya teniendo el chasis activo debemos de levantar el standby por la cual seguiremos el paso 4.

 

Paso 4

Se debe de tener la configuración (en NVRAM), el mismo IOS guardado en la misma locación de memoria que el chasis activo. Igual si no se tiene una tarjeta flash compacta se debe configurar un routed port o configurar la supervisora para tener conectividad con nuestro servidor de TFTP.

Se procede a cambiar el identificador del switch (switch_id) esto debido a QUE TODA SUPERVISORA VIENE POR DEFECTO con identificador 1 y el chasis standby tiene  identificador número 2

SupervisoraReemplazo #switch read switch_num local

Read switch_num from Active rommon is 1

SupervisoraReemplazo # switch set switch_num 2 local    (el local se puede omitir)

Set rommon's switch_num to 2

Confirmar el cambio:

SupervisoraReemplazo #switch read switch_num local

Read switch_num from Active rommon is 2

 

Paso 5

 

Se reinicia la supervisora del chasis de standby e igual NO SE SALVA LA CONFIGURACIóN

System configuration has been modified. Save? [yes/no]: no

Después de darle un reload se debe de conectar el VSL link. A este punto esa supervisora va a detectar la configuración virtual y va a iniciarse como chasis standby porque el activo tiene identificador numero 1  y de nuevo el 6500 VSS va a estar de nuevo funcionando a total satisfacción.

 

Conclusión
=========

 

Este documento es una simple una guía para los algunos escenarios en los que nos podemos encontrar  y para poder dar  una mejor respuesta cuando se encuentren con  una red caída, con miles de usuarios afectados sin poder continuar con su trabajo. Se busca se siga algunas prácticas efectivas para poder restablecer los servicios de una forma concreta, concisa y rápida.

 

Bibliografía
==========

http://www.cisco.com/c/en/us/support/docs/switches/catalyst-6500-virtual-switching-system-1440/109334-replace-vss-sup-proc-v1.html

                              

 

 

 

 

Historial de versiones
Revisión n.º
1 de 1
Última actualización:
‎07-04-2014 10:04 PM
Actualizado por:
 
Etiquetas (1)