RapidDR – Test Failover Plan

En la anterior entrada os contamos cómo crear un plan de recuperación, guardar y modificar dicha configuración. Lo que vamos a hacer en esta nueva entrada es hacer la prueba de que nuestro sistema de DR funciona correctamente.

Test failover Plan

Esta prueba comprueba que todos los pasos que seguirá el software mediante el archivo de configuración de recuperación RapidDR que hemos creado, se ejecutan de manera correcta y levanta en el CPD de respaldo las VM sin problema.

Lo primero que haremos será hacer doble clic en el icono RapidDR, entraremos en la pestaña “Test Failover Plan” y cargaremos el archivo con la configuración de VM que previamente hemos creado.

Nota: Tanto para el test como para la ejecución del plan de failover, las VMs deben tener al menos un backup desde el cual realizar todas las tareas para levantar las VMs en el site de respaldo.  

Una vez cargado el archivo, lo que haremos será revisarlo y modificar (en caso necesario) la configuración de origen y recuperación.

Tabla: Configuración del origen

Source Site Status: Muestra el estado de disponibilidad del sitio de origen. Para hacer la prueba no podremos seleccionar ni Shutdown VMs ni Backup VMs ya que dichas opciones no están disponibles para hacer el test de failover.

Al seleccionar esta opción, se deshabilitará la opción RPO.

RPO: RPO (Recovery Point Objective) es la cantidad de tiempo que ha pasado desde que se ha hecho el último backup. El valor mínimo de RPO admitido es de 5 minutos.

Detalles de vCenter (dirección, nombre de usuario y contraseña) Muestra las credenciales de vCenter del sitio de origen del plan de recuperación. Si la contraseña no se guardó en el plan, los campos de nombre de usuario y contraseña se habilitan al cargar el archivo para que podamos ingresar las credenciales.

Tabla: Configuración de recuperación

Use source site network settings: Es para usar la configuración de red del CPD principal. seleccionamos la casilla de verificación para omitir la configuración de red del plan de configuración y para usar la configuración de red de los backups que se tienen de la máquina virtual.

Nota: Comentaros que esta opción solo es aplicable a las máquinas virtuales de Windows configuradas con DHCP.

Acciones de error: Aquí lo que se selecciona es lo qué debe hacer RapidDR cuando la recuperación de una máquina virtual falla por algún error.

  • Reintentar una vez y omitir: si falla la recuperación de una máquina virtual, RapidDR intenta recuperar la máquina virtual una vez más antes de proceder con la recuperación de otras máquinas virtuales en el plan de recuperación.
  • Reintentar una vez y cancelar: si la recuperación de una máquina virtual falla, RapidDR intenta recuperar la máquina virtual una vez más y si la recuperación de la máquina virtual falla, aborta toda la operación de recuperación.
  • Omitir y continuar: si falla la recuperación de una máquina virtual, RapidDR continúa con la recuperación de otras máquinas virtuales.
  • Abortar recuperación: RapidDR cancela toda la operación de recuperación si hay algún fallo.

Una vez seleccionada la opción elegida pasamos a la pestaña de validación. En dicha pestaña lo que haremos será comprobar la inconsistencia entre el archivo de configuración de recuperación y el sitio de recuperación.

Nota: Si por algún casual os da algún error y tenéis que modificar algún parámetro de las VMs, debemos modificar el archivo de recuperación también para que se realice la validación de forma correcta.

Hacemos clic en Iniciar validación para iniciar una comprobación de inconsistencias entre el archivo de configuración de recuperación y el sitio de recuperación; Este paso se puede saltar si queremos, aunque se recomienda que se realice.

El estado se actualiza para cada paso de validación. RapidDR valida los siguientes atributos:

  • Recursos: comprueba que hay disponibilidad suficiente de CPU y memoria para recuperar las máquinas virtuales.
  • Ubicaciones de inventario: comprueba la disponibilidad de almacenes de datos configurados, centros de datos, agrupaciones de recursos y carpetas.
  • Grupos de puertos: comprueba las definiciones y la disponibilidad de los grupos de puertos.
  • Nombres de máquinas virtuales: comprueba si hay nombres de máquinas virtuales duplicados.
  • Copias de seguridad válidas: comprueba la disponibilidad y el estado protegido de los Backups. Si se define RPO, verifica que los Backups disponibles estén dentro del límite de tiempo de RPO.

Una vez completada la validación, revisamos el estado de validación, la columna de estado indica uno de los siguientes estados para cada paso de validación.

  • Validation in progress
  • Validation successful
  • Validation failed
  • Validation not done

La página Test Failover: Enumera cada máquina virtual, su nivel de prioridad y el estado de recuperación actual. Puede hacer clic para ver las operaciones que se realizan en segundo plano para recuperar la máquina virtual.

Un contador en la parte inferior de la pantalla muestra el progreso general; la cantidad de máquinas virtuales procesadas y la cantidad total de máquinas virtuales en la recuperación.

Si nos aparece algún error, realizaremos los siguientes pasos:

  1. La columna Reintentar nos sirve para identificar la máquina virtual que falló en el proceso de restauración. El botón Reintentar está habilitado en las máquinas virtuales fallidas.
  2. Podemos hacer clic en Reintentar después de haber resuelto el problema fuera de RapidDR o en el botón de las máquinas virtuales fallidas para volver a intentar la recuperación de todas las máquinas virtuales que fallaron a la vez.

Nota: RapidDR inicia la recuperación de todas las máquinas virtuales en el plan y muestra el progreso.

Una vez completada la recuperación de todas las máquinas virtuales, al hacer clic en Siguiente, aparecerá en la pantalla un resumen con la info de las máquinas virtuales que se recuperaron con éxito, el tiempo necesario para recuperar cada máquina virtual y otros detalles.

Podemos exportar el Informe en formato Excel y en pdf. El informe de auditoría captura los detalles del plan junto con los detalles de ejecución paso a paso para cada VM dentro del mismo plan.

Después de realizar el test, se recomienda limpiar las VMs de recovery que se crearon en el site de respaldo, para ello, el propio software nos facilita dicha limpieza sin necesidad de salir de la pestaña de test a failover. Para hacerlo, debemos hacer click en siguiente y dar a limpiar máquinas virtuales y se borraran del vcenter del site de respaldo sin necesidad de que nosotros lo hagamos de manera manual.

Nota: Después de cada failover/failback, RapidDR actualiza algunos parámetros en el plan de configuración.

Test a failback

Para realizar esta prueba de failback previamente se debe haber realizado la prueba de failover con la misma configuración y los pasos a realizar son básicamente, los mismo que realizamos con el test de failover.

Lo que hace este test es probar la configuración de recuperación de las VMs en el site principal con ello lo que conseguimos es asegurarnos que el proceso de ejecución de recuperación de fallos se ejecute sin problemas. Durante la prueba, las máquinas virtuales configuradas se migran desde la fuente de recuperación (site de recuperación anterior) al destino de recuperación (site principal antiguo). RapidDR también permite eliminar las máquinas virtuales del destino de Failback (antiguo site principal) después de que el Failback se realice correctamente.

Procedimiento

Dicho procedimiento se compone de los mismos pasos que el Test Failover, pero a la inversa ya que sería para volver a levantar las VMs en el site principal tal como hemos comentado en el párrafo anterior. Por eso mismo no vamos a volver a poner los pasos que hay que seguir, ya que nos podemos apoyar en el apartado anterior.

Ejecutar un Failover usando VMWare

Ejecutaremos un Failover plan con la configuración previamente creada cuando ocurra un desastre en el site principal. Para ello haremos doble clic en el icono RapidDR, entraremos en la pestaña “Ejecutar Failover Plan” y cargaremos el archivo de la configuración que previamente hemos creado para comenzar con la ejecución.

Nota:  En cualquier momento durante este procedimiento, podremos hacer clic en Cancelar para cancelar la operación.

Tabla: Configuración del origen

Source Site Status: Muestra el estado de disponibilidad del sitio de origen.

Shutdown VMs: Si seleccionamos esta casilla, diremos al sistema que apague las máquinas virtuales configuradas antes de comenzar el proceso de recuperación.

Backup VMs: Si seleccionamos esta casilla, diremos al sistema que haga una copia de seguridad de las máquinas virtuales configuradas antes de comenzar el proceso de recuperación. Al seleccionar esta opción, se deshabilitará la opción RPO.

RPO: RPO (Recovery Point Objective) es la cantidad de tiempo que ha pasado desde que se ha hecho el último backup. El valor mínimo de RPO admitido es de 5 minutos.

Tabla: Configuración de recuperación

Use source site network settings: Usar la configuración de red del site principal. Seleccionamos la casilla de verificación para omitir la configuración de red y usar la configuración de red de los backups que se tienen de la máquina virtual.

Nota: Esta opción solo es aplicable a las máquinas virtuales de Windows configuradas con DHCP.

Acciones de error: Aquí lo que se selecciona es lo qué debe hacer RapidDR cuando la recuperación de una máquina virtual falla por un error.

  • Reintentar una vez y omitir: si falla la recuperación de una máquina virtual, RapidDR intenta recuperar la máquina virtual una vez más antes de proceder con la recuperación de otras máquinas virtuales en el plan de recuperación.
  • Reintentar una vez y cancelar: si la recuperación de una máquina virtual falla, RapidDR intenta recuperar la máquina virtual una vez más y si la recuperación de la máquina virtual falla, aborta toda la operación de recuperación.
  • Omitir y continuar: si falla la recuperación de una máquina virtual, RapidDR continúa con la recuperación de otras máquinas virtuales.
  • Abortar recuperación: RapidDR cancela toda la operación de recuperación si hay algún fallo.

Una vez seleccionada la opción elegida pasamos a la pestaña de validación. En dicha pestaña lo que haremos será comprobar la inconsistencia entre el archivo de configuración de recuperación y el sitio de recuperación; si no queremos validarlo, podemos saltarnos este paso.

Los atributos que se validan son los mismos que en el test: Recursos, ubicaciones de inventario, Grupos de puertos, nombres de máquinas virtuales y backups válidos.

Una vez completada la validación, la revisamos, si está todo correcto pasamos a la siguiente pestaña y sino, hacemos clic en “Atrás” para volver a las páginas anteriores y realizar las modificaciones correspondientes.

En la siguiente pestaña lo que se hará es apagar y hacer los Backup de las VMs, si previamente lo hemos seleccionado en la primera pestaña. 

La página Execute Failover: Recovery enumera cada máquina virtual, su nivel de prioridad, y el estado de recuperación actual.

Un contador en la parte inferior de la pantalla muestra el progreso general; la cantidad de máquinas virtuales procesadas y la cantidad total de máquinas virtuales en la recuperación.

Si nos aparece algún error, realizaremos los mismos que nos encontramos en el Test:

  1. La columna Reintentar nos sirve para identificar la máquina virtual que falló en el proceso de restauración. El botón Reintentar está habilitado en las máquinas virtuales fallidas.
  2. Haga clic en Reintentar después de haber resuelto el problema fuera de RapidDR o en el botón de las máquinas virtuales fallidas para volver a intentar la recuperación de todas las máquinas virtuales que fallaron a la vez.

Nota: RapidDR inicia la recuperación de todas las máquinas virtuales en el plan y muestra el progreso.

Resumen de la ejecución

Una vez completada la recuperación de todas las máquinas virtuales, al hacer clic en Siguiente, Aparece la pantalla un resumen con la info de las máquinas virtuales que se recuperaron con éxito, el tiempo necesario para recuperar cada máquina virtual y otros detalles.

Podemos exportar el Informe en formato Excel, y pdf. El informe de auditoría captura los detalles del plan junto con los detalles de ejecución paso a paso para cada VM.

Nota: Después de cada failover/failback, RapidDR actualiza algunos parámetros en el plan de configuración.

Ejecutar un Failback

Aunque parece una obviedad, para realizar un Failback previamente debemos haber realizado un failover. Los pasos a seguir son básicamente los mismo que nos encontramos en el Failover simplemente que el site principal en este caso será el site de réplica y el site de Recovery será el Site principal, por lo que los pasos serían cargar la configuración que creamos para ello seleccionar una de las opciones sobre cómo quieres que actúe el software RapidDR en caso de encontrar algún error en una VM, yo siempre selecciono la primera opción “Reintentar una vez y omitir”, en la siguiente pestaña validamos que todo esté correcto y en la siguiente pestaña comienza el proceso de levantamiento de las maquinas de nuevo en el site principal.

Una vez que se realiza el levantamiento de cada una de las VM del plan de failover, nos aparecerá la pestaña con la información y el tiempo que a tardado en levantar cada una de las VM y la opción de exportar el archivo exactamente igual que en el plan de ejecutar el Failover.

Así de simple es usar RapidDR! Espero que os haya resultado interesante y… nos vemos en el siguiente!!!

Comparte este artículo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *