Automatización de la Recuperación de Desastres para FlashArray de Pure Storage y Pure Cloud Block Store con JetStream DR

Este artículo analiza cómo automatizar la recuperación de desastres desde un entorno VMware local con FlashArray hasta Azure VMware Solution con Pure Cloud Block Store y JetStream DR.


Resumen

Cloud-based disaster recovery can offer many advantages for organizations. Leveraging FlashArray and Pure Cloud Block Store in your hybrid cloud strategy delivers intelligent data management features, improves storage efficiency, and can save you money.   

image_pdfimage_print

Actualmente, los clientes buscan cada vez más una manera de implementar de manera fácil y efectiva la recuperación de desastres (DR) y la continuidad operativa de su infraestructura local. La nube pública podría ser una de las soluciones. Hay varias razones convincentes para ello, entre ellas:

Eficiencia en cuanto a costes: 

Las soluciones de DR basadas en la nube suelen ser más rentables que el mantenimiento de un centro de datos secundario. Los clientes solo pagan por los recursos cuando son necesarios, como durante una conmutación por error o una prueba de DR ante desastres.

Escalabilidad y flexibilidad

La nube permite que las empresas aprovisionen recursos rápidamente según sea necesario. Esto es especialmente útil para la recuperación de desastres, lo que permite una rápida puesta en marcha de la infraestructura en respuesta a una interrupción o un desastre.

Recuperación de Desastres 

Las siguientes funcionalidades de la nube pueden ayudar a optimizar los esfuerzos de recuperación de desastres: 

  • Redundancia geográfica: Los proveedores de nube pública tienen centros de datos repartidos por varias regiones a nivel mundial. Los clientes pueden replicar sus cargas de trabajo en ubicaciones geográficamente distantes, garantizando la continuidad operativa y protegiendo frente a desastres regionales.
  • Automatización y orquestación: Muchas soluciones de DR ante desastres basadas en la nube ofrecen conmutación por error y devolución automatizadas, lo que reduce los tiempos de inactividad y simplifica los procesos de recuperación de desastres.
  • Prueba: Los entornos de nube pública facilitan la realización de pruebas periódicas de los planes de DR ante desastres sin interrumpir los entornos de producción, lo que garantiza que los sistemas funcionan cuando más se necesitan.

En este artículo, mostraremos otros beneficios y ventajas de la DR desastres basada en la nube, es decir, la implementación de una estrategia de nube híbrida. Utilizaremos la infraestructura VMware local existente con FlashArray de Pure Storage® y la Azure VMware Solution (AVS) con Pure Cloud Block Store como centro de datos en la nube de destino. La orquestación y la automatización de la recuperación de desastres se proporcionarán usando la solución JetStream DR.

Otros beneficios además de los mencionados anteriormente son:

Gestión unificada en todos los entornos

FlashArray y Pure Cloud Block Store utilizan el entorno operativo Purity y se gestionan a través de Pure1®, que proporciona una plataforma de gestión unificada en los entornos locales de FlashArray y Pure Cloud Block Store. Esto simplifica la administración del almacenamiento, ya que los equipos de TI pueden supervisar, administrar y optimizar los recursos de almacenamiento desde un único panel, ya sea en la nube o localmente.

Azure VMware Solution ofrece integración con las herramientas de gestión de VMware familiares (vCenter, vSphere, NSX, etc.), lo que permite que los equipos informáticos sigan usando las plataformas que conocen y se beneficien de la escalabilidad de la nube.

Estrategia de Hybrid Cloud

Una estrategia de nube híbrida ofrece las siguientes ventajas:

  • Movilidad de datos fluida: Pure Cloud Block Store está diseñado para proporcionar una experiencia de almacenamiento homogénea entre FlashArray local y los entornos de nube (por ejemplo, Azure o AWS). Esto permite que los clientes muevan sin problemas las aplicaciones y los datos entre entornos híbridos sin necesidad de refactorizarlos, lo que permite una implementación real de la nube híbrida.
  • Casos de uso de la nube híbrida: Puede utilizar Pure Cloud Block Store para la recuperación de desastres, entornos dev/test, ráfagas en la nube y más. Al replicar los datos entre FlashArray y Pure Cloud Block Store, puede estar seguro de que las cargas de trabajo críticas pueden pasarse a la nube si es necesario.
  • Replicación en entornos híbridos: Pure Storage admite la replicación entre los sistemas FlashArray y Pure Cloud Block Store, lo que permite estrategias de protección de datos que abarcan tanto los entornos locales como los de la nube. Por ejemplo, puede replicar sus datos de producción desde una FlashArray local hasta Pure Cloud Block Store para la recuperación de desastres.
  • Recuperación de desastres basada en la nube: Pure Cloud Block Store le permite aprovechar las ventajas económicas de la nube para la recuperación de desastres, usando la nube como sitio de DR de desastres rentable. Puede pasarse a Pure Cloud Block Store en caso de que se produzca un fallo local y volver a fallar cuando sea necesario.

Orquestación y automatización de DR

En nuestro entorno, usaremos JetStream DR. Es una aplicación de software diseñada para permitir las capacidades de DR ante desastres para las máquinas virtuales y sus datos. El software se instala en un entorno VMware vSphere, desde el que replica continuamente los datos en un segundo entorno (local o en la nube). En caso de interrupción del funcionamiento normal de las máquinas virtuales en el entorno primario, las máquinas virtuales y sus datos pueden pasarse al entorno secundario para continuar su funcionamiento con una pérdida de datos mínima. Además, una vez restaurado el sitio primario, las máquinas virtuales pueden devolverse del sitio secundario al sitio primario sin ninguna pérdida de datos y con un tiempo de inactividad de unos minutos.

Para nuestra configuración, configuraremos JetStream DR para que se replique desde un centro de datos local con FlashArray de Pure Storage a un almacén de objetos en la nube (Azure Blob Storage) y un centro de datos en la nube (Azure VMware Solution) con Pure Cloud Block Store. JetStream replica las máquinas virtuales y los datos en blobs y los recursos de computación (hosts) pueden asignarse bajo demanda en caso de conmutación por error.

En caso de que se produzca un incidente en el centro de datos local, las máquinas virtuales y sus datos pueden rehidratarse y reanudar el funcionamiento en el entorno AVS. Mientras las máquinas virtuales se ejecutan en el entorno de recuperación, siguen replicando los datos en el almacén de objetos. Una vez restaurado el centro de datos local, las máquinas virtuales y sus datos (incluidos los nuevos datos generados por las máquinas virtuales en el centro de datos en la nube) pueden volver a su centro de datos original.
La combinación de Pure Cloud Block Store y los blobs de almacenamiento proporciona la solución RPO y RTO DR casi cero optimizada para los costes. Los recursos más caros —anfitriones AVS— pueden asignarse bajo demanda. Esta es la manera de desacoplar los recursos de computación y almacenamiento para lograr el mejor uso de los recursos.

recuperación tras desastres
Figura 1: JetStream DR con FlashArray de Pure Storage y Pure Cloud Block Store.

Configuración local

Se supone que el sitio protegido incluye uno o más clústeres basados en vSphere en los que se ejecutan los siguientes componentes:

  • Dispositivo de Servidor vCenter (VCSA)
  • Dispositivo de servidor de administración (MSA) de JetStream DR
  • Dispositivos Virtuales (DRVA) de JetStream DR (como mínimo uno; si son múltiples, hasta uno por host vSphere)
  • servidores anfitriones vSphere
  • Un dispositivo de almacenamiento flash compartido de baja latencia. Se utiliza como repositorio para el registro de replicación y para proporcionar almacenes de datos a máquinas virtuales.

La latencia del registro de replicación es importante para el rendimiento de las aplicaciones. De lo contrario, la DR puede afectar negativamente al rendimiento. El uso de FlashArray de Pure Storage es la mejor opción desde el punto de vista del rendimiento y la relación precio-rendimiento.

El MSA se distribuye como un archivo OVA y permite la instalación y el registro del complemento de servidor vCenter después de la implementación.

DR de JetStream
Figura 2: Complemento de servidor vCenter de JetStream.

Configuración de la nube

Para el entorno AVS, podemos tener las siguientes opciones de despliegue:

  1. We can have an AVS environment up and running in advance. In this case, you have to configure JetStream appliances (MSA and DRVA) the same way as we did with on-premises vSphere. With a running and properly configured AVS environment, you’re able to lower the recovery time objective (RTO) to a minimum because you shorten the time required for AVS deployment and configuration. However, it’s more expensive because you’re paying for allocated resources in Azure.

    We don’t need to have all hosts in the cluster; we can have an AVS pilot-light cluster (three nodes are the minimum) only to minimize costs. Other hosts can be allocated and added on demand later when failover occurs or when there’s a need for more compute power. 

    With AVS pilot-light cluster, we can: 
    • Utilice Pure Cloud Block Store para almacenar solo máquinas virtuales de misión crítica y blobs para el resto. Las máquinas virtuales de misión crítica fallarán en minutos; los datos de las máquinas virtuales que no sean de misión crítica se rehidratarán del blob de acuerdo con su SLA/RTO. Esta combinación de Pure Cloud Block Store y blobs proporciona la solución RPO y RTO DR casi cero optimizada para los costes.
    • Tenga todos los datos de las máquinas virtuales almacenados en Pure Cloud Block Store, para que no sea necesario ningún proceso de rehidratación.
  2. No tiene ningún entorno AVS en funcionamiento (todo se asignará bajo demanda en caso de conmutación por error). Se trata de una solución rentable, pero con un objetivo de tiempo de recuperación (RTO) más alto. En este caso, cuando se produce un desastre en el sitio principal, tiene que desplegar y configurar AVS primero, instalar dispositivos JetStream (MSA y DRVA), conectar Azure Blob Storage y luego puede restaurar sus cargas de trabajo protegidas. En este caso, todos los datos deben rehidratarse. La combinación de vSAN y Pure Cloud Block Store permite el desacoplamiento de la computación y el almacenamiento y reduce el tiempo de rehidratación usando tanto vSAN como Pure Storage simultáneamente.

En nuestra configuración, usaremos Azure Blob Storage como destino de replicación y Azure VMware Solution (AVS) con Pure Cloud Block Store como sitio de recuperación para la conmutación por error. Azure Blob Storage tiene que configurarse con antelación porque todos los datos de las máquinas virtuales locales protegidas se replican y almacenan aquí. 

¿Cuáles son las ventajas de Pure Cloud Block Store aquí?

AVS es una infraestructura hiperconvergente construida sobre servidores bare metal de Azure. VMware vSAN se utiliza como almacenamiento primario aquí. Esto significa que si quiere aumentar su capacidad de almacenamiento, tiene que añadir más nodos (servidores barre metal) en el clúster. Esto puede provocar ineficiencia y convertirse en una solución muy cara, sobre todo si necesita mucho almacenamiento y no necesita demasiada CPU o RAM.

Pure Cloud Block Store separa el almacenamiento de AVS y permite una gestión independiente del espacio ocupado por el almacenamiento, combinada con una reducción de datos y unos servicios de almacenamiento de nivel empresarial líderes en el sector. Los datos de Pure Cloud Block Store son de aprovisionamiento fino, comprimidos y deduplicados. Esto puede ayudarle a reducir significativamente los costes de almacenamiento de Azure en lugar de añadir caros nodos AVS.

recuperación tras desastres
Figura 3: GUI de administración de Pure Cloud Block Store.

Protección de máquinas virtuales y datos

Una vez configurado JetStream DR, el proceso de protección de las máquinas virtuales y sus datos es rápido y sencillo. La tarea puede realizarse directamente a través de la interfaz de usuario o automatizarse con scripts usando las herramientas proporcionadas por el software JetStream.

La replicación de datos desde el sitio protegido hasta el almacén de objetos es un proceso continuo. Cuando se inicia inicialmente la protección, los datos actuales de las máquinas virtuales se copian en un almacén de objetos en el sitio de almacenamiento (las máquinas virtuales seguirán funcionando normalmente sin interrupciones durante este proceso de replicación inicial). Una vez completada la replicación inicial, el estado de la máquina virtual cambiará a “recuperable” y, a partir de ese momento, todos los datos nuevos escritos por las máquinas virtuales en el almacenamiento primario se copian de manera automática y continua en el almacén de objetos para su protección. La actividad de este proceso puede observarse en el gráfico “Tasa de datos entrantes y salientes” de la pestaña Estadísticas.

DR de JetStream
Figura 4: Estadísticas de replicación de JetStream DR.

Con la replicación continua, el almacenamiento de objetos puede usarse para la recuperación de granularidad de minutos punto en tiempo, ya que JetStream replica los datos continuamente. Esto es importante para la recuperación de las máquinas virtuales de misión crítica después de los ataques de ransomware con una pérdida de datos mínima.

Conmutación por error al sitio de recuperación

En ciertos tipos de incidentes de desastre, el sitio principal puede quedar temporal o incluso permanentemente inutilizable. En este caso, JetStream DR puede usarse para recuperar los dominios afectados en un sitio de recuperación.

JetStream también le permite ejecutar una conmutación por error de prueba. Una conmutación por error de prueba funciona como una conmutación por error real, con algunas diferencias clave:

  • Las máquinas virtuales seguirán funcionando en el entorno protegido, por lo que no habrá interrupciones en su funcionamiento o protección normales en curso.
  • Durante las pruebas, los datos se replican en todo el sistema como lo haría con la conmutación por error normal; sin embargo, la propiedad del dominio protegido nunca pasa al sitio de recuperación. Además, las máquinas virtuales y los datos de prueba se eliminarán del sistema al finalizar la prueba.

Otra característica interesante de Jetstream es la recuperación puntual (PITR), que permite recuperar, probar y luego restaurar las máquinas virtuales y los datos de un momento concreto del pasado (último punto de «bienestar conocido»). Esta función está configurada por dominio protegido, lo que permite que sus máquinas virtuales y datos se restablezcan a un punto anterior en el tiempo dentro de una ventana de protección especificada por el usuario. Podemos usar el almacenamiento de objetos como una «cinta» que se mueve hacia delante y hacia atrás en el tiempo varias veces. La recuperación PITR es rápida, ya que JetStream solo recupera deltas.

Devolución

Una vez reparado el sitio primario y preparado para su funcionamiento, puede realizar fácilmente la conmutación por error desde el sitio de recuperación. Para la operación de conmutación por error, puede ser necesario volver a implementar y registrar el dispositivo de servidor de administración (MSA) de JetStream DR en el sitio principal, volver a implementar y reconfigurar los dispositivos virtuales (DRVA) de JetStream DR y conectar el sitio a la cuenta de almacenamiento en la nube. 

Si la infraestructura de DR ante desastres ya existe, la conmutación por error puede iniciarse inmediatamente. De lo contrario, primero tiene que escanear e importar el dominio protegido existente desde un almacenamiento blob en la nube conectado.

Figura 5: Análisis de JetStream DR para el dominio protegido.

Una vez que todo esté listo y configurado en el sitio principal, simplemente vaya a Dominio Protegido y seleccione Devolución.

recuperación tras desastres
Figura 6: Devolución de DR de JetStream.

Cuando se inicia la conmutación por error, el modo del dominio protegido cambia a «Retroceso en curso» y aparece una ventana emergente que realiza un seguimiento de cada paso del proceso.

DR de JetStream
Figura 7: Progreso de la recuperación ante fallos de JetStream DR.

Todas las máquinas virtuales del centro de recuperación remoto permanecen en funcionamiento sin interrupciones durante todo el proceso de recuperación. No se necesita ninguna intervención adicional del usuario para gestionar esas máquinas virtuales. Después de la conmutación por error correcta, las máquinas virtuales protegidas se reinician en el sitio principal. Las máquinas virtuales del centro de recuperación que ya no se utilicen se apagarán y eliminarán para liberar los recursos del sistema.

Conclusión

JetStream DR proporciona una solución excelente para la orquestación y automatización de la DR de máquinas virtuales que se ejecutan en VMware vSphere. Si no necesita los RTO más bajos para todas sus cargas de trabajo, puede ahorrar mucho dinero porque no necesita tener un centro de recuperación en funcionamiento con antelación. Simplemente puede replicar los datos en la cuenta de almacenamiento en la nube y activar el sitio de recuperación después de que se produzca el desastre.  

El uso de Pure Cloud Block Store como almacenamiento secundario para Azure VMware Solution (AVS) aporta otras ventajas. Pure Cloud Block Store mejora la eficiencia del almacenamiento y proporciona unas funciones de gestión de datos inteligentes. Tiene una excelente ratio de reducción de datos (DRR), que se realiza mediante tecnologías avanzadas de deduplicación y compresión de datos, lo que reduce la cantidad de datos almacenados físicamente. Esto tiene un impacto significativo en los costes del almacenamiento en la nube, porque no tiene que comprar caros nodos AVS para las cargas de trabajo que requieren un uso intensivo de almacenamiento. 

Pure Cloud Block Store ofrece un precio de pago por uso, lo que significa que solo se le cobra la cantidad exacta de almacenamiento que utiliza. Esto elimina los costes de sobreaprovisionamiento del almacenamiento. Otra cosa importante para la infraestructura de nube es que Pure Storage reduce los costes de salida de la red. Debido a nuestra ratio de reducción de datos, tenemos que mover menos datos entre regiones o entre la nube e infraestructura local.