Convertir los contratiempos en puntos fuertes: Cómo la ISD de la sucursal de primavera generó resiliencia con Pure Storage y Veeam

Una interrupción imprevista proporcionó una valiosa oportunidad de aprendizaje para un distrito escolar de Houston. Troy Neal, Director Ejecutivo de Ciberseguridad y Tecnología, comparte su experiencia.

Spring Branch ISD

Resumen

Spring Branch Independent School District in Houston experienced an unplanned outage. Preparation and planning were key to their recovery, as well as the integrated Pure Storage and Veeam solutions, which enabled them to restore large amounts of data quickly and efficiently. 

image_pdfimage_print

No hay nada divertido de hacer frente a una interrupción imprevista. Pero si está buscando un lado positivo y es un distrito escolar independiente, entonces un viernes durante las vacaciones de verano es el mejor escenario. 

Cuando una actualización de software de terceros generó interrupciones generalizadas en todo el mundo, agradecí a mis afortunadas estrellas: La escuela estaba fuera, por lo que hubo un impacto mínimo para los estudiantes, los profesores y el personal en el Distrito Escolar Independiente (ISD) de Spring Branch en Houston. Pero lo que sucedió a continuación fue el resultado de la preparación y la planificación.

Una de las muchas responsabilidades de mi equipo es realizar copias de seguridad de todas las cargas de trabajo críticas de Spring Branch ISD en Pure Storage. Estos incluyen ERP, información de estudiantes y sistemas telefónicos, así como servidores SQL y diversas aplicaciones específicas para la educación —y datos de 50.000 usuarios y 100.000 dispositivos—. La interrupción afectó a muchas de las máquinas virtuales Hyper-V del distrito, que no pudimos restaurar usando las instrucciones de recuperación del proveedor de software. 

Así que recurrimos a las copias de seguridad de Veeam de la noche anterior en Pure Storage para restaurar las operaciones rápidamente. La fuerte colaboración e integración entre Pure Storage y Veeam fue un factor clave en nuestra capacidad para recuperarnos en tan solo un fin de semana, cuando otras organizaciones estuvieron fuera de servicio durante días. También fue una buena oportunidad para practicar y perfeccionar nuestro plan de ciberresiliencia para futuros incidentes que podrían producirse durante el año escolar, cuando los periodos de inactividad más largos son problemáticos.

Hemos aprendido varias conclusiones y lecciones clave para mitigar los riesgos, proteger los datos y permitir una protección de datos constante para un funcionamiento ininterrumpido. 

1. Las copias de seguridad de calidad son clave para la recuperación

Con demasiada frecuencia, las copias de seguridad se pasan por alto o se consideran secundarias hasta que es demasiado tarde. Junto con la fatiga causada por las alertas —el 54%1 de las alertas no son investigadas por los equipos de seguridad en un día determinado—, queda muy claro por qué las copias de seguridad son un sustento para la recuperación. Sin ellos, lo que puede ser un pequeño contratiempo puede convertirse rápidamente en una crisis completa.

Spring Branch ISD utiliza FlashBlade® de Pure Storage® como repositorio de copias de seguridad principal para las copias de seguridad de Veeam. Estas copias de seguridad luego se copian en FlashArray//C™ de Pure Storage, que se encuentra en el sitio de recuperación de desastres del distrito. Las copias de seguridad están protegidas con las copias instantáneas SafeMode™ inmutables e indelebles de Pure Storage. Además de permitir una restauración rápida, FlashBlade y Veeam protegen las versiones bloqueadas de los objetos de acuerdo con los requisitos regulatorios y de privacidad de la información de identificación personal (PII).

Las soluciones integradas Pure Storage y Veeam han restaurado grandes cantidades de datos —80 terabytes— de manera rápida y eficiente, lo que pone de relieve el rendimiento mejorado de nuestra solución de almacenamiento de copias de seguridad anterior. 

Según mi compañero Ben Allen, Ingeniero Principal de Sistemas de Ciberseguridad y Operaciones: “Yo apostaría por mi carrera y reputación en Pure Storage con Veeam. Juntos superaron nuestras expectativas en todos los frentes: rendimiento, resiliencia y simplicidad”. 

2. La colaboración cruzada y la formación son fundamentales

Las interrupciones no solo afectan a un departamento, sino que afectan a toda la organización. Desde los equipos informáticos hasta el servicio de atención al cliente, todos tienen un papel en la gestión de las consecuencias. Esta interrupción fue un ejemplo perfecto de por qué la colaboración cruzada no es algo bueno, sino imprescindible. 

Para lograrlo, trabajo para fomentar la colaboración entre los equipos de infraestructura y ciberseguridad, que dirijo. También priorizo la propiedad y la formación del sistema y de las aplicaciones para el personal que maneja los datos de PII como parte de un plan de respuesta a incidentes más amplio. El acceso no autorizado a la PII puede tener graves consecuencias para la persona cuya información se ha visto comprometida, así como para nuestra organización. La ciberseguridad integrada de Pure Storage nos ayuda a cumplir los requisitos legales para proteger la PII.

Crear un entorno para el aprendizaje del personal también es clave para una respuesta rápida. Por ejemplo, Allen estaba a dos horas de distancia cuando la interrupción llegó a Spring Branch ISD. Aunque es el principal responsable de las copias de seguridad del almacenamiento, el equipo pudo intervenir sin dudarlo, porque todos los miembros del equipo informático pueden usar Pure Storage y Veeam. La formación cruzada garantiza que ninguna persona sea la única responsable de las tareas críticas y que no haya un único punto de fallo desde el punto de vista humano.

Como resultado, mis equipos pudieron comunicarse sin problemas durante el incidente, compartir recursos y tomar decisiones rápidas para volver a conectar los sistemas.  

3. El error humano siempre será un factor 

A pesar de toda la tecnología, los sistemas y los procesos implementados, el factor humano sigue siendo una preocupación importante. Esto es especialmente cierto en el caso del personal que puede comprometer inadvertidamente la seguridad mediante correos electrónicos de phishing o contraseñas reutilizadas. El distrito utiliza herramientas de gestión de la identidad y procesos estrictos para mitigar estos riesgos, pero el elemento humano sigue siendo nuestro mayor reto.

Aquí es donde SafeMode de Pure Storage realmente destaca. Reduce el riesgo y protege los datos de las ciberamenazas, incluidos los errores humanos, y es fundamental para nuestra estrategia de realización de copias de seguridad y recuperación.

Crear una cultura que anticipe los errores y los planes para ellos puede marcar la diferencia al convertir un error importante en un pequeño contratiempo. Al final, las personas cometen errores, pero las organizaciones que los planifican se recuperan más rápido y con más fuerza.

De una desgracia a la siguiente y de vuelta a la normalidad

Una interrupción imprevista puede parecer el fin del mundo, pero no tiene por qué serlo. Al centrarse en copias de seguridad de calidad, fomentar la colaboración cruzada y prepararse para los errores humanos, organizaciones como la nuestra pueden convertir un posible desastre en una experiencia de aprendizaje valiosa. No se trata solo de solucionar el problema en cuestión, sino de desarrollar sistemas y culturas lo suficientemente fuertes como para recuperarse, sin importar lo que venga a continuación.

Para nosotros, lo que vino a continuación fue el huracán Beryl. Afortunadamente, pudimos capear la tormenta basándonos en las lecciones que aprendimos de la interrupción. Si esto sucediera hoy, estamos seguros de que podríamos restaurar 80 terabytes de datos en solo unas horas.  

Además del ahorro de tiempo y la fiabilidad de la plataforma de Pure Storage, cuando se trata de operar como de costumbre, nuestro equipo ya no dedica tiempo a resolver problemas de almacenamiento como hicimos con nuestro proveedor anterior. La naturaleza de configurarlo y olvidarlo de Pure Storage nos permite centrarnos en otras tareas y el excelente soporte del equipo de Pure ha mejorado aún más nuestra experiencia. Además, gracias al modelo de suscripción Evergreen®, prevemos un ahorro de costes de hasta el 30% comparado con el proveedor de almacenamiento anterior del distrito. 

Pure Storage nos proporciona lo mejor de todos los mundos — una arquitectura rentable y resiliente que nos permite recuperarnos rápidamente si es necesario, simplificando al mismo tiempo enormemente nuestras operaciones. Tenemos la tranquilidad de saber que podemos proporcionar un entorno de aprendizaje seguro y continuo en el que nuestros estudiantes puedan destacar.

 1451 Estudio: Voz de la empresa: Análisis de seguridad y SecOps 2023