Resumen
Spring Branch Independent School District in Houston experienced an unplanned outage. Preparation and planning were key to their recovery, as well as the integrated Pure Storage and Veeam solutions, which enabled them to restore large amounts of data quickly and efficiently.
No hay nada divertido sobre lidiar con una interrupción no planificada. Pero si está buscando una ventaja y es un distrito escolar independiente, entonces un viernes durante las vacaciones de verano es el mejor escenario.
Cuando una actualización de software de terceros creó interrupciones globales generalizadas, agradecí a mis afortunadas estrellas: La escuela estaba fuera, por lo que hubo un impacto mínimo para los estudiantes, los maestros y el personal en el Distrito Escolar Independiente (ISD) de Spring Branch en Houston. Pero lo que sucedió a continuación fue el resultado de la preparación y la planificación.
Una de las muchas responsabilidades de mi equipo es hacer una copia de seguridad de todas las cargas de trabajo críticas de Spring Branch ISD para Pure Storage. Estos incluyen ERP, información de estudiantes y sistemas telefónicos, así como servidores SQL y varias aplicaciones específicas para la educación, y datos de 50 000 usuarios y 100 000 dispositivos. La interrupción afectó a muchas de las máquinas virtuales Hyper-V del distrito, que no pudimos restaurar utilizando las instrucciones de recuperación del proveedor de software.
Por lo tanto, recurrimos a las copias de seguridad de Veeam de la noche anterior en Pure Storage para restaurar las operaciones rápidamente. La fuerte asociación e integración entre Pure Storage y Veeam fue un factor clave en nuestra capacidad de recuperarnos en solo un fin de semana, cuando otras organizaciones estuvieron inactivas durante días. También fue una buena oportunidad para que practiquemos y perfeccionemos nuestro plan de resiliencia cibernética para incidentes futuros que podrían ocurrir durante el año escolar, cuando el tiempo de inactividad más prolongado es problemático.
Tuvimos varias conclusiones y lecciones clave aprendidas para mitigar los riesgos, proteger los datos y permitir la protección de datos siempre activa para operaciones ininterrumpidas.
1. Las copias de seguridad de calidad son clave para la recuperación
Con demasiada frecuencia, las copias de seguridad se pasan por alto o se consideran secundarias hasta que es demasiado tarde. Junto con la fatiga de las alertas, el 54 %1 de las alertas no son investigadas por los equipos de seguridad en un día determinado, queda muy claro por qué las copias de seguridad son un salvavidas para la recuperación. Sin ellos, lo que podría ser un revés menor puede convertirse rápidamente en una crisis completa.
El ISD de Spring Branch utiliza Pure Storage® FlashBlade® como el repositorio de copia de seguridad primario para las copias de seguridad de Veeam. Estas copias de seguridad luego se copian a Pure Storage FlashArray//C™, que se encuentra en el sitio de recuperación ante desastres del distrito. Las copias de seguridad están protegidas con snapshots SafeMode de Pure Storage inmutables e indelebles. Además de permitir una restauración rápida, FlashBlade y Veeam protegen las versiones bloqueadas de objetos de acuerdo con los requisitos regulatorios y de privacidad para la información de identificación personal (PII).
Las soluciones integradas de Pure Storage y Veeam restauraron grandes cantidades de datos, 80 terabytes, de manera rápida y eficiente, lo que destaca el rendimiento mejorado en comparación con nuestra solución de almacenamiento de copia de seguridad anterior.
Según mi colega Ben Allen, ingeniero principal de sistemas, Ciberseguridad y Operaciones: “Estaría en juego mi carrera y reputación en Pure Storage con Veeam. Juntos superaron nuestras expectativas en todos los frentes: rendimiento, resistencia y sencillez”.
2. La colaboración cruzada y la capacitación son fundamentales
Las interrupciones no solo afectan a un departamento, sino que afectan a toda la organización. Desde los equipos de TI hasta el servicio al cliente, todos tienen un rol en la administración de las consecuencias. Esta interrupción fue un ejemplo perfecto de por qué la colaboración cruzada no es algo bueno, sino imprescindible.
Para lograr esto, trabajo para fomentar la colaboración entre los equipos de infraestructura y ciberseguridad, los cuales dirijo. También priorizo la propiedad y capacitación del sistema y la aplicación para el personal que maneja datos de PII como parte de un plan de respuesta a incidentes más amplio. El acceso no autorizado a la PII puede tener consecuencias graves para la persona cuya información se vio comprometida, así como para nuestra organización. La ciberseguridad incorporada de Pure Storage nos ayuda a cumplir con los requisitos legales para proteger la PII.
Crear un entorno para el aprendizaje del personal también es clave para una respuesta rápida. Por ejemplo, Allen estaba a dos horas de distancia cuando la interrupción afectó el distrito escolar independiente de Spring Branch. Aunque es el líder principal de las copias de seguridad de almacenamiento, el equipo pudo intervenir sin dudarlo porque todos los miembros del equipo de TI pueden usar Pure Storage y Veeam. La capacitación cruzada garantiza que ninguna persona sea la única responsable de las tareas críticas y que no haya un único punto de falla desde una perspectiva humana.
Como resultado, mis equipos pudieron comunicarse sin problemas durante el incidente, compartir recursos y tomar decisiones rápidas para volver a conectar los sistemas.
3. El error humano siempre será un factor
A pesar de toda la tecnología, los sistemas y los procesos implementados, el factor humano sigue siendo una preocupación significativa. Esto es particularmente cierto para el personal que puede comprometer inadvertidamente la seguridad a través de correos electrónicos de phishing o contraseñas reutilizadas. El distrito emplea herramientas de administración de identidad y procesos estrictos para mitigar estos riesgos, pero el elemento humano sigue siendo nuestro mayor desafío.
Aquí es donde SafeMode de Pure Storage realmente brilla. Mitiga el riesgo y protege los datos de amenazas cibernéticas, incluido el error humano, y es fundamental para nuestra estrategia de copia de seguridad y recuperación.
Crear una cultura que anticipe errores y planifique para ellos puede marcar la diferencia en convertir un error importante en un contratiempo menor. Al final, las personas cometen errores, pero las organizaciones que los planifican se recuperan de manera más rápida y fuerte.
De una desgracia a la siguiente y de vuelta a la normalidad
Una interrupción no planificada puede parecer el fin del mundo, pero no tiene por qué ser así. Al enfocarse en copias de seguridad de calidad, fomentar la colaboración cruzada y prepararse para el error humano, organizaciones como la nuestra pueden convertir un desastre potencial en una experiencia de aprendizaje valiosa. No se trata solo de solucionar el problema en cuestión, se trata de construir sistemas y culturas que sean lo suficientemente fuertes como para recuperarse, independientemente de lo que suceda.
Para nosotros, lo siguiente fue el huracán Beryl. Afortunadamente, pudimos sobrellevar la tormenta en función de las lecciones que aprendimos de la interrupción. Si esto sucediera hoy, estamos seguros de que podríamos restaurar 80 terabytes de datos en solo unas horas.
Además del ahorro de tiempo y la confiabilidad de la plataforma de Pure Storage, cuando se trata de negocios como de costumbre, nuestro equipo ya no pasa tiempo solucionando problemas de almacenamiento como lo hicimos con nuestro proveedor anterior. La naturaleza de configurarlo y olvidarlo de Pure Storage nos permite enfocarnos en otras tareas, y la excelente asistencia del equipo de Pure ha mejorado aún más nuestra experiencia. Además, gracias al modelo de suscripción a Evergreen®, prevemos ahorros en costos de hasta un 30 % en comparación con el proveedor de almacenamiento anterior del distrito.
Pure Storage nos ofrece lo mejor de todos los mundos: una arquitectura rentable y resistente que nos permite recuperarnos rápidamente si es necesario y, al mismo tiempo, simplificar en gran medida nuestras operaciones. Tenemos la tranquilidad de saber que podemos ofrecer un entorno de aprendizaje seguro y continuo donde nuestros estudiantes puedan sobresalir.
1451 Investigación: Voz de la empresa: Análisis de seguridad y SecOps 2023
Explore FlashBlade
Take a free test drive.