Transformando contratempos em pontos fortes: Como o ISD da Spring Branch criou resiliência com a Pure Storage e a Veeam

Uma interrupção não planejada proporcionou uma oportunidade de aprendizado valiosa para um distrito escolar de Houston. Troy Neal, diretor executivo de segurança cibernética e tecnologia, compartilha sua experiência.

Spring Branch ISD

Resumo

Spring Branch Independent School District in Houston experienced an unplanned outage. Preparation and planning were key to their recovery, as well as the integrated Pure Storage and Veeam solutions, which enabled them to restore large amounts of data quickly and efficiently. 

image_pdfimage_print

Não há nada divertido em lidar com uma interrupção não planejada. Mas, se você está procurando um revestimento prateado e é um distrito escolar independente, então uma sexta-feira durante o verão é o melhor cenário. 

Quando uma atualização de software de terceiros criou interrupções globais generalizadas, agradeci às minhas estrelas da sorte: A escola estava fora, então houve um impacto mínimo para alunos, professores e funcionários no Spring Branch Independent School District (ISD) em Houston. Mas o que aconteceu depois foi o resultado da preparação e do planejamento.

Uma das muitas responsabilidades da minha equipe é fazer backup de todas as cargas de trabalho essenciais do ISD da Spring Branch para a Pure Storage. Isso inclui ERP, informações de alunos e sistemas telefônicos, bem como servidores SQL e vários aplicativos específicos para educação, além de dados de 50.000 usuários e 100.000 dispositivos. A interrupção afetou muitas das máquinas virtuais Hyper-V do distrito, que não conseguimos restaurar usando as instruções de recuperação do fornecedor de software. 

Então, recorremos aos backups Veeam da noite anterior na Pure Storage para restaurar as operações rapidamente. A forte parceria e integração entre a Pure Storage e a Veeam foi um fator essencial na nossa capacidade de recuperação em apenas um fim de semana, quando outras organizações ficaram inativas por dias. Também foi uma boa oportunidade para praticarmos e aprimorarmos nosso plano de resiliência cibernética para futuros incidentes que poderiam ocorrer durante o ano letivo, quando o tempo de inatividade mais longo é problemático.

Tivemos vários aprendizados e lições importantes para reduzir riscos, proteger dados e permitir proteção de dados sempre ativa para operações ininterruptas. 

1. Backups de qualidade são essenciais para a recuperação

Muitas vezes, os backups são negligenciados ou considerados secundários até que seja tarde demais. Juntamente com a fadiga de alertas, 54%1 dos alertas não são investigados pelas equipes de segurança em um determinado dia, fica muito claro por que os backups são uma solução para a recuperação. Sem eles, o que pode ser um pequeno contratempo pode rapidamente se transformar em uma crise completa.

O ISD da filial da primavera usa o FlashBlade® da Pure Storage® como repositório primário de backups da Veeam. Esses backups são então copiados para o FlashArray//C (Pure Storage FlashArray, localizado no local de recuperação de desastres do distrito. FlashArray//C Os backups são protegidos com snapshots do SafeMode . Pure Storage Além de permitir restauração rápida, o FlashBlade e a Veeam protegem as versões bloqueadas de objetos de acordo com os requisitos regulatórios e de privacidade para informações de identificação pessoal (PII, Personally Identifiable Information).

As soluções integradas Pure Storage e Veeam restauraram grandes quantidades de dados, 80 terabytes, de maneira rápida e eficiente, destacando o melhor desempenho em relação à nossa solução de armazenamento de backup anterior. 

De acordo com meu colega Ben Allen, engenheiro-chefe de sistemas, segurança cibernética e operações: “Eu apostaria na minha carreira e reputação na Pure Storage com a Veeam. Juntos, eles superaram nossas expectativas em todas as frentes: desempenho, resiliência e simplicidade.” 

2. Colaboração e treinamento cruzados são essenciais

As interrupções não afetam apenas um departamento, mas afetam toda a organização. De equipes de TI ao atendimento ao cliente, todos têm um papel no gerenciamento dos erros. Essa interrupção foi um exemplo perfeito de por que a colaboração cruzada não é uma boa opção, mas uma necessidade. 

Para conseguir isso, trabalho para promover a colaboração entre as equipes de infraestrutura e cibersegurança, ambas as quais lidero. Também priorizo a propriedade e o treinamento de sistemas e aplicativos para a equipe que lida com dados de PII como parte de um plano mais amplo de resposta a incidentes. O acesso não autorizado às PII pode ter consequências graves para a pessoa cujas informações foram comprometidas, bem como para nossa organização. A segurança cibernética integrada da Pure Storage nos ajuda a cumprir os requisitos legais para proteger PII.

Criar um ambiente para aprendizagem da equipe também é essencial para uma resposta rápida. Por exemplo, Allen estava a duas horas de distância quando a interrupção atingiu o ISD da filial da primavera. Embora ele seja o principal líder em backups de armazenamento, a equipe conseguiu intervir sem hesitação, pois todos na equipe de TI podem usar a Pure Storage e a Veeam. O treinamento cruzado garante que ninguém seja o único responsável por tarefas críticas e que não haja um único ponto de falha do ponto de vista humano.

Como resultado, minhas equipes conseguiram se comunicar sem problemas durante o incidente, compartilhar recursos e tomar decisões rápidas juntas para colocar os sistemas de volta online.  

3. Erro humano sempre será um fator 

Apesar de toda a tecnologia, os sistemas e os processos em vigor, o fator humano continua sendo uma preocupação significativa. Isso é particularmente verdadeiro para funcionários que podem comprometer inadvertidamente a segurança por e-mails de phishing ou senhas reutilizadas. O distrito emprega ferramentas de gerenciamento de identidade e processos rigorosos para mitigar esses riscos, mas o elemento humano continua sendo nosso maior desafio.

É aqui que o SafeMode da Pure Storage realmente brilha. Ela reduz os riscos e protege os dados contra ameaças cibernéticas, incluindo erro humano, além de ser fundamental para nossa estratégia de backup e recuperação.

Criar uma cultura que antecipe erros e planeje para eles pode fazer toda a diferença ao transformar um grande erro em um pequeno contratempo. No final, as pessoas cometem erros, mas as organizações que planejam se recuperar mais rapidamente e com mais força.

De um infortúnio para o próximo, e de volta aos negócios como de costume

Uma interrupção não planejada pode parecer o fim do mundo, mas não precisa ser. Ao se concentrar em backups de qualidade, incentivar a colaboração cruzada e se preparar para erros humanos, organizações como a nossa podem transformar um possível desastre em uma experiência de aprendizado valiosa. Não se trata apenas de corrigir o problema em questão, mas de criar sistemas e culturas fortes o suficiente para se recuperar, não importa o que vem a seguir.

Para nós, o próximo passo foi o furacão Beryl. Felizmente, conseguimos enfrentar a tempestade com base nas lições que aprendemos com a interrupção. Se isso acontecesse hoje, teríamos certeza de que poderíamos restaurar 80 terabytes de dados em apenas algumas horas.  

Além da economia de tempo e da confiabilidade da plataforma da Pure Storage, quando se trata de negócios como de costume, nossa equipe não passa mais tempo solucionando problemas de armazenamento como fazíamos com nosso provedor anterior. A natureza de configurar e esquecer da Pure Storage nos permite focar em outras tarefas, e o excelente suporte da equipe da Pure melhorou ainda mais nossa experiência. Além disso, graças ao modelo de assinatura Evergreen®, prevemos uma economia de até 30% em comparação com o fornecedor de armazenamento anterior do distrito. 

A Pure Storage nos oferece o melhor de todos os mundos, uma arquitetura resiliente e econômica que nos permite recuperar rapidamente, se necessário, enquanto simplificamos muito nossas operações. Temos tranquilidade sabendo que podemos oferecer um ambiente de aprendizagem seguro e contínuo, onde nossos alunos possam se destacar.

 Pesquisa 1451: Voz da empresa: Análise de segurança e SecOps 2023