Não há nada divertido em lidar com uma interrupção não planejada. Mas, se você está procurando um revestimento prateado e é um distrito escolar independente, então uma sexta-feira durante o verão é o melhor cenário.
Quando uma atualização de software de terceiros criou interrupções globais generalizadas, agradeci às minhas estrelas da sorte: A escola estava fora, então houve um impacto mínimo para alunos, professores e funcionários no Spring Branch Independent School District (ISD) em Houston. Mas o que aconteceu depois foi o resultado da preparação e do planejamento.
Uma das muitas responsabilidades da minha equipe é fazer backup de todas as cargas de trabalho essenciais do ISD da Spring Branch para a Pure Storage. Isso inclui ERP, informações de alunos e sistemas telefônicos, bem como servidores SQL e vários aplicativos específicos para educação, além de dados de 50.000 usuários e 100.000 dispositivos. A interrupção afetou muitas das máquinas virtuais Hyper-V do distrito, que não conseguimos restaurar usando as instruções de recuperação do fornecedor de software.
Então, recorremos aos backups Veeam da noite anterior na Pure Storage para restaurar as operações rapidamente. A forte parceria e integração entre a Pure Storage e a Veeam foi um fator essencial na nossa capacidade de recuperação em apenas um fim de semana, quando outras organizações ficaram inativas por dias. Também foi uma boa oportunidade para praticarmos e aprimorarmos nosso plano de resiliência cibernética para futuros incidentes que poderiam ocorrer durante o ano letivo, quando o tempo de inatividade mais longo é problemático.
Tivemos vários aprendizados e lições importantes para reduzir riscos, proteger dados e permitir proteção de dados sempre ativa para operações ininterruptas.
1. Backups de qualidade são essenciais para a recuperação
Muitas vezes, os backups são negligenciados ou considerados secundários até que seja tarde demais. Juntamente com a fadiga de alertas, 54%1 dos alertas não são investigados pelas equipes de segurança em um determinado dia, fica muito claro por que os backups são uma solução para a recuperação. Sem eles, o que pode ser um pequeno contratempo pode rapidamente se transformar em uma crise completa.
O ISD da filial da primavera usa o FlashBlade® da Pure Storage® como repositório primário de backups da Veeam. Esses backups são então copiados para o FlashArray//C (Pure Storage FlashArray, localizado no local de recuperação de desastres do distrito. FlashArray//C Os backups são protegidos com snapshots do SafeMode . Pure Storage Além de permitir restauração rápida, o FlashBlade e a Veeam protegem as versões bloqueadas de objetos de acordo com os requisitos regulatórios e de privacidade para informações de identificação pessoal (PII, Personally Identifiable Information).
As soluções integradas Pure Storage e Veeam restauraram grandes quantidades de dados, 80 terabytes, de maneira rápida e eficiente, destacando o melhor desempenho em relação à nossa solução de armazenamento de backup anterior.
De acordo com meu colega Ben Allen, engenheiro-chefe de sistemas, segurança cibernética e operações: “Eu apostaria na minha carreira e reputação na Pure Storage com a Veeam. Juntos, eles superaram nossas expectativas em todas as frentes: desempenho, resiliência e simplicidade.”
2. Colaboração e treinamento cruzados são essenciais
As interrupções não afetam apenas um departamento, mas afetam toda a organização. De equipes de TI ao atendimento ao cliente, todos têm um papel no gerenciamento dos erros. Essa interrupção foi um exemplo perfeito de por que a colaboração cruzada não é uma boa opção, mas uma necessidade.
Para conseguir isso, trabalho para promover a colaboração entre as equipes de infraestrutura e cibersegurança, ambas as quais lidero. Também priorizo a propriedade e o treinamento de sistemas e aplicativos para a equipe que lida com dados de PII como parte de um plano mais amplo de resposta a incidentes. O acesso não autorizado às PII pode ter consequências graves para a pessoa cujas informações foram comprometidas, bem como para nossa organização. A segurança cibernética integrada da Pure Storage nos ajuda a cumprir os requisitos legais para proteger PII.
Criar um ambiente para aprendizagem da equipe também é essencial para uma resposta rápida. Por exemplo, Allen estava a duas horas de distância quando a interrupção atingiu o ISD da filial da primavera. Embora ele seja o principal líder em backups de armazenamento, a equipe conseguiu intervir sem hesitação, pois todos na equipe de TI podem usar a Pure Storage e a Veeam. O treinamento cruzado garante que ninguém seja o único responsável por tarefas críticas e que não haja um único ponto de falha do ponto de vista humano.
Como resultado, minhas equipes conseguiram se comunicar sem problemas durante o incidente, compartilhar recursos e tomar decisões rápidas juntas para colocar os sistemas de volta online.
3. Erro humano sempre será um fator
Apesar de toda a tecnologia, os sistemas e os processos em vigor, o fator humano continua sendo uma preocupação significativa. Isso é particularmente verdadeiro para funcionários que podem comprometer inadvertidamente a segurança por e-mails de phishing ou senhas reutilizadas. O distrito emprega ferramentas de gerenciamento de identidade e processos rigorosos para mitigar esses riscos, mas o elemento humano continua sendo nosso maior desafio.
É aqui que o SafeMode da Pure Storage realmente brilha. Ela reduz os riscos e protege os dados contra ameaças cibernéticas, incluindo erro humano, além de ser fundamental para nossa estratégia de backup e recuperação.
Criar uma cultura que antecipe erros e planeje para eles pode fazer toda a diferença ao transformar um grande erro em um pequeno contratempo. No final, as pessoas cometem erros, mas as organizações que planejam se recuperar mais rapidamente e com mais força.
De um infortúnio para o próximo, e de volta aos negócios como de costume
Uma interrupção não planejada pode parecer o fim do mundo, mas não precisa ser. Ao se concentrar em backups de qualidade, incentivar a colaboração cruzada e se preparar para erros humanos, organizações como a nossa podem transformar um possível desastre em uma experiência de aprendizado valiosa. Não se trata apenas de corrigir o problema em questão, mas de criar sistemas e culturas fortes o suficiente para se recuperar, não importa o que vem a seguir.
Para nós, o próximo passo foi o furacão Beryl. Felizmente, conseguimos enfrentar a tempestade com base nas lições que aprendemos com a interrupção. Se isso acontecesse hoje, teríamos certeza de que poderíamos restaurar 80 terabytes de dados em apenas algumas horas.
Além da economia de tempo e da confiabilidade da plataforma da Pure Storage, quando se trata de negócios como de costume, nossa equipe não passa mais tempo solucionando problemas de armazenamento como fazíamos com nosso provedor anterior. A natureza de configurar e esquecer da Pure Storage nos permite focar em outras tarefas, e o excelente suporte da equipe da Pure melhorou ainda mais nossa experiência. Além disso, graças ao modelo de assinatura Evergreen®, prevemos uma economia de até 30% em comparação com o fornecedor de armazenamento anterior do distrito.
A Pure Storage nos oferece o melhor de todos os mundos, uma arquitetura resiliente e econômica que nos permite recuperar rapidamente, se necessário, enquanto simplificamos muito nossas operações. Temos tranquilidade sabendo que podemos oferecer um ambiente de aprendizagem seguro e contínuo, onde nossos alunos possam se destacar.