 |
Para obter uma cópia off-line ou impressa deste documento, basta escolher ⋮ Opções > Página Amigável para Impressora. Você pode então Imprimir > Imprimir em PDF ou Copiar & Colar em qualquer outro formato de documento de sua preferência. |
Introdução
Em 19 de Julho de 2024 às 04:09 UTC, a CrowdStrike lançou uma Atualização de Configuração do Sensor para Windows Systems, esta Atualização de Configuração gerou um Logic Error resultando num System Crash e Blue Screen of Death - BSOD (a famosa Tela Azul) nos Sistemas afetados.
A Atualização da Configuração do Sensor que causou o System Crash foi implementada 78 min depois (às 05:27 UTC), mas muitas Organizações levaram dias para restaurar as operações normais.
Nota: o incidente não foi resultado e nem está relacionado a um Ciberataque.
Impacto
Apesar do incidente afetar apenas dispositivos Windows que estavam ligados e podiam receber atualizações durante as primeiras horas da manhã, as consequências da interrupção continuaram por vários dias.
A Microsoft estima que esse Evento afetou 8,5 milhões de Sistemas, o que é menos de 1% do total de Máquinas Windows.
Especialistas estimam que Empresas da Fortune 500 podem ter perdido até US$ 5,4 bilhões em receitas e lucro bruto devido ao incidente.
O incidente sem dúvida nenhuma é uma das histórias mais impactantes de Segurança Cibernética de 2024.
Nota: Cibercriminosos distribuíram ferramentas e manuais falsos de reparo do CrowdStrike que instalavam Malwares. Estas Campanhas de Phishing tinham como alvo Organizações que tentavam se recuperar da interrupção, atrasando ainda mais as interrupções.
Lições Aprendidas
Este incidente isolado, de "apenas" 78 min de Inatividade não Planejada ou Interrupções Inesperadas, causou uma Paralisação Massiva de TI que interrompeu muitas Indústrias e Serviços ao redor do Mundo durante dias.
Quais as Lições Aprendidas que podemos tirar deste incidente ?
- Continuar aprendendo com Eventos como este.
- Manter-se informado sobre as novas Melhores Práticas no campo.
- Estar preparado para o Efeito Dominó
- Melhorar a Coordenação de Resposta a Incidentes (Incident Response Coordination)
- Implementar Atualizações em Etapas
- Testar de forma rigorosa
- Ter procedimentos de Rollback robustos
Conclusão
Este incidente demonstrou o quão rápido uma "simples" Atualização de Software pode afetar as Operações Globais em nosso Mundo interconectado.
O Mundo foi lembrado que o Efeito Dominó começa com uma simples e pequena peça caindo !!!
Referências
Technical Details: Falcon Content Update for Windows Hosts
Helping our Customers through the CrowdStrike Outage
Fortune 500 Firms to see $5.4 bln in CrowdStrike losses, says insurer Parametrix
The National Cyber Incident Response Plan (NCIRP)
The biggest Cybersecurity and Cyberattack Stories of 2024
The Top Internet Outages of 2024: Analyses and Takeaways