La interrupción causada por la actualización defectuosa de CrowdStrike que provocó una interrupción global del servicio de los sistemas Windows ha causado una conmoción en la comunidad de TI. Para los líderes de TI, el evento es un duro recordatorio de los riesgos inherentes a la excesiva dependencia de un único proveedor, en particular en la nube.

El incidente que provocó el bloqueo de los sistemas Windows y la aparición de la famosa “pantalla azul de la muerte” (BSOD) puso de relieve las vulnerabilidades de las infraestructuras que utilizan la nube de forma intensiva. Si bien el problema se está resolviendo, pone de relieve las posibles consecuencias catastróficas de la falla de un componente de seguridad crítico. Esto debería impulsar a los CIO a cuestionar la resiliencia de sus entornos de nube y a explorar estrategias alternativas.

Reevaluación de sus dependencias de la nube

“Cuando ocurre un problema de esta magnitud y causa una interrupción tan significativa, es importante y necesario reevaluar las creencias, decisiones y compensaciones que llevaron a la arquitectura actual”, afirma Abhishek Gupta, director de TI de DishTV, uno de los proveedores de televisión por cable más importantes de la India. “Este análisis puede dar como resultado un statu quo, pero esta reevaluación es necesaria”, afirma el director de TI, y añade que DishTV ya está reevaluando su estrategia en la nube de manera gradual después del incidente de Crowdstrike.

Shashank Jain, director de sistemas de información de la empresa de servicios financieros Shree Financials, sugiere un cambio de estrategia: “Las organizaciones y los directores de seguridad de la información deben revisar sus estrategias en la nube y se debe desalentar la aplicación automática de parches. Todos los parches deben probarse primero en un entorno de prueba”. Señala que, a pesar de la reputación de CrowdStrike, el incidente plantea un problema de confianza. Debido a que los parches no se probaron y tuvieron un efecto en cascada.

Saurabh Gugnani, director y jefe de ciberdefensa, IAM y seguridad de aplicaciones en TMF Group, con sede en los Países Bajos, agrega que un enfoque equilibrado de las estrategias en la nube es una forma de mitigar estos riesgos. [les entreprises] "Deberían revisar sus estrategias en la nube. Es necesario mezclar más todas las soluciones disponibles".

Revisar los planes de continuidad

Algunas organizaciones ya han empezado a dar el paso. “En respuesta a las recientes interrupciones en nuestras operaciones críticas, hemos actualizado de forma proactiva nuestro plan de continuidad empresarial para abordar los tiempos de inactividad inesperados y minimizar su impacto en la productividad y la prestación de nuestros servicios”, afirma Shivkumar Borade, fundador y director general de Mytek Innovations, una empresa india de servicios de TI que se ha visto afectada por el efecto BSOD. “Nuestro plan revisado incluye una gestión de comunicaciones mejorada, con múltiples capas para garantizar que todos los empleados estén bien informados sobre los posibles problemas y su resolución”.

Durante la interrupción del servicio de Crowdstrike, las comunicaciones internas de la empresa se vieron afectadas de manera significativa, ya que toda su red, incluidos Outlook, Teams y SharePoint, estaban alojadas en Microsoft 365. “Sin embargo, nuestra aplicación desarrollada internamente no se vio afectada, ya que GoDaddy utiliza su propia infraestructura de alojamiento”, afirmó el ejecutivo. “Tuvimos problemas con algunas integraciones de API relacionadas con la plataforma Azure, que estuvieron inactivas durante todo el día. Estas interrupciones provocaron una interrupción del servicio para nuestros clientes y usuarios”.

La confianza en las herramientas de seguridad, en tela de juicio

Una de las mayores preocupaciones de los CIO es la dependencia de un proveedor que impide eludir fácilmente sus servicios. La dependencia de un único proveedor de la nube, como lo demostró el incidente de CrowdStrike, crea un único punto de falla. Si se interrumpe un servicio crítico de ese proveedor, puede tener consecuencias significativas para una organización. Para mitigar este riesgo, los CIO pueden aprovechar las arquitecturas multicloud o híbridas, que se traducen en aplicaciones distribuidas en múltiples plataformas.

La analista de Forrester Allie Mellen destaca la importancia de contar con herramientas y servicios confiables para enfrentar las amenazas cibernéticas. “La confiabilidad de las herramientas y servicios que utilizan los equipos de ciberseguridad es fundamental ante los ciberataques”, afirma. “Un incidente como este pone en tela de juicio esa confiabilidad. Sin duda, generará preguntas e inquietudes entre los ejecutivos sobre cómo garantizar la confiabilidad de sus sistemas, especialmente con una tecnología tan integrada en las operaciones diarias como el software de ciberseguridad”.

El incidente puso de relieve la fragilidad de los sistemas basados ​​en la nube, donde un único punto de fallo puede tener efectos en cascada en toda la organización. “La confianza entre los proveedores de servicios en la nube y los proveedores de seguridad está ahora en tela de juicio”, afirmó Sunil Varkey, profesional de seguridad y asesor principal de Beagle Security. “Esta pérdida de confianza debería llevar a un mayor enfoque en las soluciones sin agentes, que pueden proporcionar una seguridad mejorada sin las vulnerabilidades asociadas a los agentes tradicionales”.

8,5 millones de PC con Windows afectados

Debido a la avería causada por Golpe de masas es uno de los peores eventos de ciberseguridad de la historia, dada la escala de su impacto. El incidente afectó a computadoras basadas en Windows en una variedad de industrias, incluidas aerolíneas, bancos, minoristas, corredurías, medios de comunicación y ferrocarriles. La industria de viajes se vio particularmente afectada, con aerolíneas y aeropuertos en Alemania, Francia, Países Bajos, Reino Unido, Estados Unidos, Australia, China, Japón, India, Singapur y Taiwán experimentando problemas significativos con los sistemas de facturación y emisión de boletos, lo que provocó retrasos en los vuelos y caos en algunos aeropuertos. Microsoft reconoció que aproximadamente 8,5 millones de computadoras Windows se vieron afectadas. El impacto fue tan grave que SpaceX y el CEO de Tesla, Elon Musk, decidieron eliminar CrowdStrike de todos los sistemas en las empresas que dirige.

Mejorar las prácticas de gestión de riesgos

El incidente también puso de relieve la necesidad de mejorar las prácticas de gestión de riesgos. Una mayor diligencia en la recuperación, pruebas rigurosas de las actualizaciones y su implementación por fases se consideran ahora prácticas imprescindibles. “Este incidente sirvió como una llamada de atención, destacando la necesidad de adaptación y mejora continua de las prácticas de ciberseguridad en toda la industria”, reconoce Gaurav Ranade, director de tecnología del proveedor de software RAH Infotech.

DR Goyal, arquitecto de Rakuten Symphony, una empresa del grupo Rakuten que ofrece servicios al mercado de las telecomunicaciones, aboga por un mecanismo para probar las actualizaciones en usuarios seleccionados antes de que se publiquen por completo: "Debería haber un mecanismo para probar las actualizaciones en organizaciones seleccionadas y un grupo selecto de usuarios antes de publicarlas para toda la comunidad y la base de usuarios, para reducir el impacto de un posible incidente".

A medida que evoluciona el panorama digital, garantizar la resiliencia de los sistemas basados ​​en la nube se convierte en una necesidad. “El incidente tiene implicaciones muy significativas para la economía global; los tiempos de inactividad y de recuperación más prolongados afectarán la productividad y la economía”, señala Ashis Guha, fundador de la consultora An Idea Global Innovations.

Pruebas exhaustivas de actualizaciones e implementaciones graduales

Los expertos del sector recomiendan varias estrategias para prepararse ante futuros incidentes, como implementaciones por fases, pruebas exhaustivas y sistemas de respaldo robustos. Siddharth Ugrankar, cofundador de la empresa de blockchain Qila, cree que una implementación por fases y pruebas exhaustivas de las actualizaciones podrían haber mitigado el impacto: "Si CrowdStrike hubiera implementado la actualización de manera gradual, el impacto habría sido mucho menor", afirma.

Las empresas que desean evitar problemas similares al incidente de CrowdStrike deben fortalecer su gestión de actualizaciones mejorando los protocolos de prueba en múltiples entornos, implementando evaluaciones de riesgo rigurosas y fortaleciendo los procesos de gestión de cambios con una gobernanza sólida, afirma Moyukh Goswami, director de tecnología de la empresa de capacitación Nuvepro. “Es fundamental fortalecer las capacidades de monitoreo, refinar los planes de respuesta a incidentes para adaptarse a los errores posteriores a las actualizaciones y fomentar relaciones proactivas con los proveedores”, agrega el director de tecnología.

El incidente de CrowdStrike subraya la necesidad de que los CIO revisen y fortalezcan sus estrategias en la nube. Al implementar prácticas sólidas de gestión de riesgos, fortalecer las medidas de seguridad y diversificar las soluciones en la nube, las organizaciones pueden protegerse mejor contra futuras interrupciones. Mientras la industria continúa lidiando con las implicaciones de la interrupción del servicio de CrowdStrike, el enfoque debe estar en desarrollar estrategias en la nube resistentes, adaptables y probadas exhaustivamente para navegar en un panorama digital cada vez más complejo.