Después de tener su tiempo de gloria Dentro de la herramienta de Netflix (y el Monkey Chaos)La ingeniería del caos está atrayendo más y más empresas (Mano Mano, SNCF, etc.). Sin embargo, romper un sistema de información voluntariamente para ver cómo reacciona y mejorarlo no es una decisión tomar a la ligera.

Las empresas deben examinar cuidadosamente los recursos requeridos, los riesgos introducidos y la alineación del enfoque con objetivos estratégicos más amplios. Es esencial comprender estos factores para decidir si este enfoque debe ser un elemento central o una herramienta complementaria en la estrategia de TI de una empresa. Cada organización debe determinar en qué medida seguirá este desarrollo tecnológico y el tiempo que puede esperar a que su proveedor sea para ofrecerle soluciones.

Índice
  1. Errores cada vez más frecuentes y costosos
  2. Beneficios de la ingeniería del caos
  3. Desventajas de la ingeniería del caos
  4. Una elección reflexiva y equilibrada

Errores cada vez más frecuentes y costosos

Las noticias recientes muestran que los errores humanos (mala configuración, el problema del código, etc.), los ataques de tipo DDOS y las averías pueden tener un impacto significativo en la resiliencia de infraestructura de TI. Así, en las campañas por negación del servicio, Cloudflare registró 4 millones de ataques en el segundo trimestre de 2024, en alta progresión en comparación con el trimestre anterior. Los proveedores de la nube no se salvan ni por servidores ni ataques cibernéticos. La noticia más emblemática de este verano tuvo lugar el 19 de julio con La falla del servicio de Microsoft Azure. Estaba vinculado a una actualización defectuosa del sensor Falcon Crowstrike. Varias empresas han sido afectadas con fuertes consecuencias financieras. La compañía de Delta Airlines habla sobre un déficit de $ 500 millones.

Este incidente fue una señal de alarma por varias razones. Primero, la mayoría de las empresas han comenzado a realizar su vulnerabilidad. La producción podría detenerse debido a un error estúpido. En segundo lugar, el costo total de este evento fue mucho más alto de lo que la mayoría de las empresas esperaban. También tuvo un mayor impacto de lo esperado en temas no técnicos, como las relaciones públicas y con los clientes. Finalmente, la enseñanza que se ha extraído es que el mayor riesgo proviene de las personas y no de la tecnología. La preparación para estos errores, por lo tanto, recurrir a la ingeniería del caos, se ha convertido en un reflejo en muchas organizaciones, lo que pone en equilibrio las ganancias y las limitaciones.

Beneficios de la ingeniería del caos

Suponga que una gran empresa de comercio electrónico implementa la ingeniería del caos para probar la resiliencia de su sistema en la nube durante los períodos de compra avanzados. Utiliza una herramienta dedicada para simular un aumento de las cargas de tráfico que imitan las condiciones del Black Friday. El equipo introduce deliberadamente la latencia y las paradas aleatorias del servidor para observar cómo reacciona el sistema al estrés. Durante estas pruebas, descubren cuellos de botella en la arquitectura de su base de datos que las pruebas tradicionales deberían haber detectado. Gracias a las medidas de tiempo real, implementan rápidamente estrategias adaptativas, como la escala automática de los recursos del servidor y la optimización de las solicitudes de bases de datos.

Al repetir continuamente estas experiencias del caos, la plataforma de comercio electrónico no solo es resistente a las presiones simuladas, sino que mejora su capacidad de adaptarse automáticamente a picos inesperados. Esto garantiza, o debe garantizar la experiencia transparente del cliente durante los períodos críticos de ventas. Este enfoque proactivo transforma el caos potencial en una oportunidad para fortalecer la resistencia de la infraestructura. Al menos esa es la idea.

Desventajas de la ingeniería del caos

A pesar de sus ventajas, la ingeniería del caos plantea importantes desafíos y preguntas para las empresas. Primero, está la intensidad de los recursos movilizados. De hecho, la implementación de este método requiere inversiones sustanciales en las herramientas correctas, el personal calificado y el tiempo para simular y analizar de manera efectiva los escenarios. Esto puede cambiar los presupuestos y desviar la atención de los objetivos principales de la empresa. Otro punto de fricción son los posibles impactos operativos porque la introducción intencional de errores tiene riesgos inherentes. Las empresas deben ser cautelosas, ya que estas prácticas pueden alterar los servicios, afectar el rendimiento y crear efectos secundarios indeseables que puedan causar a los clientes o pérdidas financieras.

Además, el caos de ingeniería puede desviar la atención de iniciativas más estratégicas. Las empresas a menudo dan prioridad a proyectos simples, basado en el retorno de la inversión, que contribuyen directamente al crecimiento. Construir plenamente en el método podría desviarlos de la búsqueda de innovaciones o mejoras operativas que tengan ventajas inmediatas. También debemos tener en cuenta la gestión de la complejidad. La ingeniería del caos requiere una comprensión en profundidad de las interdependencias dentro de los sistemas. Un desafío que podría disuadir a las empresas de aplicar efectivamente los principios de este enfoque.

Una elección reflexiva y equilibrada

Chaos Engineering ofrece un mecanismo de defensa proactivo contra las debilidades de los sistemas, pero las empresas deben evaluar sus riesgos en comparación con sus objetivos estratégicos. Invertir enormemente en la ingeniería del caos puede justificarse para algunos, especialmente en los sectores donde la disponibilidad y la confiabilidad son cruciales. Otros, por otro lado, se centrarían mejor en mejorar los estándares de ciberseguridad, actualizar la infraestructura y el reclutamiento de talentos.

Además, se pregunta qué tiene la intención de ofrecer proveedores de servicios en la nube en esta área. Muchas compañías se embarcan en nubes públicas porque quieren transferir parte del cargo a los proveedores, incluida la ingeniería de confiabilidad. A veces, el modelo de responsabilidad compartida se centra demasiado en los deseos de los proveedores de la nube en lugar de los de sus clientes. Puede ser hora de que algunos reproductores de nubes suban una marcha. Algunos ya lo han hecho como AWS. Al final, las empresas deberían pensar en cómo el caos la ingeniería es parte de su estrategia de TI más amplia. Al integrar elementos que corresponden a sus objetivos en lugar de adoptar el método de bloque, las empresas pueden beneficiarse de las ideas sin ser desviados de sus misiones principales. Como con cualquier innovación, la clave radica en una aplicación juiciosa.