Las interrupciones del servicio en la nube son relativamente comunes. Para proporcionar un grano adicional de resiliencia a las empresas que enfrentan incidentes y averías de todo tipo, AWS ofrece Servicio de Inyección de Fallos para ayudar a las empresas a anticiparse a ellos. "Puede utilizar los escenarios para ejecutar experimentos para garantizar que su aplicación (ya sea de una o varias regiones) funcione como se espera en caso de un problema, comprender mejor las dependencias directas e indirectas y probar el momento de la recuperación", explicar AWS.

El servicio de inyección de fallos está lejos de ser nuevo, ya que esta oferta se ofrece a todos los clientes (EC2, S3, etc.) del proveedor de nube estadounidense desde 2021. Pero AWS acaba de enriquecerlo con nuevos escenarios, especialmente en la era de los tiempos: corte de energía, pérdida de conectividad, interrupción del tráfico, indisponibilidad del servicio... “Cada escenario se utiliza para crear un modelo de experiencia. Puede utilizar los escenarios tal cual o tomar cualquier plantilla como punto de partida y personalizarla o mejorarla como desee”, explica el proveedor.

Escenarios comunes de incidentes y averías

Por ejemplo, el escenario de corte de energía consiste en "desconectar" temporalmente un conjunto específico de recursos en una única zona de disponibilidad, incluidas instancias EC2 (incluidas aquellas en clústeres EKS y ECS), volúmenes de EBS, grupos de Auto Scaling, subredes de VPC, ElastiCache para Redis. clústeres y servicio de bases de datos relacionales (RDS).

Otro ejemplo impulsado por el grupo: un problema de conectividad con un escenario que impide que la aplicación en una región de prueba pueda acceder a recursos en una región de destino. Esto incluye el tráfico de instancias EC2, tareas ECS, pods EKS y funciones Lambda adjuntas a una VPC. Y también incluye el tráfico que fluye a través de puertas de enlace de tránsito y conexiones de intercambio de tráfico de VPC, así como replicación de S3 y DynamoDB entre regiones. "Este escenario se ejecuta durante 3 horas (a menos que cambie la configuración de duración de la interrupción) y aísla la región de prueba de la región de destino de la manera especificada, con configuraciones avanzadas para controlar y seleccionar los recursos de AWS asignados en la región aislada", dice la compañía.