En un momento en que el desarrollo de IA pesa sobre el consumo de energía de los centros de datos, cualquier iniciativa para limitar este vuelo es bienvenido. En este contexto, Martin Karsten, profesor de Waterloo, y Joe Damato, un ingeniero distinguido de Fastly, ambos investigadores de la Universidad Canadiense de Waterloo, lograron mejorar la forma en que Linux administra el tráfico de red, y todo esto en 30 líneas de código. Esta pequeña modificación podría hacer que sea más efectivo el funcionamiento de las aplicaciones dentro de los centros de datos mientras se ahorra energía. El código en cuestión se basa en una investigación descrita En un artículo de 2023 Firmado por Martin Karsten y Peter Cai, un estudiante graduado. Al analizar la red en el núcleo en comparación con la red a nivel de usuario, este último determinó que un pequeño cambio no solo podría aumentar la eficiencia de la aplicación, sino también reducir el consumo de energía del centro de datos hasta el 30 %.
El código, aceptado e incluido en la versión 6.13 del núcleo de Linux, agrega otro parámetro de configuración de NAPI, IRQ_SUSPEND_TIMEOUT, para equilibrar el uso del procesador y la efectividad del procesamiento de la red cuando se usa IRQ Defirm y la encuesta NAPI Ocupar. Este equilibrio conduce a un interruptor automático entre dos modos de suministro de datos a una aplicación, el modo por pregunta o "sondeo" y el modo por interrupción o "interrumpir", dependiendo del tráfico de la red, para maximizar la eficiencia. En el modo "Polling", la aplicación requiere datos, los procesa y luego lo solicita, en un ciclo continuo. En el modo "dirigido por interrupciones", la aplicación permanece latente, ahorrando energía y recursos hasta que el tráfico de la red prevista para él llega, luego se despierta y lo trata. "Si tiene un servidor de múltiples usuarios y procesos múltiples de la antigua manera con muchas aplicaciones (pequeñas) que operan simultáneamente, este mecanismo no hará nada más, pero tampoco debería dañar", dijo Karsten.
Escenarios más adecuados que otros
Sin embargo, el investigador explica que en muchos escenarios de centros de datos, las máquinas de servidores realizan un pequeño número de aplicaciones en servidor dedicado. "Estas aplicaciones 'dominan' un conjunto de corazones y generalmente se pueden conectar a un conjunto de colas de transferencia en la tarjeta de interfaz de red. Nuestro mecanismo es útil para este tipo de aplicaciones, si también tratan mucho tráfico de red. Este es el caso de casi todos los servidores frontales, pero también muchos servidores de atrás que proporcionan los datos al frente. Cuando el tráfico de la red es importante, es más eficiente y más eficiente para el modo de reducción de la red. Por otro lado, cuando el tráfico de la red es bajo, es el tratamiento de la interrupción lo que funciona mejor. "Nuestro mecanismo detecta automáticamente [la quantité de trafic réseau] Y los interruptores entre el modo cuestionando y el modo de interrupción para obtener lo mejor de ambos mundos. »»
En la carta de apoyo para el código, el Sr. Damato describe con más detalle la implementación del parámetro: “Este método de entrega es efectivo, ya que evita que la ejecución de SoftIrq interfiera con el tratamiento de aplicaciones durante los períodos de intensa actividad. Se puede usar bloqueando EPOLL_WAIT para mantener los ciclos de la CPU durante los períodos de inactividad. La alternancia entre períodos activos y períodos de inactividad significa que el rendimiento (flujo y latencia) está muy cerca de los del modo de votación durante los períodos de alta actividad, mientras que el uso de CPU es más bajo y muy cercano al modo de interrupción atenuada. "El Sr. Karsten agrega que" en el nivel práctico, la activación de la función requiere una pequeña modificación de las aplicaciones y el ajuste de una variable de configuración del sistema. E incluso si aún no puede cuantificar las ventajas energéticas de la técnica (la economía del 30 % citada es el mejor caso), cree que "los ahorros de energía más importantes ocurren en comparación con una implementación de una pregunta permanente de modo con alto rendimiento durante los períodos de bajo tráfico".
Otras noticias que te pueden interesar