Ofrezca a cada ciudadano una medicina personalizada, adaptada no solo a su historia sino también a su patrimonio genético: es la ambición del programa suizo Health 2030. Dentro de este gran esfuerzo a escala de un país, el Centro de Genoma de Salud 2030 lleva el brazo genómico de El programa, realizando secuenciación, preparación de datos y ciertas tareas de análisis. Proyectos que se dirigen a las necesidades clínicas, como el diagnóstico rápido para las cuidados intensivos para un hospital e investigaciones, por ejemplo, en torno a la detección de células cancerosas o variantes de secuenciación de COVVI-19.
Todo el sistema, desde la secuenciación hasta la distribución de datos, incluida la parte de análisis e interpretación y las etapas de control y verificación, obviamente es compatible con un sistema de información sujeto a restricciones específicas. "Uno de los problemas centrales obviamente radica en la confidencialidad y la integridad de los datos, ya que tenemos certificaciones para producir resultados utilizables durante las fases de diagnóstico médico, observa la cabeza de Arnaud Hungler del Centro de Genoma de Salud 2030. La otra característica de nuestra actividad es el tamaño de Datos que manejamos.
Separe las muestras, asignarlas en el genoma humano
Para procesar estos datos, el Centro suizo ha configurado una primera tubería. Como iniciador, las muestras transmitidas por hospitales o universidades pasan a través del secuenciador. “Pero este proceso es muy costoso; Se necesitan alrededor de 15,000 euros por secuenciación. Por lo tanto, agrupamos las muestras para reducir el costo unitario ”, dice Arnaud Hungler. Consecuencia: en la salida, los datos pasan por un paso de multiplexación, lo que permite separar los diferentes análisis. Luego, los datos se ordenan durante un paso de mapeo, que consiste en reemplazar cada secuencia en el lugar correcto en el genoma humano. Finalmente, estos resultados se comparan con un promedio, por el momento en todo el mundo. "Lo que plantea problemas de referencia", dijo Arnaud Hungler, este promedio no representa perfectamente el patrimonio genético promedio de la población suiza. Una observación que dio a luz al Proyecto Genoma de Suiza, cuyo objetivo es secuencia 1,000, luego 15,000 y potencialmente un millón de genomas de ciudadanos suizos.
Arnaud Hungler, cabecera del Centro Genómico: “La secuenciación completa de un genoma humano genera 200 GB de datos. »»
Cada paso de esta tubería está asociado con el control de calidad, lo que permite calificar el nivel entregado porque estos resultados son accesibles para los investigadores y/o médicos. "Incluso si no somos los propietarios de datos en este caso, también mantenemos un control estricto de qué datos", dice el gerente de TI. La totalidad de esta tubería se ejecuta en un clúster Dell interno de 20 nodos de cálculo. Debido a la sensibilidad de los datos que manipula, el Centro de Genoma de Salud 2030 descarta en el estado cualquier uso de la nube.
Integre el análisis para limitar las transferencias de datos
Sin embargo, este modo operativo requiere el transporte de volúmenes muy grandes de datos a hospitales o centros de investigación. De ahí la construcción de una segunda tubería que, en lugar de enviar 200 GB para cada análisis, tiene como objetivo integrar la fase de análisis, a través de una plataforma especializada proporcionada por el editor británico Congénica. "En este modelo, restauramos un DataViz para explorar los datos de la secuenciación e integramos parte del procesamiento en estos datos, como los filtros", dice Arnaud Hungler. Dentro de esta segunda tubería, alojada en un segundo clúster Dell, el Centro Genómico también utiliza máquinas de almacenamiento puras para preguntas de rendimiento, flexibilidad, pero también simplicidad de explotación. "Porque estoy solo en eso", dice Arnaud Hungler.
Tantas características que el almacenamiento de bloques operaba antes. Sin olvidar la cuestión del rendimiento: "Dado que la producción de la solución de almacenamiento puro, el almacenamiento claramente ya no es el cuello de botella en esta tubería", dice el gerente de TI. La velocidad de descarga de datos desde el exterior ha sido multiplicada por dos, mientras que la de las transferencias internas aumentó un factor de diez. Todavía en la fase del proyecto, esta segunda tubería espera una extensión de acreditación solicitada por el Centro Genómico antes de ingresar a la producción.
¿Enciende la vida del estante?
La cuestión del almacenamiento también está en el corazón de la agenda de Arnaud Hungler. De hecho, el Proyecto Genoma de Suiza tiene como objetivo secuenciar el genoma de 15,000 ciudadanos suizos pronto. O datos de 1.5 '' que deben ser almacenados. “En términos más generales, debemos reexaminar nuestras opciones en términos de almacenamiento de datos. Porque, en nuestros procesos, es la secuencia la que más cuesta, mucho más que las fases analíticas. Por lo tanto, podría ser relevante evitar que los datos de la secuenciación hay más de seis meses, nuestra política actual, para confiar los datos preservados durante largos períodos. En otras palabras, la constitución de un centro de datos genéticos, que ahora está pensando el Centro de Genoma de Health 2030 y que sería otra palanca para la implementación de medicina personalizada en la escala de Suiza.
Otras noticias que te pueden interesar