Nube pública, pero no sólo. Esta es en cierta medida la convicción que se ha formado Crédit Mutuel Arkéa en materia de explotación de datos. “Iniciamos la hibridación de nuestros entornos de datos en 2017, a través de un primer entorno de datos en GCP (Google Cloud Platform) para una de nuestras filiales. Luego siguieron varios proyectos piloto, entre ellos dos de gran envergadura”, afirma Maxime Havez, director de datos (CDO) de este grupo de unas 11.000 personas, que comprende una actividad de banca minorista y unas cuarenta filiales especializadas.

En particular, la migración de un proceso que requiere varios días en el lago de datos interno Hadoop del banco y que involucra datos menos sensibles. "Probamos la elasticidad de la nube y redujimos este procesamiento a unas pocas horas", ilustra el CDO. Por cierto, la migración a la nube permitió identificar vías para optimizar este procesamiento y, en última instancia, repatriarlo a las infraestructuras locales que albergan el lago de datos, un activo que el banco construyó en 2009.

Índice
  1. Un código único para la nube y on-premise
  2. La nube para entrenar modelos de IA

Un código único para la nube y on-premise

A lo largo de estos proyectos, Maxime Havez y su equipo han adquirido una serie de certezas que ahora están en el centro de su enfoque de hibridación. En primer lugar, la necesidad de pensar desde el principio en la portabilidad y la multinube. “Incluso en términos de arquitectura que sustenta el ladrillo tecnológico en cuestión”, desliza el CDO. Además, Crédit Mutuel Arkéa ha optado por desarrollar e implementar su propia solución de desarrollo dedicada al procesamiento de datos. ¿La ventaja? Ya sea que la aplicación se ejecute en la nube o localmente, no es necesario modificar el código, una puerta de entrada interesante como parte de una estrategia híbrida. Esta plataforma distribuida también se basa en XML y SQL para facilitar el diálogo entre TI y las profesiones, donde los usuarios saben cómo manipular estos lenguajes. “Nuestro primer desafío en torno a esta plataforma es garantizar su uso por parte de toda nuestra comunidad interna. En segundo lugar, también estamos considerando colocarlo en código abierto”, especifica el CDO.

Para respaldar el aumento de usos, la Oficina de Datos también ha recurrido a una solución de virtualización de datos, en este caso Starburst. “Al final, tenemos un único conector independientemente de dónde se encuentren los datos, un único lenguaje dominado por las empresas (SQL, nota del editor) y una solución para acelerar el procesamiento en entornos on-premise”, resume el CDO. Sin olvidar los esfuerzos por facilitar la visualización de datos, ya sea on-premise o en la nube.

La nube para entrenar modelos de IA

Con estas convicciones y principios técnicos en la mano, Crédit Mutuel Arkéa decidió empezar con un primer proveedor de nube, eligiendo una opción que ofreciera garantías de cifrado, mediante claves almacenadas fuera de los entornos de nube. Una solución proporcionada por Thalès en Google Cloud Platform, un dúo que hoy encontramos al frente del lanzamiento de la llamada nube de confianza S3NS (pronunciada Sens).

Maxime Havez, director de datos de Crédit Mutuel Arkéa: "Nuestro principal desafío es escribir una hoja de ruta para nuestra plataforma Hadoop, que sigue siendo en gran medida local". (Foto: RF)

Esta prueba permite ahora a la Oficina de Datos de Crédit Mutuel Arkéa responder a las expectativas de los profesionales en materia de IA generativa. “Hemos identificado múltiples casos de uso, que involucran datos con niveles de sensibilidad muy diferentes. Y nuestras iniciativas en este ámbito nunca deben perder de vista una clave esencial: la sobriedad energética”, afirma Maxime Havez. En este ámbito, Crédit Mutuel Arkéa ha optado por desarrollar una versión muy simplificada de un modelo disponible en la plataforma HuggingFace. “Esto sólo fue posible gracias a la disponibilidad de GPU en la nube. Esta base técnica nos sirve hoy para explorar nuestros casos de uso. Nada de esto habría sido posible sin nuestra estrategia de hibridación”, explica el CDO.

Dicha estrategia de hibridación de la Oficina de Datos, departamento que se estructuró a partir de 2020, está ahora vinculada al programa Move to cloud del DSI, lanzado en 2023. “Nuestro principal desafío consiste en escribir una hoja de ruta para nuestra plataforma Hadoop, que aún permanece en gran medida en las instalaciones”, afirma Maxime Havez. Además, la Oficina de Datos ha mapeado las aplicaciones que ofrecen capacidades de datos dentro del grupo, es decir, unas sesenta tecnologías. “Nuestra estrategia consiste en hibridar estas capacidades, pero coherentes con nuestros principios de portabilidad, protección de datos y soberanía. »