BNP Paribas Personal Finance es una subsidiaria del Grupo BNP Paribas especializado en créditos de consumo, que ofrece servicios de pago fraccionados en sitios de comercio electrónico. Para mejorar la detección de archivos fraudulentos en estos servicios, la compañía ha experimentado el uso de una base de datos de gráficos, Neo4J, una tecnología que luego se puso en producción después de proporcionar resultados concluyentes. Se presentó una primera evaluación de este proyecto en la Feria Big Data & IA 2022.
Los servicios de pago divididos, que permiten distribuir un pago en tres o cuatro veces, son frecuentemente atacados por redes de estafadores. "Estos no están contentos para reutilizar la información (nombres, teléfono o números de tarjeta de crédito ...) de un archivo a otro. Los cambian, lo que significa que los enfoques de listas negras tradicionales ya no funcionan", explica Mehdi Barchouchi, Data & Tools Gerente de innovación en la Dirección de Riesgo Francés en BNP Paribas Personal Finance. Tenía que hacerse en tiempo real, para poder dar una respuesta inmediata al cliente que transmite su archivo.
Caso de uso perfecto
En tales tratamientos, el rendimiento de las bases de datos relacionales convencionales es insuficiente. De hecho, debemos multiplicar las articulaciones para detectar una relación entre los archivos, una operación particularmente costosa. "El problema se encuentra en la profundidad de las redes", dice Mehdi Barchouchi. Por lo tanto, BNP Paribas Personal Finance ha decidido probar una base de datos de gráficos, porque esta tecnología corresponde bien a una estructura donde se conectan múltiples datos entre ellos. Para Édouard Tabary, jefe del equipo de innovación y ciencia de datos en el Centro para Marcar Finanzas Personales BNP Paribas, "Este es el caso con un uso perfecto".
Luego se conserva la solución NEO4J y se configura un piloto en el 2020 en un servidor local, con un conjunto de datos reducido. El equipo primero crea el modelo de datos en gráficos a partir de datos tabulares, luego lo refina gradualmente para llegar al modelo de destino, especialmente utilizando algoritmos de aprendizaje automático. Finalmente, construye indicadores basados en el valor de las predicciones. "Hemos obtenido un modelo muy eficiente: al aplicarlo a una pequeña cantidad de población, hemos cubierto casi toda la red de estafadores", dice Édouard Tabary.
Édouard Tabary, jefe del equipo de innovación y ciencia de datos en el centro de Scring BNP Paribas Personal Finance: “Podemos regresar sin ninguna información común, pero con una ruta que los conecta. »»
Un proyecto complejo por su dimensión en tiempo real
El siguiente paso: industrializa el modelo, un trabajo comenzó a principios de 2021 y que terminó a principios de 2022 con el Go Live. Durante esta fase, el algoritmo continuó siendo optimizado, en particular durante tiempo real. Pero la mayoría de las veces se dedicó especialmente al diseño de una arquitectura adaptada, también alojada internamente. "Hemos configurado un sistema para llamar a la infraestructura Neo4J en tiempo real en el curso, pero este sistema siempre tiene una parte transaccional, para preservar nuestra capacidad de estudiar datos para mejorar el algoritmo", dijo Édouard Tabary.
A partir de ahora, los datos llegan directamente a la base gráfica y se pueden comparar de inmediato con todas las solicitudes anteriores, con una respuesta en unos pocos milisegundos. "Así es como podemos subir dos archivos sin ninguna información común, pero con una ruta que los conecta", explica Édouard Tabary. Una vez que los grupos han sido identificados, el equipo puede encontrar marcadores de fraude potenciales, en particular al operar los enlaces de similitud de Neo4J. El objetivo es tener los falsos positivos menos posibles, pero también es necesario comprender la ruta que llevó a un archivo a obtener un puntaje de riesgo de alto fraudulento, a fin de proporcionar una respuesta al cliente cuyo archivo se rechazaría. "Tenemos una obligación Explicación del modeloComprender los marcadores de riesgo ", subraya Mehdi Barchouchi. “Sobre una base en los gráficos, sabemos cómo volver sobre la redacción, capturar el contexto. La impronta de datos proporciona un contexto particular, a medida que obtenemos patrones cada vez más precisos. Podemos explicar la predicción del fraude al observar el vecindario, encontrar lo que llevó a la predicción a tener en cuenta los plazos legales para la conservación de los datos. El equipo también garantiza la equidad del modelo, para no inducir sesgos discriminatorios.
Un modelo llevó a evolucionar
Otras entidades del Grupo BNP Paribas usan Neo4J, incluidos él para la resolución de incidentes. Sin embargo, el uso de dicha tecnología es el primero para el equipo de finanzas personales de BNP Paribas, compuesto por dos expertos en negocios, dos científicos de datos y un pequeño grupo de desarrolladores y administradores. En este proyecto, este equipo transversal, especialmente asociado el departamento de TI y riesgos, se benefició del apoyo del editor para escribir el modelo y alimentarlo de sus datos. "Estábamos acostumbrados a formatos tabulares y tuvimos que aprender", dice Mehdi Barchouchi. Hoy, el desafío es expandir la base de Sickends para poder explorar otros casos de uso y recibir otras poblaciones.
De esta experiencia, el equipo ya ha aprendido ciertas lecciones. Según Mehdi BarChouchi, “Para iniciar dicho enfoque, es importante conocer bien sus datos y tener buenos ejemplos de fraude de red, que se pueden encontrar con el gráfico. También le recomienda dedicar tiempo, ambos aguas arriba, en la fase exploratoria, pero también después de la producción. “Este es solo el comienzo de la vida del proyecto. Debemos poder desarrollar el modelo, para reaccionar a la actividad de los estafadores ”, insiste en los datos y herramientas del gerente de innovación en el departamento de riesgos Francia. Sin olvidar, agrega, para medir el rendimiento a través de los indicadores.
Otras noticias que te pueden interesar