Gradualmente, IBM Al tocar su caja de herramientas para entrenar y optimizar los modelos de IA en mainframes. Big Blue acaba de anunciar el módulo de conjuntos de datos sintéticos. Estas bases de datos (generadas por una IA) deben estar disponibles a fines de febrero dirigidas a casos de usos específicos. Se refieren a la información sobre las tarjetas de pago, la banca y el lavado de dinero, la garantía de la propiedad.

En el lavado de dinero, Tina Tarquinio, gerente de productos de Z y Linuxone y Elpida Tzortzatos Systems, el arquitecto Z explica en un blog que "a menudo pasa desapercibido en datos reales, porque los delincuentes intentan mover fondos ilegales para ocultar su origen". Este tipo de operación "con frecuencia implica el cruce de las fronteras bancarias y nacionales, con complejos esquemas de transacciones", escribieron. El conjunto de datos sintético utilizado (banca central y lavado de dinero) cubre todo el ecosistema bancario, que incorpora transacciones globales e incluso incluye transacciones en efectivo que generalmente no están disponibles en datos bancarios reales. Su uso reduce el número de falsos positivos y ahorra horas de trabajo en la investigación de alertas.

Integración con AI TAKET

Los conjuntos de datos "están formados por archivos CSV y DDL descargables con atributos adecuados para casos de uso específicos en los sistemas Z y Linuxone, lo que los hace fáciles de usar y compatibles con todo, desde bases de datos hasta hojas de cálculo a través de las plataformas de materiales y las herramientas de IA estándar", subrayó a los dos gerentes. Explican que "si un cliente tiene un modelo o LLM existente, los datos sintéticos proporcionan información adicional rica, etiquetada y diversificada para refinar el modelo AI. Si un cliente no tiene un modelo, los conjuntos de datos pueden ofrecer material para capacitación rápida y respetuoso de la privacidad".

Los dos expertos señalan que los módulos de datos sintéticos se pueden implementar en IBM mainframes "con IA Toolkit, Cloud Pak para datos sobre z o Aprendizaje automático para Z/OS ». Estas herramientas se presentaron en septiembre pasado. Por lo tanto, AI Toolkit está diseñado para ayudar a activar aplicaciones comerciales críticas en marcos de código abierto, como el rango acelerado Z con TensorFlow, SNAPML y más. En la parte del sistema operativo, la configuración IA ofrece aprendizaje y predicciones automatizadas para la optimización, la gestión y la mejora de los procesos informáticos. Finalmente para Cloud Pak (plataforma IBM privada basada en el contenedor OpenShift de Red Hat) incorpora AU AI. Ofrece a los usuarios descargar sus datos, elegir el tipo de problema y especificar restricciones, y ejecutar una serie de experiencias automatizadas que generan rápida y fácilmente una gama muy eficiente de tuberías.