Desde su creación a principios de los años 1970, Lexisnexis, que ofrece datos jurídicos y comerciales y servicios de análisis asociados, ya se ha visto amenazada varias veces por los avances digitales: llegada de la Web, Google Search y luego software gratuito equivalente a su oferta. Sin embargo, si le creemos a Jeff Reihl, CTO de la empresa, su nuevo adversario resulta aún más formidable. Y, como era de esperar, se trata de IA generativa. Francamente admite que esta tecnología está evolucionando mucho más rápidamente que cualquier cosa que haya visto durante sus 40 años de carrera en servicios de TI.

La dirección de Lexisnexis no esperó a reaccionar y decidió, ya en marzo de 2023, con el lanzamiento del GPT-4 de OpenAI, desarrollar una estrategia para enfrentarse frontalmente a este nuevo enemigo. El equipo directivo decidió reescribir su solución y redefinir sus objetivos anuales prioritarios. “Estamos todos manos a la obra”, insiste Jeff Reihl. Tuvimos que dar un giro porque las capacidades de interacción, la amplitud de las respuestas y las capacidades de generación de datos de la IA generativa cambian las reglas del juego en nuestra industria. Sus habilidades son simplemente asombrosas. »

Índice
  1. Datos exclusivos y LLM personalizados
  2. Una transición imposible sin la nube
  3. La problemática falta de habilidades

Datos exclusivos y LLM personalizados

La amenaza es tanto más real para Lexisnexis cuanto que su actividad consiste en recopilar y proporcionar información y análisis a empresas jurídicas, de seguros o financieras, así como a organizaciones gubernamentales. Para Jeff Reihl, la empresa tiene la oportunidad de defenderse por dos motivos en particular. Por un lado, porque los grandes modelos de lenguaje general (LLM) actuales todavía contienen muchas imperfecciones. Por otro lado, porque los aproximadamente 2.000 informáticos y 200 científicos de datos de Lexisnexis trabajan con datos y herramientas exclusivos diseñados específicamente para personalizar los LLM utilizados para sus propios servicios, como Claude AI de Anthropic y GPT-4 en Microsoft Azure. LexisNexis también lleva mucho tiempo trabajando con otras IA, como la familia BERT de modelos de procesamiento del lenguaje natural (NLP), desde su introducción por parte de Google en 2018, así como con Chat GPT desde sus inicios. La empresa ahora también opera todos los principales LLM del mercado.

Lexisnexis lanzó su propia IA generativa LLM multimodelo Lexis+ AI en octubre pasado. La plataforma SaaS desarrollada específicamente para el mundo legal tiene capacidades de búsqueda conversacional detallada, está equipada con un motor de eliminación de alucinaciones y funciones para redactar documentos legales, resúmenes de casos y carga de documentos. Proporciona citas legales con enlaces a su fuente, para garantizar que los abogados tengan acceso a precedentes legales precisos y actualizados. Lexisnexis colaboró ​​en la versión beta con los clientes para refinar las indicaciones y consultas, y definir características de seguridad para garantizar la privacidad y permitir a los abogados mantener ciertas búsquedas internas.

Una transición imposible sin la nube

Para el CTO, este desarrollo habría sido imposible sin la migración a la nube que comenzó en 2015. La empresa, principalmente cliente de AWS, ahora también ofrece Microsoft Azure a muchos clientes que utilizan Microsoft Office y otras plataformas del editor. "Cada consulta en nuestra herramienta de búsqueda conversacional se dirige tanto a ChatGPT-4 en Azure como a Anthropic en AWS", explica el CTO. Elegimos el LLM óptimo en función de la pregunta formulada. » Sin embargo, el paso a la nube no ha sido fácil. Cuando Jeff Reihl se unió a la empresa en 2007, aproximadamente la mitad de la infraestructura todavía se basaba en una computadora central y dos grandes centros de datos ubicados en Estados Unidos. Además, tras varias adquisiciones de empresas, el SI de Lexisnexis se basó en un conjunto muy heterogéneo de tecnologías y una amplia variedad de formatos de datos.


Para Jeff Reihl, CTO de Lexisnexis, la llegada de la IA generativa es incluso más formidable que la de la Web o la Búsqueda de Google. (Foto Lexisnexis)

Luego, la dirección de TI pidió a la junta directiva varios cientos de millones de dólares para reemplazar toda esta infraestructura con sistemas abiertos basados ​​en XML. Luego, la empresa migró directamente (lift-and-shift) una gran parte de los datos del sistema heredado al nuevo, al tiempo que agregó capacidades de búsqueda patentadas, así como funciones de indexación y automatización. Sin embargo, las aplicaciones no estaban optimizadas para la nube y tuvieron que reestructurarse para adaptarse a la arquitectura de microservicios hace casi diez años. LexisNexis cerró sus últimos mainframes en 2020, aunque algunas cargas de trabajo todavía se están ejecutando en el último centro de datos operativo de Lexisnexis.

La problemática falta de habilidades

Los datos que utiliza Lexisnexis proceden de más de 50.000 fuentes externas, como expedientes judiciales, datos de despachos de abogados o sitios de prensa, que se integran en su propio sistema de producción de contenidos. Esto luego se enriquece con los equipos editoriales internos. Por supuesto, Lexisnexis se ha beneficiado de menores costos de infraestructura o capacidades de escalamiento vinculadas al uso de la nube. Pero la empresa encontró otra gran ventaja en esto último cuando le permitió adoptar rápidamente el aprendizaje automático y los LLM. “Fue entonces cuando empezamos a trabajar en la inteligencia artificial”, confirma Jeff Reihl. Pasamos por PNL básico y aprendizaje automático, antes de aprovechar el aprendizaje profundo. »

Por último, para hacer frente a la IA generativa, Lexisnexis también está formando a sus empleados. Si bien el equipo técnico estaba compuesto principalmente por diseñadores UX, gerentes de producto e ingenieros de software, ahora acoge a expertos jurídicos especializados, por ejemplo, en propiedad intelectual, así como a casi 200 científicos de datos e ingenieros de aprendizaje automático. "Hoy en día todavía hay muy pocas habilidades de IA generativa en el mercado", señala Jeff Reihl, "por lo que también capacitamos a personas que ya tienen un sentido de los datos". En total, Lexisnexis gastó nada menos que 1.400 millones de dólares en su transformación.