Desde 2021, Brut ha lanzado su propia plataforma de análisis de datos y un equipo de operaciones de datos dedicado, con el fin de difundir una cultura de datos en toda la empresa. Nacido en 2016, el vídeo publica sus documentales, entrevistas y contenidos informativos únicamente en las redes sociales, dirigido a un público de entre 18 y 35 años. Antes de 2021, Brut sólo explotaba de forma muy esporádica y empírica el potencial de los datos disponibles sobre sus audiencias y su comportamiento.
“Dataops no es una herramienta”, aclaró Clément Baccar, ingeniero de datos de Brut durante la conferencia Big Data & AI en París. Es un marco metodológico destinado a agilizar proyectos de datos que a veces llevan mucho tiempo implementar y escalar una plataforma de datos como la nuestra, a través de iteraciones. » El objetivo es hacer que un nuevo producto o función esté disponible inmediatamente para el usuario final. Al igual que Devops, DataOps se basa en particular en la máxima automatización de procesos. Ambos métodos tienen bases comunes como la integración, el despliegue y las pruebas continuas, pero las operaciones de datos difieren claramente con necesidades específicas vinculadas... a los datos. Recopilación, transformación, observabilidad y seguimiento de la calidad, sin olvidar el diseño de modelos de IA y ciencia de datos. "Tenemos que pensar en todo el ciclo de vida de los datos desde el principio", insiste Clément Baccar.
Uno de los desafíos que enfrenta Brut al automatizar sus procesos proviene de los datos de las redes sociales de los que se basa, que están lejos de ser homogéneos. "Tenemos 80 cuentas en una decena de redes sociales, en las que publicamos 5.000 publicaciones al mes con 1.200 millones de visitas mensuales", confirma Lore-Pascale Alechou-Tacite, también ingeniera de datos en Brut. Todos ellos evolucionan y se diferencian entre sí. » Las diferencias obviamente se refieren al tipo de datos disponibles, pero también al modelo de recopilación de API. “A veces son gratis, a veces son de pago como en Twitter (ahora X). Algunos medios también imponen cuotas de consultas. Es posible que estemos autorizados a enviar 10 solicitudes por período de 15 minutos o 100 dependiendo del medio. La madurez de la API y los datos también varía. La de Facebook existe desde 2010 mientras que la de TikTok Business tiene apenas un año. Otra diferencia, Facebook cuenta una vista por publicación a partir de los 3 segundos de consulta, mientras que TikTok cuenta desde el primer clic. »
Clément Baccar y Lore-Pascale Alechou-Tacite, ingenieros de datos, pertenecen al equipo de operaciones de datos creado por el medio de vídeo Brut en 2022 para impulsar su cultura de datos. (Big Data e IA París - Foto ED)
Además de estos desafíos vinculados a las propias fuentes de datos, existen requisitos propios de Brut. “Publicamos continuamente, pero también tenemos picos de actividad, por ejemplo durante un evento cultural o deportivo o durante las vacaciones”, explica Lore-Pascale Alechou-Tacite. Los periodistas y los equipos de ventas necesitan acceso en tiempo real a las publicaciones del Festival de Cine de Cannes, a los socios o a la publicidad programática en YouTube, etc. » El personal editorial y los equipos de ventas también necesitan escuchar socialmente los comentarios destinados a Netflix o conocer el tipo de contenido ideal para TikTok. .
Comunicación esencial entre líneas de negocio y equipos de datos.
En este doble contexto, los equipos de datos de Brut tuvieron que poner estos datos a disposición de los ingenieros de datos. Han desarrollado ETL y plantillas ETL para cada red social. Los datos sin procesar se incorporan a Big Query y luego se transforman en canalizaciones de DBT para evaluar la calidad y la actualidad de estos datos o cualquier brecha. Una vez transformados, también se almacenan en Big Query para que los equipos de datos puedan aplicarles modelos de IA. Estos datos alimentan la escucha social interna de Brut, su algoritmo de recomendación, el contenido multimedia que publica, los conocimientos y el motor de sugerencias de repost. Este último indica el porcentaje de interés de republicación de cada vídeo del catálogo. Finalmente, la plataforma de datos de Brut se administra en GCP, completamente sin servidor. Todos los servicios de datos también están acoplados en Google Cloud Build para poder reproducirlos fácilmente en todos los entornos multimedia. Esto también permite ingerir rápidamente datos de una posible nueva red social.
El proyecto se desarrolló y desplegó en un año y medio con un equipo de 15 personas. “Si se quiere establecer un marco de operaciones de datos eficaz”, explica François Vivarelli, director de productos de datos, “todos los equipos deben comunicarse bien y sin fricciones. Esto requiere varios tipos de enfoques: gestión de incidentes, implementación en pequeños pasos con incrementos diarios, revisión y codificación por pares, monitoreo de la carga mental en el proceso del incidente y la participación de las profesiones, esto incluye periodistas, equipos de ventas y producción. »
Otras noticias que te pueden interesar