Compartir:
DPG Media, un influyente grupo mediático en el Benelux, ha dado un paso significativo en la modernización de sus procesos de gestión de datos incorporando inteligencia artificial. Enfrentando el desafío de manejar un vasto y creciente catálogo de contenido audiovisual a través de su plataforma VTM GO, la compañía ha integrado tecnologías de Amazon como Bedrock y Transcribe en sus flujos de publicación de video, buscando optimizar la generación y administración de metadatos.
La expansión de su biblioteca de videos llevó a DPG Media a reconocer la necesidad de gestionar de manera eficiente los metadatos que describen sus contenidos, como información sobre actores, géneros, resúmenes de episodios y estado anímico de los programas. La precisión en estos datos no solo mejora las descripciones en guías de televisión, sino que también refina las recomendaciones de contenido y facilita la exploración por parte de los consumidores.
Entre los retos principales de este proceso de automatización se encontraban la diversidad de idiomas, la variabilidad en el volumen de contenido y la frecuencia de lanzamientos, factores que complican la estandarización de metadatos. Además, la agregación de datos debía ser consolidada de manera confiable a lo largo de diferentes temporadas de un show.
Para sortear estos desafíos, DPG Media se centró en el procesamiento de audio, descartando el análisis de datos de video debido a su elevado costo y tiempo de procesamiento. El sistema diseñado consta de dos pasos: primero, la generación de transcripciones de audio mediante modelos de reconocimiento de voz y, segundo, la extracción y generación de metadatos detallados usando modelos de lenguaje extensivo.
En la fase inicial del proyecto, DPG Media evaluó diversas estrategias de transcripción, decantándose finalmente por Amazon Transcribe, dado que proporciona transcripciones de audio precisas, soportando actualizaciones automáticas y funciones de diarización de locutores. Asimismo, para la generación de metadatos, eligieron Amazon Bedrock, utilizando el modelo Anthropic Claude 3 Sonnet, destacado por su rendimiento en lengua holandesa y su capacidad de razonamiento.
La implementación de esta solución ha permitido a DPG Media ahorrar tiempo considerable en la generación de metadatos, optimizando procesos desde la producción de subtítulos hasta la creación de resúmenes detallados de series completas. Aunque el sistema automatiza la generación de metadatos, se decidió mantener una validación humana para asegurar la calidad del resultado final antes de que llegue a los clientes. Este enfoque no solo mejora la experiencia del usuario proporcionando recomendaciones más precisas, sino que también refuerza el compromiso de DPG Media de integrar capacidades humanas con tecnologías avanzadas.
La iniciativa refleja un paso hacia la modernización continua y la mejora de la experiencia del consumidor en una industria en constante evolución. DPG Media sigue explorando nuevas oportunidades para experimentar con modelos adicionales y mejorar sus sistemas a medida que la tecnología avanza, con el objetivo de alinear su oferta de contenido con los hábitos de consumo modernos y las innovaciones tecnológicas.