Compartir:
Volkswagen, el gigante automovilístico europeo, ha dado un paso adelante en la gestión del conocimiento dentro del ámbito de la producción al implementar una innovadora solución basada en inteligencia artificial generativa. En colaboración con el equipo de Prototipado e Ingeniería de Clientes de AWS (AWSI-PACE), VW ha puesto en marcha un prototipo que utiliza los avanzados modelos Claude 3 de Anthropic en Amazon Bedrock. Este prototipo permite extraer y analizar información de documentos privados complejos en formato PDF que contienen tanto texto como imágenes.
El principal desafío técnico para Volkswagen fue desarrollar un sistema eficiente capaz de manejar y procesar datos en un entorno multimodal que garantizara la precisión y accesibilidad de la información almacenada. La solución, basada en la arquitectura de Recuperación de Generación Aumentada (RAG), permite a VW gestionar y acceder de manera eficiente a la información interna, mejorando así la precisión y eficiencia en sus operaciones productivas.
La arquitectura desarrollada emplea un sistema backend nativo sin servidor de AWS, centrado en la eficiencia, escalabilidad y fiabilidad. Este sistema integra varios servicios de AWS como Amazon S3 para el almacenamiento de datos, Amazon Kendra para la búsqueda semántica y Amazon Bedrock para el análisis e inferencia de datos. Los modelos de visión de Claude 3 dentro de Amazon Bedrock son fundamentales para entender y analizar imágenes junto con el texto, lo que resulta esencial para extraer información de documentos complejos.
El flujo de trabajo del sistema comienza cuando un usuario carga un documento PDF a través de la interfaz web, facilitada por Amazon CloudFront. Una vez cargado, el documento es almacenado en Amazon S3, donde Amazon Kendra procede a indexar el texto. Simultáneamente, una función Lambda extrae imágenes de los documentos, y estas imágenes son procesadas por Amazon Bedrock para extraer texto contextual relevante. Este texto es nuevamente almacenado en S3 y posteriormente indexado por Amazon Kendra para mejorar la capacidad de búsqueda y consulta.
El sistema no solo gestiona documentos en alemán, sino que también demuestra una impresionante capacidad multilingüe, manejando consultas y proporcionando respuestas tanto en alemán como en inglés. Este avance es crucial para usuarios que interactúan con documentos en múltiples idiomas, permitiéndoles realizar consultas en su idioma preferido y mejorando, de este modo, la experiencia del usuario.
Los resultados del prototipo han sido impresionantes. No solo se ha logrado un proceso de búsqueda semántica más preciso y contextualmente relevante, sino que también se ha proporcionado una experiencia de usuario mejorada al integrar capacidades multilingües. Estas características han ampliado significativamente el alcance y la accesibilidad del sistema para los usuarios de VW.
Stefan Krawinkel, representante de VW, expresó su satisfacción con los resultados alcanzados, destacando el espíritu innovador del equipo de AWS y la capacidad de la inteligencia artificial generativa para enfrentar desafíos complejos y redefinir fronteras tecnológicas. La colaboración no solo ha permitido superar barreras actuales, sino que también ha abierto nuevas posibilidades para futuras innovaciones en el sector automotriz.