Creación de una solución de resumen de audio sin servidores con Amazon Bedrock y Whisper

Elena Digital López

En el ámbito empresarial, la gestión de información vital derivada de reuniones y entrevistas ha encontrado un aliado en las nuevas tecnologías. Las grabaciones de estos encuentros son esenciales, pero la transcripción y el resumen manual son procesos tediosos. Afortunadamente, los avances en inteligencia artificial generativa y el reconocimiento automático de voz están optimizando estos procedimientos, haciéndolos más ágiles y eficientes.

La seguridad de datos personales es una prioridad, no solo por razones éticas sino también legales. Actualmente, el modelo Open AI Whisper Large V3 Turbo, accesible a través del Amazon Bedrock Marketplace, permite la transcripción de audio casi en tiempo real, a la vez que elimina información sensible gracias a sus robustas funciones de privacidad. Amazon Bedrock ofrece un servicio gestionado que se sirve de modelos de compañías punteras en inteligencia artificial como AI21 Labs y Anthropic, incorporando medidas de seguridad mediante los Bedrock Guardrails para proteger los datos personales.

El proceso se inicia con la carga de archivos mediante una aplicación frontend basada en React, la cual está alojada en Amazon CloudFront y apoyada por Amazon S3 y Amazon API Gateway. Este sistema activa una máquina de estados en Step Functions, que organiza el procesamiento en varias fases: transcripción de audio, identificación de hablantes y generación de resúmenes, coordinadas por funciones Lambda para mantener un flujo de datos continuo y sin interrupciones.

Cada paso del flujo de trabajo está diseñado para completarse antes de avanzar al siguiente, incorporando mecanismos para manejar errores y reintentos de manera automática. Al finalizar, el usuario recibe un resumen de la grabación que respeta la privacidad y cumple con las normativas vigentes.

Esta innovadora solución no solo incrementa la eficiencia en la gestión de información, sino que también establece un nuevo estándar de seguridad, protegiendo eficazmente los datos personales. Sectores como la salud, finanzas y servicios legales, donde la protección de datos es crítica, se verán considerablemente beneficiados por la adopción de esta tecnología.

Scroll al inicio