Compartir:
El desarrollo de un prototipo innovador para la traducción de voz en tiempo real está revolucionando el soporte al cliente multilingüe en las empresas globales. Gracias a la colaboración entre AWS y DXC Technology, se ha creado un prototipo de traducción de voz a voz (V2V) que promete transformar la forma en que los centros de contacto manejan las interacciones con clientes en diferentes idiomas.
La iniciativa surgió a raíz de un desafío que enfrentaba DXC Technology en el tercer trimestre de 2024: sus centros de contacto globales necesitaban atender a clientes que hablaban múltiples idiomas sin incrementar de forma exponencial los costos asociados con la contratación de agentes especializados en lenguas de bajo volumen. Anteriormente, DXC había explorado varias alternativas, pero encontró limitaciones en cada una de ellas, que iban desde restricciones en la comunicación hasta requisitos de infraestructura que afectaban la confiabilidad y la escalabilidad del servicio. Esta situación llevó a ambas empresas a organizar un hackathon enfocado en definir los requisitos esenciales para una traducción en tiempo real, así como establecer métricas de latencia y precisión y crear una estrategia de implementación por fases.
El impacto en el negocio ha sido significativo. El prototipo no solo ha permitido maximizar el talento técnico al contratar y emparejar agentes según su conocimiento técnico, sino que también ha eliminado las restricciones geográficas y lingüísticas en la contratación y entrega de soporte. A través de un modelo de traducción por uso, se han reducido costos al eliminar las primas por experiencia en múltiples idiomas y los gastos de formación especializada.
El sistema funciona mediante tecnologías avanzadas de reconocimiento de voz y traducción automática de AWS. El prototipo utiliza Amazon Connect para permitir la traducción de conversaciones en tiempo real entre agentes y clientes: el habla del cliente se convierte en texto con Amazon Transcribe, que luego se traduce gracias a Amazon Translate y se convierte nuevamente en audio con Amazon Polly. El proceso es bidireccional, asegurando que tanto el agente como el cliente puedan comunicarse en su idioma preferido, manteniendo una conversación fluida.
Sin embargo, los implementadores han encontrado desafíos. Aunque el sistema ha sido optimizado para minimizar el tiempo de procesamiento de audio, la experiencia del usuario no coincide completamente con la de una conversación en el mismo idioma. Esto se debe a períodos de silencio en los que tanto el agente como el cliente no escuchan ninguna respuesta mientras se procesan las traducciones. Para abordar esta limitación, se están explorando complementos de streaming de audio que simulan una conversación más natural y continua.
A medida que las empresas buscan mejorar su comunicación multilingüe en centros de contacto, el prototipo V2V de Amazon Connect está disponible para personalización y puede servir como base para el desarrollo de soluciones innovadoras en las comunicaciones. Con esta tecnología, se espera no solo derribar las barreras del idioma, sino también mejorar la flexibilidad operativa y la experiencia del cliente en un entorno comercial cada vez más globalizado.