Mejorando el Relleno de Slots en Amazon Lex mediante Puntuaciones de Confianza en la Transcripción

Elena Digital López

El desarrollo de chatbots con capacidades de reconocimiento de voz ha recibido un impulso significativo gracias a Amazon Lex, una herramienta que busca optimizar la interacción con los usuarios mediante una captura precisa del habla. Una de las principales dificultades en este campo es garantizar que los datos específicos, como números de cuenta o códigos de confirmación, se detecten con exactitud. Para abordar esta necesidad, Amazon Lex ha incorporado las puntuaciones de confianza de transcripción, un recurso innovador que promete mejorar la fiabilidad en la recopilación de datos.

Estas puntuaciones de confianza son métricas que Amazon Lex emplea para evaluar el grado de certeza en la conversión de voz a texto de los valores de slot, independientemente de las puntuaciones de reconocimiento de intención o entidad. Cada vez que se pronuncia un valor de slot, Lex asigna una puntuación de confianza que permite a los desarrolladores verificar la precisión de la entrada, valorar la necesidad de confirmación o repetir la pregunta, e inclusive modificar el flujo de conversación basándose en el nivel de confianza detectado.

La implementación de este sistema introduce diversas estrategias para manejar los slots de manera eficiente. Entre ellas, la confirmación progresiva que sugiere, por ejemplo, aceptar un valor con una puntuación de confianza alta (superior a 0.9), mientras que las puntuaciones medias o bajas requieren confirmar o repetir la información. También se pone en práctica la re-pregunta adaptativa, ajustando los mensajes según la confianza, y una lógica de ramificación que redirige a un agente humano en caso de persistentes intentos de baja confianza.

Este enfoque estratégico se hace evidente en las interacciones diarias entre usuarios y agentes virtuales. Implementando estas pautas, no solo se minimizan los errores en la recepción de información crítica, sino que se incrementan las tasas de auto-servicio y se gestiona más adecuadamente las condiciones de audio adversas. Así, se logra una mejora en la experiencia del cliente a través de flujos conversacionales más inteligentes.

Complementando esta innovación, la integración de Amazon Lex con Amazon Connect permite evaluar la confianza en las transcripciones en tiempo real, ajustando el proceso de verificación de información según sea necesario. Los ejemplos prácticos demuestran cómo este grado de confianza influye en la interacción entre usuario y agente virtual, promoviendo un intercambio más ágil y satisfactorio.

Para implementar esta tecnología, es necesaria una cuenta de AWS y ciertos permisos específicos para manejar los recursos pertinentes. A partir de aquí, se pueden seguir unos pasos definidos para crear y configurar tanto el bot de Amazon Lex como el flujo de Amazon Connect. La personalización del flujo conversacional, incluida la lógica de puntuación de confianza de transcripción, es facilitada por la Visual Conversation Builder.

No obstante, existen limitaciones actuales para este servicio. Las puntuaciones de confianza de transcripción solo están disponibles en inglés y para entradas de audio de 8 kHz. Asimismo, no se generan puntuaciones para las entradas de audio de la ventana de prueba de Amazon Lex V2.

En última instancia, para los diseñadores de conversaciones en Amazon Lex, optimizar la experiencia del usuario es esencial. La implementación de este tipo de características permite mantener un diálogo natural mientras se asegura la precisión en la captura de información esencial, llevando a una interacción más satisfactoria con los usuarios.

Scroll al inicio