Compartir:
Uno de los usos más comunes de la inteligencia artificial generativa (IA) y los grandes modelos de lenguaje (LLMs) en un entorno empresarial es responder preguntas basadas en el corpus de conocimiento de la empresa. Los modelos de fundación preentrenados (FMs) sobresalen en tareas de comprensión del lenguaje natural (NLU), como la generación de resúmenes, la generación de texto y la respuesta a preguntas sobre una amplia gama de temas. Sin embargo, a menudo tienen dificultades para proporcionar respuestas precisas sin "alucinaciones" y no pueden abordar cuestiones sobre contenido no incluido en sus datos de entrenamiento. Además, los FMs se entrenan con una instantánea temporal de los datos y no tienen la capacidad inherente de acceder a datos frescos en tiempo real, lo que puede llevar a respuestas incorrectas o inadecuadas.
Nos enfrentamos a un desafío fundamental con los datos empresariales: superar la desconexión entre el lenguaje natural y los datos estructurados. El lenguaje natural es ambiguo e impreciso, mientras que los datos se adhieren a esquemas rígidos. Por ejemplo, las consultas SQL pueden ser complejas e intuitivas para usuarios no técnicos. Manejar consultas complejas que impliquen múltiples tablas, uniones y agregaciones dificulta la interpretación de la intención del usuario y la traducción correcta en operaciones SQL. La terminología específica del dominio también complica el proceso de mapeo. Otro desafío es acomodar las variaciones lingüísticas que los usuarios emplean para expresar el mismo requisito. Manejar eficazmente sinónimos, paráfrasis y frases alternativas es importante. La ambigüedad inherente del lenguaje natural también puede resultar en múltiples interpretaciones de una sola consulta, dificultando la comprensión precisa de la intención del usuario.
Para superar esta brecha, se necesita un procesamiento avanzado del lenguaje natural (NLP) que mapee las consultas de los usuarios con el esquema de la base de datos, tablas y operaciones. En esta arquitectura, Amazon Q Business actúa como intermediario, traduciendo el lenguaje natural en consultas SQL precisas. Los usuarios pueden simplemente hacer preguntas como "¿Cuáles fueron las ventas de equipo para exteriores en el tercer trimestre de 2023?" Amazon Q Business analiza la intención, accede a las fuentes de datos y genera la consulta SQL. Esto simplifica el acceso a los datos para los usuarios no técnicos y optimiza los flujos de trabajo para los profesionales, permitiéndoles centrarse en tareas de más alto nivel.
En este artículo, se discute una arquitectura para consultar datos estructurados utilizando Amazon Q Business y construir una aplicación para consultar datos de costos y uso en Amazon Athena con Amazon Q Business. Amazon Q Business puede crear consultas SQL a sus fuentes de datos cuando se le proporciona el esquema de la base de datos, metadatos adicionales que describen las columnas y tablas, e instrucciones de avisos. Puede extender esta arquitectura para usar fuentes de datos adicionales, validación de consultas y técnicas de aviso para cubrir una gama más amplia de casos de uso.
La siguiente figura representa la arquitectura de alto nivel de la solución propuesta. Los pasos 3 y 4 amplían la integración del Centro de Identidad IAM de AWS con Amazon Q Business para un flujo de autorización. En esta arquitectura, se utiliza Amazon Cognito para la autenticación de usuarios y un emisor de tokens confiable para el Centro de Identidad IAM. También se puede usar un proveedor de identidad propio como emisor de tokens confiable siempre que sea compatible con OpenID Connect (OIDC).
El flujo de trabajo incluye los siguientes pasos:
- El usuario inicia la interacción con la aplicación Streamlit, que es accesible a través de un Balanceador de Carga de Aplicación, actuando como punto de entrada.
- La aplicación solicita al usuario autenticarse utilizando sus credenciales de Amazon Cognito, manteniendo acceso seguro.
- La aplicación intercambia el token obtenido de Amazon Cognito por un token del Centro de Identidad IAM, otorgando el alcance necesario para interactuar con Amazon Q Business.
- Utilizando el token del Centro de Identidad IAM, la aplicación asume un rol de Administración y Gestión de Identidades (IAM) de AWS y obtiene una sesión de AWS desde el Servicio de Seguridad de Tokens de AWS (AWS STS), habilitando la comunicación autorizada con Amazon Q Business.
- Basado en la consulta en lenguaje natural del usuario, la aplicación formula los avisos y metadatos relevantes, que luego son enviados a la API
chat_sync
de Amazon Q Business. En respuesta, Amazon Q Business proporciona una consulta Athena apropiada para ejecutar. - La aplicación ejecuta la consulta Athena recibida de Amazon Q Business y los datos resultantes se muestran en la interfaz de usuario de la aplicación web.
Para concluir, Amazon Q Business puede utilizar directamente los LLM para generar respuestas adecuadas, utilizando modos de chat como CREATOR_MODE
, que permite omitir la generación de recuperación aumentada (RAG) y usar texto directo en la ventana de contexto para la generación de respuestas. Esta capacidad permite a los usuarios empresariales utilizar las capacidades avanzadas de NLP y NLU para acceder y analizar datos estructurados de manera efectiva, facilitando la toma de decisiones basada en datos, la innovación y la creación de nuevas oportunidades para el crecimiento y el éxito.