Acelera el Desarrollo de Flujos de Trabajo de ML con Amazon Q Developer en Amazon SageMaker Studio

Elena Digital López

Los proyectos de machine learning (ML) son inherentemente complejos, involucrando múltiples pasos intrincados desde la recolección y preprocesamiento de datos hasta la construcción, despliegue y mantenimiento de modelos. Los científicos de datos enfrentan numerosos desafíos a lo largo de este proceso, como la selección de herramientas adecuadas, la necesidad de instrucciones paso a paso con ejemplos de código y la solución de errores y problemas. Estos desafíos iterativos pueden obstaculizar el progreso y ralentizar los proyectos. Afortunadamente, asistentes de desarrolladores impulsados por IA generativa como Amazon Q Developer han surgido para ayudar a los científicos de datos a simplificar sus flujos de trabajo y acelerar los proyectos de ML, permitiéndoles ahorrar tiempo y enfocarse en iniciativas estratégicas e innovación.

Amazon Q Developer está totalmente integrado con Amazon SageMaker Studio, un entorno de desarrollo integrado (IDE) que proporciona una única interfaz web para gestionar todas las etapas del desarrollo de ML. Puedes usar este asistente de lenguaje natural desde tu cuaderno de SageMaker Studio para obtener asistencia personalizada en lenguaje natural. Ofrece recomendaciones de herramientas, orientación paso a paso, generación de código y soporte para solucionar problemas. Esta integración simplifica tu flujo de trabajo de ML y te ayuda a construir, entrenar y desplegar modelos de ML de manera eficiente sin necesidad de salir de SageMaker Studio para buscar recursos adicionales o documentación.

Amazon Q Developer se presenta como una herramienta para analizar el conjunto de datos de Diabetes 130-US hospitales y desarrollar un modelo de ML que prediga la probabilidad de readmisión después del alta. A lo largo de este ejercicio, se utiliza Amazon Q Developer en SageMaker Studio para diversas etapas del ciclo de desarrollo, experimentando de primera mano cómo este asistente de lenguaje natural puede ayudar incluso a los científicos de datos o ingenieros de ML más experimentados a simplificar el proceso de desarrollo y acelerar el tiempo hasta obtener valor.

Para los usuarios de AWS Identity and Access Management (IAM) y AWS IAM Identity Center, es posible usar la suscripción Amazon Q Developer Pro tier dentro de Amazon SageMaker. Los administradores pueden suscribir a los usuarios al nivel Pro desde la consola de Amazon Q Developer, habilitar el nivel Pro en la configuración del dominio de SageMaker y proporcionar el Amazon Resource Name (ARN) del perfil de Amazon Q Developer. El nivel Pro ofrece chat ilimitado y sugerencias de código en línea.

Para iniciar el proyecto de ML para predecir la probabilidad de readmisión en pacientes con diabetes, es necesario descargar el conjunto de datos Diabetes 130-US hospitales. Este conjunto contiene datos de atención clínica de 10 años (1999-2008) en 130 hospitales de EE. UU. y redes de entrega integradas. Cada fila representa los registros hospitalarios de pacientes diagnosticados con diabetes, quienes se sometieron a pruebas de laboratorio, entre otras.

En SageMaker Studio, se puede empezar a trabajar en el problema de ML de reducir las tasas de readmisión para pacientes con diabetes usando la capacidad de chat junto al cuaderno de JupyterLab. Se pueden hacer preguntas sobre cómo generar código para analizar los datos de hospitales de EE. UU., cómo formular el problema de ML y desarrollar un plan para construir un modelo de ML que prediga la probabilidad de readmisión después del alta.

Es posible preguntar a Amazon Q Developer que ayude a planificar el proyecto de ML. En este caso, se pide al asistente que muestre cómo entrenar un clasificador de bosque aleatorio usando el conjunto de datos de Diabetes 130-US. Si se genera código, se puede usar la interfaz de usuario para insertar directamente el código en el cuaderno.

Amazon Q Developer también ofrece explicaciones de código existente y soluciones para errores comunes. Simplemente hay que seleccionar la celda con el error e ingresar /fix en el chat.

Para obtener el máximo provecho del chat de Amazon Q Developer, se recomienda seguir las mejores prácticas al redactar tus consultas, siendo directo y específico, proporcionando información contextual y evitando temas sensibles.

Además, se pueden recibir sugerencias de código en tiempo real mientras se escribe en el cuaderno de JupyterLab. En un ejemplo, se demuestra cómo utilizar esta función para generar bloques de código para varias tareas de ciencia de datos: desde la exploración de datos hasta la ingeniería de características, el entrenamiento de un modelo de bosque aleatorio, la evaluación del modelo y finalmente el despliegue del modelo para predecir la probabilidad de readmisión de pacientes con diabetes.

Al usar Amazon Q Developer en SageMaker Studio, no se utiliza contenido del cliente para mejorar el servicio, independientemente de si se utiliza el nivel gratuito o pro. Es posible optar por no compartir el uso de datos del IDE completando ciertos pasos en la configuración.

Para evitar incurrir en cargos de AWS después de probar esta solución, se debe eliminar el dominio de SageMaker Studio.

En conclusión, utilizando un caso de uso real, se desarrolló un modelo de ML que predice la probabilidad de readmisión después del alta para pacientes en el conjunto de datos de Diabetes 130-US hospitales. A lo largo del ejercicio, se utilizó Amazon Q Developer en SageMaker Studio para diversas etapas del ciclo de desarrollo, demostrando cómo este asistente puede ayudar a simplificar el proceso de desarrollo y acelerar el tiempo hasta obtener valor, incluso para practicantes de ML experimentados.

Scroll al inicio