Migrar flujos de Amazon SageMaker Data Wrangler a Amazon SageMaker Canvas para acelerar la preparación de datos

Elena Digital López

Amazon SageMaker Canvas introduce una innovadora integración con SageMaker Data Wrangler, proporcionando una interfaz visual mejorada que simplifica y acelera la preparación de datos para proyectos de aprendizaje automático (ML). Este avance responde a una de las demandas más comunes de los clientes: la necesidad de reducir la complejidad y el tiempo requerido en la preparación de datos, una tarea frecuentemente tediosa y laboriosa.

Ahora, SageMaker Canvas no solo permite la construcción y despliegue de modelos ML sin escribir código, sino que también incorpora capacidades avanzadas de preparación de datos específicas para ML, anteriormente disponibles solo en SageMaker Data Wrangler. Esta combinación ofrece a los usuarios un espacio de trabajo integral y sin código para la preparación de datos, así como para la creación y el despliegue de modelos ML.

La plataforma mejora la preparación de datos con varias características nuevas y optimizadas. Entre ellas se incluyen la carga de páginas hasta diez veces más rápida, una interfaz de lenguaje natural para la preparación de datos y la posibilidad de visualizar el tamaño y la forma de los datos en cada paso. Además, se han mejorado las funciones de reemplazo y reordenación de transformaciones para iterar en el flujo de datos de manera más eficiente. Los usuarios también pueden crear modelos con un solo clic dentro de la misma interfaz o crear conjuntos de datos de SageMaker Canvas para afinar modelos de base.

El nuevo proceso permite a los usuarios migrar sus flujos de Data Wrangler existentes al entorno de SageMaker Canvas, haciendo uso de Amazon Simple Storage Service (Amazon S3) como paso intermedio. Este método de migración implica abrir un terminal en SageMaker Studio, copiar los archivos de flujo a Amazon S3 e importarlos a SageMaker Canvas.

Una vez migrados, estos flujos pueden ser modificados y analizados mediante la interfaz visual de SageMaker Canvas, utilizando capacidades tanto manuales como de lenguaje natural para explorar y preparar los datos. Cuando los usuarios están satisfechos con los datos, pueden optar por crear un modelo de ML o exportar el conjunto de datos para construir y usar modelos de aprendizaje automático.

La integración de SageMaker Data Wrangler en SageMaker Canvas representa un enfoque unificado para la preparación de datos, la construcción de modelos y su despliegue, permitiendo a analistas de negocio y usuarios no técnicos ser más eficientes en sus proyectos de ML. Esta herramienta no solo ahorra tiempo y reduce la complejidad, sino que también incorpora características avanzadas que mejoran la calidad y precisión de los modelos ML.

Para comenzar a explorar estas nuevas capacidades de SageMaker Canvas, los usuarios pueden iniciar sesión, preparar sus flujos de datos, y experimentar el poder de una plataforma unificada para la preparación de datos y el desarrollo de modelos de ML.

Scroll al inicio