Compartir:
Durante la conferencia AWS re:Invent 2024, Amazon Web Services (AWS) ha dado a conocer un avance significativo en su plataforma Amazon SageMaker HyperPod, que ahora opera en integración con Amazon Elastic Kubernetes Service (EKS). Esta nueva característica está diseñada para optimizar el desarrollo de inteligencia artificial generativa al permitir la ejecución de tareas en recursos de computación acelerada compartidos, lo que podría resultar en un ahorro de costos de hasta un 40%.
La implementación de esta gobernanza de tareas permite a los administradores controlar de manera eficiente la asignación de esos recursos acelerados a diversos equipos y proyectos. Además, ofrece la posibilidad de establecer políticas que prioricen diferentes tipos de tareas, facilitando a las organizaciones concentrarse en impulsar la innovación en inteligencia artificial generativa y reduciendo significativamente el tiempo de lanzamiento de productos al mercado. Esta nueva capacidad elimina la necesidad de lidiar con la complejidad de coordinar la distribución de recursos.
AWS también ha compartido mejores prácticas para maximizar los beneficios de esta herramienta, enfocándose en garantizar que tanto la experiencia administrativa como la de los científicos de datos sea fluida. Destaca especialmente la administración de la capacidad de cómputo, que gracias a esta herramienta, permite a los administradores establecer asignaciones específicas para cada equipo. Así, se determina qué tipo de tareas se realizan y cómo se priorizan en comparación con otros grupos, reforzando la eficiencia mediante estrategias de cuotas y asignación de peso.
Para facilitar la supervisión y la gestión, se ofrece un tablero que proporciona una visión clara del rendimiento del cluster y de la utilización de los recursos, con la posibilidad de integrar herramientas adicionales como Amazon Managed Prometheus y Grafana para un análisis más detallado.
Los científicos de datos también se benefician de un acceso más adecuado y un mayor control sobre la infraestructura mediante roles basados en control de acceso. Esto les permite enviar tareas con la priorización correcta y les proporciona herramientas como HyperPod CLI, que simplifican la interacción con el sistema y permiten ajustes de tareas de forma más eficaz.
SageMaker HyperPod presenta, además, escenarios prácticos que demuestran cómo diversos tipos de empresas, desde startups hasta grandes corporaciones, pueden optimizar el uso de recursos y reducir los tiempos de espera en sus operaciones. Este sistema, diseñado para ofrecer escalabilidad y eficiencia, se perfila como un aliado esencial para los desarrolladores de soluciones avanzadas de inteligencia artificial que operan en la nube.