Nuevas Capacidades de NVIDIA en Amazon SageMaker Aceleran Cargas de Trabajo de Inferencia de IA

Elena Digital López

En el marco del evento re:Invent 2024, se ha anunciado una colaboración estratégica destinada a acelerar las tareas de inferencia de inteligencia artificial (IA) utilizando nuevas capacidades impulsadas por la tecnología computacional de NVIDIA y las herramientas de software de Amazon SageMaker. Este esfuerzo consolida la continua alianza entre ambas compañías, ahora enfocada en mejorar el soporte para instancias de GPU dedicadas a la inferencia e integrar las innovaciones de NVIDIA.

Se dieron a conocer tres importantes avances que mejoran las capacidades de inferencia de IA. En primer lugar, los microservicios NVIDIA NIM están ahora disponibles en AWS Marketplace para despliegues de SageMaker Inference, facilitando el acceso a modelos de IA generativa de última generación para los usuarios. En segundo lugar, el modelo NVIDIA Nemotron-4 ha sido incorporado a Amazon SageMaker JumpStart, ampliando significativamente la oferta de modelos preentrenados de alta calidad disponibles. Este modelo destaca por sus habilidades multilingües y su rendimiento en pruebas de razonamiento.

Finalmente, las instancias P5e y G6e optimizadas para la inferencia ahora están disponibles en Amazon SageMaker, equipadas con las tarjetas gráficas NVIDIA H200 Tensor Core y L40S para gestionar cargas de trabajo exigentes de inferencia de IA.

Durante el evento, se destacó cómo estos desarrollos permiten a las organizaciones desplegar modelos de IA generativa de manera rápida y escalar sus aplicaciones de forma eficiente mediante los microservicios NVIDIA NIM. Asimismo, el modelo NVIDIA Nemotron-4, una innovadora adición a los modelos de lenguaje grande, está plenamente integrado en la oferta de SageMaker JumpStart, facilitando su implementación para una amplia gama de clientes.

En el ámbito del hardware, las nuevas instancias P5e y G6e, equipadas con las GPUs de NVIDIA, ofrecen avances significativos respecto a generaciones anteriores, permitiendo tanto la implementación como el entrenamiento de modelos de aprendizaje automático más complejos.

Este anuncio representa un avance significativo en términos de accesibilidad y eficiencia para las empresas que buscan aprovechar las avanzadas capacidades de inferencia de IA, permitiendo su aplicación en proyectos de diversos sectores industriales. Con estas mejoras, las organizaciones podrán impulsar la innovación y optimizar sus procesos de decisión gracias a una infraestructura optimizada y flexible, capaz de manejar complejas cargas de trabajo y diversos casos de uso a nivel empresarial.

Scroll al inicio