Pixtral 12B ya disponible en Amazon SageMaker JumpStart: Innovación en IA

Elena Digital López

Hoy se ha anunciado el lanzamiento de Pixtral 12B, un modelo de lenguaje visual de última generación desarrollado por Mistral AI, que ahora está disponible para los clientes a través de Amazon SageMaker JumpStart. Este modelo, capaz de manejar tanto tareas de texto como multimodales, promete rendimiento excepcional en aplicaciones como la comprensión de gráficos, la respuesta a preguntas sobre documentos, el razonamiento multimodal y el seguimiento de instrucciones.

El modelo Pixtral 12B destaca por su capacidad de procesar imágenes en su resolución y relación de aspecto originales, sin comprometer las tareas textuales. Su innovadora arquitectura incluye un codificador de visión con 400 millones de parámetros y un decodificador transformador multimodal con 12 mil millones de parámetros, lo que le permite realizar inferencias rápidas y precisas.

Disponible bajo la licencia comercial Apache 2.0, Pixtral 12B ofrece a empresas y startups una poderosa herramienta para desarrollar aplicaciones multimodales complejas. La integración con SageMaker JumpStart facilita el acceso y despliegue de modelos de aprendizaje automático en un entorno seguro, permitiendo personalizaciones profundas para casos de uso específicos.

SageMaker JumpStart, parte de AWS, permite a los desarrolladores despliegue de modelos preentrenados de alto rendimiento en instancias dedicadas de inferencia, incluyendo las potenciadas por AWS Trainium e Inferentia. Aunque el ajuste fino del Pixtral 12B aún no está disponible, sus capacidades permiten tareas como el reconocimiento óptico de caracteres (OCR), análisis de gráficos y conversión de imágenes a código a través de interfaces intuitivas o el SDK de Python de SageMaker.

Con esta innovación, Mistral AI refuerza su posición en el desarrollo de modelos de lenguaje visual, mientras que Amazon SageMaker JumpStart sigue facilitando el acceso a avanzadas arquitecturas de modelos. Este avance marca un paso importante en la integración de modelos multimodales en procesos empresariales, cimentando el camino hacia futuras innovaciones en inteligencia artificial.

Scroll al inicio