Compartir:
Los avances recientes en inteligencia artificial generativa están revolucionando la manera en que las empresas gestionan y producen contenido visual. Entre los líderes de este cambio se encuentra Amazon Bedrock, un servicio completamente gestionado que ofrece modelos fundamentales de alto rendimiento de compañías reconocidas en inteligencia artificial como AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, Stability AI y Amazon, a través de una sola API. Este servicio permite a las empresas personalizar modelos, perfeccionar sus capacidades, y ejecutar generación aumentada por recuperación (RAG) de manera responsable y segura.
Las ventajas de estas herramientas en el ámbito empresarial son notables, pues permiten mejorar la experiencia del usuario y generar material multimedia como imágenes, diagramas, infografías o formas personalizadas. Adicionalmente, es posible evaluar la confianza en el contenido creado mediante modelos de evaluación preentrenados que han sido adaptados con datos y parámetros propios de la organización.
En las últimas semanas, Amazon ha presentado su innovador Amazon Titan Image Generator G1 v2 en el entorno Bedrock. Este modelo especial se basa en la vasta experiencia de Amazon a lo largo de 25 años en inteligencia artificial y aprendizaje automático, permitiendo a los creadores de contenido generar imágenes de alta calidad rápidamente a partir de sencillas indicaciones en inglés. Las imágenes producidas alcanzan una calidad de estudio, idónea para publicidad, comercio electrónico y entretenimiento. La versión ampliada del G1 v2 introduce mejoras que permiten guiar la creación de imágenes utilizando referencias visuales, editar imágenes ya existentes, eliminar fondos, generar diversas versiones y personalizar el modelo de forma segura para mantener la consistencia de la marca.
Asimismo, se ha lanzado el modelo Anthropic Claude 3.5 Sonnet, que establece nuevos estándares en la industria por su elevado nivel de inteligencia, superando a otros modelos generativos en diversos parámetros de evaluación. También disponible en Amazon Bedrock, ofrece la misma velocidad y costo que el modelo original, pero con significativas mejoras en razonamiento avanzado y en la comprensión de instrucciones complejas.
La interacción con estos modelos a través de Amazon Bedrock implica el envío de un prompt como una solicitud a través de la API, que es procesada mediante una función AWS Lambda. Esta función invoca a Amazon Bedrock para generar una imagen basada en el prompt utilizando el Amazon Titan Image Generator G1 v2, y luego evalúa la imagen mediante el modelo Claude 3.5 Sonnet, encargándose de describirla, puntuarla y sugerir mejoras. Las imágenes generadas se almacenan en Amazon S3 con un enlace pre-firmado como respuesta.
El sistema completo está diseñado para implementarse en la región AWS us-east-1 e integrarse fácilmente con infraestructuras ya existentes mediante un archivo de plantilla de AWS CloudFormation. Estas innovaciones demuestran el creciente potencial de la inteligencia artificial generativa para automatizar y personalizar tareas creativas dentro de las empresas.