Revolucionando la Generación de Videos: Una Nueva Era Tecnológica

PUBLICADO EN Actualidad

X (Twitter) Facebook LinkedIn WhatsApp Telegram Pinterest

La competencia en el campo de la inteligencia artificial para la generación de video se intensifica con el reciente lanzamiento de Veo 2 por parte de Google DeepMind. Este innovador modelo promete transformar la creación de contenido audiovisual, ofreciendo videos de alta calidad con resoluciones de hasta 1080p y duraciones que superan el minuto. Con una amplia variedad de estilos visuales y cinematográficos, Veo 2 busca establecer nuevos estándares en la industria.

Este modelo se destaca por su capacidad de generar videos realistas, comprendiendo múltiples tipos de tomas de cámara como vistas desde drones, tomas panorámicas y primeros planos. Un ejemplo impresionante es la recreación de un plano en ángulo bajo de flamencos en un lago, capturando la belleza natural con una exactitud que refleja las intenciones de DeepMind de acercarse al realismo cinematográfico.

Comparado con Sora, el modelo reciente de OpenAI, Veo 2 sobresale en realismo y precisión física, lo que permite un mayor control sobre el proceso de generación de video. Sora, por su parte, se enfoca más en la narrativa creativa y escenarios imaginativos. Google ha realizado pruebas que revelan que Veo 2 supera a competidores como Sora Turbo en la calidad de los clips de video, aunque reconoce que aún hay desafíos en escenas complejas y secuencias de movimiento.

Inicialmente, Veo 2 será implementado en productos seleccionados como VideoFX, YouTube y Vertex AI, antes de expandirse a plataformas como YouTube Shorts en 2025. Para asegurar la transparencia y un uso responsable, todos los videos generados llevarán una marca de agua invisible denominada SynthID.

Además, DeepMind ha actualizado su modelo de generación de imágenes, Imagen 3, que ahora produce imágenes con colores más vivos y mayor detalle. Este avance forma parte de un despliegue global. Paralelamente, Google Labs ha lanzado un experimento llamado «Whisk», que utiliza las capacidades de Imagen 3 y Gemini para demostrar los avances en la generación visual mediante interacción de imágenes, subrayando el potencial de la inteligencia artificial en la creación de contenido visual.