Compartir:
Generative AI está revolucionando la manera en que interactuamos con la tecnología. Desde chatbots que conversan como humanos hasta generadores de imágenes que producen visuales impactantes, esta asombrosa tecnología está transformando nuestro mundo. Pero detrás de estas capacidades asombrosas se encuentra una gran infraestructura computacional cargada de complejidades técnicas que a menudo pasan desapercibidas.
En este artículo, exploraremos el ámbito de la computación de alto rendimiento (HPC) y los desafíos involucrados en la producción de aplicaciones de inteligencia artificial generativa como los gemelos digitales. También analizaremos el crecimiento explosivo en la demanda de computación, las limitaciones de las configuraciones tradicionales de HPC, y las soluciones innovadoras que están surgiendo para enfrentar estos obstáculos.
Me presento brevemente. Soy Santosh, y mi formación es en física. Actualmente, dirijo la investigación y el desarrollo de productos en Covalent, donde nos enfocamos en la orquestación de la computación a gran escala para la inteligencia artificial, el desarrollo de modelos y otros dominios relacionados.
La inteligencia artificial generativa se está abriendo paso en numerosos dominios, siendo utilizada en tecnologías climáticas, tecnologías de salud, software y procesamiento de datos, inteligencia artificial empresarial, y robótica y gemelos digitales. Hoy nos centraremos en estos últimos.
Un gemelo digital es una representación virtual de un sistema o proceso físico. Implica recolectar datos matemáticos del sistema real y alimentarlos a un modelo digital.
Por ejemplo, en aplicaciones robóticas y de manufactura, podemos imaginar una gran fábrica con numerosos robots operando de manera autónoma. Modelos de visión por computadora rastrean las ubicaciones de robots, personas y objetos dentro de la instalación, con el objetivo de alimentar estos datos numéricos a una base de datos que un modelo de IA puede entender y razonar.
Con esta réplica virtual del entorno físico, el modelo de IA puede comprender el escenario real en desarrollo. Si ocurre un evento imprevisto, como la caída de una caja de una estantería, el modelo puede simular múltiples caminos futuros para el robot y optimizar su curso de acción recomendado.
Otra aplicación poderosa es en el cuidado de la salud. Los datos del paciente, provenientes de sus signos vitales y otras lecturas médicas, podrían alimentar un modelo fundamental que brinde orientación y recomendaciones en tiempo real a los médicos en función de la condición actual del paciente.
Sin embargo, llevar este concepto a entornos de producción reales o de atención médica presenta numerosos desafíos técnicos que deben ser abordados.
Pasemos ahora al poder computacional detrás de estas aplicaciones avanzadas de IA. Hace unos años, gigantes como Walmart eran los que más gastaban en servicios de computación en la nube de proveedores como AWS y GCP, invirtiendo cientos de millones de dólares cada año. Sin embargo, en los últimos años, han surgido nuevas startups de IA como los mayores consumidores de estos recursos.
Por ejemplo, entrenar ChatGPT-3 en 2022 costó aproximadamente 4 millones de dólares solo en poder computacional. Su sucesor, ChatGPT-4, ascendió a un estimado de 75 millones de dólares en costos de computación. Y el recientemente lanzado Gemini Ultra de Google acumuló casi 200 millones de dólares en gasto computacional.