Ufxqu fKVkM 4NAxE HlNdQ jcHr1 E7CvT act3e 5cvBX

Elon Musk instaló 100.000 GPU Nvidia H200 en 19 días


Cuando compra a través de enlaces en nuestros artículos, Future y sus socios de distribución pueden ganar una comisión.

  Musk ayuda en Memphis.   Musk ayuda en Memphis.

Crédito: xAI en Twitter/X

Elon Musk y el equipo detrás de xAI han logrado una maravilla de la ingeniería al configurar un supercúmulo de 100.000 GPU H200 Blackwell en la friolera de 19 días. El director ejecutivo de Nvidia, Jensen Huang, contó la historia de la increíble destreza de instalación de Elon Musk con miembros de Tesla Owners Silicon Valley en X.

Huang describe la escapada de 19 días de Musk con asombro y respeto, calificando el esfuerzo de “sobrehumano”. El equipo de xAI supuestamente pasó de la fase de “concepto” a la compatibilidad total con el “equipo” de Nvidia en menos de tres semanas. Esto también incluye ejecutar la primera ejecución de entrenamiento de IA de xAI en el supercúmulo recién construido.

De principio a fin, el proceso implicó construir la enorme fábrica X donde residirían las GPU y equipar toda la fábrica con refrigeración líquida y energía para que las 200.000 GPU estuvieran operativas. Eso sin mencionar toda la coordinación entre los equipos de ingeniería de Nvidia y Elon Musk para enviar e instalar todo el hardware y la infraestructura de manera precisa y coordinada.

Para ponerlo en perspectiva, Huang afirma que a un centro de datos promedio le toma cuatro años hacer lo que Elon Musk y su equipo pudieron hacer en 19 días. Sólo tres años de ese tiempo se dedicarían a la planificación, mientras que el último año se utilizaría para enviar el equipo, instalarlo y ponerlo todo en funcionamiento.

Huang también describe en detalle cuán compleja es la red en el hardware de Nvidia. Explica que conectar en red los equipos de Nvidia no es como conectar en red los servidores de centros de datos tradicionales. “La cantidad de cables que van en un nodo… la parte posterior de una computadora está compuesta por todos cables”.

La integración de Elon Musk de 100.000 GPU H200 “nunca se ha hecho antes” (según Jensen Huang) y probablemente no será duplicada nuevamente por otra empresa, al menos no durante mucho tiempo.



Source link

Leave a Comment

4bWBU ZBk9A q7YbS YrUK1