web analytics
Image Credits : NVIDIA

NVIDIA GB300 NVL72 domină toate testele MLPerf AI Training

NVIDIA stabilește un nou standard în AI cu platforma GB300 NVL72

NVIDIA a atins un nou nivel de performanță în domeniul inteligenței artificiale, obținând rezultate spectaculoase în cadrul celor mai recente teste MLPerf AI Training. Sistemul GB300 NVL72, bazat pe arhitectura Blackwell Ultra, a reușit să câștige toate cele șapte categorii majore ale benchmarkului, un rezultat care confirmă încă o dată poziția dominantă a companiei în ecosistemul AI la scară largă.

Performanțe impresionante în antrenarea modelelor de limbaj

Cea mai spectaculoasă realizare este timpul obținut la antrenarea modelului Llama 3.1 405B, una dintre cele mai complexe arhitecturi de limbaj existente. Platforma NVIDIA a reușit să finalizeze antrenarea în doar 10 minute, folosind configurația de top cu 5.120 de GPU-uri. Este un pas imens înainte pentru industrie, mai ales când luăm în calcul faptul că astfel de modele necesită în mod normal sesiuni de antrenament de durată foarte mare.

Pe lângă acest model, sistemul a obținut rezultate excelente și în alte teste:

  • 0,4 minute pentru Llama 2 70B LoRA
  • 5,2 minute pentru Llama 3.1 8B
  • 12,5 minute pentru modelul vizual FLUX.1
  • 0,71 minute pentru DLRM dcnv2
  • 1,1 minute pentru R-GAT
  • 1,4 minute pentru RetinaNet

Aceste valori demonstrează că platforma nu este doar puternică, ci și versatilă în lucrul cu modele foarte diverse.

Image Credits : NVIDIA

Comparativ cu generațiile anterioare

Un aspect important este diferența considerabilă față de generațiile precedente. Comparată cu arhitectura Hopper H100, noua platformă livrează:

  • Peste 4 ori mai multă performanță în antrenarea Llama 3.1 40B
  • Aproape dublu față de sistemul GB200 din aceeași familie Blackwell
  • De 5 ori mai rapidă în fine tuning pentru Llama 2 70B comparativ cu H100

Acest salt tehnologic nu este doar o evoluție firească, ci un avans care poate schimba ritmul de dezvoltare al modelelor AI în următorii ani.

Rolul memoriei și al interconectării în creșterea performanței

Unul dintre punctele forte ale sistemului GB300 NVL72 este infrastructura sa avansată. Fiecare GPU include 279 GB de memorie HBM3e, iar întregul rack pune la dispoziție aproximativ 40 TB de memorie combinată pentru CPU și GPU.

La acestea se adaugă:

  • rețea InfiniBand Quantum X800,
  • lățime de bandă de 800 GB pe secundă,
  • optimizări software prin ecosistemul CUDA.

Toate aceste elemente contribuie la reducerea timpilor de transfer și la o fluiditate crescută în antrenarea modelelor de dimensiuni uriașe.

Image Credits : NVIDIA

Impactul asupra industriei de AI

Introducerea platformei Blackwell Ultra reprezintă un moment de referință pentru viitorul AI. Antrenamente care înainte necesitau zile pot fi acum rulate în câteva minute. Acest lucru înseamnă:

  • iterații mai rapide,
  • costuri reduse,
  • dezvoltare accelerată pentru LLM, modele vizuale sau sisteme multimodale,
  • posibilitatea de a experimenta la o scară fără precedent.

Faptul că NVIDIA a reușit să câștige toate cele șapte teste MLPerf confirmă maturitatea tehnologiei sale și capacitatea de a oferi soluții stabile și performante pentru companiile interesate de AI avansat.

GB300 NVL72 nu este doar un nou produs, ci o demonstrație a direcției în care se îndreaptă viitorul AI. Performanțele sale permit cercetătorilor și companiilor să exploreze teritorii care până acum erau foarte greu accesibile. Cu mai multă putere, memorie și viteză de comunicație, platforma deschide calea spre o nouă generație de aplicații artificiale, mai inteligente și mai eficiente.