Se presupune că NVIDIA lucrează la o nouă placă grafică bazată pe GPU Hopper H100, care ar avea o capacitate de memorie HBM2e de până la 120 GB.
NVIDIA a anunțat oficial până acum două versiuni ale GPU-ului Hopper H100, o placă SXM5 și o variantă PCIe. Ambele dispun de GPU Hopper H100 configurate diferit și, deși capacitatea VRAM este aceeași, de 80 GB, prima utilizează noul standard HBM3, în timp ce cea de-a doua utilizează standardul HBM2e.
Acum, pe baza informațiilor furnizate de s-ss.cc (via MEGAsizeGPU), NVIDIA ar putea lucra la o nouă versiune PCIe a GPU-ului Hopper H100. Noua placă grafică nu va dispune de 80 GB HBM2e, ci va merge până la capăt cu 120 GB de memorie HBM2e.
Conform informațiilor disponibile, placa grafică Hopper H100 PCIe nu numai că vine cu toate cele șase stive HBM2e activate pentru 120 GB de memorie pe o interfață de bus pe 6144 biți, dar vine și cu aceeași configurație de GPU GH100 ca și varianta SXM5. Aceasta reprezintă un total de 16.896 de nuclee CUDA și o lățime de bandă de memorie care depășește 3 TB/s. Performanța de calcul de precizie unică a fost evaluată la 30 TFLOPs, ceea ce este același lucru ca în cazul variantei SXM5.
Așadar, revenind la specificații, GPU-ul NVIDIA Hopper GH100 este compus dintr-o dispunere masivă de 144 de cipuri SM (Streaming Multiprocessor), care se regăsește într-un total de 8 GPC-uri. Aceste GPC-uri au un total de 9 TPC-uri care sunt compuse din 2 unități SM fiecare. Acest lucru ne oferă 18 SM pe GPC și 144 pe întreaga configurație de 8 GPC. Fiecare SM este compus din până la 128 de unități FP32, ceea ce ar trebui să ne ofere un total de 18 432 de nuclee CUDA. În continuare sunt prezentate câteva dintre configurațiile la care vă puteți aștepta de la cipul H100:
Implementarea completă a GPU-ului GH100 include următoarele unități:
- 8 GPCs, 72 TPCs (9 TPCs/GPC), 2 SMs/TPC, 144 SMs per full GPU
- 128 FP32 CUDA Cores per SM, 18432 FP32 CUDA Cores per full GPU
- 4 Fourth-Generation Tensor Cores per SM, 576 per full GPU
- 6 HBM3 or HBM2e stacks, 12 512-bit Memory Controllers
- 60 MB L2 Cache
GPU NVIDIA H100 SXM5 include următoarele unități:
- 8 GPCs, 66 TPCs, 2 SMs/TPC, 132 SMs per GPU
- 128 FP32 CUDA Cores per SM, 16896 FP32 CUDA Cores per GPU
- 4 Fourth-generation Tensor Cores per SM, 528 per GPU
- 80 GB HBM3, 5 HBM3 stacks, 10 512-bit Memory Controllers
- 50 MB L2 Cache
- Fourth-Generation NVLink and PCIe Gen 5
Acum nu se știe dacă este vorba de o placă de test sau de o viitoare iterație a GPU-ului Hopper H100 care este testată. NVIDIA a declarat recent la GTC 22 că GPU-ul Hopper a intrat în producție completă și că primul val de produse va fi lansat luna viitoare. Pe măsură ce randamentele se îmbunătățesc, este posibil să vedem cu siguranță pe piață placa grafică Hopper H100 PCIe de 120 GB și variantele SXM5, dar deocamdată, cea de 80 GB este ceea ce vor primi majoritatea clienților.
Leave a Review