nVIDIA a ridicat oficial cortinele pentru a dezvălui cel mai mare și mai puternic procesor grafic până în prezent, al plăcii grafice Ampere pe 7 nm. Primul produs care prezintă noua arhitectură Ampere este o placă grafică numită GA100 și acest cip este în prezent cel mai mare procesor grafic ce va fi produs pe nodul superexploatat al procesului TSMC de 7 nm. Astăzi, vom face o aprofundare în arhitectura plăcii grafice Ampere GA100 (dacă nu am făcut-o până acum), specificațiile și primele produse care ar fi prezentat în cadrul sistemului.
Ampere GA100 GPU este de departe cea mai mare placă grafică pe 7 nm construită vreodată. Este concepută în întregime pentru piața HPC cu aplicații pentru cercetarea științifică, inteligență artificială, rețele neuronale pe mai multe niveluri și inferență AI. Există o mulțime de specificații și o mulțime de produse despre care o să vorbim, așa că hai să începem.
În primul rând, nVIDIA Ampere GA100 va fi disponibilă în mai mulți factori de formă. De la o simplă placă Mezzanine Modular la una pe slot PCIe 4.0 complet. Placa vine, de asemenea, în diverse configurații, dar cea pe care nVIDIA o evidențiază astăzi este Tesla A100, care este utilizată pe sistemele DGX A100 și HGX A100.
Arhitectura și specificațiile nVIDIA 7nm Ampere GA100
Când vine vorba de specificațiile de bază, Ampere GA100 de la nVIDIA este un monstru în toată puterea cuvântului. Mărimea unui asemenea masiv este de 826 mm2, (da, ați citit bine, vreo 82 centimetri pătrați.. și nu vă gândiți că instalați așa ceva în PC-ul vostru, căci vom vedea într-un alt articol la ce sunt folosite asemenea plăci) care este chiar mai mare decât placa grafică Volta GV100, care a fost de 815 mm2. De asemenea, placa are dublul numărul de tranzistoare, adică 54 de miliarde față de 21.1 ale predecesorului său, ceea ce este foarte impresionant. Având în vedere dimensiunea cipului și numărul de tranzistori, procesorul grafic Ampere GA100 este cel mai dens construit vreodată.
Implementarea completă a plăcii grafice nVIDIA Ampere GA100 include următoarele configurații:
- 8 GPC, 8 TPC/GPC, 2 SM/TPC, 16 SM/GPC, 128 SM per placă grafică;
- 64 Nuclee FP32 CUDA/SM, 8192 Cores FP32 CUDA per placă grafică;
- 4 nuclee tensor/SM de generație a treia, 512 nuclee tensor de generație a treia
per placă grafică; - 6 stive HBM2, 12 controlere de memorie de 512 biți;
Placa grafică A100 Tensor Core, implementare a lui Ampere GA100 include următoarele configurații:
- 7 GPC, 7 sau 8 TPC/GPC, 2 SM/TPC, până la 16 SM/GPC, 108 SM;
- 64 Nuclee FP32 CUDA/SM, 6912 Nuclee CUDA FP32 per placă grafică;
- 4 nuclee tensor/SM de generație a treia, 432 nuclee tensor de generație a treia
per placă grafică; - 5 stive HBM2, 10 regulatoare de memorie de 512 biți;
În timp ce Tesla A100 prezintă specificații reducționiste datorită producțiilor timpurii pe 7 nm, care sunt încă foarte bune, având în vedere dimensiunea acestui „SUPER PROCESOR GRAFIC”, placa nVIDIA Ampere GA100 în versiunea sa completă este ceea ce urmează să vedem.
Cu 128 de SM-uri și 8192 de nuclee CUDA, nVIDIA Ampere GA100 este, de asemenea, procesorul grafic cu cel mai mare număr de nuclee single pe care l-am văzut vreodată. Vine și cu 8192 nuclee FP32, 4096 nuclee FP64 și 512 nuclee tensor. Pe procesorul grafic există 8 clustere de procesare grafică, fiecare cu 16 unități SM și 8 TPC-uri. Placa GA100 are un TDP de 400W pentru varianta sa Tesla A100.
Placa nVIDIA A100 este o descoperire în materie de design tehnic împuternicită de cinci inovații cheie:
- Arhitectura NVIDIA Ampere — Baza lui A100 este arhitectura procesorului grafic nVIDIA Ampere, care conține peste 54 de miliarde de tranzistoare, ceea ce face ca acesta să fie cel mai mare procesor pe nodul de 7 nanometri din lume.
- Nuclee tensor din a treia generație cu TF32 — Nucleele tensor adoptate din plin de nVIDIA sunt acum mai flexibile, mai rapide și mai ușor de utilizat. Capacitățile lor extinse includ noul TF32 pentru AI, care permite performanța AI de până la 20x de precizie FP32, fără modificări de cod. În plus, nucleele tensor suportă acum FP64, oferind până la 2,5x mai multe calcule decât generația anterioară pentru aplicațiile HPC.
- GPU multi-instance — MIG, o nouă funcție tehnică, permite unui singur procesor grafic A100 să fie repartizat în șapte părți separate, astfel încât să poată oferi diferite grade de calcul pentru sarcini de diferite dimensiuni, oferind o utilizare optimă și maximizând randamentul investițiilor.
- nVIDIA NVLink de generație a treia — Dublează conectivitatea de mare viteză între procesoare grafice pentru a oferi o scalare eficientă a performanței într-un server.
- Spațialitate structurală — Această nouă tehnică de eficiență valorifică natura inerent limitată a matematicii AI pentru a dubla performanța.
Alte specificații pentru nVIDIA Ampere GA100 includ o interfață uriașă cu un bus de 6144 biți, care dispune de până la 48 GB memorie HBM2e în șase stive HBM2 care sunt împărțite în microcipul procesorului. Fiecare stivă are capacitate VRAM 2 GB pe microcip, iar ca să ajungă la 48 GB am avea nevoie de stive 4-hi. Fiecare stivă 4-hi ar fi compusă din 8 GB capacitate și 6 stive egale cu 48 GB capacitate. Memoria rulează cu viteze de peste 2,0 Gbps, ceea ce ar duce la o lățime de bandă de aproximativ 1,6 Tbps.
[tie_slideshow]
[/tie_slideshow]
nVIDIA Ampere va veni cu mai multe configurații de memorie HBM, dar va maxim 48 GB, cu excepția cazului în care nVIDIA dorește să ofere în viitor o variantă de 6-hi sau 8-hi, ceea ce ar ridica capacitatea de memorie la 72 sau chiar 96 GB. Tesla V100S de la nVIDIA deja dublează capacitatea HBM a Tesla V100, oferind 32 GB față de 16 GB, astfel încât este complet posibil ca nVIDIA să facă același lucru cu o variantă viitoare a Tesla A100.
[tie_slideshow]
[/tie_slideshow]
[tie_slideshow]
[/tie_slideshow]
Puteți vedea mai multe detalii aici.
Leave a Review