web analytics

Acceleratorul Intel Gaudi AI Accelerator obține un salt de 2 ori mai mare de performanță pe GPT-3 cu software-ul FP8

Parteneri

Acer

Astăzi, MLCommons a publicat rezultatele testului de referință MLPerf training v3.1, standard în domeniu, pentru antrenarea modelelor de inteligență artificială, iar Intel a prezentat rezultatele pentru acceleratoarele Intel Gaudi 2 și procesoarele Intel Xeon Scalable de a 4-a generație cu Intel Advanced Matrix Extensions (Intel AMX). Intel Gaudi2 a demonstrat un salt semnificativ de 2 ori mai mare în ceea ce privește performanța, odată cu implementarea tipului de date FP8 în cadrul criteriului de referință GPT-3 de instruire v3.1. Prezentările de benchmark au întărit angajamentul Intel de a aduce inteligența artificială pretutindeni cu soluții AI competitive.

„Continuăm să inovăm cu portofoliul nostru de AI și să ridicăm ștacheta cu rezultatele noastre de performanță MLPerf în benchmark-urile AI MLCommons consecutive. Procesoarele Intel Gaudi și Intel Xeon de generația a 4-a oferă clienților un beneficiu semnificativ în ceea ce privește raportul preț-performanță și sunt gata de implementare astăzi. Amploarea configurației noastre de hardware și software pentru AI oferă clienților soluții complete și opțiuni adaptate la sarcinile de lucru AI”, a declarat Sandra Rivera, vicepreședinte executiv Intel și director general al grupului Data Center și AI.

Cele mai noi rezultate MLCommons MLPerf se bazează pe performanțele puternice ale Intel în materie de inteligență artificială față de rezultatele anterioare de instruire MLPerf din iunie. Procesorul Intel Xeon rămâne singurul procesor care raportează rezultate MLPerf, iar Intel Gaudi2 este una dintre cele trei soluții de accelerare pe care se bazează rezultatele, dintre care doar două sunt disponibile în comerț.

Intel Gaudi2 și procesoarele Intel Xeon de generația a 4-a demonstrează performanțe convingătoare de instruire AI într-o varietate de configurații hardware pentru a răspunde la gama tot mai largă de cerințe de calcul AI ale clienților.

Gaudi2 continuă să fie singura alternativă viabilă la H100 de la NVIDIA pentru nevoile de calcul AI, oferind un raport preț-performanță semnificativ. Rezultatele MLPerf pentru Gaudi2 au arătat performanța de instruire în creștere a acceleratorului AI:

Gaudi2 a demonstrat un salt de performanță de două ori mai mare cu implementarea tipului de date FP8 în cadrul criteriului de referință GPT-3 de formare v3.1, reducând timpul de formare cu mai mult de jumătate în comparație cu criteriul de referință MLPerf din iunie, finalizând formarea în 153,58 minute pe 384 de acceleratoare Intel Gaudi2. Acceleratorul Gaudi2 suportă FP8 atât în format E5M2, cât și în format E4M3, cu opțiunea de scalare întârziată atunci când este necesar.
Intel Gaudi2 a demonstrat antrenarea pe modelul multimodal de difuzie stabilă cu 64 de acceleratoare în 20,2 minute, folosind BF16. În viitoarele teste de referință de instruire MLPerf, performanța modelului Stable Diffusion va fi prezentată pe tipul de date FP8.
Pe opt acceleratoare Intel Gaudi2, rezultatele de referință au fost de 13,27 și 15,92 minute pentru BERT și, respectiv, ResNet-50, utilizând BF16.
Intel rămâne singurul furnizor de procesoare care a prezentat rezultatele MLPerf. Rezultatele MLPerf pentru Xeon de generația a 4-a au evidențiat performanța sa puternică:
Intel a prezentat rezultate pentru RESNet50, RetinaNet, BERT și DLRM dcnv2. Rezultatele procesoarelor scalabile Intel Xeon din a 4-a generație pentru ResNet50, RetinaNet și BERT au fost similare cu rezultatele puternice de performanță out-of-box prezentate pentru benchmark-ul MLPerf din iunie 2023.
DLRM dcnv2 este un model nou față de cel prezentat în iunie, procesorul demonstrând un timp de prezentare de 227 de minute până la formare, utilizând doar patru noduri.
Performanțele procesoarelor Xeon de a 4-a generație demonstrează că multe organizații de întreprinderi pot antrena în mod economic și durabil modele de învățare profundă de dimensiuni mici și medii pe infrastructura IT existentă a întreprinderii cu procesoare de uz general, în special pentru cazurile de utilizare în care instruirea reprezintă o sarcină de lucru intermitentă.

Cu actualizări și optimizări de software, Intel anticipează și mai multe progrese în ceea ce privește rezultatele performanței AI în viitoarele teste de referință MLPerf. Produsele Intel pentru inteligență artificială oferă clienților mai multe opțiuni pentru soluțiile de inteligență artificială pentru a satisface cerințele dinamice care necesită performanță, eficiență și utilizare.

Translated with DeepL