Ce este un GPU Hopper?

Cuprins

Procesoarele grafice Hopper reprezintă cea mai nouă generație de procesoare grafice de înaltă performanță de la NVIDIA, special concepute pentru AI și calcul de înaltă performanță (HPC). Dispunând de o arhitectură de ultimă generație cu nuclee Tensor avansate, acestea integrează multiple tehnologii inovatoare pentru a oferi eficiență maximă. Ideale pentru o gamă largă de sarcini, procesoarele grafice Hopper acceptă inferența AI, antrenamentul de învățare profundă, AI generativ și multe altele.

Care este designul arhitectural al GPU-urilor Hopper de la NVIDIA?

Denumirea „Hopper GPU” provine de la arhitectura Hopper, care este microarhitectura GPU ce stă la baza procesoarelor grafice de înaltă performanță și este optimizată pentru sarcini de lucru AI și aplicații HPC. GPU-urile Hopper sunt fabricate de TSMC utilizând procesul de 4 nanometri și au peste 80 de miliarde de tranzistori, ceea ce le face unele dintre cele mai avansate plăci grafice disponibile pe piață.

Cu arhitectura Hopper, NVIDIA combină ultima generație de nuclee Tensor cu cinci inovații revoluționare: motor transformator, sisteme de comutare NVLink/NVSwitch/NVLink, calcul confidențial, GPU-uri multi-instanță (MIG) de a doua generație și instrucțiuni DPX. Aceste tehnologii permit GPU-urilor Hopper să atingă o accelerare a inferenței AI de până la 30 de ori mai mare față de generația anterioară (pe baza chatbotului Megatron 530B de la NVIDIA — cel mai cuprinzător model de limbaj generativ din lume).

Care sunt caracteristicile inovatoare ale GPU-urilor Hopper?

GPU-urile Hopper au mai multe caracteristici noi care contribuie la îmbunătățirea performanței, eficienței și scalabilității. Prezentăm mai jos cele mai importante inovații:

Motor transformator: Cu ajutorul motorului transformator, GPU-urile Hopper sunt capabile să antreneze modele AI de până la nouă ori mai rapid. Pentru sarcini de inferență în domeniul modelelor lingvistice, GPU-urile ating o accelerare de până la 30 de ori mai mare decât generația anterioară.
Sistemul de comutare NVLink: A patra generație de NVLink oferă o lățime de bandă GPU bidirecțională de 900 GB/s, în timp ce NVSwitch asigură o mai bună scalabilitate a clusterelor H200. Acest lucru garantează că modelele AI cu trilioane de parametri pot fi procesate în mod eficient.
Calcul confidențial: arhitectura Hopper asigură protecția datelor, modelelor AI și algoritmilor dvs. și în timpul procesării.
GPU multi-instanță (MIG) 2.0: A doua generație a tehnologiei MIG permite divizarea unui singur GPU Hopper în până la șapte instanțe izolate. Acest lucru permite mai multor persoane să proceseze simultan sarcini de lucru diferite, fără a se interfera reciproc.
Instrucțiuni DPX: Instrucțiunile DPX permit calcularea algoritmilor programați dinamic de până la șapte ori mai rapid decât cu GPU-urile arhitecturii Ampere.

Pentru ce cazuri de utilizare sunt potrivite GPU-urile Hopper?

Procesoarele grafice NVIDIA bazate pe arhitectura Hopper sunt concepute pentru o gamă largă de sarcini de lucru de înaltă performanță. Principalele domenii de aplicare pentru procesoarele grafice Hopper sunt: ¬

Sarcini de inferență: GPU-urile se numără printre soluțiile de vârf din industrie pentru utilizarea productivă a inferenței AI. Fie că este vorba de sisteme de recomandare în comerțul electronic, diagnostic medical sau predicții în timp real pentru conducerea autonomă, GPU-urile Hopper pot procesa rapid și eficient cantități uriașe de date.
AI generativ: GPU-urile de ultimă generație oferă puterea de calcul necesară pentru antrenarea și executarea instrumentelor cu AI generativ. Procesarea paralelă permite calcule mai eficiente pentru sarcini creative, cum ar fi generarea de text, imagini și videoclipuri.
Antrenare deep learning: Cu puterea lor de calcul ridicată, GPU-urile Hopper sunt ideale pentru antrenarea rețelelor neuronale de mari dimensiuni. Arhitectura Hopper scurtează semnificativ timpul de antrenare a modelelor AI.
AI conversațional: Optimizate pentru procesarea limbajului natural (NLP), GPU-urile Hopper sunt ideale pentru sistemele lingvistice bazate pe AI, cum ar fi asistenții virtuali și chatbot-urile AI. Acestea accelerează procesarea modelelor AI de mari dimensiuni și asigură o interacțiune receptivă care poate fi integrată perfect în procesele de afaceri, cum ar fi asistența.
Analiza datelor și big data: GPU-urile Hopper gestionează cantități uriașe de date la viteză mare și accelerează calculele complexe prin procesare paralelă masivă. Acest lucru permite companiilor să evalueze mai rapid big data pentru a face previziuni și a iniția măsurile potrivite.
Știință și cercetare: deoarece GPU-urile sunt proiectate pentru aplicații HPC, acestea sunt ideale pentru simulări și calcule extrem de complexe. GPU-urile Hopper sunt utilizate, de exemplu, în astrofizică, modelarea climatică și chimia computațională.

Modelele actuale de la NVIDIA

Odată cu lansarea NVIDIA H100 și NVIDIA H200, compania americană a introdus pe piață două GPU-uri Hopper. În schimb, NVIDIA A30 este încă construit pe arhitectura Ampere anterioară. Din punct de vedere tehnic, H200 nu este un model complet nou, ci mai degrabă o versiune îmbunătățită a H100. Următoarea prezentare generală evidențiază diferențele cheie dintre aceste două GPU-uri:

Memorie și lățime de bandă: În timp ce NVIDIA H100 este echipat cu o memorie HBM3 de 80 GB, GPU-ul H200 are o memorie HBM3e cu o capacitate de 141 GB. H200 este, de asemenea, clar în avantaj în ceea ce privește lățimea de bandă a memoriei, cu 4,8 TB/s, comparativ cu 2 TB/s pentru H100.
Performanță pentru inferența AI: În comparație, NVIDIA H200 oferă o performanță de inferență de două ori mai mare pentru modele precum LLaMA 2-70 B. Acest lucru permite nu numai o procesare mai rapidă, ci și o scalare eficientă.
Aplicații HPC și calcul științific: H100 oferă deja un nivel de performanță de primă clasă pentru calcule complexe, pe care H200 îl depășește. Viteza de inferență este de până la două ori mai mare, iar performanța HPC este cu aproximativ 20% mai mare.