ноември 12, 2023

NVIDIA ще пусне 3 нови модела ИИ-ускорители за Китай със занижена производителност: H20, L20 и L2

NVIDIA ще пусне 3 нови модела специализирани ИИ-ускорители за Китай. Новите продукти ще бъдат в отговор на новите търговски ограничения на САЩ за износ на компютърно оборудване за центрове за данни в Китай и други страни. За това съобщават няколко източника.

Новите правила за износ, въведени от САЩ отчитат цялостната производителност на специализираните ИИ-ускорители и понижават летвата дотолкова, че дори геймърската видеокарта GeForce RTX 4090 е забранена за износ в Китай, Русия и редица други страни. Според новите ограничения, произведението от броя на битовете за изчислителна производителност, наречено Total Processing Performance или TPP не трябва да надвишава 4800, а геймърският флагман на NVIDIA достига стойност от 5285.

NVIDIA вече разполага с нови модели ИИ-ускорители, които не са обект на последните ограничения за износ. Те са наречени H20, L20 и L2. Масовото им производство ще започне следващия месец. На свой ред китайският държавен информационен канал Chinastarmarket, цитиран от Bloomberg, съобщава, че NVIDIA ще започне да доставя тези ускорители в Китай през следващите няколко дни, а официалното им обявяване ще се състои през втората половина на този месец.

Точните спецификации на NVIDIA H20, L20 и L2 не са известни. Според някои източници H20 е изграден на базата на модифициран графичен чип GH100 на архитектурата Hopper и използва опаковката CoWoS на TSMC. Двата представители на серията L може да имат нещо общо с архитектурата на Ada Lovelace. Анализаторите от Semianalysis отбелязват, че H20 може да се справи с някои задачи дори по-добре от ускорителя H100, който попадна под забрана за доставка.

ITHome публикува основните характеристики на изброените ускорители. Според тези данни, H20 ще получи 96 GB памет HBM3 с пропускателна способност 4 TB/s и ще предложи производителност на тензорните ядра до 296 Tflops при целочислените операции INT8. TPP на новия продукт ще бъде 2368 и ще бъде в рамките на новите ограничения за износ. В операциите FP64 ускорителят H20 ще осигурява производителност на ниво 1 Tflops (H100 осигурява 34 Tflops), а в операциите FP16/BF16 – 148 Tflops (H100 осигурява 1979 Tflops). Консумацията на енергия на H20 ще бъде 400 W. H20 ще запази поддръжката на шината NVLink със скорост 900 Gbytes/s. Това ще позволи до осем ускорителя да бъдат обединени в клъстер.

NVIDIA L20 в PCIe форм-фактор ще разполага с 48 GB GDDR6 памет и ще осигурява максимална изчислителна производителност от 239 Tflops при INT8 операции. На свой ред моделът L2, също във форм-фактор PCIe ще получи 24 GB GDDR6 памет и ще има пикова изчислителна производителност от 193 Tflops при INT8 задачи. Данните за TPP за моделите L20 и L2 ще бъдат съответно 1912 и 1544.


source

Сподели: