март 20, 2025

Nvidia представи Blackwell Ultra с 288 GB HBM3e памет – ИИ-ускорител за „ерата на разсъжденията“

Nvidia официално представи ИИ-ускорителя за изчисления в центрове за данни Blackwell Ultra B300, суперчипа Grace Blackwell Ultra GB300 и различни системи, базирани на него, като част от откриването на конференцията GTC 2025. Новият продукт е създаден „за ератана разсъжденията“, т.е. за най-новите, по-сложни и изискващи много ресурси ИИ-модели, способни да размишляват върху различни проблеми, подобно на хората.

Nvidia традиционно не разкри всички подробности за новите продукти. Компанията само отбеляза, че графичните процесори Blackwell Ultra (в GB300 и B300) физически се различават от чиповете Blackwell (в GB200 и B200).

Обърнете внимание, че Blackwell Ultra B300 е класически графичен ускорител, докато Grace Blackwell Ultra GB300 е комплект от процесор Grace Arm със 72 Neoverse V2 ядра и два графични процесора Blackwell Ultra.

Платка с чифт процесори Grace и четири процесора Blackwell Ultra

Nvidia изтъква 50-процентно увеличение на капацитета на паметта на комплекта. Blackwell Ultra разполага с 288 GB HBM3e памет, което ще е полезно при работа с особено големи ИИ-модели. Капацитетът на паметта е увеличен чрез използването на нови 12-степенни HBM3e стекове – Blackwell B200 използва 8-степенни HBM3e стекове, които осигуряват 192 GB памет.

Според Nvidia производителността на Blackwell Ultra трябва да е 1,5 пъти по-висока от тази на Blackwell при работа с вече обучени ИИ-модели (FP4 inference).

Компанията твърди, че производителността е 15 Pflops за FP4 изчисления и 30 Pflops за разредени FP4 изчисления. За оригиналния ускорител Blackwell B200 тези стойности са съответно 10 и 20 Pflops.

GB300 NVL72

Nvidia ще предложи няколко готови системи, базирани на новите ускорители, които ще започнат да се доставят през втората половина на тази година. GB300 NVL72 всъщност е готов сървърен шкаф, който съчетава 72 графични процесора Blackwell Ultra и 36 процесора Grace. Новият продукт, както и предшественикът му GB200 NVL72 е оборудван със система за течно охлаждане, използва NVLink от пето поколение, модули Nvidia ConnectX-8 SuperNIC и предлага 18 TB оперативна памет LPDDR5X. Производителността достига 1100 Pflops при FP4 изчисления и до 1400 Pflops при разредени FP4 изчисления.

Nvidia специално отбелязва използването на 5-то поколение NVLink интерконектор, който свързва отделните чипове, за да създаде „един голям графичен процесор“. Пропускателната способност на всеки графичен процесор е 1,8 TB/s, а общата пропускателна способност е 130 TB/s. Започвайки с Blackwell, NVLink може да се използва и като интерфейс за свързване на няколко сървърни шкафа, което преди това се правеше чрез InfiniBand със скорост 100 GB/s. Поради това Nvidia твърди, че за този конкретен сценарий скоростта е увеличена 18 пъти.

Blackwell Ultra DGX SuperPOD

Към NVLink могат да бъдат свързани до 576 графични процесора. Всъщност Nvidia също ще предлага такава система – Blackwell Ultra DGX SuperPOD. Това е клъстер от осем стойки NVL72, който включва 288 процесора Grace, 576 чипа Blackwell Ultra, 300 TB HBM3e памет и FP4 производителност от 11,5 екзафлопа.

Накрая Nvidia представи системата HGX B300 NVL16 – решение за тези, които искат чип с x86 архитектура вместо процесора Grace Arm.

Системата има 16 графични процесора B300 и някакъв вид x86 процесори, свързани чрез NVLink. Nvidia не уточнява кои процесори се използват, но в миналото са използвани чипове от AMD и Intel.

Изчислителните ускорители и системите, базирани на Blackwell Ultra ще се появят на пазара през втората половина на тази година. Те ще се предлагат от всички големи производители на сървъри, както и нови продукти ще се предлагат от големите доставчици на облачни услуги.

source

Сподели: