ноември 1, 2025

NVIDIA официално представи „суперчипа“ Vera Rubin с производителност до 100 петафлопа

На конференцията GTC 2025 във Вашингтон, окръг Колумбия, главният изпълнителен директор на NVIDIA Дженсен Хуанг представи следващото поколение компютърни ускорители Vera Rubin Superchip. Платформата комбинира централния процесор Vera и два гигантски графични процесора Rubin на една платка, за да осигури до 100 петафлопа изчислителна мощ. Тази система е предназначена да бъде в основата на бъдещите ИИ суперкомпютри, чиято производителност ще се измерва в екзафлопи.

Всеки графичен процесор Rubin се състои от два масивни кристала с CUDA ядра и осем стека HBM4 памет с капацитет общо 288 GB. Спецификациите на графичните процесори все още не са оповестени, но е известно, че една система Vera Rubin Superchip осигурява до 100 петафлопа FP4 – формат, оптимизиран за инференции, т.е. за изпълнение на вече обучени модели на изкуствен интелект.

Процесорът Vera се базира на архитектурата Arm, има 88 ядра и 176 нишки. Свързан е с интерфейса на графичния процесор NVLink-C2C с пропускателна способност от 1,8 TB/s, както и е оборудван със собствена оперативна памет LPDDR (общо 32 клетки), чийто общ обем заедно с HBM достига 2 TB на една система.

Въз основа на тези решения NVIDIA изгражда новите сървърни шкафове Vera Rubin NVL144, предназначени за обучение и работа с ИИ модели. Тяхната производителност достига 3,6 екзафлопа за извеждане на вече обучени ИИ модели (FP4) и 1,2 екзафлопа за обучение (FP8), което е 3,3 пъти по-бързо от сегашните системи NVL72 от поколението GB300. Общата пропускателна способност на паметта HBM4 достига 13 TB/s, а пропускателната способност на системната памет – 75 TB/s.

Компанията обяви и следващото поколение платформа – Rubin Ultra NVL576, която ще бъде налична през втората половина на 2027 г. Тя ще използва четири големи графични чипсета Rubin Ultra и 1 TB памет HBM4e. Тази система ще осигурява до 15 екзафлопа FP4 и 5 екзафлопа FP8, като предлага до 365 TB бърза памет и мрежова пропускателна способност до 1,5 PB/s чрез NVLink.

Първите образци на чиповете Rubin вече са получени в лабораториите на NVIDIA за тестване. Според Хуанг масовото производство на суперчипа Vera Rubin ще започне през третото или четвъртото тримесечие на 2026 г. В бъдеще Rubin ще бъде наследен от архитектура с кодово име Feynman, която се очаква да бъде пусната на пазара през 2027-2028 г. NVIDIA все още не е разкрила никакви подробности.

source

Сподели: