Bolt Graphics обяви универсална видеокарта със SO-DIMM слотове, която може да се конкурира с RTX 5080
Всички съвременни видеокарти се предлагат с твърдо определено количество видеопамет, а в най-продуктивните модели HBM паметта е интегрирана на същата подложка като основния кристал. Напоследък обаче изискванията към размера на паметта нарастват по-бързо и производителите все по-често изискват допълнителен капацитет на паметта. Радикално различен подход предлага Bolt Graphics, която наскоро обяви серията Zeus.
Въпреки „пандемията от изкуствен интелект“, Bolt Graphics в своето съобщение не набляга на нашумялата технология, а нарича Zeus първия графичен процесор, специално разработен за HPC, рендиране, трасиране на лъчи и дори компютърни игри.
Интересното е, че Zeus не е базиран на някаква затворена архитектура: скаларната част на новия графичен процесор е базирана на спецификацията RISC-V RVA23, а векторната част е представена от FP64 ALU, базиран на леко модифициран RVV 1.0. Другите функции се реализират чрез потребителски разширения и отделни ускорителни блокове. Всички те ползват общ кеш от 128MB. Блокът за телеметрия и вътрешната връзка за комуникация с други изчислителни блокове допълват конфигурацията.
Използван е чипсет подход. Основният „градивен елемент“ на Zeus 1c26-032 включва GPU-чиплет, който е свързан с 32GB LPDDR5x памет (273 GB/s) и DDR5 външен контролер на паметта (90 GB/s), т.е. при желание можете да инсталирате още 128GB RAM (два SO-DIMM модула).
Чиплетът на графичния процесор има вградени DisplayPort 2.1a и HDMI 2.1b контролери и комуникира с външния свят чрез IO-чиплета, към който е свързан чрез канал с капацитет 256 GB/s. IO-чипът предлага необичаен набор от портове. В допълнение към два PCIe 5.0 x16 интерфейса (всеки по 64 GB/s), има специален RJ-45 порт за BMC и 400GbE QSFP-DD порт. И накрая, наличен е хардуерен модул за кодиране на видео, който може да обработва два 8K@60 AV1/H.264/H.265 потока.

Заявеното ниво на производителност при векторни FP64/FP32/FP16 изчисления е 5/10/20 Tflops, а при INT16/INT8 матрични изчисления – 307,2/614,4 Tflops. Хардуерното устройство за трасиране на лъчите осигурява до 77 Giga Rays/s (гигалъча в секунда). За сравнение, NVIDIA RTX 5090 е в състояние да осигури 32 Giga Rays/s, а производителността на FP64 е 1,6 Tflops. В същото време настоящите решения на NVIDIA все още са по-бързи от Zeus 1c26-032 при изчисления с намалена точност. Новият продукт обаче има важно предимство – нивото му на TDP е само 120W. Вторият интерфейс PCIe 5.0 x16 може да се използва за директно комбиниране на две видеокарти.


Вариантът на ускорителя с два чиплета се нарича Zeus 2c26-064/128, а а този с четири- 4c26-256. Последните цифри означават количеството запоена LPDDR5X RAM памет. Що се отнася до разширяемата памет, броят на наличните SO-DIMM слотове също зависи от модела и е до 8, така че във флагманската конфигурация базовите 256GB LPDDR5x могат да бъдат допълнени с цели 2TB DDR5. Производителността с увеличаването на броя на GPU-чиповете нараства почти пропорционално, но има и някои други нюанси. Така например в Zeus 2c26-064 и Zeus 2c26-128 (и двата варианта имат TDP от 250W) има само един IO-чип, а GPU-чиповете са обединени от 768-гигабайтова шина.


Разработчиците очевидно са проектирали своето дете така, че да предлага широки възможности за клъстериране, за което свидетелства наличието на мощна мрежова подсистема.
Поддържат се както скромни конфигурации от два графични процесора, свързани директно чрез Ethernet 400GbE, така и мащабни системи на ниво шкаф, съдържащи 80 броя Zeus 4c26-256, свързани както към комутатора, така и директно една към друга. Такъв клъстер консумира 44 kW, но е в състояние да изпълнява мащабни физически симулации или да обучава ИИ-модели, благодарение на огромната 160TB споделена памет. Изчислителната производителност на такъв клъстер достига 1,6 Pflops в режим FP64 и 196 Pflops в режим FP8.


Една от характеристиките на новите продукти е трасиращото устройство Glowstick, което може да работи в реално време в почти всички съвременни пакети за 3D моделиране или редактиране на видео, като Maya, 3ds Max, Blender, SketchUp, Houdini и Nuke. Той ще бъде допълнен от патентованата библиотека MaterialX на Bolt, включваща над 5000 висококачествени текстури, a с поддръжката на стандарта OpenUSD ще може лесно да се интегрира във всяка верига за рендериране и последваща обработка. Планира се и създаването на електромагнитен симулатор Bolt Apollo. Обещани са собствени драйвери Vulkan/DirectX и SDK, използващи LLVM.
Bolt Graphics е определила ранния достъп до комплектите за разработчици за четвъртото тримесечие на тази година. Базираните на Zeus 2U сървъри трябва да бъдат налични през третото тримесечие на следващата година, а масовите доставки на сървъри и PCIe карти ще започнат едва през четвъртото тримесечие на същата година. Все още е трудно да се каже колко добре ще работи новата архитектура, но ако вярваме на предварителните тестове на Zeus, печалбата спрямо съществуващите ИИ-ускорители е значителна, особено по отношение на консумацията на енергия.









