януари 28, 2026

Microsoft представи най-новия си AI ускорител Maia 200 с 216GB HBM3e памет, произведен по 3 nm технологичен процес

Microsoft представи най-новия си патентован AI ускорител – Azure Maia 200. Новият чип е следващото поколение от линията Maia на компанията за сървърни графични процесори, предназначени да изпълняват задачи, свързани с изпълението на AI модели със скорост и производителност, които надминават предложенията на основни конкуренти като Amazon и Google.

Maia 200 е позициониран като най-ефективната система за изводи, внедрявана някога от Microsoft.

Във всички прессъобщения на компанията се набляга както на показателите за висока производителност, така и на твърденията за ангажимента на Microsoft към околната среда. Компанията твърди, че Maia 200 осигурява 30% по-висока производителност за един долар в сравнение с първото поколение Maia 100, което е доста впечатляващо, като се има предвид, че новият чип има и 50% по-висока стойност на TDP от своя предшественик.

Maia 200 е създаден по 3 nm процес на TSMC и съдържа 140 милиарда транзистора. Твърди се, че той е способен да осигури до 10 Pflops производителност при FP4 изчисления, което е три пъти повече от конкурента Trainium3 на Amazon. Maia 200 е оборудван с 216GB памет HBM3e с пропускателна способност 7 TB/s и има също 272MB вградена SRAM памет.

Сравнителната таблица по-горе, изготвена от портала Tom’s Hardware показва, че Maia 200 демонстрира ясно превъзходство в изчислителната мощ в сравнение с решението на Amazon и в някои отношения се равнява на AI ускорителя B300 Ultra на Nvidia. Очевидно е, че е безсмислено да ги сравняваме като преки конкуренти. Клиентите не могат да си купят Maia 200 директно, а Blackwell B300 Ultra е оптимизиран за много по-ресурсоемки задачи от чипа на Microsoft. Освен това софтуерният стек на Nvidia дава на B300 значително предимство пред всеки друг конкурент.

Въпреки това Maia 200 превъзхожда B300 по отношение на ефективността, което е голямо постижение в епоха, в която обществената загриженост относно отрицателното въздействие на изкуствения интелект върху околната среда непрекъснато нараства.

Maia 200 работи с почти наполовина по-нискo TDP от това на B300 (750 срещу 1400W). И макар че новият AI ускорител на Microsoft е сходен по енергийна ефективност с предшественика си Maia 100, той, както и предшественикът му, ще работят под теоретичния си максимален TDP. За Maia 100 беше обявено TDP от 700W, но Microsoft твърди, че консумацията на енергия е само 500W по време на работа.

Maia 200 е оптимизиран за работа с 4-битови (FP4) и 8-битови (FP8) прецизни изчисления с плаваща запетая. Този AI ускорител е предназначен за клиенти, които работят с AI модели, изискващи FP4 производителност, а не по-сложни операции. Както предполага Tom’s Hardware, голяма част от бюджета на Microsoft за научноизследователска и развойна дейност за този чип е насочен към йерархията на паметта, използвана в неговите 272MB високопроизводителна SRAM памет. Последната е разделена на „многостепенна клъстерирана SRAM (CSRAM) и плочковидна SRAM (TSRAM)“, което осигурява подобрена производителност и философия на интелигентно и равномерно разпределение на работното натоварване в HBM и SRAM кристалите.

Съобщава се, че AI ускорителите Maia 200 вече са внедрени в централния център за данни на Microsoft в САЩ (Azure), като се планира бъдещо внедряване в западен център за данни (Финикс, Аризона). Чиповете ще станат част от хетерогенната инфраструктура на Microsoft, като ще работят в тандем с различни други AI ускорители.


source

Сподели: