септември 1, 2025

Китайският бизнес преминава към възстановените ускорители NVIDIA A100 и H100 поради проблеми с доставките на H20

Китайската индустрия за изкуствен интелект постепенно преминава към обновени или употребявани AI ускорители NVIDIA A100 и H100, след като пореден кръг от експортни ограничения на NVIDIA H20 принуди компаниите да търсят алтернативи. Изкуствено отслабеният ускорител H20 трябваше да задържи NVIDIA на китайския пазар, но чипът на практика беше „изолиран“, дори след като за продажбите му беше получена зелена светлина отново след временна забрана, след като китайските регулатори поставиха под въпрос безопасността му, съобщава Tom’s Hardware, цитирайки Digitimes.

Всичко това доведе до бързо увеличение на търсенето на по-стари модели A100 и H100, като китайските компании „реконфигурираха“ такива ускорители за използване в евтини, но високопроизводителни системи за инференс. Последните изискват значително по-малко ресурси от обучението на ИИ-моделите, а работните натоварвания могат да се изпълняват ефективно на относително слаб хардуер.

Ето защо дори A100 с 80GB HBM2e (2TB/s), представен през 2020 г., остава доста полезен в някои случаи. Въпреки че архитектурата Ampere отстъпва на Hopper по отношение на пиковата производителност, тя все още е ефективна за инференс благодарение на относително големия си капацитет на паметта и развитата CUDA софтуерна екосистема. За чатботове и системи за препоръки е рентабилно да се използват системите без най-модерните чипове.

H100, представен през 2022 г., е значително по-мощен от A100 в задачите, свързани с обучение. В същото време, H20 първоначално е оптимизиран за по-малко ресурсоемък инференс, но възможностите му са намалени толкова много, че производителността му е 3-7 пъти по-ниска от тази на H100 и е повече от 30 пъти по-бавен в изчислителните задачи FP64. С други думи, дори A100 може би все още е по-привлекателен за китайските купувачи от новия H20.

Тъй като никой все още не е успял да създаде нещо съпоставимо със софтуерната екосистема NVIDIA CUDA, старите графични процесори са доста търсени. Особено след като оборудването за инференс е по-малко взискателно във всяко отношение, а китайските центрове за данни очевидно нямат проблеми с енергията и са готови да плащат за обновена остаряла електроника, дори с намалена надеждност.

В резултат на това NVIDIA се озова в странна позиция. Компанията някога отписа 5,5 милиарда долара заради непродадени запаси от H20 —​- когато САЩ решиха напълно да забранят доставките им за Китай. След отмяната на забраната компанията рязко увеличи производството на H20, но сега е изправена пред нежеланието на китайските власти да видят тези чипове в страната. Въпреки това, нейните ускорители все още са един от основните катализатори за бума на изкуствения интелект в Китай. С други думи, чиповете на компанията все още доминират на пазара в Китай, но активността на сивите пазари може да намали ползите от бизнеса с Китай. Вече се появи информация за разработването на нов ускорител, базиран на съвременната архитектура Blackwell — макар и също отслабена.

source

Сподели: