Партнёры NVIDIA начали публиковать первые результаты тестирования новых ускорителей Blackwell. Данные шокируют: кластер всего из четырёх новейших GB300 демонстрирует более чем шестикратное превосходство над связкой из шестнадцати H100 в реальной задаче по запуску большой языковой модели.
Облачный провайдер CoreWeave провёл наглядное сравнение, запустив 175-миллиардную модель DeepSeek R1 на двух конфигурациях:
-
Классическая: 16 ускорителей NVIDIA H100 (Hopper)
-
Новая: 4 ускорителя NVIDIA GB300 (Blackwell)
Результат оказался впечатляющим: конфигурация на GB300 показала прирост в 6.5 раз по скорости обработки (генерации токенов) по сравнению с массивом из H100.
Такой колоссальный скачок производительности достигнут не только за счёт raw-мощности новых чипов. Ключевую роль сыграли две архитектурные инновации Blackwell:
-
Сверхбыстрая связь между GPU: Вторая генерация технологии NVLink обеспечивает беспрецедентную пропускную способность для обмена данными между чипами в рамках одного узла, практически устраняя «бутылочное горлышко» коммуникации.
-
Эффективный тензорный параллелизм: Новая архитектура позволяет использовать 4-полосный тензорный параллелизм (TP4) там, где H100 требовал 16-полосного (TP16). Это означает меньше накладных расходов на разделение задачи и более эффективную координацию между ускорителями.
Ожидается, что системы на базе ускорителей GB300 поступят в дата-центры ведущих облачных провайдеров и корпоративных клиентов во второй половине 2024 года, укрепляя лидерство NVIDIA в гонке за доминирование в эпоху ИИ.
Подписывайтесь на наш телеграмм канал и читайте новости в удобном формате — https://t.me/occlub_ru.