Site icon OCClub

NVIDIA GB300 против H100: четверка новых ускорителей в 6.5 раз быстрее шестнадцати предыдущих флагманов

Партнёры NVIDIA начали публиковать первые результаты тестирования новых ускорителей Blackwell. Данные шокируют: кластер всего из четырёх новейших GB300 демонстрирует более чем шестикратное превосходство над связкой из шестнадцати H100 в реальной задаче по запуску большой языковой модели.

Облачный провайдер CoreWeave провёл наглядное сравнение, запустив 175-миллиардную модель DeepSeek R1 на двух конфигурациях:

Результат оказался впечатляющим: конфигурация на GB300 показала прирост в 6.5 раз по скорости обработки (генерации токенов) по сравнению с массивом из H100.

Такой колоссальный скачок производительности достигнут не только за счёт raw-мощности новых чипов. Ключевую роль сыграли две архитектурные инновации Blackwell:

  1. Сверхбыстрая связь между GPU: Вторая генерация технологии NVLink обеспечивает беспрецедентную пропускную способность для обмена данными между чипами в рамках одного узла, практически устраняя «бутылочное горлышко» коммуникации.

  2. Эффективный тензорный параллелизм: Новая архитектура позволяет использовать 4-полосный тензорный параллелизм (TP4) там, где H100 требовал 16-полосного (TP16). Это означает меньше накладных расходов на разделение задачи и более эффективную координацию между ускорителями.

Ожидается, что системы на базе ускорителей GB300 поступят в дата-центры ведущих облачных провайдеров и корпоративных клиентов во второй половине 2024 года, укрепляя лидерство NVIDIA в гонке за доминирование в эпоху ИИ.

Подписывайтесь на наш телеграмм канал и читайте новости в удобном формате — https://t.me/occlub_ru.

Exit mobile version