На конференции GPU Technology Conference наряду с профессиональным графически ускорителем Quadro GV100, речь про который шла в предыдущей новости, компания NVIDIA представила ещё кое-что. Кое-что очень, очень выдающееся – DGX-2. DGX-2 это кластерный суперкомпьютер на базе 16х ускорителей Tesla V100, специально «заточенный» для задач, связанных с машинным обучением.
Графический процессор каждого из таких ускорителей насчитывает 5120 CUDA-ядер и 640 специализированных ядер Tensor. На одной подложке с GPU установлены 32 ГБ HBM2 памяти от Samsung, что в совокупности с 4096-битной шиной данных обеспечивает пропускную способность порядка 900 ГБ/с.
А теперь перейдём к очень занимательным цифрам. В общей сложности DGX-2 насчитывает без малого 81.920 CUDA-ядер, 10.240 Tensor-ядер, 512 ГБ видеопамяти HBM2 с общей пропускной способность в 14,4 ТБ/с. В нагрузке всё это дело потребляет порядка 10 кВт.
Объединены все ускорители в системе интерфейсом NVSWitch, благодаря которому обеспечивается соединение GPU-GPU со скоростью 300 ГБ/с, что в 12 раз быстрее PCI-Express. Наряду с шиной NVLink 2 вся эта система по сути представляет из себя один графический процессор титанических размеров.
Среди прочих спецификаций значатся пара процессоров Intel Xeon Platinum (не говорят какие точно), возможность установки до 1,5 ТБ оперативной памяти и сверхскоростных NVMe-накопители с общим объёмом 30-60 ТБ. Для связи с внешним миром используется 100-гигабитный интерфейс.
Весит вся система 350 фунтов (почти 160 кг).
И на сладенькое: стоит данная установка $400.000. Налетай.