Вчера в ходе выставки GTC17 самый главный босс NVIDIA Дженсен Хуанг со сцены представил ускоритель Tesla V100, основанный на архитектуре Volta. По старой доброй традиции NVIDIA их архитектуры носят имена великих физиков, и если с архитектурой Pascal была отдана честь французу Блезу Паскаль, то в этот раз почтили Алессандро Вольта.
Про Tesla V100 есть что рассказать. По словам Дженсена, стоимость разработки ускорителя составила 3 миллиарда долларов, и по совместительству это самый ёмкий чип, когда-либо созданный человечеством. GPU располагает 5120 CUDA-ядрами, 21 миллиардом транзисторов (площадь 815 мм2), и построен он на 12-нм FFN-техпроцессе. Фактически, в GPU CUDA-ядер еще больше – 5376, но часть из них отключена. Работает ускоритель при 1455 МГц, что при такой ёмкости настоящее достижение.
Внушительное число CUDA-ядер – это еще далеко не все. Добрую треть площади отнимают специализированные ядра Tensor. Задача этих ядер состоит в ускорении глубокого обучения, и в этом плане Tesla V100 нет равных. Заявлены 120 Тфлопс вычислительной мощности в глубоком обучении, 15 Тфлопс при операциях с одинарной точностью, и 7,5 Тфлопс с двойной точностью. Это… это не передать как много.
Кроме того, Tesla V100 получил 16 ГБ видеопамяти HBM2 и 4096-битную шину данных, что обеспечивает 900 ГБ/с общей пропускной способности.
Пока представлена только версия с интерфейсом NVLink 2.0, пропускная способность которого 300 ГБ/с. Чуть позже, вероятно, представят и версию с привычным PCI-Express.
Источник:
Videocardz