Сколько о нем было слухов, которые появились еще даже несколько лет назад, и вот наконец Nvidia опубликовала практически полные спецификации ускорителя Tesla P100. Особо примечателен сей релиз по двум случаем: во-первых, именно здесь впервые применяется самый «большой» Pascal – GP100 (у нового Titan X графический чип не полный), а во-вторых, именно здесь впервые применяется новая многослойная память HBM2.
Начнем с GPU. В общей сложности в нем 15,3 млрд. транзисторов, а его площадь 610 мм2, не включая микросхемы памяти, расположенные на одной подложке. Здесь целых 3840 CUDA-ядер. И да, несмотря на всю энергоэффективность архитектуры Pascal, заявленный уровень TDP – 300 Вт. Работает все это при 1328-1480 МГц.
Теперь о памяти. Как и в Radeon Fury, в Nvidia Tesla P100 четыре микросхемы памяти, и тут их 16 ГБ (чуть позже появятся вариации на 32 ГБ). Общая пропускная способность памяти скорость памяти – 720 ГБ/с. Контроллеров памяти здесь 4, каждый по 512 бит (итого 4096-битная шина данных).
В вычислительной мощности скачек, без преувеличений, огромен. Tesla P100 способен обрабатывать 10,6 Тфлопс операций с одинарной точностью и 5,3 Тфлопс с двойной. Для сравнения:
Интересный момент. Nvidia Tesla P100 будет в двух вариация. Первая – как стандартная PCI-Express карта, и вторая – с новым интерфейсом подключения Mezzanine.
Источник:
AnandTech