Hardware

Изучаем блок-схему графических процессоров NVIDIA Turing

Первые обзоры на видеокарты NVIDIA Turing, а именно на RTX 2080 и RTX 2080 Ti, свет увидят ровно через неделю. С тем и станет понятно, какова архитектура Turing в деле, ведь на данный момент всё выглядит противоречиво. Тем временем в Сеть попали кое-какие технические детали новой архитектуры. В частности, предлагаю ознакомиться с блок-схемами графических процессоров TU102, TU104 и TU106.

Архитектура NVIDIA Turing использует кластерную структуру исполнительных модулей. Каждый кластер, именуемый GPC (Graphics Processing Cluster) имеет 8 (у TU104) или 12 (у TU102 и TU106) SM-модулей. В свою очередь в SM-модуль состоит из привычных CUDA-ядер в количестве 64 единиц, 8 Tensor-ядер для задач машинного обучения, и одного RT-ядра для расчёта трассировки лучей RayTracing.

SM-модули получили также новый исполнительный блок INT32. Он позволяет графическим процессорам Turing параллельно выполнять операции с плавающей и не плавающей точкой. По утверждениям NVIDIA, это на 36% увеличивает число операцией с плавающей точкой.

TU104 и TU102, ставшие основой для RTX 2080 и RTX 2080 Ti, в действительности используют не весь чип. Часть кластеров GPC у них отключена, а полные GPU TU104 и TU102 применяется в Quadro RTX 6000 и RTX 5000 соответственно. В итоге GeForce RTX 2070 (TU106) – единственная видеокарта из новой серии с полностью активным чипом.

Графические процессоры TU102 и TU104 дополнительно получили интерфейс связи NVLink x8, обеспечивающий связь между двумя адаптерами. TU106 такого интерфейса лишен полностью. К слову о SLI. Видеокарты Turing могут работать в SLI только в тандеме. 3х и 4х связки упраздняются.

Источник:
Videocardz

You may also like