GeForce RTX 3090 и GPU GA102
Видеокарты NVIDIA базируются на архитектуре Ampere и 8-нм техпроцессе Samsung. Выбор Samsung в качестве контрактного производителя вызвал немало скепсиса. С тайваньской литейной TSMC «зелёный» производитель сотрудничает давно, их 7-нм техпроцесс обкатан уже великолепно, он просто лучше узла N8 Samsung по всем параметрам, да и есть в ассортименте более передовые техпроцессы. К тому же самый крупный чип, GA100 с 54 млрд. транзисторов, предназначенный исключительно для продукции для дата-центров, выпускается по 7-нм техпроцессу TSMC.
Между тем, разница между узлом N7 TSMC и N8 Samsung куда больше, чем кажется. Зная площадь кристалла и количество транзисторов можно легко рассчитать показатель плотности транзисторов. Ядро GA100 имеет 826 мм2 площади и 54 млрд. «транзюков» – 65,37 МТ/мм2 плотности. GA102: 628,4 мм2, 28 млрд. и 44,56 МТ/мм2. Как итог 7 нм TSMC сильно плотнее.
О причинах можно спорить долго, хотя скорее всего они финансового характера, но в Сети есть слух, мол пока абстрактная линейка RTX 3000 Super будет уже на 7-нм от TSMС.
И всё же переезд с 12-нм на 8-нм – это большой переход. Настолько большой, что GPU GA102, являющийся флагманским для игровых видеокарт семейства GeForce, вместил 28 млрд. транзисторов. Это самый ёмкий массово производимый графический процессор для игровых видеокарт, производимый когда-либо. Для сравнения, GPU TU102, применяемый в GeForce RTX 2080 Ti и TITAN RTX, имеет 18,6 млрд. транзисторов. При том площадь кристалла сократилось с 754 мм2 до 629 мм2. Естественно, плотность теплового потока увеличилась, и это одна из причин, почему RTX 3090 настолько горячие, о чем подробнее несколько позже.
Графический процессор NVIDIA GA102 в своей урезанной версии применяется в GeForce RTX 3080, и в менее урезанной версии в GeForce RTX 3090. Полновесная модификация из, вероятно, экономических соображений не используется нигде – уж слишком мал % выхода полностью годных GA102. В нашем случае будет рассматриваться GA102-300-A1, характерный для RTX 3090 c заводским разгоном, и для Palit GeForce RTX 3090 GamingPro OC в частности.
Существенный рост транзисторного бюджета не столько сказался на поверхностной топологии GPU, сколько на внутренней. У TU102 было шесть GPC-кластеров (Graphics Processing Cluster), у GA102 в полновесной конфигурации их 7. Мультипотоковых процессоров (SM – Streaming Multiprocessor) на один GPC по-прежнему приходится 12 штук. Ключевое различие кроется непосредственно в количестве CUDA-ядер – их на один SM-блок стало вдвое больше.
На каждый SM-блок как и ранее приходится по одному RT-ядру, но уже второго поколения. NVIDIA обещает двукратный рост производительности при расчёте «лучей», а также устранение сильной просадки кадровой частоты при трассировке лучей на движущиеся объекты и при размытии эффектом Motion Blur. Теперь RT-ядра имеют параллельные блоки и хитрые алгоритмы расчета на упреждение.
Tensor-ядер не просто не стало больше, их количество уполовинено: теперь по 4 ядра Tensor на один SM-блок. При этом обещается как минимум двухкратный рост производительности, что говорит о росте эффективности в внушительные 4 раза. Это повысит производительность при активации DLSS-сглаживания.
В конечном счёте полновесная версия GPU NVIDIA GA102 имеет 10 752 CUDA-ядра, и не применяется нигде. Модификация GA102-300, характерная для RTX 3090, имеет GPU с двумя деактивированными SM-блоками. В итоге GeForce RTX 3090 располагает 10 496 CUDA, 328 Tensor и 82 RT-ядрами. Модификация GA102-200, применяемая в RTX 3080, урезана сильнее: 8704 CUDA-, 272 Tensor- и 68 RT-ядер.
Подсистема памяти нового поколения видеокарт также претерпела изменения. Прежде всего были взяты чипы GDDR6X с частотой 19,5 ГГц. В ассортименте Micron есть решения с только частотой 21 ГГц, но перестраховываясь NVIDIA урезала частоту до 19,5 ГГц. Всё дело, как предполагается, в плотнейшей компоновке моделей Founders Edition, склонности GDDR6X к перегреву и высоком общем уровне TDP. В случае GeForce RTX 3090 24 гигабайта памяти GDDR6X сопрягаются по 384-битной шине данных, что обеспечивает 936 ГБ/с пропускной способности.
NVIDIA GeForce RTX 3090 по этому показателю вплотную приближается к рекордсмену – к Radeon VII с пропускной способностью 1 Тбайт/с, оснащенной многослойной памятью HBM2.
Увы, multi-GPU связки достигли статуса олдскула, и поддержка подобных конфигураций со стороны чипмейкеров становится все меньше и меньше. С начала следующего года NVIDIA перестаёт выпускать собственные SLI-профили совсем, перекладывая реализацию SLI целиком на плечи разработчиков игр. А игроделы реализовывают поддержку mGPU по своему желанию и в необязательном порядке. Среди новеньких карт 3000-ой серии в тандеме могут работать только флагманские RTX 3090, получившие новый разъём NVLink.
Сильно быстрее NVLink не стал – 112,5 ГБ/с вместо 100 ГБ/с ранее, но новый мостик за $80 купи. Изменилась топология: теперь четыре линии по 28 ГБ/с вместо двух по 50 ГБ/с. Чем он на практике лучше первой версии NVLink непонятно. Возможности установить более двух адаптеров не появилось.
Наконец подобрались к непростому вопросу денег. GeForce RTX 3090 получила просто беспрецедентный по меркам потребительских одночиповых видеокарт рекомендованный ценник – $1500. Но RTX 3090 позиционируется не как прямой преемник RTX 2080/2080 Ti, а скорее как новый TITAN RTX. Во всяком случае в маркетинговых материалах NVIDIA приводит именно такое сравнения. И если TITAN стоил на старте $2500, то $1500 за RTX 3090 выглядят не так уж плохо. Что правда, недо-TITAN это. Линейка TITAN примечательна расширенными возможностями по обработке данных с двойной точностью (FP64). У RTX 3090 производительность FP64 равна 1/60 от FP32. Кроме того, TITAN-ы имели доступ к специализированным Studio-драйверам, а RTX 3090 – нет.
А будет ли в целом TITAN RTX Ampere? – вопрос хороший. GA102 в составе RTX 3090 отключен лишь на 2%, что как-то не намекает на пространство для ещё одной карты. 48 ГБ память GDDR6X?! – может, но только тогда, когда Micron сможет удвоить плотность микросхем GDDR6X. А самую-самую полновесную версию GPU с маркировкой вида xx-100 NVIDIA исторически не применяла в серии «титанов». Поэтому появление подобного решения маловероятно, и поэтому GeForce RTX 3090 уместно считать прямым преемником TITAN RTX, пусть и с оговорками.
NVIDIA подготовила собственный референсный дизайн видеокарт GeForce RTX 3070, RTX 3080 и RTX 3090. Особенно необычным получился дизайн последних двух с очень плотной компоновкой, V-образной платой, новым 12-контактным разъёмом питания и нетипичной системой охлаждения. К сожалению, приобрести/достать RTX 3080 и RTX 3090 в версиях Founders Edition крайне проблематично, поэтому первое знакомство с GeForce RTX 3090 начнём с модели от Palit в исполнении GamingPro OC.
2 комментария
если не секрет, какая судьба ждет карточку теперь?)
Да как и все продадим на авито за 150к, делов-то=)
На самом деле образец был возвратный