OCClub

AMD Ryzen Threadripper 3970X: обзор. Синоним выражения “высокопроизводительный процессор”

Первое поколение процессоров Ryzen Threadripper, конечно, стало событием, ведь AMD замахнулась на такой сектор рынка, куда раньше даже кротким взглядом не смотрела. Позиции Intel тогда пошатнулись, но не слишком. Предложения были не плохие, но «детские болезни» вносили дёгтя, да и преимущество в количестве ядер оставалось за «синими». Выход Threadripper 2000 изменил положение, подставив под сомнение целесообразность сборки HEDT-платформы на Intel. Ядер стало больше, сами они – мощнее, платформа AMD развитее и современнее. Intel же во второй раз предлагала тоже самое. И вот вышли Threadripper 3000, после которых фраза многоядерный процессор стала буквально синонимом AMD, и антиподом Intel. По сути, у AMD HEDT-платформа только начинается там, где у Intel заканчивается. В ответ Intel в третий раз предлагает тоже самое, но за вдвое дешевле.

В линейку Ryzen Threadripper 3000 первоначально вошли две модели – Threadripper 3960X и 3970X, насчитывающие 24 и 32 ядра соответственно. Несколько позже к ним примкнул монструозный 64-ядерный Threadripper 3990X, ставший для HEDT-платформы Intel не просто гвоздём в крышку, а анкерным болтом из твёрдосплава. Но один лишь впечатляющий флагман – не есть вся линейка, цена в $4000 отпугивает, и Threadripper 3960X с Threadripper 3970X вызывают не меньший интерес.

К слову, промежуточную 48-ядерную модель AMD решили не выпускать. Хотя и архитектура, и даже вид маркировки намекает на возможность появления такой версии. Свою позицию AMD аргументирует просто: нужно более 32 ядер? – покупай сразу ультимативный Threadripper 3990X!

Казалось бы, в «сухих» характеристиках Threadripper 3960X и Threadripper 3970X от предшественников в виде Threadripper 2970WX и 2990WX ушли не слишком далеко. Да, у прямых преемников стало больше ядер, но, по сути, лишь на ступень ниже сместились маркировки. Threadripper 2970WX и 3960X – 24-ядерные/48-поточные процессоры. Threadripper 2990WX и 3970X – 32-ядерные/64-поточные. Boost-частоты подтянулись на сотню-другую мегагерц, зато базовая частота на 700-800 МГц сразу, что внушительно. Рост частот и производительности в целом обеспечен двумя факторами: новой архитектурой и техпроцессом. Существенный прирост показатели IPC, и возможность теперь показывать класс даже в играх, обеспечен в корне иной топологией. Настало время со время этим разобраться.

Сегодня на “Тест’O’дроме” будет «тестодромиться» один из представителей семейства Ryzen Threadripper 3000 – Threadripper 3970X. Это 32-ядерный/64-поточный процессор, возможностей которого хватит с лихвой под совсем любые нужды. Более того, некоторые зарубежные ресурсы, к примеру TechSpot, даже называют его “самым лучшим игровым процессором”. Забегая наперёд скажу, что в играх Threadripper 3000 показывают достойные результаты, куда лучше, чем предшественники, пусть это и не их стезя. Но всё-таки «убийцы потоков 3000» предназначены для другого.

Топология Threadripper 3970X

Подобно Ryzen 3000 для десктопной платформы, Ryzen Threadripper 3000 тоже «переехали» на чиплетный дизайн. Под огромной крышкой соседствуют CCD-комплексы, содержащие x86-ядра на архитектуре Zen 2, а также центральный кристалл ввода-вывода IOD. Первые производятся по передовому 7-нм техпроцессу TSMC, а IOD-кристалл – по 12-нм техпроцессу GlobalFoundries. Таким образом, процессоры получились интернациональными как никогда: часть компонентов производится в Америке, часть – на Тайване, и окончательная сборка в Малайзии. Длинный жизненный путь Threadripper отображен прямо на крышке.

AMD Ryzen Threadripper 3970X: обзор. Синоним выражения "высокопроизводительный процессор"

Каждый CCD-комплекс имеет порядка 3,9 млрд. транзисторов (74 мм2), а центральный IOD-кристалл около 8,34 млрд (416 мм2). Итого суммарно транзисторный бюджет Threadripper 3970X порядка 24 млрд., а площадь – 712 мм2. Можно было создать и единый большой кремний такого размера, это отнюдь не рекорд. К примеру, графический процессор NVIDIA TU102 (RTX 2080, Titan RTX) имеет площадь 754 мм2. Но мультичиповая конфигурация, применяемая AMD, гораздо выгоднее из экономической точки зрения. Проще и дешевле произвести 5 некрупных кристаллов, и после соединить их сверхскоростной шиной, чем один монструозных размеров. И этот постулат возводится в степень при применении передовых техпроцессов.


7-нм CCD-комплекс. Источник изображения: Fritzchens Fritz

8-ядерные CCD-комплексы в точности аналогичны тем, что применяются в десктопных Ryzen 3000. Только если у Ryzen их в лучшем случае 2, то у Threadripper 3970X и 3960X их по 4 штуки, а у 3990X и вовсе 8 единиц. Кроме того, сами ядра на архитектуре Zen 2 по показателю IPC (инструкций за такт) стали на 15-18% производительнее за счёт архитектурных оптимизаций.


12-нм кристалл IOD. Источник изображения: Fritzchens Fritz

Кристалл IOD унаследован от серверных процессоров Epyc, но в урезанном виде. В составе Threadripper он урезан ровно вдвое: два двухканальных контроллера DDR4-3200 + два контроллера PCI-Express 4.0 на 32 линии каждый.

Технически AMD могла реализовать 8-канальный доступ к памяти вместо 4-канального. Почему нет? – сама AMD говорит, что 4 канала с Threadripper работают лучше. Но скорее здесь дело в экономической составляющей. Кристалл площадью 416 мм2 – самый большой, что сходил с конвейера GlobalFoundries в рамках 12-нм. Вероятно, не все они получаются годными, рабочими целиком. Целые-годные – в серверные Epyc, чуть битые – урезаются в половину и ставятся в Threadripper. Кроме того, 8-канальный доступ требует больше слоёв в подложке, а это тоже затраты. Истина, скорее всего, как обычно посередине: лепту вносят и разные экономические составляющие, и отсутствие сопоставимого прироста пропускной способности памяти.

Иная топология в корне изменила процесс доступа к внутрикремниевой памяти. У Threadripper первого и второго поколений чиплеты с ядрами были полнофункциональными. Помимо самих ядер, в них содержался кэш, шины PCI-Express, ряд вспомогательных блоков и контроллеров. Теперь все это переместилось в центральный кристалл ввода-вывода IOD, а CCD теперь содержит ядра и только их.

Топология Threadripper 2990X

Такой подход принес ряд дивидендов, а точнее избавил от «бутылочного горлышка». Ранее ССD-комплекс мог обращаться к памяти другого CCD через шину Infinity Fabric, что лишний раз засоряло трафик шины, не говоря уже о лишних задержках. Хуже того, часть ядер Threadripper 2970WX и 2990WX вообще не имела собственной памяти. При надобности они обращались к соседним, что вызывало рост задержек в 1,5 раза и сильно сказывалась на производительности в специфических задачах. Теперь же подход в корне иной: памяти в ядрах нет (вся она в центральном кристалле), лишние задержки искоренены, ядра напрямую меж собой общаться не могут, шина Infinity Fabric гоняет кратно меньше трафика, а прямо лишнего – так и вовсе нисколько.

Кратко говоря, наиважнейшее топологическое изменение в том, что Threadripper перешли от распределённой схемы реализации памяти и вспомогательных контроллеров к централизованной. Важно понимать, что это не идеальное решение, а выбор меньшего из зол. В случае с действительно многоядерными процессорами делается либо так, либо как было в Threadripper 2000 (с дополнительными задержками), либо на едином монолитном кристалле. В последнем случае задержек не будет, но стоимость и % выхода годной продукции, особенно вспоминая дороговизну 7-нм техпроцесса TSMC, получится нецелесообразной.

«Новый» сокет sTR4 и платформа TRX40

С новым поколением процессоров пришел и новый сокет. С одной стороны, весьма неожиданно, поскольку массовый AM4 как-то справился и с возросшим вдвое количеством ядер, и с появлением интерфейса PCI-Express 4.0, да и родственные Threadripper-ам серверные Epyc-и обошлись без нового сокета. С другой стороны, пришли фундаментальные изменения, про которые через пару абзацев. Но как факт для Threadripper потребуется новая материнская плата с чипсетом AMD TRX40 и сокетом SP3 (sTR4).

Совместимости нет ни прямой, ни обратной. Плата с TRX40 не заработает с процессором Threadripper 1-го и 2-го поколений, и наоборот – Threadripper 3-го поколения не заработает с платой на чипсете X399. Механически вставить получится, но система не будет стартовать.

Что удивительно, сам сокет остался прежний. Это 4096-контактная «розетка» типа LGA с аналогичной физически картой контактов. Даже так называемые «ключи» на том же месте. Изменилось электрическое назначение нескольких контактов. AMD называет такой ход необходимостью ввиду возросшего энергопотребления и ряда других изменений. Энтузиасты считают, что совместимость можно было и сохранить, и «старый» sTR4 вполне бы справился, но совместимость намеренно поломали. Истина, вероятно, как всегда где-то посередине. То есть AMD теоретически могла обеспечить совместимость, но для этого пришлось бы чем-то пожертвовать, а для пока абстрактных Threadripper 4-го поколения пространства для манёвра совсем бы не осталось.

Одним из ключевых нововведений, потребовавших новую платформу, стоит считать внедрение интерфейса PCI-Express 4.0. Из-за этого в 4 раза вырос канал связи между процессором и чипсетом. Ранее он осуществлялся через 4 линии PCI-E 3.0 (3,94 ГБ/с теоретических, на деле меньше), а ныне мало того, что связь через двое более быстрый PCI-E 4.0, так ещё и линий стало 8. В итоге канал связи увеличился до 15,75 ГБ/с.

Процессор Threadripper 3000 имеет суммарно 56 линии PCI-Express 4.0, которые могут быть гибко сконфигурированы под порты SATA и M.2. Также встроен четырёхканальный контроллер памяти DDR4-3200 и контроллер USB 3.2 Gen 2 на 4 линии.

Относительно AMD X399 сам чипсет TRX40 стал существенно продвинутее. Также он переехал на другой техпроцесс. Для производства AMD TRX40 задействуются довольно современные (а по чипсетным меркам даже передовые) 12-нм производственные мощности GlobalFoundries. Чипсет имеет 16 встроенных линий PCI-Express 4.0, которые производители плат могут конфигурировать на SATA-порты, M.2, слоты PCI-E и прочие на своё усмотрение.

На этом фоне AMD не упустила возможности подколоть конкурента. Их платформа имеют суммарную пропускную способность интерфейсов под 133 ГБ/с, а у Intel почти втрое меньше – 52 ГБ/с.

Параллельно этому, вместо двух высокоскоростных портов USB 3.2 Gen 2 (10 Гбит/с) стало 8, а вот в остальном чипсет «похудел». SATA – 4 вместо 8 ранее; USB 2.0 – 4 вместо 6; USB 3.2 Gen1 – 0 вместо 4. Да, от внутрикремниевой поддержки USB 3.2 Gen1 (5 Гбит/с) AMD полностью отказалась. Производители материнских плат могут реализовывать такие порты только сторонними контроллерами.

Из чипсета был полностью вырезан интерфейс HD Audio, являющийся неотъемлемой часть любого набора системной логики до этого. Именно по этой причине у всех материнских плат на чипсете AMD TRX40 указывается два аудиотракта (обычно это Realtek ALC1220 и ALC4050H). Дело в том, что мощный Realtek ALC1220 может работать только через HD Audio, и ALC4050H выполняет роль моста. К ALC1220 он подключается по HD Audio, а к чипсету – через шину USB.

TRX40, в отличии от предшествующего X399, и аналогично массовому X570, разрабатывала не ASMedia, как все прочие чипсеты, а сама AMD. Вероятно, всё дело в поддержке PCI-Express 4.0, но чипсеты от AMD получились непривычно горячими – 15 Вт TDP (обычно 4-5 Вт). Поэтому платы с TRX40 в обязательном порядке имеют вентилятор на чипсете.

Цены на такие платы, увы, совсем не радуют. На данный момент представлено суммарно 12 плат от ASUS, ASRock, Gigabyte и MSI. Самые-самые бюджетные решения стоят от $450. К слову, с нашим обзором ASRock TRX40 Creator можно ознакомиться здесь.

Упаковка, внешний вид Threadripper 3970X

Крутому процессору – крутая коробка. Под стать ценнику, Threadripper 3970X поставляется в интересной коробке, через переднее окошко которой видна крышка «камня». По сравнению с предшествующими Threadripper-ами, коробка стала кратко компактнее.

Процессор стоит на подложке, прикрытый крышкой из полупрозрачного оргстекла. Сам CPU сразу находится в оранжевой пластиковой рамке, являющейся частью сокета. После установки процессора в гнездо рамка остаётся прямо на нём.

«Новый» сокет SP3 (sTR4) от условно «старого» не отличается. Совместимость с процессорными кулерами с припиской TR4 и увеличенной подложкой сохранилась. В комплекте с процессором поставляется крепление, позволяющее установить большинство СВО (на базе помпы Asetek). Перечень систем охлаждения под Threadripper по-прежнему не столь большой. Расширяется на 1-2 модели в год.

Отмечу, что хотя заявленные 280 Вт TDP Threadripper 3970X выглядят действительно страшно, но деле всё не так плохо. Noctua NH-U14S TR4-SP3 – кулер неплохой, на великолепном радиаторе Noctua и с 140-мм пропеллером, на всё-таки далеко не топовый. И даже он в тесте AIDA64, где по показаниям датчиков урабатывались все 280 Вт, удерживал процессор на 78 градусах (по показания CPU Diode).

Под разгон, конечно, нужен или топовый суперкулер, или СВО с как минимум 240-мм радиатором, но разгонять Threadripper 3970X особо не зачем, да и особо некуда.

Тестирование

AMD Ryzen Threadripper 3970X – 32-ядерный/24-поточный процессор с частотой работы 3,7-4,5 ГГц, 128 МБ кэш-памяти третьего уровня, TDP 280 Вт и четырёхканальным контроллером памяти DDR4-3200, поддерживающим до 256 ГБ ОЗУ.

В первую очередь стоит отметить снижение задержек работы памяти. Если предыдущие Threadripper из-за своей топологии не могли преодолеть 100-нс рубеж доступа к оперативной памяти, что оказывало весомое влияние на производительность, то теперь вкладываются в 90 нс c памятью DDR4-3000. Увеличение скорости памяти до режима DDR4-3600, которые сама AMD называет наиболее оптимальными, снижает задержки до сопоставимых с мейнстрим-платформами ~80 нс.

Скорость памяти по-прежнему сильно сказывается на производительности. В синтетических бенчмарках разницы нет, но в профессиональных приложениях и даже играх она есть. Между режимами DDR4-3000 и DDR4-2400 она составляет около 10%, между DDR4-3000 и DDR4-3600 – ещё на ~+5%.

Для Threadripper 3970X AMD и так отбирает наилучшие чиплеты, работающие почти на пределе. Также пришли новые механизмы работы Boost. Банальное привычное поднятие множителя зачастую приводит даже к снижению производительности, поскольку отобранные ещё на заводе самые быстрые ядра (которые не всегда самые быстрые) только урезаются по частоте. Для качественного разгона Threadripper 3000, как и Ryzen 3000, лучше всего применить Custom Power Plan от 1usmus. Кратко говоря, он перераспределяет быстрейшие ядра, которые сама AMD почему-то определила некорректно, и изменяет схему работы диспетчера Windows, распределяющего нагрузку между потоками/ядрами. Custom Power Plan обязателен к применению с всеми процессорами AMD на архитектуре Zen 2.

Но всё-таки немного потенциала в AMD Threadripper 3970X есть. А раскрыть его очень сложно, ведь требования к системе охлаждения выдвигаются запредельные. Лишь небольшое поднятие напряжение, а без этого дела не будет, приводит к очень существенному росту нагрева. В нашем случае процессор удалось разогнать до 3,8 ГГц постоянных по всем ядрам – всего на +100 МГц относительно стоковой базовой частоты. Овчинка выделки не стоит.

В утилите Ryzen Master можно переключить процессор в режим Creator или Game. В первом активны все ядра и потоки, а в Game Mode отключается половина. Threadripper 3970X становится 16-ядерным/32-поточным. Фактически это «костыль». Проблема в том, что игры пока плохо работают с большим количеством ядер, как и сам диспетчер Windows, путающийся в ядрах. Отключением половины ядер (самых медленных по версии Ryzen Master, но он зачастую не прав) путаницы становится чуть меньше, производительность в играх на 1-2% лучше. В целом, рекомендации в этом вопросе просты, и заложены в само название режимов. Со временем, когда Windows научится грамотно работать с ядрами, а игры смогут задействовать много ядер, режимы Creator и Game станут бесполезны.

Ниже приведен ряд тесты в нескольких синтетических бенчмарках, а на последующих страницах тестирование в профессиональных приложениях и чуть-чуть играх.

Тестирование в профессиональных приложениях

Обычно в наших обзорах внимание профессиональным приложением не уделяется, но Threadripper-ы на то и «заточены». Мы не располагаем внушительным парком процессоров и материнских плат для сопоставления результатов, поэтому часть данных была взята из обзора Guru3D.

Magix Vegas Pro 14.0

Важно отметить, что Vegas Pro умеет работать только в 16 потоков, поэтому здесь возможности Threadripper 3970X фактически урезаны вчетверо.

V-Ray

V-Ray 1.08 умеет великолепно распараллеливать потоки. Здесь задействуются все 64 потока, а при возможности даже больше.

Corona

Встроенный в Corona бенчмарк также хорошо распределяет нагрузку на множество ядер. В частности, поддерживаются до 72 потоков.

Handbrake

Транскодировщик видео Handbrake использует максимум ядер. В данном случае кодировался трейлер h.264 DTS 1080P в Matroska x.264 с 5.1-канальным звуком AC3.

Blender

Бенчмарк Blender тоже хорошо распараллеливает нагрузку по ядрам. Использовался пресет bmw27.

Тестирование в играх

Пусть Threadripper 3970X не для игр создавался, и рядовому геймеру лучше обратить внимание на процессоры подешевле и менее «ядерные», для полноты картины в нескольких играх тестирование было проведено.

Shadow of the Tomb Raider (DX12)

Игра базируется на усовершенствованной версии движка Foundation от Eidos Montreal. Поддерживается только API DirectX 12.

Metro Exodus (DX12)

В основе Metro Exodus лежит эксклюзивный движок 4A Engine, являющийся демонстратором передовых графических технологий. Поддерживается только DirectX 12, а также есть поддержка технологий NVIDIA RTX, DLSS и HairWorks. В этом тесте эксклюзивные технологии NVIDIA деактивированы.

The Witcher 3 (DX11)

Третья часть саги о похождениях Геральта вышла в 2015, но и по сей день представляет собой вызов для компьютерного «железа». Лежащий в основе движок REDengine 3 был специально разработан для игр с открытым миром. Он использует API DirectX 11 с тесселяцией и рядом эффектов постобработки. Из соображений нейтральности технология HairWorks была отключена.

За, против, вердикт

Что тут скажешь, с Threadripper 3000 компания AMD показала, что HEDT-сегмент принадлежит ей. Новое поколение процессоров оказалось просто восхитительным. Хотя у основных моделей ядер больше не стало, их по-прежнему 24 в случае Threadripper 3960X и 32 у Threadripper 3970X, сами ядра стали намного мощнее.

Фактически AMD лишила Intel последнего преимущества её HEDT-платформы – показателя производительности на ядро. Новая архитектура Zen 2 и принципиально новая топология позволили AMD сравняться с Intel по этому параметру. Это заметно даже в играх, где Threadripper 3970X не уступает мейнстрим-процессорам Intel. Но за AMD очень весомое преимущество в количестве ядер. В тех рабочих задачах, где нагрузка может распараллеливаться на все ядра, 18 Intel-овских ядер сильно проигрывают 32 AMD-шным.

Как было сказано ещё в самом начале, сложилась такая ситуация, когда у AMD HEDT-платформа только начинается там, где у Intel уже заканчивается.

Помимо этого, Threadripper 3000 получили поддержку передового интерфейса PCI-Express 4.0. Он не только вдвое быстрее. Наряду с чипсетом TRX40, вся платформа предлагает 72 линии PCI-E против 44 у конкурента. Как показывает практика, для видеокарт режим PCI-E 4.0 бесполезен, но SSD-накопители на новом интерфейсе вдвое быстрее. Снова-таки, рядовому пользователю с лихвой и 24 линий хватит, но в узкоспециализированных задачах запас пригодится.

Принципиально иная топология избавила процессоры от «болячки», а именно задержек доступа к ОЗУ и кэш-памяти процессора. Это, вместе с возросшими частотами и рядом оптимизацией на уровне архитектуре, делает новые Threadripper 3000 бескомпромиссным решением.

Но есть и негативные стороны. Во-первых, ощутив силу, AMD подняла цены. Рекомендованный ценник 32-ядерного Threadripper 3970X составляет $2000. В пересчете цена/ядро одно ядро Zen 2 стоит ~$62, а одно Intel-овское ядро – ~$55. Историческое событие. К тому же, как минимум в $400 обойдётся материнская плата с чипсетом TRX40, а совместимости с предыдущим поколением плат нет. Энергопотребление и тепловыделение стало еще больше, и со всеми этими нюансами придётся мириться.

Хорошо:

Не хорошо:

Exit mobile version