Архитектура Skylake-X: кэш-мешь и AVX-512
Изначально Intel планировала с новым HEDT-процессорами пойти по протоптанной стезе – +2 ядра, +100-200 МГц, рост показателя IPC за счёт новой архитектуры – всё. Broadwell-E насчитывали 10 ядер как максимум, и в планах было на 12 ядрах для флагманского процессора и остановиться, но случился Ryzen Threadripper, и планы переменились.
С релизом Skylake-X Intel впервые в рамках десктопной платформы начала предлагать модели с 12, 14, 16 и 18 ядрами, и это очень важный момент. Ранее предшествующие Broadwell-E базировалась только на кристалле LCC (Low Core Count), по сути представляющим собой адаптированные под народные нужды серверники Skylake-SP. Процессоры Skylake-X с числом ядер до 12 также остались на LLC-кристалле (но он другой), а более ядерные модели впервые переехали на кристалл типа HCC (High Core Count). Хоть название отличается всего на одну букву, “под капотом” топологическое устройство разнится существенно.
Ядро Intel Core i9-7980XE
Столь важную веху чипмейкер отметил в маркировке процессоров. Серия Core i9 впервые дебютировала именно с Skylake-X. По-видимому, таким образом подчёркивался особенный статус процессоров, ну и на фоне Ryzen 7 циферка “9” смотрится более победоносно.
Надобность инструкций AVX-512 – тема очень обширная, но именно с Skylake-X эти инструкции впервые пришли в настольный сегмент. Кроме того, появился новый интегрированный контроллер памяти DDR4-2666 с поддержкой четырёхканального режима, существенные метаморфозы произошли с кэш-памятью, на 4 стало больше линий PCI-Express, сама архитектура Skylake принесла рост показателя IPC (производительность на такт), появилась поддержка технологии Turbo Boost 3.0.
Про кэш-память стоит рассказать отдельно. У предшествующих Broadwell-E на ядро приходилось 256 КБ кэша L2 и 2,5 МБ кэша L3. В свою очередь у Skylake-X стало на одно ядро приходиться 1 МБ кэша L2 и 1,375 МБ L3. Кое-где прибавилось, кое-где убавилось. Но сам кэш работает иначе. Теперь содержимое кэша L2 не дублируется в L3, а за счёт большего вчетверо объёма кэша L2 вероятность нахождения нужных данных именно в нём больше. Минус такого подхода в том, что если ядру требуются данные другого ядра – то он должен обращаться к чужому кэшу L2, ведь кэш L3 (где раньше была копия) уже не общий. Это приводит к дополнительным задержкам, однако увеличенная вероятность попадания в кэш L2 компенсирует этот недостаток, во всяком случае так утверждает чипмейкер.
Небывалый рост количества ядер вынудил Intel отказаться от кольцевой шины. Когда ядер очень много, кольцевая шина – не самый удачный подход, приводящий к лишним задержкам, и чем обмен данным между ядрами интенсивнее – тем кольцевая шина менее годная. В итоге Skylake-X используют топологию сетки (Mesh) – каждое ядро подключено только к соседним. В целом, кольцевая шина лучше, но только если ядер не много (до 10), а далее начинаются лишние издержки. Свыше десятка – лучше Mesh.
Технология Turbo Boost 3.0 – штука интересная. Планировщик задач Windows автоматически определяет самые «качественные» ядра, способные работать быстрее других. Благодаря этому на лету частоты одного-двух ядер могут вырасти ещё на 100-200 МГц, немного повышая производительность при одно- двухпоточной нагрузке.
Хотя Skylake-X и не получили новый 10-нм техпроцесс (да, молва за 10 нм была ещё три года назад), архитектура Skylake принесла ряд новшеств, благодаря которым удельная производительность выросла на ~10% при неизменных тактовых частотах.
3 комментария
x570 + Threadripper? Исправьте ошибку))
Ошибки нет, я неправильно прочел, извиняюсьД
5Ghz берет процессор вообще в лёгкую, на кастом воде. Ни один адекватный человек, приобретая такой процессор не будет устанавливать на него СЖО замкнутого цикла.