На прошлой неделе Дженсен Хуанг (Jen-Hsun Huang) вышел на сцену и официально представил видеокарты Nvidia GeForce GTX 1070 и GTX 1080. Помимо презентации самих ускорителей и их разгонного потенциала, демонстрировались новые технологии, примененные в архитектуре Pascal. Именно им и посвящен этот материал. Конечно, будут рассмотрены не все новшества. О некоторых новых и/или обновленных технологиях будет рассказано в обзоре GTX 1080, который появится уже в совсем скором времени.
Pascal и GPU GP 104
Первое и самое важное изменение в Pascal – уход от 28-нм техпроцесса, который использовался в потребительских видеокартах с момента выхода GeForce GTX 600-серии, с марта 2012 года. Архитектура Pascal основывается на новом 16-нм FinFET техпроцессе производства TSMC, и с переходом на более тонкую литографию приходят впечатляющие улучшения в области энергопотребления и масштабирования производительности.
Но прежде всего более тонкий техпроцесс, зачастую, позволяет нарастить частоту. В «стоке» видеокарта работает более чем при 1700 МГц. Также, судя по многочисленным обзорам, GTX 1080 способен разгоняться до 2100+ МГц, а это референс, еще и серьезно ограниченный по питанию.
Стоит отметить, что не только уменьшение техпроцесса позволило так поднять частоту. По словам Иона Альбена (Jonah Alben) – старшего вице-президента подразделения GPU Engeneering, после перехода на 16-нм FinFET техпроцесс новые графические процессоры могли работать на частоте около 1325 МГц, и команда Nvidia долгое время работала над наращиванием частот. Итогом работы стала GTX 1080, которая функционирует при 1733 МГц.
Как же удалось добиться такого уровня улучшения тактовой частоты и производительности относительно архитектуры Maxwell? Pascal сочетает в себе несколько интересных нововведений, позволяющих существенно увеличить эффективность.
Оптимизации позволили не только увеличить тактовую частоту, но и эффективность CUDA-ядер GPU GP104 относительно предшественника – GM204. Доказательство тому – прирост производительности в 70% (относительно GTX 980) и это еще на не до конца доведенных до ума драйверах.
Одно из изменений можно рассмотреть на блок-схеме, которая представлена выше. Теперь в одном кластере GPC заместь четырех SM-s (simultaneous multiprocessor) блоков их пять.
PolyMorphEngine 4.0
Существенное дополнение в самом кристалле GPU лишь одно – добавление нового модуля к PolyMorph Engine. Добавился синхронный блок мультипроекцирования. Новый блок находится в самом конце тракта обработки кадра и создает несколько схем проекции из одного потока геометрии.
Если не вдаваться в подробности, а там все очень сложно, то новый блок берет обработку геометрии на себя, не всю, но существенную часть. Таким образом нагрузка на другие блоки графического процессора уменьшается. Помимо этого, PolyMorph помогает формировать картинку под корректными углами на мультимониторных конфигурациях, но об этом позже.