Недавно Nvidia подтвердила запуск полноценного производства платформы Vera Rubin для ИИ-датацентров. Компания заверила партнёров, что релиз состоится позже в этом году и опередит конкурентов, включая AMD.
Однако на этом изменения не заканчиваются. По новым данным, Nvidia также пересматривает характеристики Rubin. Цель очевидна — увеличить производительность и укрепить позиции на фоне ускорителей AMD Instinct.
TDP Rubin вырастает до 2,3 кВт
Согласно информации KeyBanc, опубликованной через инсайдера @Jukan05, Nvidia зафиксировала энергопотребление Rubin GPU на уровне 2,3 кВт. Изначально компания заявляла 1,8 кВт. При этом некоторые аналитики ожидали рост до 2,5 кВт.
Таким образом, итоговое значение оказалось посередине. Тем не менее это всё равно означает прирост примерно 500 Вт на GPU.
Причина проста. Nvidia хочет обеспечить заметный отрыв от AMD Instinct MI455X, который, по прогнозам, будет потреблять около 1,7 кВт.
Рост пропускной способности памяти
Дополнительное подтверждение поступило от SemiAnalysis. По их данным, Nvidia увеличила скорости передачи данных у HBM4. В результате пропускная способность памяти Rubin GPU достигает 22,2 ТБ/с.
Для сравнения, ранее фигурировало значение около 13 ТБ/с. Это колоссальный скачок.
На момент публикации Nvidia официально не подтвердила эти данные. Компания была запрошена для комментария.
Зачем нужен дополнительный запас мощности
Дополнительные 500 Вт дают Nvidia больше свободы. Во-первых, GPU сможет дольше удерживать высокие тактовые частоты под постоянной нагрузкой. Это особенно важно для обучения и инференса.
Во-вторых, снижается риск троттлинга при полной загрузке ускорителя. Кроме того, больший энергобюджет позволяет одновременно задействовать больше вычислительных блоков.
В итоге растёт реальная пропускная способность, а не только показатели в спецификациях.
Ускорение памяти и интерконнектов
Дополнительная мощность полезна не только для тензорных блоков. Она также позволяет разгонять HBM4-память и PHY-модули.
Более того, Nvidia может повысить частоты всех соединений. Речь идёт о памяти, внутренних шинах и NVLink. При этом сохраняются надёжные сигнальные зазоры.
Это особенно важно сейчас. Современные ИИ-системы всё чаще упираются именно в пропускную способность памяти и фабрики соединений.
Выгоды на уровне стоек и датацентров
На уровне системы рост TDP означает большую производительность на узел и на стойку. Для гиперскейлеров это критично.
Им важнее общая эффективность кластера, а не абсолютная производительность одного GPU. Если задача решается меньшим числом ускорителей, снижается нагрузка на сеть и повышается эффективность инфраструктуры.
Однако такой подход требует готовности работать с существенно более высоким энергопотреблением.
Плюсы для производства и надёжности
Повышенный TDP даёт преимущества и на этапе производства. Он упрощает биннинг кристаллов и увеличивает запас по напряжению.
В результате Nvidia получает лучший выход годных чипов. При этом нет необходимости отключать вычислительные блоки или снижать частоты.
Итог
Таким образом, дополнительные 500 Вт служат сразу нескольким целям. Nvidia повышает производительность Vera Rubin. Компания усиливает конкурентоспособность решений VR200 NVL144. Кроме того, она закладывает запас надёжности для стабильной работы в масштабных датацентрах.
В качестве бонуса Nvidia потенциально сможет поставить на рынок больше GPU. Это положительно скажется и на финансовых результатах компании.
В итоге Vera Rubin становится не просто мощнее на бумаге, а более предсказуемой и устойчивой платформой для ИИ-нагрузок.
Подписывайтесь на наш телеграмм канал и читайте новости в удобном формате — https://t.me/occlub_ru.
