Вскрылся необычный нюанс работы серверных процессоров AMD EPYC 7002 (Rome). Компания разослала технический документ, в котором говорится о гарантированном зависании через примерно 1044 дня беспрерывной работы. Самое интересное, что AMD не собирается исправлять эту проблему.
Как поясняет чипмейкер, ядру не удаётся выйти из состояния сна CC6 (Core C6 State). Точное время зависания может быть разным, всё зависит от Spread Spectrum и частоты REFCLK.
Более детально проблему описывает пользователь Reddit Acid_migrain. По его словам, EPYC 7002 зависает не через 1044 дня, а 1042 дня и 12 часов. Внутренний таймер Timestamp Counter Scaling работает при частоте 2800 МГц, перемножение 2800 × 106 × 1042,5 даёт 0x3800000000000000. «Здесь слишком много нулей, чтобы не быть совпадением», – говорит энтузиаст.
AMD рекомендует либо отключить режим сна CC6, либо перезагружать сервер каждый 2 года и 10 месяцев.
Источник:
Tom’s Hardware