FMA – это операция умножения/сложения с одним округлением. Не вдаваясь в глубокие исторические подробности, сейчас это у процессоров AMD эквивалент инструкциям AVX у Intel. Ещё в 2011 году с процессорами Bulldozer AMD реализовала поддержку набора инструкций FMA4. Далее с процессорами Piledriver инструкции FMA4 тоже были. А вот с приходом архитектуры Zen и процессоров Ryzen внезапно оказалось, что поддерживаются у них только FMA3. Во всяком случае именно так показывают все диагностические утилиты.
Дело в том, что FMA4 на 33% быстрее, чем FMA3. Здесь цифра обозначает не «поколение», а количество операндов на инструкцию. А вот причина, почему в AMD решили ограничить/отключить FMA4, остаётся неизвестной. Возможно, из-за ошибок. Возможно, из-за проблем с стабильностью работы. Или всё-таки AMD не отключила?
Господа с YouTube-канала Level1Techs решили проверить это, выполнив адаптированный сценарий, который отправляет инструкции FMA4 процессору. Задача FMA4, запущенная на процессоре, неожиданно не получила отказа и была успешно выполнена. Это интересная находка.
Между тем, CPUID и многие другие подобные утилиты всё ещё утверждают, что набор инструкций FMA4 не найден/не поддерживается.
К слову, FMA4 для линейной алгебры оказался более эффективным, чем AVX. При чем как с однократной, так и с двойной точностью.