В конференции разработчиков I/O 2017 компания Google, в представлении не нуждающаяся совсем, представила второе поколения собственной разработки для машинного обучения – Tensor Processing Unit (TPU).
В настоящее время Google утверждает, что второе поколение Tensor Processing Unit уже полностью работоспособно, и понемногу такие установки внедряются на различных сервисах гиганта. Пока компания не слишком раскрывает сведения о том, как это все работает, но зато не упустила возможность похвастаться впечатляющей производительностью.
Один юнит может обеспечить до 180 терафлопс вычислительной мощности с плавающей запятой, а целый кластер, состоящий из 64 юнитов, обеспечивает 11,5 петафлопс. Для сравнения, NVIDIA Tesla V100 тоже специально «заточенный» для глубокого обучения ускоритель, и Tesla V100 обеспечивает лишь 120 Тфопс.
“Используя Tensor Processing Unit V2 мы уже наблюдали значительное улучшение времени обучения. Расчет одной из наших новых моделей крупномасштабного перевода обычно занимал целый день, при использовании 32 лучших коммерчески доступных графических ускорителей, а теперь аналогичное вычисление проводится также за 1 день, но используется только 1/8 от мощности всего кластера” – сказал представитель Google.