Summit — грандиозное инженерное решение на базе двух видов процессоров — в единой связке работают около 9200 22-ядерных процессоров IBM POWER9 и около 27600 GPU Nvidia Tesla V100, предназначенных для решения задач по обучению и применению ИИ.
Одной из самых масштабных стал эксперимент с участием Berkeley Lab, Oak Ridge National Laboratory и инженеров Nvidia. Самому быстрому суперкомпьютеру в мире «скормили» набор данных из снимков атмосферы сверхвысокого разрешения, собранный в Berkeley Lab, и учили идентифицировать экстремальные погодные явления.
Как сообщается на сайте Минэнерго США, оплатившего создание машины, в ходе эксперимента была достигнута пиковая производительность 1,13 exaops (миллиард миллиардов операций в секунду) при средней скорости в 0,99 exaops. Это сделало алгоритм анализа изображений DeepLabv3+ самым быстрообучаемым ИИ в мире. При обычных вычислениях, по данным разработчиков, Summit демонстрирует быстродействие свыше 3 exaops.
Такая производительность — сочетание нового подхода в формировании вычислительных узлов, связанных высокоскоростной шиной NVLink, а также ряда программных решений. Summit состоит из 4608 серверов, в каждом из которых работает по паре процессоров от IBM и шесть — Volta Tensor Core GPU от Nvidia. Система водяного охлаждения ежеминутно прокачивает более 15 тонн воды.
DeepLabv3+ специально модифицировали, чтобы он мог эффективно воспользоваться такой невероятной мощностью, рассказал программист Торстен Курц. Обычно приложения на основе TensorFlow оперируют сравнительно скромными вычислительными ресурсами.
DeepLabv3+, как утверждают создатели, способен анализировать hi-res изображения буквально попиксельно и будет предсказывать ураганы и наводнения, а также фиксировать мельчайшие изменения в динамике стихийных катаклизмов, вызванные изменением климата.