Серия тестов MLPerf считается наиболее качественным и репрезентативным методом проверки возможностей искусственного интеллекта в суперкомпьютерах, а также эффективным способом обучения ML-моделей (Machine Learning). Консорциум разработчиков платформы состоит из более чем 70 компаний и групп исследователей из ведущих университетов.
Машины Google установили рекорд в следующих моделях тестирования: DLRM, Transformer, BERT, ResNet-50, SSD и Mask R-CNN. Первая — это рекомендательная система, вторая отвечает за обработку естественного языка, третья — новый поисковый алгоритм Google, четвертая — модель для классификации изображений, пятая — ИИ для идентификации объектов в реальном мире и последняя, Mask R-CNN — архитектура нейронной сети для сегментации объектов на изображениях.
Суперкомпьютер, используемый Google в тренировочных раундах MLPerf был в четыре раза больше, чем Cloud TPU v3 Pod, который установил три рекорда в прошлом году. Система включала 4096 чипов TPU v3 и сотни хост-машин и каждая была подключена через сверхбыстрое соединения (DCI). В общей сложности, компьютер обеспечил более 430 PFOLPS (петафлопс) производительности при максимальной нагрузке.
«Мы установили новый рекорд с помощью обновленной системы машинного обучения в TensorFlow, JAX и Lingvo. Четыре из восьми моделей были обучены с нуля менее чем за 30 секунд», — заявил представитель Google AI Навин Кумар.
TensorFlow, о которой говорит Кумар, — это комплексная среда машинного обучения с открытым исходным кодом Google, а Lingvo и JAX — высокоуровневые структуры для последовательных моделей и исследований, основанных на преобразовании составных функций.
«Последние результаты конкурса MLPerf доказывают, что Google удалось создать самый быстрый в мире обучаемый суперкомпьютер с поддержкой машинного обучения. Используя этот суперкомпьютер, а также новейший чип Tensor Processing Unit (TPU), Google установила рекорды производительности в шести из восьми тестов MLPerf», — говорится в блоге Google.
Сейчас Google проходит следующий этап тестирования в MLPerf. В новом тесте компания использует нейросети для прогнозирования в режиме реального времени, этот метод также называется «логический вывод». В консорциуме заявляют, что результаты тестирования будут опубликованы до конца 2020 года.