Hitech logo

Кейсы

NVIDIA представила «суперчип» Vera Rubin с производительностью до 100 петафлопс

TODO:
Екатерина ШемякинскаяВчера, 08:44 AM

На конференции GTC 2025 в Вашингтоне глава NVIDIA Дженсен Хуанг представил новое поколение вычислительных ускорителей Vera Rubin Superchip. Платформа объединяет центральный процессор Vera и два гигантских графических процессора Rubin на одной плате, обеспечивая до 100 петафлопс вычислительной мощности. Эта система призвана стать основой будущих ИИ-суперкомпьютеров, чья производительность будет измеряться эксафлопсами.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Каждый графический процессор Rubin состоит из двух массивных кристаллов с ядрами CUDA и восьми стеков памяти HBM4 общим объемом 288 ГБ. Характеристики GPU пока не раскрываются, но известно, что одна система Vera Rubin Superchip обеспечивает до 100 петафлопс FP4 — формата, оптимизированного для инференса, то есть выполнения уже обученных моделей искусственного интеллекта.

Центральный процессор Vera базируется на архитектуре Arm, имеет 88 ядер и 176 потоков. Он связан с GPU интерфейсом NVLink-C2C с пропускной способностью 1,8 ТБ/с, а также оснащен собственной оперативной памятью LPDDR (всего 32 ячейки), общий объем которой вместе с HBM достигает 2 ТБ на систему.

На основе этих решений NVIDIA создает новые серверные стойки Vera Rubin NVL144, рассчитанные на обучение и запуск моделей ИИ. Их производительность достигает 3,6 эксафлопс для вывода уже обученных ИИ-моделей (FP4) и 1,2 эксафлопс для обучения (FP8), что в 3,3 раза быстрее, чем у текущих систем поколения GB300 NVL72. Общая пропускная способность памяти HBM4 достигает 13 ТБ/с, а системной памяти — 75 ТБ.

Компания также анонсировала платформу следующего уровня — Rubin Ultra NVL576, которая появится во второй половине 2027 года. В ней будет использоваться четыре крупных GPU-чиплета Rubin Ultra и 1 ТБ памяти HBM4e. Эта система обеспечит до 15 эксафлопс FP4 и 5 эксафлопс FP8, предлагая до 365 ТБ быстрой памяти и пропускную способность сетей до 1,5 ПБ/с через NVLink.

Первые образцы чипов Rubin уже поступили в лаборатории NVIDIA для тестирования. По словам Хуанга, массовое производство Vera Rubin Superchip стартует в третьем или четвертом квартале 2026 года. В будущем Rubin сменит архитектура под кодовым названием Feynman, запуск которой ожидается в 2027–2028 годах. NVIDIA пока не раскрывает подробностей.