Каждый графический процессор Rubin состоит из двух массивных кристаллов с ядрами CUDA и восьми стеков памяти HBM4 общим объемом 288 ГБ. Характеристики GPU пока не раскрываются, но известно, что одна система Vera Rubin Superchip обеспечивает до 100 петафлопс FP4 — формата, оптимизированного для инференса, то есть выполнения уже обученных моделей искусственного интеллекта.
Центральный процессор Vera базируется на архитектуре Arm, имеет 88 ядер и 176 потоков. Он связан с GPU интерфейсом NVLink-C2C с пропускной способностью 1,8 ТБ/с, а также оснащен собственной оперативной памятью LPDDR (всего 32 ячейки), общий объем которой вместе с HBM достигает 2 ТБ на систему.
На основе этих решений NVIDIA создает новые серверные стойки Vera Rubin NVL144, рассчитанные на обучение и запуск моделей ИИ. Их производительность достигает 3,6 эксафлопс для вывода уже обученных ИИ-моделей (FP4) и 1,2 эксафлопс для обучения (FP8), что в 3,3 раза быстрее, чем у текущих систем поколения GB300 NVL72. Общая пропускная способность памяти HBM4 достигает 13 ТБ/с, а системной памяти — 75 ТБ.

Компания также анонсировала платформу следующего уровня — Rubin Ultra NVL576, которая появится во второй половине 2027 года. В ней будет использоваться четыре крупных GPU-чиплета Rubin Ultra и 1 ТБ памяти HBM4e. Эта система обеспечит до 15 эксафлопс FP4 и 5 эксафлопс FP8, предлагая до 365 ТБ быстрой памяти и пропускную способность сетей до 1,5 ПБ/с через NVLink.
Первые образцы чипов Rubin уже поступили в лаборатории NVIDIA для тестирования. По словам Хуанга, массовое производство Vera Rubin Superchip стартует в третьем или четвертом квартале 2026 года. В будущем Rubin сменит архитектура под кодовым названием Feynman, запуск которой ожидается в 2027–2028 годах. NVIDIA пока не раскрывает подробностей.

