«Архитектура Vera Rubin разработана для решения фундаментальной проблемы, с которой мы сталкиваемся: объем вычислительных ресурсов, необходимых для ИИ, стремительно растет, — заявил Хуанг аудитории. — Сегодня я могу сказать вам, что Vera Rubin находится в полномасштабном производстве».
Архитектура Rubin, названная в честь астронома Веры Флоренс Купер Рубин, состоит из шести отдельных чипов, предназначенных для совместного использования. Центральное место в архитектуре занимают графические процессоры Rubin, к которым подключены центральные процессоры Vera, разработанные для мышления ИИ-агентов. Благодаря новым улучшениям в системах Bluefield и NVLink эта архитектура также решает растущие проблемы с хранением данных и межсоединениями, пишет Tech Crunch.
Объясняя преимущества нового хранилища, старший директор Nvidia по решениям для инфраструктуры ИИ Дион Харрис указал на растущие потребности современных систем ИИ в памяти, связанной с кэшированием. «Когда вы начинаете внедрять новые типы рабочих процессов, такие как агентный ИИ или долгосрочные задачи, возникает большая нагрузка и высокие требования к вашему кэшу ключ-значение, — сказал Харрис журналистам во время телефонного разговора, имея в виду систему памяти, используемую моделями ИИ для сжатия входных данных. — Поэтому мы ввели новый уровень хранения, который подключается к вычислительному устройству извне, что позволяет гораздо эффективнее масштабировать ваш пул хранения».
Архитектура Rubin, впервые анонсированная в 2024 году, заменит архитектуру Blackwell, которая, в свою очередь, пришла на смену архитектурам Hopper и Lovelace. Большинство крупных облачных сервисов уже запланировали переход на процессоры Rubin, включая Anthropic, OpenAI и Amazon Web Services. Системы Rubin также будут использоваться в немецком суперкомпьютере Blue Lion и в готовящемся к запуску суперкомпьютере Doudna Национальной лаборатории им. Лоуренса (США).
Как и ожидалось, новая архитектура также представляет собой значительный шаг вперед в скорости и энергоэффективности. По информации Nvidia, архитектура Rubin будет в 3,5 раза быстрее, чем Blackwell, решать задачи обучения моделей, и в 5 раз быстрее действовать в задачах вывода, достигая производительности до 50 петафлопс.
На прошлогодней конференции Future of AI Summit Хуанг заявил, что именно Пекин «в конечном счёте одержит победу» в гонке искусственного интеллекта. Аргументы Хуанга просты и прагматичны: Китай быстрее снимает регуляторные барьеры, щедро субсидирует энергозатраты дата-центров и поощряет переход на отечественные ускорители.

