Главной новинкой стал серверный ускоритель Baikal BE-AI-D1000, ориентированный на дата-центры и ИИ-инфраструктуру. Он сможет обеспечивать производительность до 1000 Тфлопс в режиме FP8 и 500 Тфлопс в FP16, что соответствует классу NVIDIA L40S для задач генеративного ИИ и машинного обучения.
Ускоритель получит от 48 до 64 Гбайт памяти стандарта GDDR. При этом компания отказалась от использования более дорогой высокоскоростной памяти HBM, которая применяется в топовых ИИ-чипах NVIDIA и AMD. Окончательные параметры масштабирования системы и форм-фактор устройства пока не раскрываются. Ориентировочная стоимость одного ускорителя составит $10 тыс.
Кроме того, Baikal обещает совместимость с экосистемой CUDA. Ускоритель сможет запускать популярные ИИ-фреймворки, такие как PyTorch и TensorFlow, без серьёзной переработки программного обеспечения. Для этого предполагается использовать слой трансляции, аналогичный технологии ZLUDA.


Помимо самого ускорителя, компания представила концепцию комплексной серверной платформы для ИИ-задач. Она будет объединять собственный графический ускоритель и новый процессор Baikal S2 на архитектуре Arm Neoverse N2. Эта архитектура была представлена Arm в 2020 году и ориентирована на высокопроизводительные серверные системы и облачные вычисления.
Фактически речь идет о создании российского аналога систем NVIDIA DGX — специализированных серверов для обучения и запуска нейросетей. Проект создается при участии российских технологических компаний, которые помогают дорабатывать архитектуру ускорителя и серверной платформы под реальную нагрузку и требования рынка.

