Baikal собирается выпустить отечественные ИИ-чипы, совместимые с Nvidia CUDA

Тренды

Екатерина Шемякинская19 мая, 09:41

Екатерина Шемякинская19 мая, 09:41

Российская компания Baikal Electronics представила на конференции ЦИПР 2026 в Нижнем Новгороде собственную линейку решений для искусственного интеллекта — два ускорителя и новую серверную платформу. Флагманский ускоритель Baikal BE-AI-D1000 обеспечит производительность до 1000 Тфлопс в режиме FP8, будет совместим с экосистемой CUDA, а его стоимость составит $10 тыс. Выход продуктов запланирован на 2029–2030 годы.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Главной новинкой стал серверный ускоритель Baikal BE-AI-D1000, ориентированный на дата-центры и ИИ-инфраструктуру. Он сможет обеспечивать производительность до 1000 Тфлопс в режиме FP8 и 500 Тфлопс в FP16, что соответствует классу NVIDIA L40S для задач генеративного ИИ и машинного обучения.

Китай меняет образование в пользу ИИ: в вузах закрыли 12 тыс. старых учебных программ

Ускоритель получит от 48 до 64 Гбайт памяти стандарта GDDR. При этом компания отказалась от использования более дорогой высокоскоростной памяти HBM, которая применяется в топовых ИИ-чипах NVIDIA и AMD. Окончательные параметры масштабирования системы и форм-фактор устройства пока не раскрываются. Ориентировочная стоимость одного ускорителя составит $10 тыс.

Кроме того, Baikal обещает совместимость с экосистемой CUDA. Ускоритель сможет запускать популярные ИИ-фреймворки, такие как PyTorch и TensorFlow, без серьёзной переработки программного обеспечения. Для этого предполагается использовать слой трансляции, аналогичный технологии ZLUDA.

Помимо самого ускорителя, компания представила концепцию комплексной серверной платформы для ИИ-задач. Она будет объединять собственный графический ускоритель и новый процессор Baikal S2 на архитектуре Arm Neoverse N2. Эта архитектура была представлена Arm в 2020 году и ориентирована на высокопроизводительные серверные системы и облачные вычисления.

Фактически речь идет о создании российского аналога систем NVIDIA DGX — специализированных серверов для обучения и запуска нейросетей. Проект создается при участии российских технологических компаний, которые помогают дорабатывать архитектуру ускорителя и серверной платформы под реальную нагрузку и требования рынка.

Также по теме

Тренды

Россия за 10 лет потеряла почти 30 тысяч ученых

Тренды

SK Hynix заявила о создании первого в мире модуля памяти DDR5

Тренды

Электрические фургоны Rivian приступили к доставкам заказов Amazon

Тренды

На фабрике NIO тестируют роботов-гуманоидов

Новости СМИ2