Jalapeño — это не перепрофилированный ускоритель обучения и не универсальный процессор для ИИ, а специализированная ASIC-микросхема, архитектура которой выстроена вокруг конкретных требований инференса в больших масштабах. Главные проблемы, которые она решает, — дорогостоящее перемещение данных между памятью и вычислительными блоками, баланс между пропускной способностью и задержкой, а также эффективность сетевого взаимодействия. Предварительные внутренние тесты показывают значительно более высокую производительность на ватт по сравнению с современным оборудованием, однако конкретных цифр и бенчмарков пока не раскрывается.
Судя по опубликованным изображениям, Jalapeño содержит один крупный вычислительный чиплет площадью около 840 мм² (вплотную к пределу фотошаблона EUV-литографии), окружённый шестью модулями памяти HBM. Такой масштаб нетипичен для чипов инференса и больше напоминает процессоры для обучения ИИ. По всей видимости, это сознательный выбор в пользу минимизации задержек — ключевого параметра для задач рассуждения и агентных вычислений.
От первоначального проектирования до готовой производственной микросхемы прошло всего девять месяцев, тогда как стандартный цикл создания ASIC-микросхем с нуля занимает полтора-два года.
Столь высокий темп объясняется несколькими факторами: совместной работой инженеров OpenAI и Broadcom, повторным использованием Broadcom собственной логики в разных проектах, а также применением моделей OpenAI для ускорения отдельных этапов проектирования и оптимизации чипа.
Чип должен поддерживать существующие и будущие языковые модели как OpenAI, так и сторонних клиентов. Генеральный директор Broadcom Хок Тан уточнил, что Jalapeño будет развёрнут в центрах обработки данных гигаваттного масштаба совместно с Microsoft и другими партнёрами начиная с 2026 года.
Новый процессор стал частью более широкой стратегии OpenAI по контролю над инфраструктурой искусственного интеллекта. Компания развивает не только модели и приложения вроде ChatGPT и Codex, но и аппаратные компоненты, необходимые для их масштабирования. По словам президента OpenAI Грега Брокмана, это часть долгосрочной стратегии по расширению доступа к вычислительным ресурсам, которая должна сделать ИИ быстрее, надёжнее и доступнее для людей и бизнеса.

