Охлаждение — одна из главных статей расходов в центре обработки данных: на него уходит до 40% всей потребляемой электроэнергии. Традиционные ЦОД полагаются на холодный воздух: мощные вентиляторы гонят его через стойки с серверами, отводя тепло от чипов. Чем жарче снаружи и чем горячее оборудование, тем больше энергии требуется, чтобы этот воздух охладить. По мере роста мощности ИИ-ускорителей задача становится всё сложнее. «Как только мощность на чип превысила определённый уровень, жидкостное охлаждение стало обязательным», — говорит президент производителя систем жидкостного охлаждения Motivair Ричард Уитмор.
Кремниевые чипы выделяют огромное количество тепла, но сами по себе способны работать при высоких температурах — проблема не в жаре как таковой, а в её отводе. Чем выше температура охлаждающей жидкости, тем меньше энергии нужно тратить на её предварительное охлаждение перед подачей к чипам. По оценкам, каждый дополнительный градус температуры хладагента снижает затраты на охлаждение на 4%. При этом производительность чипов не страдает: охлаждающие пластины удерживают их температуру в пределах допустимых рабочих параметров даже при подаче жидкости при 45°C.
Инженеры Nvidia полностью переработали архитектуру теплоотвода. Прежде серверы с жидкостным охлаждением были гибридными: GPU и CPU получали охлаждающие пластины, а остальные компоненты по-прежнему охлаждались воздухом. В платформе Rubin жидкость, представляющая собой смесь 75% воды и 25% пропиленгликоля, поступает к каждому компоненту через единый вход и выход, поглощает тепло непосредственно на чипе и выходит при температуре около 55°C. Тепло передаётся внешним сухим охладителям — большим радиаторным змеевикам снаружи здания. Контур заполняется один раз и работает в замкнутом режиме на протяжении всего срока службы объекта.
В результате ЦОД мощностью 50 МВт может экономить более $4 млн в год только на электроэнергии и воде. Потребление воды снижается с 2,6 млн галлонов на мегаватт в год при традиционных системах с градирнями практически до нуля. Плотность размещения серверов в стойке при этом растёт: система, прежде занимавшая шесть стоек, теперь умещается в две.
Поскольку платформа Rubin полностью интегрирует жидкостное охлаждение, каждый облачный провайдер и оператор ЦОД, строящий инфраструктуру под неё, автоматически переходит на новый стандарт. Дополнительным бонусом становится возможность утилизации отработанного тепла: его можно направлять на отопление соседних зданий. В подходящем климате, например, при стабильно прохладном наружном воздухе механические чиллеры не нужны вовсе, а уровень шума в зале падает с 85 децибел до тишины.
На фоне прогнозируемого роста энергопотребления ЦОД с 460 ТВт·ч в 2026 году до 3700 ТВт·ч к 2040-му охлаждение превращается в один из ключевых факторов устойчивости всей ИИ-индустрии.

