«Организации быстро переходят от экспериментов к масштабному внедрению агентов ИИ-программирования, но многие недооценивают финансовое влияние растущего потребления токенов», — заявил старший главный аналитик Gartner Нитиш Тьяги. По его словам, разработчики обычно оптимизируют скорость и удобство работы, а не стоимость вычислений, поэтому без контроля расходы могут расти быстрее, чем производительность.
По мере того как крупные поставщики переходят от фиксированных подписок к тарификации за токены, затраты предприятий на ИИ становятся всё более непредсказуемыми: компании не всегда понимают, какие именно задачи потребляют больше всего токенов. По данным The Register, счета за разработку ИИ-приложений выросли с $20–100 до $2000–5000 в месяц на одного разработчика, а в отдельных случаях ежемесячные расходы могут достигать $20 тыс. Показателен пример Uber: компания израсходовала весь годовой бюджет на ИИ за первые четыре месяца 2026 года и после этого ввела для сотрудников месячный лимит в $1500 на каждый инструмент ИИ-разработки.
Расходы растут и из-за того, как сотрудники используют ИИ-агентов. Среди основных причин перерасхода Gartner называет чрезмерную автономность агентов, слишком большие контекстные окна, отсутствие оптимизации запросов и недостаток встроенных механизмов контроля затрат со стороны поставщиков ИИ-решений.
По оценке аналитиков, ситуация может ухудшиться по мере роста популярности агентного ИИ. Всё больше сотрудников, которые раньше не использовали подобные инструменты, начинают подключать их к рабочим процессам, что увеличивает общее потребление токенов. При этом рост инвестиций в инфраструктуру и разработку моделей может привести к дальнейшему удорожанию ИИ-сервисов.
Чтобы избежать неконтролируемого роста расходов, Gartner рекомендует компаниям внедрять управляемую модель использования ИИ: определять, какие задачи действительно требуют агентов, выбирать подходящие модели под уровень сложности и ограничивать использование наиболее дорогих систем только там, где они дают максимальную пользу.
Кроме того, организации должны внедрять мониторинг токенов, лимиты потребления, автоматическое распределение задач между моделями и регулярно анализировать рабочие процессы. В будущем эффективность работы с ИИ будет зависеть не только от возможностей самих моделей, но и от того, насколько хорошо компании научатся управлять стоимостью их использования.

