В исследовании отмечается, что ценовое давление заставляет компании снижать зависимость от премиальных решений OpenAI и Anthropic — причиной стал переход индустрии к оплате по фактическому использованию. О той же проблеме предупреждают и в Gartner: по их словам, затраты на ИИ становятся непредсказуемыми, а компании не всегда понимают, сколько токенов требует та или иная задача. Это, по прогнозу, может привести к тому, что уже к 2028 году расходы на разработку ПО с применением ИИ превысят среднюю зарплату разработчика.
Аналитики JPMorgan указывают, что стоимость использования ИИ в ряде случаев резко выросла. Например, цена токенов OpenAI, по данным отчёта, удвоилась между версиями GPT-5.4 и GPT-5.5, а Microsoft повысила стоимость Copilot и расширила тарифы для нескольких моделей. Некоторые корпоративные клиенты сообщают, что их расходы на ИИ увеличились до 100 раз после пересмотра ценовой политики.
На этом фоне уже фиксируются первые переходы на более дешёвые альтернативы. Стартап Lindy отказался от моделей Claude от Anthropic в пользу китайской DeepSeek, заявив о значительной экономии и улучшении эффективности. Генеральный директор Coinbase Брайан Армстронг также прогнозирует, что большинство ИИ-задач в ближайший год перейдёт на более доступные модели.
Соотношение цены и производительности всё чаще становится решающим фактором в пользу открытых и дешёвых решений. В одном из сравнений Claude Opus 4.8 набрал 56 баллов в бенчмарке при стоимости $3700, тогда как DeepSeek V4 Pro получил 44 балла всего за $186, что делает его почти в 20 раз дешевле.
Китайские разработчики, включая DeepSeek, Alibaba, Xiaomi, MiniMax и Kimi, всё чаще занимают лидирующие позиции в так называемой «эффективности интеллекта на доллар» — показателе, который сочетает качество модели и её стоимость эксплуатации.
При этом JPMorgan отмечает, что премиальные модели OpenAI и Anthropic сохранят важную роль в задачах, требующих максимальной точности, таких как научные исследования, кибербезопасность и продвинутые ИИ-агенты. Однако большая часть корпоративных задач не требует топового уровня производительности, что открывает масштабный рынок для более дешёвых альтернатив с открытым исходным кодом.

