Hitech logo

Тренды

Gartner: к 2030 году стоимость работы с ИИ снизится более чем на 90%

TODO:
Екатерина ШемякинскаяСегодня, 11:46 AM

Аналитическая компания Gartner спрогнозировала резкое снижение стоимости работы с искусственным интеллектом. К 2030 году выполнение вывода для моделей с триллионом параметров подешевеет более чем на 90% по сравнению с 2025 годом. Речь идет о вычислениях, необходимых для генерации ответов и обработки запросов в системах GenAI.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

По оценке аналитиков, ключевым фактором станет рост эффективности самих моделей и инфраструктуры. Уже к концу десятилетия большие языковые модели будут в среднем в 100 раз экономичнее ранних аналогов 2022 года при сопоставимом масштабе.

Снижение стоимости обеспечат сразу несколько технологических факторов. Среди них — развитие полупроводников, более эффективное использование вычислительных ресурсов, распространение специализированных чипов и оптимизация архитектуры моделей. Дополнительно будет расти роль периферийных вычислений, где часть задач обрабатывается ближе к пользователю.

В основе расчётов лежит понятие «токенов» — минимальных единиц данных, которые обрабатывает модель. Один токен соответствует примерно четырем символам текста. Именно стоимость обработки токенов определяет цену работы большинства ИИ-сервисов.

Однако удешевление не означает автоматического снижения расходов для бизнеса. Более продвинутые системы, особенно агенты, требуют гораздо больше вычислений. По оценке Gartner, такие системы могут использовать в 5–30 раз больше токенов на одну задачу, чем обычные чат-боты.

В результате общий спрос на вычисления будет расти быстрее, чем снижается их стоимость. Это означает, что совокупные расходы на использование ИИ могут увеличиться, несмотря на удешевление отдельных операций.

Аналитики считают, что ключевое преимущество получат компании, способные грамотно распределять задачи между разными типами моделей. Простые и массовые операции будут передаваться более лёгким и дешевым системам, а ресурсоемкие вычисления — использоваться только для сложных задач. Такой подход позволит сохранить баланс между стоимостью и производительностью в условиях стремительного роста возможностей искусственного интеллекта.