«Первый сверхинтеллект превзойдет человека по способности к обучению», — заявил Рафаилов на конференции TED AI в Сан-Франциско. По его словам, такой ИИ сможет эффективно осмысливать концепции и адаптироваться, выдвигать собственные гипотезы, проводить эксперименты и использовать окружающую среду для проверки своих идей.
Рафаилов критикует подход OpenAI, Anthropic и Google DeepMind, которые вложили миллиарды в увеличение масштабов моделей и данных. По его мнению, системам ИИ не хватает не мощности, а способности учиться на собственном опыте.
Чтобы проиллюстрировать проблему, исследователь привел пример ИИ-программистов. Несмотря на способность выполнять сложные задачи, например, анализировать код и реализовывать функции, эти системы не сохраняют полученный опыт и не накапливают знания.
В отличие от человека, который со временем совершенствует навыки, ИИ каждый раз начинает обучение заново. По сути, у модели каждый «рабочий день» как первый.
Рафаилов также обратил внимание на склонность таких агентов использовать конструкции типа try/except pass, которые позволяют программе продолжать работу при ошибках. Он объяснил, что это отражает ограниченность текущих систем обучения: модели оптимизированы для быстрого решения задач, а не для понимания и самосовершенствования.
Дальнейшее увеличение вычислительных мощностей не приведет к созданию истинного общего ИИ. «Мы не способны справиться с общим искусственным интеллектом и сверхинтеллектом в рамках нынешних парадигм», — сказал Рафилов. По мнению исследователя, вместо масштабирования следует сосредоточиться на качественных данных и корректной структуре вознаграждений для обучения.
Рафаилов предлагает использовать «метаобучение» или «обучение обучению». Вместо разрозненных задач модели получают структурированные учебные курсы с упражнениями.
При этом вознаграждается не просто решение конкретной задачи, а прогресс в обучении, способность усваивать абстракции и адаптироваться. Такой подход имитирует то, как студент постепенно осваивает учебник, и уже доказал свою эффективность в системах, подобных AlphaGo.
Thinking Machines Lab был основан в феврале бывшим техническим директором OpenAI Мирой Мурати и уже привлек рекордное начальное финансирование в $2 млрд при оценке в $12 млрд. В стартапе работает около 30 исследователей из OpenAI, Google, Meta и других ведущих лабораторий. Компания уже выпустила первый продукт Tinker — API для тонкой настройки моделей с открытым исходным кодом По словам Рафаилова, это лишь основа для более амбициозной программы, направленной на развитие ИИ, способного учиться самостоятельно.

