DeepMind разработала умный механизм для сокращения галлюцинаций — автоматическую систему оценки. Когда ученый работает с AlphaEvolve, он дает задачу и предлагает варианты решений и пути их поиска: инструкции, уравнения, фрагменты кода и соответствующую литературу. Модель генерирует много вероятных решений, используя быструю модель Gemini Flash и более детализированную Gemini Pro. Затем каждое из них анализируется встроенной системой оценки. Благодаря эволюционному принципу, AlphaEvolve концентрируется на наиболее удачном варианте и продолжает его совершенствовать.
AlphaEvolve работает лишь в узких областях, например, в компьютерных науках и системной оптимизации. Также модель описывает решения только в виде алгоритмов, поэтому не подходит для задач с нечисловыми данными.
AlphaEvolve проверили на 50 математических задачах из разных разделов, включая геометрию и комбинаторику. Как заявляет DeepMind, в 75% случаев система нашла уже известные лучшие решения, а в 20% случаев даже предложила более совершенные варианты.
DeepMind также протестировала AlphaEvolve на практических задачах — например, по повышению эффективности дата-центров Google и ускорению обучения моделей. AlphaEvolve сгенерировала алгоритм, который в среднем позволяет постоянно восстанавливать 0,7% вычислительных ресурсов Google по всему миру. Система также предложила оптимизацию, которая сократила общее время обучения моделей Gemini на 1%.
Следующее поколение процессоров Tensor от Google также выиграет благодаря AlphaEvolve. Согласно DeepMind, ИИ предложил изменение в описании чипа на языке Verilog, которое убирает лишние биты и повышает эффективность работы. Google сейчас проводит проверку этого решения, и не исключено, что оно будет реализовано в новом чипе.
DeepMind утверждает, что главное достоинство AlphaEvolve — экономия времени и возможность освободить специалистов для более важных задач. Компания создает удобный интерфейс для работы с AlphaEvolve и планирует сначала предоставить ранний доступ к инструменту некоторым ученым, а затем, возможно, сделать его доступным для более широкого круга пользователей.