Hitech logo

Кейсы

OpenAI выпустила GPT-Rosalind — модель для медико-биологических наук

TODO:
Екатерина ШемякинскаяСегодня, 11:55 AM

OpenAI представила специализированную модель искусственного интеллекта GPT-Rosalind, ориентированную на ускорение разработки лекарств и научных исследований в области биологии и химии. Новая система должна сократить путь от лабораторной гипотезы до готового препарата, который сегодня может занимать 10–15 лет и требовать миллиардных инвестиций.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

В отличие от универсальных языковых моделей, GPT-Rosalind создана как узкоспециализированный инструмент для научных задач. Она предназначена для синтеза данных, выдвижения гипотез и планирования экспериментов — работы, которая обычно требует времени и высокой квалификации исследователей. Своё название модель получила в честь химика Розалинд Франклин. Её исследования позволили расшифровать ДНК, но долгие годы имя ученой оставалось в тени знаменитых коллег-мужчин Джеймса Уотсона и Фрэнсиса Крика.

Модель оптимизирована для работы с геномикой, белковой инженерией и химией. Она демонстрирует высокие результаты на профильных бенчмарках. Так, в тестах BixBench с реальными биоинформатическими задачами система превзошла другие модели с опубликованными результатами, а в наборе LABBench2 показала лучшие показатели, чем GPT-5.4, в 6 из 11 задач.

Отдельно проводились испытания совместно с компанией Dyno Therapeutics. В задачах прогнозирования соответствия РНК-последовательностей и белков модель показала результаты выше 95-го процентиля среди экспертов, а в задачах генерации последовательностей — около 84-го процентиля.

Это указывает на способность системы выявлять сложные закономерности, которые могут ускользать от моделей общего назначения.

Помимо самой модели, OpenAI представила экосистему инструментов для научной работы. Раньше исследователям приходилось работать разрозненно: для одного проекта нужно было заглянуть в базу белковых структур, изучить клиническую литературу за 20 лет, а затем запустить отдельную программу для анализа генетических последовательностей. Новый плагин OpenAI для Codex (доступен на GitHub) объединяет доступ к более чем 50 биологическим базам данных и научным источникам, автоматизируя рутинные задачи. В набор входят модули по биохимии, генетике человека, функциональной геномике и клиническим исследованиям.

Доступ к GPT-Rosalind на первом этапе будет ограниченным, поскольку модель способна перепроектировать биологические структуры. Инструмент распространяется в формате исследовательского превью и доступен только проверенным корпоративным пользователям в США.

Компании должны пройти процедуру отбора и подтвердить, что их проекты соответствуют требованиям безопасности и общественной пользы.

Релиз уже получил поддержку со стороны крупных игроков индустрии. Представители Amgen, Moderna и NVIDIA отмечают, что подобные инструменты способны ускорить разработку лекарств и сократить время перехода от анализа данных к практическим экспериментам. OpenAI также указывает на предыдущие проекты, например, сотрудничество с Ginkgo Bioworks, где применение ИИ позволило снизить затраты на производство белков на 40%.