«Microsoft AI Diagnostic Orchestrator» (MAI-DxO) — первый проект нового медицинского подразделения Microsoft AI, которое возглавляет Мустафа Сулейман, сооснователь DeepMind. К работе над системой привлекли сотрудников из DeepMind. По словам Сулеймана, эти испытания — шаг к созданию «медицинского суперинтеллекта», который в будущем может помочь решить проблему нехватки врачей и сократить время ожидания в перегруженных системах здравоохранения.
В основе новой системы Microsoft лежит «оркестратор», который формирует виртуальные команды из пяти ИИ-агентов. Каждый из этих агентов играет роль «доктора» со своей специализированной задачей. Например, один выдвигает гипотезы, другой подбирает диагностические тесты. Затем эти ИИ-агенты взаимодействуют друг с другом, чтобы определить оптимальный план действий.
В ходе тестирования системе предоставили 304 исследования из авторитетного медицинского журнала New England Journal of Medicine (NEJM). В этих материалах подробно описывалось, как врачи справлялись с наиболее сложными клиническими случаями. MAI-DxO должна была не только поставить правильный диагноз, но и показать логику своего решения. Для этого использовалась новая методика под названием «цепь дебатов», которая обязывает ИИ-модели мышления детально, шаг за шагом, объяснять процесс решения проблем.
Microsoft применила в своей системе ведущие большие языковые модели от OpenAI, Meta, Anthropic, Google, xAI и DeepSeek. «Оркестратор» улучшил работу всех моделей, но наилучшие результаты были достигнуты в паре с OpenAI o3. Она правильно решила 85,5% медицинских кейсов из журнала NEJM.
Для сравнения, опытные врачи, участвовавшие в исследовании, поставили верный диагноз примерно в 20% случаев. Во время этого эксперимента медикам не разрешалось пользоваться учебниками или консультироваться с коллегами, что, безусловно, могло бы повысить их показатели.
Версия этой технологии вскоре может быть также интегрирована в чат-бот Microsoft Copilot и поисковую систему Bing, которые ежедневно обрабатывают 50 млн медицинских запросов.
Сулейман заявил, что Microsoft вплотную подходит к созданию ИИ-моделей, которые превосходят человеческие возможности: они быстрее, дешевле и вчетверо точнее. Бывший руководитель медицинского подразделения DeepMind Доминик Кинг отметил, что новая программа Microsoft «показала лучшие результаты, чем всё, что мы когда-либо видели». Он также подчеркнул экономическую выгоду ИИ-моделей, которые сокращают количество необходимых тестов для диагностики, что порой экономит сотни тысяч долларов. Технология пока находится на ранней стадии развития, не прошла независимую экспертную оценку и не готова для использования в клинической практике.