Hitech logo

Кейсы

ИИ от Microsoft ставит диагнозы в четыре раза точнее врачей

TODO:
Екатерина ШемякинскаяВчера, 09:16 AM

Microsoft представила новый медицинский инструмент на базе искусственного интеллекта, который, по заявлению компании, способен диагностировать сложные заболевания в четыре раза эффективнее опытных врачей. Система под названием Microsoft AI Diagnostic Orchestrator использует взаимодействие нескольких ИИ-агентов и уже показала точность до 85,5% в тестах на реальных клинических случаях. Для сравнения, опытные врачи, участвовавшие в исследовании, поставили верный диагноз примерно в 20% случаев. В будущем технология может стать частью Microsoft Copilot и Bing, но пока находится на ранней стадии и не готова к применению в больницах.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

«Microsoft AI Diagnostic Orchestrator» (MAI-DxO) — первый проект нового медицинского подразделения Microsoft AI, которое возглавляет Мустафа Сулейман, сооснователь DeepMind. К работе над системой привлекли сотрудников из DeepMind. По словам Сулеймана, эти испытания — шаг к созданию «медицинского суперинтеллекта», который в будущем может помочь решить проблему нехватки врачей и сократить время ожидания в перегруженных системах здравоохранения.

В основе новой системы Microsoft лежит «оркестратор», который формирует виртуальные команды из пяти ИИ-агентов. Каждый из этих агентов играет роль «доктора» со своей специализированной задачей. Например, один выдвигает гипотезы, другой подбирает диагностические тесты. Затем эти ИИ-агенты взаимодействуют друг с другом, чтобы определить оптимальный план действий.

В ходе тестирования системе предоставили 304 исследования из авторитетного медицинского журнала New England Journal of Medicine (NEJM). В этих материалах подробно описывалось, как врачи справлялись с наиболее сложными клиническими случаями. MAI-DxO должна была не только поставить правильный диагноз, но и показать логику своего решения. Для этого использовалась новая методика под названием «цепь дебатов», которая обязывает ИИ-модели мышления детально, шаг за шагом, объяснять процесс решения проблем.

Microsoft применила в своей системе ведущие большие языковые модели от OpenAI, Meta, Anthropic, Google, xAI и DeepSeek. «Оркестратор» улучшил работу всех моделей, но наилучшие результаты были достигнуты в паре с OpenAI o3. Она правильно решила 85,5% медицинских кейсов из журнала NEJM.

Для сравнения, опытные врачи, участвовавшие в исследовании, поставили верный диагноз примерно в 20% случаев. Во время этого эксперимента медикам не разрешалось пользоваться учебниками или консультироваться с коллегами, что, безусловно, могло бы повысить их показатели.

Версия этой технологии вскоре может быть также интегрирована в чат-бот Microsoft Copilot и поисковую систему Bing, которые ежедневно обрабатывают 50 млн медицинских запросов.

Сулейман заявил, что Microsoft вплотную подходит к созданию ИИ-моделей, которые превосходят человеческие возможности: они быстрее, дешевле и вчетверо точнее. Бывший руководитель медицинского подразделения DeepMind Доминик Кинг отметил, что новая программа Microsoft «показала лучшие результаты, чем всё, что мы когда-либо видели». Он также подчеркнул экономическую выгоду ИИ-моделей, которые сокращают количество необходимых тестов для диагностики, что порой экономит сотни тысяч долларов. Технология пока находится на ранней стадии развития, не прошла независимую экспертную оценку и не готова для использования в клинической практике.