
Исследование, опубликованное в журнале Science, заставило медицинское сообщество заговорить о новой реальности. Команда ученых из Гарвардской медицинской школы и Beth Israel Deaconess Medical Center провела серию экспериментов, сравнивая диагностические способности моделей OpenAI с работой практикующих врачей. Результаты оказались, мягко говоря, неожиданными.
Исследователи взяли данные 76 реальных пациентов, поступивших в отделение скорой помощи Beth Israel. Диагнозы ставили два врача-терапевта (attending physicians по внутренней медицине) и две модели OpenAI: o1 и 4o. Затем два других врача оценивали результаты вслепую, не зная, какой диагноз принадлежит человеку, а какой машине.
Важный момент: данные для ИИ никак не обрабатывались предварительно. Модели получали ровно ту же информацию, которая была доступна в электронных медицинских картах на момент каждого диагностического этапа.
На этапе первичной сортировки (triage) модель o1 дала точный или очень близкий диагноз в 67% случаев. Один врач попал в точку в 55% случаев, второй показал результат 50%. Разница особенно заметна именно на первом этапе, где информации о пациенте меньше всего, а скорость решения критична.
Тема ии в медицине диагностика выходит на принципиально новый уровень, когда речь идет о ситуациях с дефицитом времени и данных.
Сами авторы исследования подчеркивают: это не означает, что ИИ готов принимать решения о жизни и смерти в реальном отделении скорой помощи. Они говорят о необходимости проспективных клинических испытаний в реальных условиях.
Кристен Пантагани, практикующий врач скорой помощи, обратила внимание на существенный нюанс: в исследовании диагнозы ИИ сравнивались с диагнозами терапевтов, а не специалистов экстренной медицины. Это разные специальности с разными подходами.
По её словам, задача врача скорой помощи при первом контакте с пациентом не угадать финальный диагноз, а определить, есть ли состояние, которое может убить человека прямо сейчас. Это совершенно другая задача по сравнению с тем, что оценивалось в исследовании.
Адам Родман, один из ведущих авторов исследования, предупредил, что на сегодня не существует формальной системы ответственности за диагнозы, поставленные ИИ. Пациенты по-прежнему хотят, чтобы решения о лечении принимали люди.
Модели также тестировались только на текстовой информации, а существующие данные говорят о том, что foundation models значительно хуже справляются с нетекстовыми входными данными: изображениями, аудио, результатами физикального осмотра.
Результаты показывают потенциал ИИ как инструмента поддержки принятия решений, особенно в условиях высокой нагрузки и ограниченной информации. Если вас интересует, как подобные модели, включая OpenAI o1, могут быть интегрированы в рабочие процессы, мы в Фабио Де Лука разрабатываем решения на базе ИИ, включая системы анализа данных и автоматизации для бизнеса.
Исследование Гарварда не закрывает дискуссию, а скорее открывает её. Ии в медицине диагностика пока остается вспомогательным инструментом, но скорость прогресса такова, что игнорировать эти результаты уже невозможно. Вопрос не в том, заменит ли ИИ врача, а в том, как именно они будут работать вместе.