Врачи стали хуже диагностировать опухоли из-за использования ИИ
. Ученые изучили, как врачи диагностируют аденому при колоноскопииThe Lancet: врачи стали хуже диагностировать рак из-за использования ИИ

Всего несколько месяцев использования искусственного интеллекта (ИИ) ухудшает способность врачей самостоятельно диагностировать рак. После того как помощь ИИ была отключена, успехи врачей в диагностике опухолей снизились на 20%, показало новое исследование, опубликованное в журнале The Lancet Gastroenterology & Hepatology.
Исследование проводилось в четырех эндоскопических центрах Польши с сентября 2021 года по март 2022 года. В конце 2021 года в практику центров был внедрен искусственный интеллект, который начал использоваться при проведении колоноскопии. С этого момента процедуры выполнялись как с помощью ИИ, так и без него. За это время было проведено 1443 процедуры колоноскопии без использования ИИ: 795 — до внедрения ИИ и 648 — после его внедрения. Колоноскопию проводили 19 опытных эндоскопистов, каждый из которых выполнил более 2 тыс. таких процедур.
Внедрение ИИ снизило частоту самостоятельного выявления предраковой опухоли аденомы при колоноскопии. До внедрения ИИ аденому диагностировали в 28,4% случаев, после — всего в 22,4%. Снижение составило 6% в абсолютных числах. При использовании ИИ аденому выявляли в 25,3% случаев.
Исследователи считают, что ИИ пагубно влияет на способность врачей самостоятельно принимать решения и брать на себя ответственность за них. Один из авторов исследования, Юичи Мори, подчеркнул, что эти проблемы могут усугубляться по мере развития искусственного интеллекта. Он также считает, что из-за нейросетей врачи могут стать менее компетентными в будущем.
Результаты исследования подтверждают выводы другого эксперимента, проведенного в Массачусетском технологическом институте. Тогда исследователи доказали, что использование чат-бота ChatGPT снижает активность мозга и вовлеченность при выполнении заданий.
Между тем более раннее исследование показало, что ChatGPT превзошел врачей-стажеров в диагностике сложных респираторных заболеваний у детей. Искусственный интеллект смог более качественно выявлять клинические случаи, связанные с такими заболеваниями, как муковисцидоз, астма и инфекции грудной клетки.
В исследовании приняли участие десять врачей-стажеров с опытом работы в педиатрии менее четырех месяцев. Им было дано задание проанализировать эти сценарии и поставить диагноз, используя только интернет-ресурсы. Точно такая же задача стояла и перед чат-ботами. ChatGPT получил самую высокую среднюю оценку — семь баллов из девяти, его ответы показались экспертам наиболее «гуманными». Google Bard (в феврале 2024 года переименован в Gemini) набрал шесть баллов, а Microsoft Bing получил такую же оценку, как и стажеры, — четыре балла. При этом ответы чат-ботов от Google и Microsoft эксперты легко опознали как сгенерированные нейросетью.