В едно скорошно проучване е разгледано отблизо как генеративният изкуствен интелект се справя с диагностицирането на медицински състояния в сравнение с лекарите. То е проведено от изследователска група, ръководена от д-р Хиротака Такита и доц. Дайджу Уеда във Висшето училище по медицина към Университета Осака Метрополитън.

Този систематичен преглед и метаанализ преминава през огромен брой проучвания, общо 18 371, и ги свежда до 83 за подробен анализ. Резултатите хвърлят светлина както върху силните, така и върху слабите страни на изкуствения интелект в здравеопазването.

Изследването обхваща различни генеративни модели на ИИ, като GPT-4, Llama3 70B, Gemini 1.5 Pro и Claude 3 Sonnet в различни области на медицината. GPT-4 е най-изследваният. Като цяло диагностичната точност на тези модели с изкуствен интелект е средно 52.1% (95% ДИ: 47.0 - 57.1%). Някои модели са били почти толкова точни, колкото и лекарите, които не са експерти, без съществена статистическа разлика (разлика в точността: 0.6% [95% CI: -14.5% до 15.7%], p=0.93). Въпреки това лекарите експерти все още превъзхождаха ИИ със значителна разлика в точността от 15.8% (95% CI: 4.4% - 27.1%, p=0.007)], въпреки че с всички постижения това може да е само въпрос на време.

Проучването установи също, че ИИ се представя по сходен начин в повечето медицински специалности с няколко изключения: дерматология и урология. ИИ е показал по-добри резултати в дерматологията, вероятно защото тази област включва разпознаване на модели - нещо, в което ИИ е особено добър. Но тъй като дерматологията също изисква сложни разсъждения и вземане на решения, съобразени с конкретния пациент, резултатите не показват цялата история. За урологията констатациите се основават на едно голямо проучване, което затруднява по-широкото прилагане на резултатите.

„Това изследване показва, че диагностичните възможности на генеративния ИИ са сравними с тези на лекарите без специалност. Той би могъл да се използва в медицинското образование в подкрепа на лекарите неспециалисти и да подпомага диагностиката в райони с ограничени медицински ресурси“, добавя д-р Такита. „За да се проверят възможностите на ИИ, са необходими по-нататъшни изследвания, като например оценки в по-сложни клинични сценарии, оценки на ефективността с използване на действителни медицински записи, подобряване на прозрачността на вземането на решения от ИИ и проверка в различни групи пациенти.“

Освен за диагностика проучването подчертава потенциала за използване на ИИ в медицинското образование. Според изследователите „сравнимите резултати на настоящите генеративни модели на ИИ с тези на лекарите в неекспертни условия разкриват възможност за интегриране на ИИ в медицинското обучение“. ИИ би могъл да се използва за симулиране на реални случаи, като помага на студентите по медицина и стажантите да учат и оценяват уменията си.

Съществуват обаче опасения относно прозрачността и пристрастността на тези модели. Много системи за ИИ не споделят подробности за данните от обучението си, което поражда въпроси дали резултатите от тях могат да се прилагат за всички популации. Изследователите посочват, че „прозрачността осигурява разбиране на знанията, контекста и ограниченията на модела“, и подчертават необходимостта от ясни, етични и задълбочено валидирани приложения на ИИ.

Засега генеративният ИИ, макар и обещаващ, има тенденция да се затруднява със сложни случаи, в които е включена подробна информация за пациента. Трябва ли лекарите да започнат да се притесняват, че ще загубят работата си? На този етап е трудно да се каже, но що се отнася до диагностиката, това със сигурност е малко вероятно в обозримо бъдеще.

Снимка: Unsplash

Виж още: Новото предложение на Harley: е-мотори за полицаи