По-старите ИИ модели вече показват признаци на влошаване на когнитивните способности

Tech

17.02.2025

Хората все повече разчитат на изкуствения интелект за поставяне на медицински диагнози, тъй като тези инструменти могат бързо и ефективно да откриват аномалии и предупредителни знаци в медицинските истории, рентгеновите снимки и други набори от данни, преди те да станат очевидни с просто око. Но ново проучване поражда опасения, че технологиите на ИИ като големите езикови модели (LLM) и чатботовете, подобно на хората, показват признаци на влошаване на когнитивните способности с възрастта.

„Тези констатации оспорват предположението, че изкуственият интелект скоро ще замени лекарите“, пишат авторите на изследването в статията, „тъй като когнитивното увреждане, очевидно при водещите чатботове, може да повлияе на тяхната надеждност при медицинската диагностика и да подкопае доверието на пациентите“.

Учените са тествали публично достъпните чатботове, управлявани от големи езикови модели, включително ChatGPT на OpenAI, Sonnet на Anthropic и Gemini на Alphabet, като са използвали теста Montreal Cognitive Assessment (MoCA) - серия от задачи, които невролозите използват за проверка на способностите в областта на вниманието, паметта, езика, пространствените умения и изпълнителните умствени функции.

MoCA се използва най-често за оценка или проверка на настъпването на когнитивни нарушения при състояния като болест на Алцхаймер или деменция. На изследваните лица се поставят задачи, като например да нарисуват определен час върху циферблата на часовник, да започнат от 100 и да извадят многократно седем, да запомнят възможно най-много думи от изговорен списък и т.н. При хората 26 от 30 точки се считат за успешен резултат (т.е. субектът няма когнитивни нарушения). Въпреки че някои аспекти на тестовете, като назоваването, вниманието, езика и абстракцията, бяха привидно лесни за повечето от използваните LLM, всички те се представиха зле при визуалните/пространствените умения и изпълнителните задачи, като някои от тях се справиха по-зле от други в области като забавеното припомняне.

Важно е да се отбележи, че макар най-новата версия на ChatGPT (версия 4) да е постигнала най-високи резултати (26 от 30), по-старият Gemini 1.0 LLM е постигнал само 16 точки - което води до заключението, че по-старите LLM показват признаци на когнитивен упадък.

Авторите на изследването отбелязват, че резултатите от него са само наблюдателни - критичните разлики между начините, по които работят изкуственият интелект и човешкият ум, означават, че експериментът не може да представлява пряко сравнение. Но те предупреждават, че той може да посочи това, което те наричат „значителна слабост“, която може да постави спирачки пред внедряването на ИИ в клиничната медицина. По-конкретно, те се противопоставят на използването на ИИ в задачи, изискващи визуална абстракция и изпълнителна функция.

Също така се появява леко забавната идея човешките невролози да поемат изцяло нов пазар - самите ИИ, които имат признаци на когнитивни нарушения.

Снимка: Unsplash

Виж още: Светлинното платно може да позволи междузвездни пътувания с невиждани досега скорости

Тагове: