С напредването на големите езикови модели (LLM) - включително GPT-4, най-новото въплъщение на технологията на OpenAI, която стои зад ChatGPT - учените започват да използват тяхната мощ. Експлозията от инструменти, задвижвани от изкуствен интелект (ИИ), включва няколко търсачки, които имат за цел да улеснят изследователите да се докоснат до фундаментални научни статии или да обобщят основните открития в дадена област. Техните разработчици твърдят, че приложенията ще демократизират и рационализират достъпа до научни изследвания.
Но някои инструменти явно се нуждаят от повече усъвършенстване, преди изследователите да могат да ги използват в помощ на своите проучвания. Клементин Фурие е изследовател от Париж, която оценява LLM в Hugging Face, базирана в Ню Йорк компания за разработка на платформи за изкуствен интелект с отворен код. Тя е използвала търсачка с ИИ, наречена Elicit, за да помогне за намирането на документи за докторската си дисертация. Elicit търси статии в базата данни Semantic Scholar и идентифицира най-добрите проучвания, като сравнява заглавията и резюметата на статиите с въпроса за търсене.
Фурие казва, че според нейния опит Elicit невинаги е подбирал най-подходящите статии. Инструментът е добър за предлагане на документи, "които вероятно не бихте разгледали", казва тя. Но неговите резюмета са "безполезни" и "също така ще предложи много неща, които не са пряко свързани", добавя тя. "Много е вероятно да допуснете много грешки, ако използвате само това."
Джунгвон Бюн, главен оперативен директор в Ought, компанията в Сан Франциско, Калифорния, която е създала Elicit, казва: "В момента имаме стотици хиляди потребители с различни специализации, така че Elicit неизбежно ще бъде по-слаба при някои заявки". Платформата работи по различен начин от другите търсачки, тъй като се фокусира по-малко върху съвпадението на ключовите думи, броя на цитатите и повторяемостта. Но потребителите могат да филтрират за тези неща.
Други изследователи имат по-положителен опит с инструмента. "Elicit.org определено е моят фаворит за търсене", казва Аарон Тей, библиотекар в Singapore Management University. "Той е близо до това да измести Google Scholar като първото ми търсене за академично търсене", казва той. "Що се отнася до релевантността, имах обратния на Фурие опит с Elicit. Обикновено получавам приблизително същата релевантност като Google Scholar - но от време на време той интерпретира по-добре заявката ми за търсене."
Тези несъответствия може да зависят от областта, предполага Тей. Фурие добавя, че в нейната изследователска област времето е от решаващо значение. "Една година в машинното обучение е един век във всяка друга област", казва тя. "Всичко преди пет години е напълно без значение", а Elicit не отчита това, добавя тя.
Друг инструмент, наречен scite, чиито разработчици са базирани в Ню Йорк, използва LLM за организиране и добавяне на контекст към цитиранията на документи - включително къде, кога и как даден документ е цитиран от друг документ. Докато ChatGPT е известен с "халюцинациите" - измислянето на препратки, които не съществуват, - scite и неговият инструмент Assistant премахват това главоболие, казва Джош Никълсън, изпълнителен директор на scite. "Голямата разлика тук е, че вземаме резултатите от ChatGPT, търсим ги в нашата база данни и след това ги сравняваме семантично с реални препратки." Никълсън казва, че scite си партнира с повече от 30 научни издателства, включително с големи фирми като Wiley и Американското химическо дружество, и е подписал редица споразумения за индексиране - което дава на инструмента достъп до пълния текст на милиони научни статии.
Снимка: Unsplash
Виж още: Генеративният изкуствен интелект може да замени 300 милиона работни места