Чатботът с изкуствен интелект, известен като ChatGPT, разработен от компанията OpenAI, привлече вниманието и въображението на обществеността. Някои приложения на технологията са наистина впечатляващи, като например способността ѝ да обобщава сложни теми или да участва в дълги разговори.
Не е изненадващо, че други компании за изкуствен интелект побързаха да пуснат свои собствени големи езикови модели (LLM) - името на технологията, която стои в основата на чатботове като ChatGPT. Някои от тези LLM ще бъдат включени в други продукти, като например в търсачките.
Имайки предвид впечатляващите му възможности, The Conversation реши да тества чатбота върху Wordle - играта с думи от New York Times, която също е доста популярна от известно време. Играчите имат шест опита да познаят петбуквена дума. При всяко отгатване играта показва кои букви, ако има такива, са на правилните позиции в думата.
Използвайки последното поколение, наречено ChatGPT-4, тестът открива, че представянето му при тези загадки е изненадващо слабо. Може да се очаква, че игрите с думи ще бъдат лесна задача за GPT-4. LLM моделите се обучават върху текст, което означава, че са изложени на информация, за да могат да се усъвършенстват в това, което правят. ChatGPT-4 беше обучен на около 500 милиарда думи: цялата Wikipedia, всички книги от публичния домейн, огромни обеми научни статии и текст от много уебсайтове.
Чатботовете с изкуствен интелект могат да играят важна роля в живота ни. Разбирането на причините, поради които ChatGPT-4 се затруднява с Wordle, дава представа за начина, по който LLM представят и работят с думи - заедно с ограниченията, които това носи.
Първо, СhatGPT-4 е тестван върху пъзел Wordle, в който журналистът знае правилните места на две букви в една дума. Моделът беше #E#L#, където # представляваше неизвестните букви. Отговорът беше думата mealy. Пет от шестте отговора на ChatGPT-4 не съвпаднаха с модела. Отговорите бяха: beryl, feral, heral, merle, revel и pearl.
При други комбинации чатботът понякога намираше валидни решения, но като цяло беше много неуспешен. В случай на дума, отговаряща на модела ##OS#, той намери пет правилни варианта. Но когато моделът беше #R#F#, той предложи две думи без буквата F и една дума - Traff, - която не се среща в речниците.
В основата на ChatGPT е дълбока невронна мрежа: сложна математическа функция или правило, което съпоставя входните данни с изходните. Входовете и изходите трябва да са числа. Тъй като ChatGPT-4 работи с думи, те трябва да бъдат преведени в числа, за да може невронната мрежа да работи с тях.
Преводът се извършва от компютърна програма, наречена токенизатор, която поддържа огромен списък от думи и последователности от букви, наречени токени. Тези лексеми се идентифицират с числа. Дума като friend (приятел) има идентификатор на токена 6756, така че дума като friendship (приятелство) се разбива на токени friend (приятел) и ship (кораб). Те се представят като идентификатори 6756 и 6729.
Когато потребителят въведе въпрос, думите се преобразуват в числа още преди ChatGPT-4 да започне да обработва заявката. Дълбоката невронна мрежа няма достъп до думите като текст, така че не може реално да разсъждава за буквите, както могат хората.
Снимка: Unsplash
Виж още: Открихте грешка в ChatGPT? OpenAI вече ще ви плаща за това