Ако изкуственият интелект е част от съвременната история, то дали е възможно той да ни помогне да изясним някои неизвестни от миналото? Вече сме виждали чрез него да бъдат завършвани картини или да бъдат разпознавани фалшификати от оригинали, така че каква е следващата стъпка?
Google DeepMind в сътрудничество с екип учени създаде нов инструмент, базиран на изкуствен интелект, който използва дълбоки невронни мрежи за дешифриране на повредени текстове от Древна Гърция. Новата система носи името Ithaca и се основава на по-ранна система за възстановяване на текст, наречена Pythia. Според проучване, публикувано в сп. Nature, Ithaca идентифицира не само текста, но и произхода му и прави предположение за времето на създаването му. В действителност, много от източниците - независимо дали става въпрос за свитъци, папируси, камък, метал или керамика - са толкова повредени, че голяма част от тях са практически нечетими. Определянето на мястото на произход на текстовете също може да бъде предизвикателство, тъй като те вероятно са били премествани многократно. Идентифицирането на епохата им също е голямо предизвикателство, понеже стандартните методи не са особено щадящи към артефактите. Специалистите смятат, че много често може да има няколко възможни трактовки, като често се разчита на игри с думите и отгатване на липсващите символи, които да завършат фразата. Разбира се, разчита и на други контекстни улики в надписа - като граматически и езикови съображения, оформление и форма, текстови и исторически паралели.
Както вече уточнихме, първоначално беше разработена Pythia, система за възстановяване на древен текст, наречена на името на върховната жрица, която е като Делфийски оракул, който доставя изявления на бог Аполон. Pythia беше дело на Янис Асаел, Теа Сомършилд и Джонатан Праг от DeepMind, които си сътрудничиха с изследователи от Оксфордския университет. За да “захранят” системата, над 35 000 надписа и повече от 3 милиона думи от VII век пр.н.е. до V век н.е., съдържащи се в базата данни на Packard Humanities Institute (PHI), бяха трансформирани в текст с машинно действие, който те нарекоха PHI-ML. След това Pythia беше обучена да предсказва липсващите думи и знаци благодарение на възможностите на дълбоки невронни мрежи. Системата можеше да възпроизведе до 20 различни възможни букви или думи, които биха могли да запълнят пропуските, но от самите историци зависеше кой вариант е най-удачен.
Сега екипът се завръща с Ithaca, която може да “хвърли светлина върху възможните основни географски връзки в древния свят” между 800 г. пр.н.е. и 800 г. н.е. Тестването разкри, че Ithaca сама по себе си е в състояние да постигне 62 процента точност при възстановяването на повреден текст в сравнение с 25 процента точност, постигната от самите историци. Но комбинацията от човек и машина повишава общата точност до 72 процента, което е едно наистина емблематично постижение. Ithaca вече е била поставена на тест относно правилните дати на група древни Атински декрети, които са били обект на исторически спор: историците са смятали, че те датират не по-късно от 446 г. пр.н.е., но някои историци започнаха да поставят под въпрос този период, особено след като някои от тях изпаднаха в предполагаемо противоречие с историческите разкази на Тукидид. Според Ithaca те се датират от 421 г. пр.н.е., което е много близко и до съвременното предположение на историците. „Въпреки че може да изглежда като малка разлика, тази промяна на датата има значителни последици за нашето разбиране за политическата история на класическа Атина“, каза Сомършилд в изявление. Според екипа следващата стъпка е да се разработят допълнителни версии на Ithaca, които могат да възстановят текст на други древни езици, включително акадски, демотски, иврит и маи.
Снимки: Wikimedia/Ithaca/Google
Виж още: Динозавър срещу Юсеин Болт в състезание, което всеки иска да види