Независимо дали сме креативни или не чак толкова много, всички сме попадали в ситуация, в която трябва да опишем някаква идея, представена под формата на изображение. Било то идеалната рокля или пък подредба на видеоигри, или просто кактус с мексиканска шапка в средата на пустинята - въображението може да играе тази игра до безкрай. И сега си представете, че служителите, отговарящи за AI на Google, могат да я играят, защото след години усилен труд те вече могат да зададат критериите и изкуственият интелект да създаде за тях идеалното изображение.
До този момент лидер в генерирането на изображение от текст беше DALL-E - програма, създадена от AI lab OpenA към Google. Но технологичният гигант вдигна летвата и представи Imagen. Най-общо казано, на програмата се подава текст, който тя превръща в изображение.
Примерите са доста фантастични и трябва да признаем - дори прекалено идеални. Разбира се, не трябва да се премълчава фактът, че по всяка вероятност за демонстрацията са избрани най-добрите резултати и всъщност напредъкът да не е чак толкова усъвършенстван. Но може и да е... Всъщност няма начин да преценим сами, понеже Google не смята да направи Imagen достъпен за обществеността. И причината е повече от предвидима: потенциалните обезпокоителни приложения като например фалшиви новини, измами или тормоз.
А и бихте ли оставили този инструмент в ръцете на потребителите, след като той е бил обучаван посредством огромни количества данни, които трябва след това да се филтрират?
Общото заключение е, че Imagen произвежда постоянно по-добри изображения от DALL-E 2. Разбира се, за това е създаден специален бенчмарк, наречен DrawBench, който разполага със списък от 200 задачи, а резултатите се оценяват от членове на екипа. И отзивите явно са категорични.
Снимки: Google/Imagen
Виж още: AI на Google може да ви тренира за интервю за работа