Вероятно вече чували за невероятните резултати, постигнати от изкуствен интелект за текст към изображение, като Dall-E, Stable Diffusion и Midjourney. В края на миналата година Meta направиха няколко опита, демонстрирайки, че същото е възможно и от текст към видео. Google също работят за постигането на интригуващи резултати, но както е известно, в началото тази усъвършенствана технология не е достъпна за обществеността. Има обаче едно изключение: QuickVid.
Преди очакванията ви да станат твърде високи, важно е да осъзнаете, че това не е еквивалентно на генерирането на хиляди неподвижни изображения със стабилна дифузия и сглобяването им за създаване на видео или получаване на достъп до най-модерните AI системи в света за истинско видео генериране. Това е много ранно влизане в надпреварата за решение за текст към видео.
Началото е лесно - задайте изискванията си и изкуственият интелект ще се опита да генерира скрипт по него. След това AI написва малко „по-подробен“ разказ, а той се разказва благодарение на синтезиран мъжки или женски глас. Последната стъпка разкрива как QuickVid наслагва скрипта като заглавия и добавя миниатюрни изображения, генерирани от Dall-E API.
В интервю за TechCrunch разработчикът на QuickVid споделя, че предстоят подобрения, като повече опции за персонализиране пристигат през януари. В крайна сметка QuickVid ще включва и надписи и поддържащи аватари. Ако потребителите решат, че си заслужава, може да се появят още много различни варианти, включващи AR и VR.
Снимки: Unsplash
Виж още: Запознайте се със София: робота, който се шегува с унищожаването на човечеството