Докато изкуството, базирано на изкуствен интелект, се разраства през последните две години, най-добрите генератори на изображения с изкуствен интелект остават до голяма степен същите. Adobe Firefly, Midjourney, DALL-E и Stable Diffusion се борят помежду си, като всеки от тях въвежда нови постижения във всяка актуализация.
Но изглежда, че Flux, сравнително нов генератор на ИИ изображения с отворен код, е на път да вземе короната, поне що се отнася до реализма. Първите експериментатори, които използват модела на собствените си устройства, го свързват с Lora на XLabs - скрипт за фина настройка, който изглежда добавя допълнителни детайли. Резултатите са почти неразличими от снимките при първи поглед.
При по-внимателно разглеждане изображенията все още могат да бъдат идентифицирани като генерирани от изкуствен интелект доста лесно. Текстът е големият издайник, особено малкият текст на неща като каишката и микрофона на изображението по-горе. Моделите и текстурите също могат да изглеждат странно, когато ги погледнете, а елементите могат да не са пропорционални. Като оставим това настрана, на пръв поглед изображенията, които се разпространяват в социалните мрежи, изглеждат като нормални снимки на нормални хора.
Създаден от стартъпа Black Forest Labs, генераторът на изображения с изкуствен интелект Flux е обявен за наследник на Stable Diffusion, защото е с отворен код. Това означава, че кодът му е свободно достъпен и всеки може да се занимава с него, да променя модела и да го включва в свои собствени генератори. Потребителите могат да стартират Flux локално, ако разполагат с достатъчно добър компютър, но той е достъпен и за платформи за множество модели като Poe и Nightcafe.
Всъщност има три версии на Flux.01. Има версия Pro, която се предлага с търговски лиценз, след това има средно тежък модел Dev и по-бърз модел Schnell (Black Forest Labs са базирани в Германия, както може да се очаква от името).
Въпреки че Ideogram впечатли мнозина, когато се появи на сцената преди няколко месеца, Flux изглежда сега е най-големият конкурент на Midjourney по отношение на фотореализма. Самият модел изглежда дава много реалистични резултати, въпреки че текстурите на кожата могат да бъдат по-малко убедителни и да изглеждат по-пластични. Но някои потребители получават ужасяващо реалистични резултати, когато комбинират Flux с Lora - скрипт за фина настройка на фотореализма, създаден от XLabs.
Снимка: Unsplash
Виж още: Apple Maps стартира уеб приложение 19 години след Google Maps, но все още мрази Android телефона ви