Изследователи предлагат нов метод, който използва дълбоко обучение за създаване на триизмерни холограми от двуизмерни цветни изображения.
Холограмите осигуряват триизмерен (3D) изглед на обектите, предлагайки ниво на детайлност, което не може да се сравни с двуизмерните (2D) изображения. Тяхното реалистично и поглъщащо показване на триизмерни обекти прави холограмите изключително ценни в различни сектори, включително медицински изображения, производство и виртуална реалност.
Традиционната холография включва запис на триизмерните данни на обекта и взаимодействието му със светлината - процес, който изисква висока изчислителна мощност и използването на специализирани камери за заснемане на 3D изображения. Тази сложност ограничава широкото разпространение на холограмите.
В последно време бяха предложени и много методи за дълбоко обучение за генериране на холограми. Те могат да създават холограми директно от 3D данни, заснети с помощта на RGB-D камери, които улавят както информация за цвета, така и за дълбочината на даден обект. Този подход заобикаля много изчислителни предизвикателства, свързани с конвенционалния метод, и представлява по-лесен начин за генериране на холограми.
Сега екип от изследователи, ръководен от проф. Томойоши Шимобаба от Висшето училище по инженерство в университета Чиба, предлага нов подход, основан на дълбоко обучение, който допълнително оптимизира генерирането на холограми, като създава 3D изображения директно от обикновени 2D цветни изображения, заснети с обикновени камери. Йошиюки Ишии и Томойоши Ито от Graduate School of Engineering, Chiba University също са част от това проучване, което наскоро беше публикувано в списание Optics and Lasers in Engineering.
Обяснявайки причините за това проучване, проф. Шимобаба казва: "Има няколко проблема при реализирането на холографски дисплеи, включително придобиването на 3D данни, изчислителната цена на холограмите и преобразуването на холограмните изображения, за да съответстват на характеристиките на холографското дисплейно устройство. Предприехме това проучване, защото смятаме, че дълбокото обучение се развива бързо през последните години и има потенциал да реши тези проблеми".
Предложеният подход използва три дълбоки невронни мрежи (DNN) за преобразуване на обикновено 2D цветно изображение в данни, които могат да се използват за показване на 3D сцена или обект като холограма. Първата DNN използва цветно изображение, заснето с обикновена камера, като входна информация и след това предсказва свързаната с него карта на дълбочината, предоставяйки информация за 3D структурата на изображението.
Както оригиналното RGB изображение, така и картата на дълбочината, създадена от първата DNN, след това се използват от втората DNN, за да се генерира холограма. Накрая третата DNN усъвършенства холограмата, генерирана от втората DNN, като я прави подходяща за показване на различни устройства.
Изследователите са установили, че времето, необходимо на предложения подход за обработка на данни и генериране на холограма, е по-добро от това на най-съвременния графичен процесор.
"Друго забележително предимство на нашия подход е, че възпроизведеното изображение на крайната холограма може да представлява естествено възпроизведено 3D изображение. Освен това, тъй като информацията за дълбочината не се използва по време на генерирането на холограмата, този подход е евтин и не изисква устройства за 3D изображения, като RGB-D камери след обучението", добавя проф. Шимобаба, докато обсъжда резултатите по-нататък.
В близко бъдеще този подход може да намери потенциално приложение в дисплеи за глава за генериране на висококачествени 3D дисплеи. По същия начин той може да доведе до революция в генерирането на холографски дисплей в автомобила, който може да бъде в състояние да представя необходимата информация за хора, пътища и знаци на пътниците в 3D формат. По този начин се очаква предложеният подход да проправи пътя за увеличаване на развитието на повсеместната холографска технология.
Снимка: Unsplash
Виж още: Тонове човешки боклук замърсяват Марс след 50 години проучвания