Базираното на ДНК съхранение на данни предлага решения на някои от проблемите, създадени от непрекъснато нарастващия капацитет на човечеството да създава данни. В сравнение с повечето други медии ДНК предлага феноменална плътност на компресията. Ако се съхранява в правилните условия, ДНК не изисква енергия, за да поддържа данните в продължение на векове.

Но ДНК технологията не е без недостатъците си. В момента няма стандартен метод за кодиране на битове в модела, създаден на базата на ДНК веригата. Синтезирането на конкретни последователности остава доста скъп процес. А достъпът до данните с помощта на сегашните методи е бавен и изчерпва живота на ДНК, използвана за съхранение. Ако се опитате да получите достъп до данните твърде много пъти, най-вероятно ще трябва да ги възстановите по някакъв начин - процес, който рискува да доведе до множество грешки в складираната информация.

Екип от MIT и Broad Institute реши да се справи с някои от тези проблеми. По време на специален експеримент изследователите са създали базирана на ДНК система за съхранение на изображения, която се намира някъде по средата между файлова система и база данни, базирана на метаданни.

Основната технология се основава на факта, че ДНК ще се прикрепва към стъклени мъниста от силициев диоксид. Това привличане е независимо от размера на ДНК, така че можете да съхранявате произволно големи парчета данни, използвайки тази система (в този случай фрагментите са над 10 пъти размера на типичното парче от ДНК за съхранение на данни, използвани в миналото). След като ДНК е на повърхността на тези мъниста, изследователите полимеризират малко допълнителен силициев диоксид отгоре. Този процес покрива ДНК и я предпазва от околната среда. Използвайки флуоресцентен маркер, изследователите потвърждават, че системата е ефективна; по същество всички частици, създадени по този начин, съдържат ДНК.

Но забавната част е достъпът до данните. Изследователите съхраняват свързана с ключови думи колекция от изображения, като всяка ключова дума е кодирана, прикрепена към външната страна на обвивката. За да използваме техния пример, изображение на оранжева домашна котка ще бъде свързано с ключовите думи „оранжево“, „котка“ и „домашен“, докато изображението на тигър просто ще има „оранжево“ и „котка“.

Тъй като тези тагове са едноверижни, е възможно да се проектира последователност, която да образува двойна спирала. Етикетите на складираното изображение са свързани с различно оцветени флуоресцентни молекули, така че всяка стъклена обвивка, свързана с правилните маркери, да започне да свети в определени цветове. Вече имаме машини, които използват лазери, за да разделят информацията въз основа на цвета, в който светят (обикновено машините се използват за сортиране на флуоресцентно маркирани клетки). В тази машина оранжево мънисто, складирало информация за домашна котка, ще свети на различни дължини на вълната, отколкото оранжево мънисто на тигъра, така че картинката на домашната котка може да бъде извадена от библиотеката.

Останалата част от нея ще остане недокосната, така че няма значителна загуба на данни всеки път, когато се случи този процес. И тъй като топчетата са по-плътни от водата, лесно е да се концентрира отново съхранението на данни просто като се използва центрофуга, за да се завърти неизползваната част от библиотеката по дъното на епруветка.

Макар това изследване да представлява значителен скок в сложността за съхранение на базата на ДНК, все още си остава само теоретично изобретение. Това означава, че е доста бавно, което прави дори лентовите устройства да изглеждат светкавично бързи. Изследователите изчисляват, че дори ако са натъпкали много повече данни във всяко стъклено зърно, търсенията ще започнат да се допълват с около 1 GB данни в секунда. Това би означавало, че търсенето в петабайт данни ще отнеме малко повече от две седмици.

Снимка: Broad Institute

Виж още: Куче робот помага на SpaceX за ракетата, която ще ходи до Марс (ВИДЕО)