В один прекрасный момент мы сможем закодировать всю информацию мира в пары литрах ДНК

    За крайние пару лет ученые расшифровали геномы мамонтов и лошадки возрастом 700 000 лет, используя куски ДНК, извлеченные из окаменелостей. ДНК точно сохраняется намного подольше, чем организмы, для которых она несет внутри себя генетические коды. Компьютерные ученые и инженеры издавна грезят взнуздать миниатюрность и устойчивость ДНК для хранения цифровых заданных. Они намерены закодировать все эти нули и единицы в молекулы А уж, C, G и T, кои образуют винтообразную лестницу полимера ДНК — и заслуги сего десятилетия в сфере синтеза и секвенирования ДНК привели к строгому прорыву. Недавнешние опыты продемонстрировали, что в один прекрасный момент мы сможем закодировать всю цифровую информацию мира в пары литрах ДНК — и дочитать ее поновой спустя тыщи лет.

    В один прекрасный момент мы сможем закодировать всю информацию мира в пары литрах ДНК

    Энтузиазм со стороны Microsoft и остальных технологических корпораций увеличивает напряжение в данной сфере. В минувшем месяце Microsoft Research заявила, что заплатит стартапу в области синтетической биологии Twist Bioscience энную сумму, дабы сделать 10 миллионов цепочек ДНК, разработанных компьютерными учеными предприятия Microsoft для хранения заданных. Ведущий производитель памяти Micron Technology а также финансирует научные исследования хранения заданных в ДНК, дабы обусловить, может ли система на базе нуклеиновой кислоты расширить пределы электрической памяти. Этот приток денежек и энтузиазма может мал-помалу понизить безмерные издержки и предпринять хранение заданных в ДНК вероятным уже сквозь десять лет, рассказывают исследователи.

    Люди сгенерируют наиболее 16 триллионов гб цифровых заданных к 2017 году, и огромную часть сего надо будет архивировать. Юридические, денежные и мед заданные, также, конечно же, мультимедийные файлы. Сейчас заданные хранятся на твердых дисках, оптических дисках в энергоемких дата-центрах размером со склад. В наилучшем случае эти заданные хранятся тридцать лет, в худшем — несколько. За исключением тамошнего, как только разговаривает компьютерный конструктор Microsoft Research Кэрин Штраус, «мы производим намного все больше заданных, чем успевает промышленность по производству механизмов для них хранения, и прогнозы отображают, что этот разрыв будет расти».

    А уж сейчас добавим ко всему этому ДНК. Она живет столетия, ежели держать ее в сухом прохладном месте. На теоретическом уровне с ее помощью можно упаковать млрд гб заданных в размер кубика сахара. Магнитные ленты, плотнейшая из современных среда хранения заданных, умещают 10 гб в фолиант же объеме места. «ДНК — это же неописуемо плотный, крепкий и энергонезависимый носитель данных», разговаривает Ольгица Миленкович, доктор электротехники и вычислительной техники в Институте штата Иллинойс в Урбана-Шампейн.

    Все поэтому, что любая из четверых архитектурных молекул — аденин (А уж), цитозин (C), гуанин (G) и тимин (T) — занимает кубический нанометр в объеме. Используя систему кодировки — скажем, в какой А уж воображает биты «00», C воображает «01» и т.д. — ученые умеют покупать ряды нулей и единиц, образующих цифровые файлы с заданными, и производить цепочку ДНК, содержащую снимок либо видео. Само собой разумеется, реальная методика кодировки куда труднее, чем мы здесь для вас написали. Синтез дизайнерской цепочки ДНК — это же процесс записи заданных. Потом ученые умеют дочитать них, секвенируя цепочки.

    Генетик Гарвардского вуза Джордж Черч основал эту область исследовательских работ в 2012 году, закодировав 70 млрд копий книжки — один миллион гигабит — в кубическом миллиметре ДНК. Годом потом ученые из Евро колледжа биоинформатики продемонстрировали, что умеют дочитать, без единой ошибки, 739 кб заданных, заключенных в ДНК.

    В минувшем году несколько команд ученых показали целиком функционирующие системы. В августе ученые E.T.H Zurich инкапсулировали синтетическую ДНК в стекло, подвергли условиям, моделирующим истечение 2000 лет, и целиком вернули закодированные заданные. Наряду с сиим, Миленкович и ее коллеги сказали об сохранении страничек Википедии силами шести южноамериканских институтов в ДНК и — предоставив последовательностям специфические «адреса» — выборочно зачитали и отредактировали части напечатанного текста. Произвольный доступ к заданным максимально важен, дабы избежать целесообразность «секвенировать целую книжку, дабы дочитать один лишь параграф», разговаривает Миленкович.

    В апреле Штраус и ученые Джорд Силиг и Луис Цезе из Вашингтонского вуза сказали об фолиант, что сумели записать три файла изображения, каждый в несколько десятков кб, в 40 000 цепочек ДНК, используя свою схему кодирования, а уж опосля полагать них в персональном порядке, и не допустив ошибок. Работу они предположили в апреле на конференции Ассоциации по электронно-вычислительной технике. При помощи 10 миллионов цепочек, кои Microsoft покупает у Twist Bioscience, ученые планируют обосновать, что заданные ДНК можно хранить в куда наиболее обширных масштабах. «Наша задачка — продемонстрировать конечную систему, в какой мы кодируем файлы ДНК, синтезируем молекулы, храним них в течение долговременного времени, а уж потом восстанавливаем, секвенируя ДНК, — говорит Штраус. — Начинаем с битов и возвращаемся к битам».

    Производитель памяти Micron изучает ДНК в качестве посткремниевой технологии. Корпорация финансирует работу Черча и ученых Вуза штата Айдахо, дабы сделать безошибочную систему хранения в ДНК. «Рост цене хранения заданных будет провоцировать другие решения, и хранение в ДНК является одним из самых многообещающих решений», разговаривает Гуртей Санду, директор отдела развития многообещающих технологий в Micron.

    Ученые еще пока отыскивают методы уменьшения количества ошибок в кодировке и декодировании заданных. Однако главные части технологии уже на пространствах. Эдак что все-таки мешает нам перейти от хранилищ заданных размером с обувную коробочку перед началом стеклянных капсул с ДНК? Цена. «Процесс записи в миллион раз дороже», разговаривает Силиг.

    И вот посему: производство ДНК включает нанизывание молекул нанометровых объемов одну за одной с высочайшей точностью — это же сложная задачка. И хотя цена секвенирования свалилась по причине резво развивающегося спроса на эту услугу, синтез ДНК и не имел подобного драйвера на базаре. Миленкович заплатила подле 150 баксов, дабы сделать ряд из 1000 синтезированных нуклеотидов. Секвенирование миллиона нуклеотидов стоит ли подле цента.

    Энтузиазм к хранению заданных от Microsoft и Micron возможно конкретно тем самым импульсом, что нужен для начала понижения расходов, разговаривает Силиг. Мозговитая инженерия и новейшие технологии вроде микрофлюидики и нанопорового секвенирования ДНК, кои помогают сократить и убыстрить процесс, а также будут содействовать продвижению. Ныне уходит несколько часов, дабы секвенировать несколько сотен пар нуклеотидов — и деньки на них синтез — используя кучу оборудования. Хотелось бы проводить все это же в маленький коробке передач, по другому привилегию герметичности хранения заданных будет потеряно.

    Ежели все удастся, Штраус представляет возникновение корпораций, предлагающих сервисы по хранению архивных ДНК в течение последующего десятилетия. «Вы сумеете открыть браузер и загрузить файлы на них веб-сайт либо забрать свои байты назад, как только с облаком», разговаривает она. Либо можно будет выкупить диск ДНК заместо твердого диска.