Dijital datalar DNA’da depolanabilir mi?

Teknoİstanbul

New member
6 Haz 2021
345
0
1
Massachusetts Teknoloji Enstitüsü

Şu an itibariyle, Dünya’da yaklaşık 10 trilyon gigabayt dijital data mevcut ve her gün beşerler bu havuza 2.5 milyon gigabayta kadar data ekleyen e-postalar, fotoğraflar, tweetler ve belgeler üretiyorlar. Bu dataların büyük kısmı, birkaç futbol alanı büyüklüğünde olabilen ve inşa edilmesi ve bakımı yaklaşık 1 milyar dolara mal olan ‘eksabayt (bir eksabayt=1 milyar gigabayt) data merkezleri’ ismiyle bilinen devasa tesislerde saklanır.

Biroldukca bilim insanı, alternatif bir tahlilin genetik detaylarımizi içeren molekülde yattığına inanıyor: DNA, fazlaca büyük ölçülerdeki bilgiyi çok yüksek yoğunlukta depolamak üzere evrimleşmiştir. Massachusetts Teknoloji Enstitüsü (MIT) Biyoloji Mühendisliği Profesörü Mark Bathe, teorik olarak, Uz söylüyor.

Hem MIT Broad Enstitüsü birebir vakitte Harvard’ın ortak üyesi olan Bathe, “Dünyanın biriktirdiği bu büyük ölçüdeki datayı, bilhassa de arşiv datalarını depolamak için yeni tahlillere muhtaçlık duyuyoruz” diyor: “DNA, flash bellekten bile bin kat daha ağırdır ve değişik olan bir öteki özelliği de bir sefer DNA polimerini ürettikten daha sonra rastgele bir güç tüketmemesidir. DNA üzerine bilgi yazabilir ve onu sonsuza dek saklayabilirsiniz.”

Bilim insanları, manzaraları ve metin sayfalarını DNA biçiminde kodlayabildiklerini daha evvel ortaya koymuşlardı. tıpkı vakitte, biroldukça DNA modülünün oluşturduğu bir karışımın ortasından istenen bir belgeyi seçmek için kolay bir yola da muhtaçlık duyulacaktır. Bathe ve meslektaşları, [eski bir çalışmada] her bir bilgi belgesini, içeriği oluşturan kısa DNA dizileri ile etiketlenmiş 6 mikrometre uzunluğunda bir silika parçacığına işleyerek bunu yapmanın bir yolunu göstermişlerdi.

Araştırmacılar, bu yaklaşımı kullanarak, 20 manzaradan oluşan bir dizi içerisinden, DNA olarak depolanan imgeleri tek tek hakikat bir biçimde çıkarabileceklerini gösterdiler. Kullanılabilecek muhtemel etiketlerin sayısı göz önüne alındığında, bu yaklaşım 1020 belgeye kadar ölçeklenebiliyor.

STABİL DEPOLAMA

Dijital depolama sistemleri, metinleri, fotoğrafları ya da farklı rastgele bir bilgiyi 0’lar ve 1’ler dizisi halinde kodlar. Bu birebir bilgi, genetik kodu meydana getiren A, T, G ve C* ismi verilen dört nükleotid kullanılarak DNA’da da kodlanabilir. örneğin, G ve C 0’ı temsil etmek için kullanılabilirken, A ve T 1’i temsil eder.

DNA, bir depolama ortamı olarak dilek edilen birkaç özelliği bünyesinde barındırır: Son derece stabildir ve sentezlenmesi ile dizilenmesi ziyadesiyle kolaydır (ama değerlidir da). Öte yandan, yüksek yoğunluğu sebebiyle -her nükleotid iki bite muadil, yaklaşık 1 nanometre küp büyüklüğündedir- DNA biçiminde depolanan bir eksabayt data, avucunuzun içine bile sığabilir.

Bu çeşitten data depolamanın önündeki manilerden biri, bu derece büyük ölçüde DNA’nın sentezlenmesinin maliyetidir. Günümüzde, bir petabayt bilgi (1 milyon gigabayt) yazmak 1 trilyon dolara mal oluyor. Bathe, sıklıkla arşiv bilgilerini depolamak emeliyle kullanılan manyetik bantlarla rekabet edebilmek için, DNA sentezinin maliyetinden yaklaşık altı sıfır atılması gerektiğini iddia ediyor. Bathe, flash belleklerdeki bilgi depolama maliyetinde son birkaç on yılda görülen değerli düşüşe misal halde, bu düşüşün on ilâ yirmi yıl ortasında gerçekleşeceğini düşündüğünü tabir ediyor. Maliyetin yanı sıra, bilgileri depolamak maksadıyla DNA’yı kullanmanın önündeki bir öteki büyük mahzur, öbürleri içinden istediğiniz belgeyi seçmenin kuvvetliğüdür.

Bathe, “Peki, DNA yazma teknolojilerinin, DNA üzerine bir eksabayt yahut zettabayt bilgi yazmanın uygun maliyetli olduğu bir noktaya ulaştığını var iseydığımız durumda ne olacak? Üzerinde sayısız evrak, fotoğraf ya da sinema ve öteki şeyler bulunan bir DNA yığınına sahip olacaksınız ve aradığınız resmi ya da sineması bulmanız gerekecek” diyor: “Bu, tıpkı samanlıkta iğne bulmaya çalışmaya benzeyecek.”

Şu anda, DNA evrakları klasik formda PCR (‘polimeraz zincir reaksiyonu’) kullanılarak alınıyor. Her bir DNA bilgi evrakı, muhakkak bir PCR kapsülüne (ing. ‘primer’) bağlanan bir dizi içerir. Makul bir belgeyi buradan çıkarmak, istenen diziyi bulmak ve büyütmek için örneğe bu kapsül eklenir. birebir vakitte, bu yaklaşımın dezavantajlarından biri, kapsül ve amaç dışı DNA dizileri içinde çapraz karışmanın gerçekleşebilmesidir; bu durum, istenmeyen evrakların çağrılmasına niye olur. Ayrıyeten, PCR geri çağırma süreci kimi enzimlere gereksinim duyar ve havuzda bulunan DNA’nın büyük kısmını tüketir. Bathe, “Bu durumda, iğneyi bulmak için samanlığı yakarsınız; çünkü geri kalan DNA güçlendirilmemiş olur ve aslında onları çöpe atmış olursunuz” diyor.

EVRAK ALMA

MIT grubu, alternatif bir yaklaşım olarak, her DNA evrakını küçük bir silika parçacığı içine yerleştirmeyi içeren yeni bir evrak çağırma tekniği geliştirdi. Her kapsül, belgenin içeriğine karşılık gelen tek sarmallı DNA ‘barkodları’ ile etiketleniyor. Araştırmacılar, bu yaklaşımın uygun maliyetli olabileceğini göstermek için yaklaşık 100 bayta muadil olan yaklaşık 3 bin nükleotid uzunluğundaki DNA kesimlerine 20 farklı manzara kodladılar. (Ayrıca kapsüllerin bir gigabayta kadar DNA evraklarına sığabileceğini de ortaya koydular.)

Evrakların her biri ‘kedi’ ya da ‘uçak’ üzere başlıklara karşılık gelen barkodlarla etiketlendi. “Araştırmacılar seçilen bir manzarayı geri almak istediklerinde, bir DNA meselai çıkarıyor ve aradıkları etiketlere karşılık gelen kapsülleri ekliyorlar; örneğin, bir kaplan imgesi için ‘kedi’, ‘turuncu’ ve ‘vahşi’ ya da bir mesken kedisi için ‘kedi’, ‘turuncu’ ve ‘yerli’ etiketlerini kullanıyorlar.”

Kapsüller, floresan ya da manyetik parçacıklarla etiketlenir; bu ise numuniçin rastgele bir eşleşmeyi çıkarmayı ve onu tanımlamayı kolaylaştırır. Bu yaklaşım, dilek edilen belgenin alınmasına imkan sağlarken, DNA’nın geri kalanını bozulmadan bırakarak depoya geri konmasını sağlar. Kullandıkları geri alma süreci, “Başkan VE 18.yüzyıl” üzere Boole** mantık sözlerinin, tıpkı bir Google görsel araması ile olmasına emsal halde, [ABD’nin eski başkanlarından] George Washington’ın olmasına imkân sağlar.

Banal, “Kavramsal kanıtımızın mevcut haliyle, saniyede 1 kilobaytlık data arama hızındayız. Şu anda, evrak sistemimizin arama suratı, DNA üzerine 100 megabayt boyutunda data yazmayı imkânsız kılan büyük maliyeti ve paralel olarak kullanabileceğimiz dizileyici sayısı ile hudutlu olan ‘kapsül başına veri’ boyutuna nazaran belirleniyor. DNA sentezi gereğince ucuzlarsa, kullandığımız yaklaşımla belge başına depolayabileceğimiz data boyutunu en üst seviyeye çıkarabiliriz” diyor.

Araştırmacılar, [etiketleme] barkodları için, Harvard Tıp Fakültesi’nde genetik ve tıp profesörü olan Stephen Elledge tarafınca geliştirilen ve her biri yaklaşık 25 nükleotid uzunluğundaki 100 bin diziden oluşan bir kütüphanede bulunan tek sarmallı DNA dizilerini kullandılar. Her belgeye bu etiketlerden ikisini eklemeniz halinde, 1010 (10 milyar) farklı belgeyi eşsiz halde etiketleyebilir ve her birine dört etiket eklediğinizde 1020 belgeyi eşsiz halde etiketleyebilirsiniz.

Bathe, buna misal bir DNA kapsüllemenin ‘soğuk’ bilgileri, yani bir arşivde tutulan ve fazlaca sık kullanılmayan dataları depolamak kelam konusu olduğunda faydalı olabileceğini düşünüyor. Laboratuvarı, hem uzun vadede DNA bilgilerini depolamak tıpkı vakitte kısa vadede klinik ve öbür mevcut DNA örneklerini depolamak gayesiyle, DNA’nın uzun periyodik depolanması doğrultusunda teknoloji geliştirecek ‘Cache DNA’ isimli bir çalışmayı hayata geçiriyor. Bathe, “DNA’yı bir bilgi depolama ortamı olarak uygulanabilir hale getirmek vakit alsa bile, şu anda Covid-19 testi, insan genom dizileme ve başka alanlardan gelen DNA ve RNA örneklerinin düşük maliyetli büyük depolanması konusunda acil bir muhtaçlık kelam konusu” diyor.

*A, T, G, C: Adenin, Timin, Guanin, Sitozin.

**Boole mantığı, Boole operatörleri olarak bilinen, ‘veya’, ‘ve’ ve ‘değil’ halindeki üç sıradan söz etrafında odaklanmış bir cebir biçimidir. Boole mantığının merkezinde, tüm pahaların yanlışsız yahut yanlış olduğu fikri bulunur.


Yazının özgünü EurekAlert sitesinden alınmıştır. (Çeviren: Tarkan Tufan)