Verilerimizi DNA’da depolayabilir miyiz? Büyük veri sorununda doğa yöntemi

Günümüzde veri depolama ve büyük veri oldukça önemli bir problem. Her ne kadar verilerimizi bulut sistemlerinde depoluyor olsak da bulut sistemleri de esasında devasa veri depolama alanlarıdır ve çalışması için oldukça yüksek enerji ve alan gerektirir. Son birkaç yıl içinde yılda tüm insanlık tarihinde ürettiği verinin toplamından daha fazla veri üretildi. Peki, büyük veri sorunu ile nasıl başa çıkacağız? Cevap milyarlarca yıldır bizimle birlikte olan DNA kodlarında gizli olabilir.

BİLİM-TEKNOLOJİ 16.03.2022, 16:02 Tayfur Bal
Verilerimizi DNA’da depolayabilir miyiz? Büyük veri sorununda doğa yöntemi

Bugünlerde tüm düşünce ve hareketlerimiz fotoğraf ve videolar vasıtasıyla dijital veri olarak kayıt ediliyor. Telefonumuzdaki alanın tükenmesi dışında nadiren dijital izlerimiz hakkında düşünüyoruz. Fakat insanlık son birkaç yılda tüm insanlık tarihinde ürettiği verinin toplamından daha fazla veri üretti. Büyük veri son yıllarda büyük bir sorun hâline gelmeye başladı. Dijital kayıt birimleri oldukça pahalı. Öte yandan sahip olduğumuz bu cihazların hiçbiri uzun yıllar hayatta kalamıyor.

Veri depolama sistemleri oldukça gelişti

Bugün yıllar önce internete kaydedilen bilgilere bile erişim sağlayabiliyoruz. Bu durum çoğu zaman oldukça işimize yarıyor. 20 ya da 30 yıl öncesinin bir içeriğine bakıldığında boyutlar değişse de her iki dönemde de depolama aygıtlarını çalışma yöntemi aynı şekilde gerçekleşiyor. Hatta 1950’lerde piyasaya sürülen IBM’nin ilk sabit diskinde bile benzer bir teknoloji vardır. Yaklaşık küçük bir oda büyüklüğünde olan disk bir adet mp3 şarkı taşıyabilecek bir kapasiteye sahiptir ve ağırlığı bir tonun üzerindedir. Bu teknoloji ile bir megabayt verinin saklanabilmesi için 10.000 dolar ödenmesi gerekiyor. Günümüzde oldukça pahalı ve akıl almaz geliyor ancak o günün teknolojisi dahilinde insanlığın yapabildiği depolama kapasitesi bununla sınırlıydı.

1950'lerde IBM'nin depolama için kullandığı devasa boyutlardaki veri depolama aygıtı sadece 5 megabayt veri depolayabiliyordu. 

Güncellenen aygıtlar ile veri depolamak

Yılar içinde verilerin depolanmasında çok yol kat edildi. Cihazlar çok büyük bir ivme ile gelişti. Fakat tüm medyalar eninde sonunda eskimeye mahkum ve güncelliğini yitiriyor. Örneğin 30 yıl önce kullanılan disketleri bugün kullanmıyoruz. Bu disketler koleksiyoncuların oldukça ilgisini çekse de artık depolama aygıtı olarak kullanılamıyor. Bununla beraber günümüzde yer alan tüm teknolojiler de eninde sonunda bizim verilerimiz ve tüm hafızamızla beraber ölecek veya kaybolacak.

CD ve DVD'ler 15 20 yıl öncesinde depolama aygıtı olarak kullanılıyor olsa da şu an yerlerini taşınabilir USB depolama aygıtlarına bıraktılar. 

“Bulut” hesabı birçok disketten oluşan bir yapıdır

Depolama probleminin çözüldüğü yönünde bir algı var fakat sadece harici çözüme dönüştürülüyor. E-posta ve fotoğraflarımızı depolamaktan endişe etmiyoruz. Çünkü bulut hesabında yer alıyorlar. Fakat arka planda bir depolama problemi yer alıyor. Hepsinden önce, bulut sistemi sadece birçok diskten oluşan bir yapıdır. Şu an söz konusu olan ve biriktirdiğimiz birçok dijital veri gerçekten önemli veriler değil ve silinebilirler. Ancak bunu yapabilmemiz için günümüzde neyin önemli olduğunu da bilmemiz gerekiyor. Fakat, günümüzde neyin önemli olduğunu gerçekten nasıl bilebiliriz?

verilerimizi bulut sistemine kaydettiğimizde aslında sadece uzakta yer alan bir depolama merkezine kaydetmiş oluruz. 

Hangi verilerimiz daha önemli?

Mağaralarda yer alan çizimler ve yazılardan, taş tabletlerden insanlık tarihi hakkında çok şey öğrenildi. Taş tabletlerden diller çevrildi ve insanlığın geçmişine ait değerler aydınlatıldı ancak yine de hikayenin tamamına sahip değiliz. Veriler bizim hikayemizi ve bugünümüzü oluşturuyor. Şu an verilerimizi ve insanlık bilgilimizi taş tabletlere değil depolama aygıtlarına kaydediyoruz. Ve arkaik insanların aksine bugün kayda geçirmek için neyin önemli olduğunu seçmemize gerek yok. Bütün verilerimizi kaydetmenin bir yolu bulunuyor. Ve bu yol yaklaşık 1.5 milyar yıldır bizimle birlikte.

Cevap yıllardır bizimle olan DNA’da gizli olabilir

1950'lerden kalma geçerli uzun vadeli soğuk depolama yöntemi, verileri pizza büyüklüğündeki manyetik alanlar üzerine yazıyor. Ancak DNA depolama yöntemleri potansiyel olarak daha ucuz, daha enerji verimli ve daha uzun ömürlüdür. Araştırmalar, bir tuzla uygun şekilde kapsüllenmiş DNA'nın oda sıcaklığında onlarca yıl stabil kaldığını ve bir veri merkezinin kontrollü ortamında çok daha uzun süre dayanması gerektiğini gösteriyor. DNA ayrıca bakım da gerektirmiyor ve DNA'da saklanan dosyalar ihmal edilebilir bir maliyetle kolayca kopyalanabiliyor.

Tüm insanlık bir pinpon topunun içinde

Bundan da öte DNA, oldukça küçük bir hacimde şaşırtıcı miktarda bilgiyi arşivleyebilir. Bunu hayal etmek için şu şekilde düşünebilirsiniz: insanlık 2025 yılına kadar tahmini 33 zettabayt (zetta 21 sıfırlı bir sayıyı ifade etmek için kullanılır) veri üretecek. DNA depolama yöntemleri ile, tüm bu bilgiler boş alanla bir pinpon topuna sıkıştırabilir. Dünyanın en büyük kütüphanelerindeki 74 milyon x milyon (sayı ifade edilebilmesi için milyon kelimesi iki kere yazıldı) baytlık bilgi, bir tohum büyüklüğündeki bir DNA arşivine sıkıştırılabilir. Bu teknik olarak 6 bin kat daha küçük bir hacim anlamına geliyor. Tohumu ikiye bölerek Facebook'un tüm verilerini saklayabilirsiniz.

Buz Adam Ötzi’den öğrenebileceklerimiz

Kulağa bilim kurgu filmi gibi gelebilir. Ancak DNA depolama teknolojisi bugün var. Bunu biliyoruz çünkü bilim insanları yüz binlerce yıl önce yaşamış ilk insanlardan DNA elde ettiler. Bunlardan birisi Buz Adam Ötzi. Ötzi İtalya ve Avusturya arasında dağların tepesinde iyi korunmuş hâlde bulundu ve günümüzde Avusturya'da yaşayan akrabaları olduğu ortaya çıktı. Yani bugün Avusturya’da yaşanan biri Ötzi'nin kuzeni olabilir. Burada önemli olan konu, eski telefonlardan çıkarttığımız bilgiden daha fazla bilgiyi ilkel insandan çıkartma hususunda daha fazla şansımızın olmasıdır. DNA'yı okuma kabiliyetimiz sayesinde verileri kaybetme ihtimalimiz herhangi bir insan yapımı cihaza göre çok daha azdır. Her yeni depolama formatı okumak için yeni bir yönteme ihtiyaç duyar. Bu nedenle verilerin depolanması dışında okunması da büyük bir probleme dönüşebilir. DNA'yı ise her zaman okuyabiliriz.

Buz Adam Ötzi olarak bilinen M.Ö. 3000 yılları civarında yaşadığı düşünülen ve günümüze oldukça iyi koşullarda korunarak gelen bir insan mumyası. Buz Adam Ötzi 1991 yılında Avusturya'da keşfedildi. 

Teknolojik engellerin aşılması gerekiyor

Ancak bunu uygulanabilir kılmak için araştırmacıların farklı teknolojileri entegre etme konusundaki birkaç zorlu teknolojik engeli aşması gerekiyor. Bu işi yapmak için büyük bir işbirliğinin parçası olarak, Los Alamos Ulusal Laboratuvarı'ndaki yer alan bir ekip, moleküler depolama için önemli bir etkinleştirme teknolojisi geliştirdi. Yazılım - Uyarlanabilir DNA Depolama Kodeksi (ADS Codex) - veri dosyalarını bilgisayarların anladığı ikili dilden biyolojinin anladığı dört harfli kodlara çeviriyor.

Bilgisayar kodundan genetik koduna

Çoğu insan DNA'yı düşündüğünde, bilgisayarları değil, hayatı düşünür. Ancak DNA'nın kendisi, bir organizma hakkında bilgi iletmek için dört harfli bir koddur. DNA molekülleri, her biri bir harfle tanımlanan dört tip bazdan veya nükleotitten yapılır: Adenin (A), timin (T), guanin (G) ve sitozin (C). Bunlar, dünyadaki her canlıyı inşa etmek için kullanım kılavuzu sağlayan tüm DNA kodunun temelidir. Oldukça iyi anlaşılmış bir teknoloji olan DNA sentezi, tıpta sadece birkaç uygulamayı saymak gerekirse farmasötiklerde ve biyoyatık geliştirmede yaygın olarak kullanılmaktadır. Teknik, bazları belirli A, C, G ve T dizileriyle gösterilen çeşitli düzenlemeler halinde düzenler. Bu bazlar, molekülü oluşturmak için birbirlerinin etrafına bükülmüş bir zincirle sarılır. Bu harflerin diziler halinde ve farklı kombinasyonlar halinde düzenlenmesi, bir organizmaya nasıl olacağını ve temel anlamda ne tür dürtülere sahip olacağını söyleyen bir kod oluşturur.

Bilgisayar ve doğanın eşsiz benzerliği

DNA moleküllerinin eksiksiz seti genomu, yani vücudunuzun planını oluşturur. Araştırmacılar, DNA moleküllerini sentezleyerek - onları sıfırdan oluşturarak - A, C, G ve T harflerinden oluşan uzun dizileri belirleyebileceklerini veya yazabileceklerini ve sonra bu dizileri okuyabileceklerini keşfettiler. İşlem, bir bilgisayarın ikili sistemde yer alan verileri depolama şekline benziyor. Dijital dünyada her şey 1 ve 0’larla temsil edilir. Buna göre bilgisayarda bulunan her veri bize nasıl göründüğünden bağımsız olarak makine dilinde tamamen 1 ve 0’larla temsil edilir. Bilgisayar bilimi ve biyolojideki benzerlikler ortaya çıktığında ve bu iki sistemi birbirine çevirmenin matematiksel bir yolu bulunduğunda ikili kodları molekül kodlarına çevirmek sadece zaman meselesine dönüşüyor.

Zaman problemi en büyük sorun

Yöntemin işe yaradığı kanıtlandı, ancak DNA kodlu dosyaları okumak ve yazmak şu anda uzun zaman alıyor. DNA'ya tek bir baz eklemek yaklaşık bir saniye sürüyor. Bu hızda bir arşiv dosyası yazmak on yıllar alabilir, ancak araştırmalar, aynı anda birçok moleküle yazan paralel işlemler de dahil olmak üzere daha hızlı yöntemler geliştiriyor. ADS Codex adındaki yazılım, sıfırları ve birleri A, C, G ve T'nin dört harf kombinasyonunun dizilerine tam olarak nasıl çevireceğini ayarlıyor. Codex ayrıca kod çözmeyi ikili koda geri döndürüyor. DNA birkaç yöntemle oluşturulabiliyor ve ADS Codex bu yöntemlerin hepsini uygulayabiliyor.

Kopya hatalarının önüne geçilmeli

Ne yazık ki geleneksel dijital sistemlere göre DNA sentezi ile moleküler depolamaya yazarken hata oranları çok yüksek. Bu hatalar, dijital dünyada olduğundan farklı nedenlerden kaynaklanıyor ve bu nedenle düzeltilmesi daha zor. Dijital bir sabit diskte, sıfır bire döndüğünde veya tam tersi olduğunda hata oluşur. DNA depolama yöntemlerinde ise sorunlar ekleme ve silme hatalarından kaynaklanıyor. Örneğin, ACGT yazmaya çalışıyor olabilirsiniz, ancak bazen A yazmaya çalıştığında herhangi bir şey gerçekleşmez ve harf dizisi sola kayarak AAA yazar.

Normal hata düzeltme kodları bu tür bir sorunla mücadele edemez, bu nedenle ADS Codex yazılımı, verileri doğrulayan hata algılama kodları kullanıyor. Yazılım, verileri tekrar ikili dosyaya dönüştürdüğünde, kodların eşleşip eşleşmediğini test ediyor. Eğer eşleşme gerçekleşmezse doğrulama başarılı olana kadar bazları (harfleri) kaldırıp yeniden ekliyor.

Akıllı Ölçeklendirme

ADS Codex'in 1.0 sürümü tamamlandı ve bu yılın sonlarında yazılım diğer ekipler tarafından geliştirilen depolama ve alma sistemlerini değerlendirmek için kullanılmayı bekliyor. Bu çalışma, Los Alamos'un ulusal güvenlik misyonunun bir parçası olarak bilgi işlem alanındaki yeni gelişmelere öncülük etme geçmişiyle uyumlu olarak geliştirildi. 1940'lardan bu yana, bu bilgi işlem ilerlemelerinin bir sonucu olarak, yalnızca dijital verilerin en eski ve en büyük depolarından bazıları toplandı. Hala muazzam bir değeri var. Verileri sonsuza kadar sakladığımız için, geleneksel yöntemlere bir alternatif bulma konusunda uzun süredir yeni bir sistemin gelmesi bekleniyor.

Tüm arşivlerimiz tohum büyüklüğündeki bir yapıya sığdırılabilir

Dünyanın tüm verileri—tüm dijital fotoğraflarınız ve tweet'leriniz; küresel finans sektörünün tüm kayıtları; ekili araziler, birlik hareketleri ve buzulların erimesiyle ilgili tüm bu uydu görüntüleri; modern bilimin çoğunun altında yatan tüm simülasyonlar; ve çok daha fazlası - bir yere depolanmak zorunda. “Bulut” sistemi aslında tam olarak bir bulut değildir. Trilyonlarca milyonlarca baytı depolamak ve muhafaza etmek için büyük miktarda elektrik tüketen devasa depolardaki dijital veri merkezleridir. Oluşturulması, çalıştırılması ve korunmaları milyarlarca dolara mal olan bu veri merkezleri, veri depolama ihtiyacı katlanarak artmaya devam ettikçe ayakta kalmakta zorlanabilir. DNA, dünyanın veri depolama konusundaki açgözlü iştahını doyurmak için büyük umut vaat ediyor. Teknoloji, yeni araçlar ve yeni yollar gerektiriyor. Ancak bir gün dünyanın en değerli arşivleri tohum büyüklüğündeki molekül koleksiyonunda yeni bir yuva bulabilir.

HABERNEDİYOR.COM | TAYFUR BAL - ÖZEL HABER

Yorumlar (0)
12
açık