Discs durs d’ADN, l’alternativa al problema d’emmagatzematge de dades?

Com més va generem més dades i no tenim cap solució a llarg termini per a conservar-les

VilaWeb
Marc Belzunces
13.08.2022 - 21:40
Actualització: 15.08.2022 - 09:51

La premsa lliure no la paga el govern, la paguen els lectors


Fes-te de VilaWeb, fem-nos lliures

Cada dia es pugen a YouTube 720.000 hores de vídeo, l’equivalent a vuitanta-dos anys de reproducció sense pausa. La coneguda xarxa social audiovisual és només una de les moltes plataformes d’internet que generen una enorme quantitat de dades. Un volum amb creixement desmesurat que necessita ser emmagatzemat. I que en el futur no sembla que hagi de disminuir. A la xarxa actual se sumarà la internet de les coses, que ens omplirà de sensors, cadascun dels quals generarà informació que s’haurà d’emmagatzemar. Les companyies, per seguretat, es veuen forçades a reescriure en nous dispositius tota la seva informació periòdicament cada pocs anys, cosa que genera un volum de residus electrònics enorme. Trobar una tecnologia d’emmagatzematge que duri segles, o fins i tot mil·lennis, esdevé clau per a evitar aquest malbaratament i conservar intacte el coneixement de la civilització humana. Hi ha unes quantes opcions en competició. La natura ens pot marcar el camí, ja que ha reeixit emmagatzemant durant milers de milions d’anys una gran quantitat d’informació, gràcies a l’ADN. Teòricament, en un únic gram d’ADN sintètic es poden arribar a emmagatzemar fins a 215.000 terabytes (TB), l’equivalent a més de 10.000 discs durs actuals.

El problema de conservar el volum de dades actuals

Els analistes consideren que l’any 2024 hi haurà una necessitat d’emmagatzematge anual de nou zettabytes. Aquesta quantitat equival a uns 10.000 milions de TB. Si tenim en compte que actualment els discs durs que podem comprar en una botiga tenen mides fins a un màxim de vint TB, això equival a haver de fabricar milers de milions d’aquests dispositius cada any. Que a més ocupen una gran quantitat d’espai i consumeixen una gran quantitat d’energia. L’atenció se centra en el núvol. Com més va més hi confiem per desar imatges, vídeos, documents, correus, etc. Edificis sencers plens de discs durs repartits arreu del món contenen la informació més important de la humanitat, generalment amb unes quantes còpies redundants distribuïdes per diversos punts del planeta. Alhora, com més va són més comuns els NAS (sigles de Network Attached Storage, emmagatzematge adjunt en xarxa) en empreses i llars, petits ordinadors amb discs durs que actuen de núvol personal en què fem la còpia de seguretat de les dades de manera redundant –típicament per duplicat, amb la mateixa dada en dos discs durs. En aquests espais d’alta utilització, els discs durs tenen una vida útil entre tres anys i cinc. Una volta passat aquest període, n’hem de comprar de nous i copiar-hi les dades per no perdre-les. Tecnologies alternatives, com ara les cintes magnètiques, poden arribar a durar deu anys. Tanmateix, si volem emmagatzemar informació en discs òptics (CD, DVD i Blu-Ray), el risc és alt, ja que la durabilitat és molt variable i incerta. Va dels 2 anys a més de 200, si més no teòricament.

A més, hi ha informació que és més important que les fotografies de les últimes vacances, i que conservar-la de manera inalterada durant dècades, segles o mil·lennis resulta cabdal. Historials mèdics, obres de literatura, films, obres d’art i el coneixement científic i tecnològic que anem acumulant i que defineixen el nostre progrés com a civilització. Fins ara, el paper tampoc no té assegurada la integritat a llarg termini. Com podem fer perquè Tirant lo Blanc, Plats Bruts o “Estiu 1993” es puguin continuar consultant d’aquí a mil anys o deu mil i no es perdin per sempre? Actualment, com vèiem, optem per reescriure tota aquesta informació en dispositius nous, de gran cost econòmic i poc sostenibles ambientalment. Amb el risc d’anar introduint-hi errors a causa de fer-ne tantes còpies seguides, tot perdent informació que pot acabar per fer que sigui impossible l’accés als fitxers. Les grans companyies d’informàtica investiguen per trobar alternatives fiables al sistema actual.

Actualment, hi ha multitud de centres de dades repartits arreu del món amb milers de discs durs que s’han de renovar periòdicament (imatge: Amazon).

En aquesta línia, Microsoft ha començat el Projecte Silici. Mitjançant làsers similars als que s’usen per a la correcció de la miopia, desen informació en làmines de quars (diòxid de silici, el segon element més comú de l’escorça terrestre). Es creen un seguit de capes en tres dimensions on s’escriu la informació en codi binari (zeros i uns) a una escala de nanòmetres (més prim que un full de paper). L’avantatge d’això és que el quars pot aguantar una inundació, aigua calenta, microones, camps magnètics i moltes més inclemències, cosa que asseguraria la integritat de les dades potencialment durant milions d’anys. D’aquesta manera podríem conservar elements clau de la nostra cultura i arxius de gran valor sense preocupar-nos-en excessivament. De fet, la primera prova s’ha fet en col·laboració amb els estudis Warner Bros, amb la còpia del film del 1978 Superman. La productora està molt interessada a conservar tresors antics, com ara Casablanca, programes de ràdio de la dècada dels quaranta, dibuixos animats, sèries de televisió i més documents, amb tecnologies d’emmagatzematge que puguin durar segles sense necessitat d’haver-les de copiar cada pocs anys en nous dispositius. Cal tenir en compte que aquesta nova tecnologia només permet d’escriure un cop, i no reescriure com sí que podem fer amb els discs durs actuals. En cas d’haver-ho de fer, hauríem de duplicar la informació en una altra làmina de quars i llençar l’anterior. Tanmateix, és una tecnologia potencialment molt barata i que permetria de crear grans arxius de seguretat repartits arreu del món sense unes necessitats sofisticades de conservació.

Discs durs d’ADN

Emmagatzemar informació en roques és, en certa manera, emular la natura. Les pedres contenen molta informació que els geòlegs i més científics poden llegir. El passat climàtic del planeta, els organismes que hi han viscut, les catàstrofes que ha viscut la Terra. Tanmateix, la natura ha creat una altra manera d’emmagatzemar informació molt més complexa i reeixida durant milions d’anys: l’ADN. Es tracta d’una molècula orgànica formada per quatre bases: adenina (A), timina (T), citosina (C) i guanina (G). La combinació d’aquestes quatre lletres conté tota la informació que defineix un organisme viu, el seu codi genètic. Aquest codi es pot llegir, escriure, reparar i copiar. En certa manera, podem dir que és el disc dur que ha desenvolupat l’evolució biològica. Si tenim en compte que actualment els discs durs fan servir zeros i uns per definir el fitxer que desem, l’ADN és un candidat perfecte per a fer la mateixa, però amb A, T, C i G. Així, per a traspassar la informació binària a ADN només cal emprar dues lletres per a emular els zeros i els uns, o la combinació de dues d’elles.

No és una idea de fa poc. El 1999 un grup de científics de Nova York van crear un missatge xifrat de vint-i-dos caràcters dins una cadena d’ADN, envoltada per uns marcadors genètics específics per fer notar on era el fragment de codi genètic amb el missatge. Van inserir l’ADN dins un punt en un text d’una carta escrita a mà. I es van enviar a ells mateixos la carta per correu postal. En rebre-la, van localitzar l’ADN, el van seqüenciar i van descodificar-ne el missatge: “Invasió 6 de juny: Normandia”. Va ser la primera demostració que el codi genètic es podia emprar per emmagatzemar informació generada per humans. El 2012, un equip científic del Regne Unit assolia la transformació de 739 kB de fitxers informàtics en cadenes genètiques, incloent-hi els 154 sonets de Shakespeare i un fragment del famós discurs de Martin Luther King, on pronuncià la mítica frase “Tinc un somni”. Els 2016, investigadors de la Universitat de Washington i de Microsoft van ser capaços d’arribar als 200 MB de dades tot emprant cadenes d’ADN. Hi van incloure la Declaració dels Drets Humans i un vídeo en alta definició, entre més dades.

L’empresa Microsoft investiga en aquesta àrea d’ençà del 2015. De fet, es beneficia de tots els avenços que hi ha hagut en biotecnologia, que han abaratit molt la seqüenciació genètica gràcies al desenvolupament de màquines sofisticades que permetent de sintetitzar, manipular i seqüenciar l’ADN. Una volta consolidada aquesta tecnologia i en fase d’universalització en l’àmbit de la medicina, investiguen per aplicar-la a l’àmbit de les tecnologies de la informació i la comunicació (TIC). L’ADN presenta dos grans avantatges per a emmagatzemar informació. Per una banda, la densitat que té, perquè pot emmagatzemar un milió de TB en només un mil·límetre cúbic. Milers de vegades més dens que qualsevol tecnologia d’emmagatzematge actual. Per exemple, permetria d’emmagatzemar cent milions de films en alta definició en la mida d’un cacauet, o tota la informació que hi ha a internet avui en la mida d’una capsa de sabates. El guany en relació amb la situació actual seria inimaginable.

Per una altra banda, la durabilitat: amb una vida mitjana de cinc-cents anys, superant àmpliament els discs durs actuals. Tanmateix, es pot anar molt més enllà si l’ADN s’emmagatzema en un ambient fred i fosc. De fet, aquests anys s’han desenvolupat noves tècniques que permeten de seqüenciar ADN de restes de neandertals, que van viure entre nosaltres fins fa quaranta mil anys. El rècord de lectura d’un codi genètic antic se situa en 1,2 milions d’anys, corresponents a mamuts conservats en el permagel polar. S’espera doblar aquesta xifra si es troben restes prou ben conservades, tenint en compte que el permagel més antic és de fa 2,6 milions d’anys. Per si això no fos prou, els científics investiguen amb ADN sintètic que s’autoreplica. Un equip va emmagatzemar la lletra d’una cançó infantil en cadenes genètiques i la va introduir dins el genoma d’un microbi amb característiques especials. En concret, un bacteri que pot sobreviure dins el buit i sense aigua durant sis anys, i fins i tot resistir un nivell de radiació mil vegades superior al que mataria a un humà. El bacteri es va reproduir durant cent generacions sense pèrdua d’informació. Entre les potencials línies de recerca futures, hi hauria la d’inserir còpies redundants dins l’organisme que es podrien emprar per a corregir automàticament els errors de còpia, tot preservant la integritat de les dades durant molt més temps. Tot plegat ens demostra que en unes condicions controlades de conservació, podríem emmagatzemar informació durant grans períodes de temps gràcies a l’ADN. O, fins i tot, introduir tota la informació generada per la humanitat en organismes que s’anessin reproduint per tot el planeta, tot fent-la durar fins i tot si l’espècie humana desaparegués.

Una tecnologia alternativa és emmagatzemar informació en làmines de quars (fotografia: Project Silica/Microsoft).

Els avenços per a solucionar els problemes amb l’ADN

Microsoft, de moment, espera poder combinar totes dues tecnologies, bioquímica i de silici, en sistemes híbrids. Això estaria motivat perquè la tecnologia actual d’ADN presenta un gran inconvenient: la velocitat d’escriptura. Per emmagatzemar informació en forma d’ADN es fan servir xips que contenen estructures en què es fan créixer les cadenes genètiques a una escala nanomètrica –més petita que el gruix d’un full de paper. Fins ara, el rècord d’emmagatzematge se situa en uns 200 MB, per als quals van trigar vint-i-quatre hores. Tanmateix, hi ha avenços significatius. L’any passat, un equip dels EUA va presentar un prototip de xip que millorava cent vegades la velocitat d’emmagatzematge. Això és gràcies al fet que s’ha aconseguit de manipular de manera directa l’enzim que sintetitza les cadenes genètiques, i no mitjançant sistemes mecànics, com feia la tecnologia anterior. Fins ara, es feien servir seqüències pre-existents d’ADN, que es modificaven tot afegint-hi nova informació. L’inconvenient és que per a emmagatzemar de manera acurada informació en un procés d’aquesta mena calen deu hores. Amb els nous progressos, ja és possible de sintetitzar ADN nou que contingui la informació requerida, tot augmentant la velocitat i la resolució (densitat) de la informació, i escrivint-la en uns quants minuts, i no pas hores ni dies.

La tecnologia d’emmagatzematge amb ADN encara ha de progressar perquè arribi als consumidors finals. Tanmateix, és una opció molt prometedora i torna a demostrar que, malgrat els enormes progressos de la humanitat, les solucions que la natura ha generat durant milers de milions d’anys gràcies a l’evolució, són encara molt per davant de la tecnologia humana. En qualsevol cas, si la civilització actual acabés en col·lapse, estaríem en disposició de conservar la cultura i el coneixement tècnic i científic més enllà d’uns llibres i discs durs que es deteriorarien ràpidament, o que serien destruïts intencionadament, com manta vegada hem vist. Acabarem desant totes les fotografies, llibres, apunts i records personals dins el cos?

Més notícies

La premsa lliure no la paga el govern. La paguem els lectors.

Fes-te de VilaWeb, fem-nos lliures.

Fer-me'n subscriptor
des de 60€ l'any / 5€ el mes