Gli scienziati propongono di archiviare i dati futuri nel DNA invece che nel cloud

Lo sviluppo dell'intelligenza artificiale si basa su enormi volumi di dati che possono essere organizzati, archiviati e accessibili in modo efficiente. In questo contesto, le bioscienze stanno emergendo come un campo in grado di offrire alternative innovative per risolvere questa sfida.

dna
"Guerre di archiviazione": per preservare e salvaguardare enormi quantità di dati con l'avvento dell'intelligenza artificiale, il DNA, non il cloud, potrebbe essere la soluzione.

Gli scienziati suggeriscono un'idea rivoluzionaria: archiviare enormi quantità di dati non in centri digitali né nel cloud, ma in catene di DNA sintetico.

Questa proposta sfrutta il fatto che la molecola che conserva la nostra eredità genetica (DNA) possiede proprietà eccezionali, un’informazione densissima con capacità di conservazione a lungo termine in condizioni stabili.

Come funziona l’archiviazione nel DNA?

Il processo di archiviazione nel DNA comporta tre fasi principali: il primo passo è creare un codice che converte l’informazione binaria (zeri e uno) nella sequenza di nucleotidi del DNA; poi, si sintetizzano quei filamenti di DNA; infine, queste molecole vengono conservate per un recupero futuro.

Una proposta audace: archiviare informazioni in molecole biologiche

Ogni variante nel design (come il codice impiegato, la sintesi o la forma di conservazione) può variare a seconda del gruppo di ricerca o dell’azienda, il che ha portato alla creazione della DNA Data Storage Alliance, un’alleanza che mira a standardizzare i processi e facilitare l’interoperabilità.

Il DNA è assolutamente promettente per archiviare dati su larga scala

Il DNA può gestire un’estrema densità di dati. Ha il potenziale per custodire quantità colossali di informazione in volumi minuscoli. Un altro punto chiave è la durabilità, poiché il DNA può conservarsi intatto per millenni se mantenuto in condizioni adeguate. E il terzo beneficio concreto che offre è la stabilità energetica, non richiede energia elettrica continua per mantenere i dati.

Per le sue qualità, il DNA è ideale per archiviare dati in modo compatto ed ecologico, superando le debolezze di hard disk, nastri o sistemi basati sul silicio.

In un mondo in cui la produzione di dati cresce in modo esponenziale e l’infrastruttura digitale consuma sempre più energia, il DNA emerge come un’alternativa con enorme promessa.

La sua stabilità, densità e basso fabbisogno energetico lo posizionano come candidato ideale per archiviare dati a lunghissimo termine: da archivi culturali a dati scientifici, senza dipendere dall’obsolescenza tecnologica o dal consumo elettrico costante.

Sfide da risolvere prima che diventi di massa

Nonostante il potenziale del DNA come metodo di archiviazione, esistono ancora diverse barriere tecniche ed economiche. Senza dubbio il costo di sintetizzare e sequenziare DNA è ancora molto elevato, e questo è principalmente ciò che ne limita l’applicazione di massa fino ad oggi.

Sono necessari metodi efficienti che traducano dati digitali in sequenze di DNA, li codifichino con precisione e ne permettano un recupero affidabile.

Inoltre, i tempi di lettura e scrittura sono lenti rispetto alle memorie convenzionali. La standardizzazione tecnologica è imprescindibile per garantire compatibilità e scalabilità, ed è per questo che l’alleanza citata è rilevante.

Il DNA è un sistema a base 4; al contrario, i computer archiviano e processano informazione in binario. Invece di assegnare un “1” o uno “0” a ciascun nucleotide del DNA (una A, C, T o G), si potrebbe assegnare una combinazione particolare di due cifre a ogni base, per cui una A potrebbe rappresentare “00”, la C “01”, la T “10” e la G “11”.

Teoricamente, ciò significa che ogni nucleotide del DNA può codificare fino a 2 bit unici. In pratica, il sistema non è così efficiente (alcune combinazioni di nucleotidi sono meno stabili o indesiderabili, ed esistono diversi protocolli chimici per convertire bit in basi di DNA).

Man mano che gli esseri umani adottano strumenti avanzati come l’intelligenza artificiale, la moneta del futuro saranno i dati. Giganti tecnologici come Microsoft stanno già raccogliendo miliardi di dollari per costruire data center per l’IA.

Attualmente è in corso una vera e propria "Guerra dello Storage" per scoprire come preservare e salvaguardare quantità di dati in crescita esponenziale. Data center grandi come campi da calcio e che consumano gigawatt di energia sono un’opzione. L’archiviazione in DNA potrebbe anche essere una soluzione compatta ed energeticamente efficiente.

Applicazioni nella vita reale: traguardi recenti nell’archiviazione di dati nel DNA

Per illustrare la concretezza di questa possibilità (l’archiviazione di dati nel DNA), ti raccontiamo alcuni casi già realizzati. Per esempio, una casa editrice ha lanciato un libro codificato in DNA, confezionato in capsule di acciaio inossidabile e capace di conservarsi per migliaia di anni.

Questa tecnologia già suscita interesse tra organismi e aziende che cercano di archiviare informazioni vitali senza dipendere dal consumo energetico dei data center tradizionali.

Il DNA è almeno mille volte più compatto degli hard disk a stato solido. Per dimostrare fino a che punto sia compatto, i ricercatori hanno codificato in piccole quantità di DNA i 154 sonetti di Shakespeare, 52 pagine di musica di Mozart e un episodio della serie Netflix Biohackers.

I ricercatori hanno codificato in DNA opere come i sonetti di Shakespeare, la musica di Mozart e un episodio di una serie Netflix, dimostrando la sua fattibilità per archiviare informazione digitale.

Quest’anno (2025), i progressi in biotecnologia e calcolo molecolare hanno compiuto un salto con ricerche che risolvono alcune delle principali sfide affrontate dall’archiviazione digitale nel DNA.

Per esempio, un team di ricerca ha presentato un metodo basato su CRISPR-Cas9 che permette di effettuare accesso casuale a file digitali codificati in DNA, evitando la necessità di sequenziare tutto il materiale archiviato. Questo approccio, pubblicato recentemente sulla rivista scientifica Nature Communications, incorpora inoltre tecniche di apprendimento profondo per generare indirizzi molecolari che rendono possibili ricerche semantiche all’interno di un database di sequenze.

DNA bit dati IA archiviazione
Ogni nucleotide di DNA può codificare fino a 2 bit unici.

La validazione sperimentale ha incluso fino a 1,6 milioni di sequenze, dimostrando che è possibile recuperare informazione specifica in modo più efficiente, con implicazioni dirette per la scalabilità di questa tecnologia.

Gli scienziati lavorano per affrontare le sfide ancora aperte per l’archiviazione digitale nel DNA, ottenendo accesso casuale, ricerche semantiche e recupero massivo senza distorsioni.

Un altro studio, anch’esso pubblicato recentemente, ha introdotto la strategia denominata MPHAC-DIS (Massively Parallel Homogeneous Amplification of Chip-scale DNA for DNA Information Storage). Questo sistema permette di amplificare e recuperare dati di DNA su larga scala, senza distorsioni e con alta fedeltà, grazie a un processo parallelo su chip combinato con algoritmi di correzione basati su immagini.

I risultati mostrano che MPHAC-DIS potrebbe risolvere una delle limitazioni più critiche: la perdita di precisione e accessibilità durante la lettura di dati archiviati nel DNA. Questo avanzamento apre la strada ad applicazioni commerciali con costi più competitivi e tempi di accesso più affidabili.

Riferimenti della notizia

Hyun-Jung Kim, et al. "Random access and semantic search in DNA data storage". Nature Communications. Febbraio 2025.

Xiaolong Shi, et al. "Massively parallel homogeneous amplification of chip-scale DNA for DNA Information Storage (MPHAC-DIS)". Nature Communications. Gennaio 2025.

Maddie Bender. "DNA could revolutionize how we store our data". National Geographic – Science. 21 agosto 2025.