Come studente di dottorato in Germania mi sono occupato di determinare la struttura e la funzione di un pezzetto di RNA di un certo virus. Questo pezzetto di RNA aveva una particolare peculiarità: invece di essere tradotto in qualche proteina virale dal macchinario della cellula infetta, si ripiegava in una forma tridimensionale utile a legare certe proteine, e così controllare l’attività del genoma virale. Il punto importante per il lettore qui è uno: nella sequenza del genoma di un organismo, nel caso del mio virus costituito da un filamento di RNA, non è contenuta solo l’informazione che determina tutti i tipi di proteina che servono a costruire e far funzionare l’organismo stesso, ma anche quella che serve a determinare quando e quanto un certo gene debba essere tradotto in una corrispondente proteina. Le zone del genoma che non specificano la natura di una proteina, ma invece determinano la quantità e le condizioni in cui debba essere prodotta quella, si chiamano elementi regolatori, e appartengono alla vasta porzione del nostro genoma che non è tradotto in proteine, e si chiama DNA non codificante. Riempendosi inutilmente la bocca con un termine tecnico desunto dalla fisica, oggi va di moda chiamare questo 98% del nostro genoma che non codifica per proteine “materia oscura” genetica, a significare che non sappiamo ancora molto sul suo reale funzionamento e sul perché rappresenti una percentuale così ampia del nostro DNA; in ogni caso, come anche la mia tesi di dottorato ha contribuito a dimostrare, il nuovo termine alla moda è già meglio del precedente, “DNA spazzatura”, il quale assertivamente dava a intendere che le parti del genoma che non corrispondessero alla sequenza di alcuna proteina fossero in realtà un inutile orpello acquisito durante l’evoluzione.
Che il 95% del nostro genoma, fatto da DNA non codificante per proteine, non sia né spazzatura né poi così oscuro, giungono a dimostrarlo oggi due lavori pubblicati sulla stessa rivista – Nucleic Acid Research.
Nel primo, che rappresenta il culmine di un lavoro titanico durato venti anni, si è prodotta una mappatura dettagliata di tutti gli elementi regolatori contenuti nella sequenza che segue immediatamente il messaggio che corrisponde a ogni singola proteina prodotta da un verme microscopico molto usato come modello anche per le malattie umane, un nematode facile da studiare e maneggiare in laboratorio. Si tratta di un risultato enorme: per la prima volta è infatti disponibile per un organismo complesso, un animale, un’esplorazione sistematica e completa di una parte del “DNA spazzatura” che in realtà fornisce all’organismo l’enorme flessibilità necessaria per utilizzare la sua informazione genetica, alterando il modo, la quantità e le condizioni in cui ciascun singolo gene è trasformato in una corrispondente proteina. L’accesso ai dati ottenuti è stato reso disponibile alla comunità scientifica in modo strutturato, immediato e facilmente automatizzabile, così che adesso tutti potranno cominciare ad analizzare la ragnatela di interazioni regolatorie alla base dei più disparati processi fisiologici e patologici, comuni all’umile verme nematode come all’uomo e a moltissime altre specie.
Che cosa possa riservare questa esplorazione, è chiaro dal secondo lavoro, che riguarda un altro tipo di elementi regolatori sempre ascritti a quello che precipitosamente era stato battezzato “DNA spazzatura”. In questo lavoro, gli autori hanno studiato alcune regioni conservate nel genoma non codificante, precedentemente identificate come conservate in molti tipi di cellule e di organismi diversi. Queste regioni sono riconosciute da una certa proteina che, legando simultaneamente più di una regione bersaglio, ripiega il DNA in modi specifici, come farebbe una clip che congiunga fra loro due punti distanti di un filo. Ora, il modo in cui il DNA si ripiega in una nostra cellula è fondamentale per controllare la sua attività: ricordando che in ogni cellula sono racchiusi filamenti di DNA per una lunghezza totale di circa due metri, è evidente che controllare le parti “arrotolate” e quelle lasciate libere nell’incredibilmente compatto gomitolino di DNA serve a stabilire quali tratti di genoma sono accessibili per fare le proteine corrispondenti, e quali invece no.
Bene: i ricercatori hanno ipotizzato che se le sequenze conservate che fungono da punti di ancoraggio per la proteina che ripiega il DNA dovessero risultare difettose, ciò potrebbe variare il modo in cui il DNA può raggomitolarsi, disturbando quindi la regolazione delle proteine regolate attraverso questo meccanismo, e contribuire a patologie quali il cancro. I ricercatori hanno quindi valutato più di 3.000 campioni di tumore provenienti da pazienti con diagnosi di 12 tipi di cancro, disponibili nel database dell’International Genome Consortium, e hanno scoperto che proprio le regioni di ancoraggio che determinano il corretto raggomitolarsi del DNA erano sostanzialmente sempre mutate nel cancro. Ogni singolo campione di cancro aveva cioè almeno una mutazione in un sito di legame per la particolare proteina che serve a ripiegare il lugo filamento di DNA, oggetto dello studio.
Adesso, si tratta di capire in dettaglio quali meccanismi cellulari sono alterati dalle mutazioni identificate: è chiaro, tuttavia, che nella stragrande maggioranza dei pazienti, in molti tipi di cancro diversi, le stesse mutazioni del “DNA spazzatura” sono in realtà di enorme significato, e possono aprire la strada a terapie “universali” per patologie oncologiche fra loro diversissime. Altro che “spazzatura” o “materia oscura”: è sempre più evidente come, tolta la minima parte di informazione genetica che serve a specificare quali sono le proteine a disposizione, il resto consiste in una sterminata quantità di informazione che è cruciale per costruire un organismo e farlo funzionare, aumentando di ordini di grandezza la complessità di quanto si può ottenere dal genoma.