Uno dei parametri più importanti nel determinare il tipo di terapia migliore per trattare il cancro è la conoscenza del suo sito di origine, ovvero della sede primaria di oncogenesi. Tuttavia, in una percentuale variabile tra il 3 per cento e il 5 per cento dei casi, in particolare nei casi in cui i tumori si sono metastatizzati in tutto il corpo, gli oncologi non hanno un modo semplice per determinare da dove ha avuto origine il cancro. Questi tumori sono classificati come tumori di primaria sconosciuta (CUP). La mancanza di conoscenza del sito di origine di un tumore spesso impedisce ai medici di essere in grado di somministrare ai pazienti farmaci “di precisione”, che sono generalmente approvati per specifici tipi di cancro in cui sono noti per funzionare. Questi trattamenti mirati tendono a essere più efficaci e hanno meno effetti collaterali rispetto ai trattamenti generici e a maggiore tossicità che sono comunemente prescritti ai pazienti affetti da CUP.
Per questo motivo, un gruppo di ricerca dell’Istituto Dana-Farber negli Stati Uniti ha deciso di provare ad usare il profilo genetico dei tumori per esaminarne la possibile correlazione con il sito di origine, a partire da circa 400 geni comunemente mutati nel cancro ed il cui stato è esaminato nelle analisi di routine di quell’istituto. I risultati sono stati pubblicati su Nature Medicine; da questi, apprendiamo che i ricercatori hanno addestrato un modello di apprendimento automatico sui dati di quasi 30.000 pazienti a cui era stato diagnosticato uno fra 22 tipi di cancro più comuni conosciuti. Quella serie di dati includeva pazienti del Memorial Sloan Kettering Cancer Center e del Vanderbilt-Ingram Cancer Center, oltre che del Dana-Farber.
I ricercatori hanno quindi testato il modello risultante su circa 7.000 tumori che non erano nel set usato per l’addestramento, il cui sito primario di origine era noto. Il modello, che i ricercatori hanno chiamato OncoNPC, è stato in grado di prevedere le loro origini con una precisione di circa l’80 per cento. Per i tumori con previsioni ad alta confidenza, che costituivano circa il 65 per cento del totale, la sua accuratezza è salita a circa il 95 per cento. Dopo questi risultati incoraggianti, i ricercatori hanno utilizzato il modello per analizzare una serie di circa 900 tumori di pazienti affetti da CUP, tutti provenienti da Dana-Farber. Hanno scoperto che per il 40 per cento di questi tumori, il modello era in grado di fare previsioni ad alta affidabilità. I ricercatori hanno quindi confrontato le previsioni del modello con un’analisi delle mutazioni germinali, o ereditarie, in un sottoinsieme di tumori con i dati disponibili, che possono rivelare se i pazienti hanno una predisposizione genetica a sviluppare un particolare tipo di cancro. I ricercatori hanno scoperto che le previsioni del modello avevano molte più probabilità di corrispondere al tipo di cancro più fortemente previsto dalle mutazioni germinali rispetto a qualsiasi altro tipo di cancro.
Per convalidare ulteriormente le previsioni del modello, i ricercatori hanno confrontato i dati sul tempo di sopravvivenza dei pazienti CUP con la prognosi tipica per il tipo di cancro previsto dal modello. Hanno scoperto che i pazienti con CUP a cui si prevedeva di avere un cancro con una prognosi infausta, come il cancro al pancreas, mostravano tempi di sopravvivenza corrispondentemente più brevi. Allo stesso tempo, i pazienti con CUP per i quali si prevedeva di avere tumori che in genere hanno prognosi migliori, come i tumori neuroendocrini, mostravano tempi di sopravvivenza più lunghi. Il tempo di sopravvivenza nei pazienti con tumori misteriosi, cioè, era coerente con le previsioni circa l’origine del tumore fatto dal sistema di apprendimento automatico.
Un’altra indicazione che le previsioni del modello potrebbero essere utili è venuta dall’osservazione dei tipi di trattamenti che i pazienti CUP analizzati nello studio avevano ricevuto. Circa il 10 per cento di questi pazienti aveva ricevuto un trattamento mirato, basato sulla migliore ipotesi dei loro oncologi sull’origine del cancro. Tra questi pazienti, quelli che hanno ricevuto un trattamento coerente con il tipo di cancro previsto dal modello hanno avuto risultati migliori rispetto ai pazienti che hanno ricevuto un trattamento generalmente somministrato per un tipo di cancro diverso da quello previsto dal modello. Usando questo modello, i ricercatori hanno anche identificato un ulteriore 15 per cento di pazienti (aumento di 2,2 volte) che avrebbe potuto ricevere un trattamento mirato esistente, se il loro tipo di cancro fosse stato conosciuto, invece di ricevere un trattamento generico, a causa della mancata identificazione del sito di origine del tumore.
Questa percentuale rappresenta il miglioramento che si potrebbe ottenere nel trattamento, se lo strumento fosse utilizzato in accompagnamento ai normali criteri diagnostici, ai fini di identificare la terapia migliore per i pazienti CUP. Visti i risultati incoraggianti sin qui ottenuti, è possibile pensare ad un’ulteriore espansione della capacità diagnostiche e di indirizzo terapeutico del modello. In particolare, si potrebbero includere altri tipi di dati, come immagini patologiche e immagini radiologiche, per fornire una previsione più completa utilizzando più modalità diagnostiche. Ciò potrebbe consentire di affinare non solo l’identificazione del tipo di tumore e la previsione prognostica, ma potenzialmente anche il trattamento ottimale, con una probabilità maggiore per una classe di tumori di difficile classificazione, la quale, come abbiamo visto, può arrivare ad interessare fino ad un paziente oncologico ogni 20. Se le promesse saranno mantenute sul campo, queste applicazioni dell’apprendimento automatico e dell’intelligenza artificiale potranno essere disponibili in tempi relativamente brevi; a patto, naturalmente, che i medici siano pronti ad accoglierle e siano messi nelle migliori condizioni per farlo, invece di continuare a rendere il loro lavoro sempre più difficile nel nostro paese.