Intelligenza artificiale nella diagnostica senologica: pronta per il prime time?

Al Breast Club il punto sull’IA nella diagnostica per immagini. La centralità del ruolo del radiologo nelle decisioni cliniche.
Si sente tanto parlare di intelligenza artificiale applicata alla medicina, in particolare alla diagnostica. E tutto sembra a portata di mano. Ma non è così, neppure in uno dei campi più avanzati, quello della diagnostica radiologica. Ma avere le idee chiare su quelli che sono i gap da colmare aiuterà a coprire prima le distanze tra il wishful thinking e la pratica clinica. Mancano studi di Health Technology Assessment (HTA) e cost-effectiveness. Troppo ampio il gap tra le popolazioni studiate nei trial clinici e quelle del real-world. Infine, resta da capire se, in ambito di diagnostica radiologia ci si potrò affidare a software ‘plug in’, capaci di funzionare su tutte le macchine o se, ogni azienda produttrice dei macchinari radiologici svilupperà un suo sistema di IA ‘built in’. Ma in questo caso saranno necessari studi di confronto head to head per valutare l’affidabilità dei diversi sistemi, in diversi contesti clinici. Infine, meritano grande attenzione anche le istanze medico-legali ed etiche. Ma la strada sembra segnata e il punto di non ritorno è già stato superato, anche se il radiologo in carne e ossa ‘is here to stay’. Il punto della situazione è stato fatto durante un Breast Club al Policlinico Gemelli, ospitato dal professor Gianluca Franceschini, dal titolo ‘AI that helps, not hypes’.
Nove anni fa, Geoffrey Hinton, premio Nobel per la fisica 2024 per i suoi studi sul machine learning, sconvolse la comunità scientifica dicendo: “smettete di formare radiologi, perché è ovvio che l’intelligenza artificiale renderà il loro lavoro completamente obsoleto da qui a cinque anni”. Una profezia che si è rivelata un po’ azzardata, ma che, in ogni caso ha gettato un sasso nello stagno di chi viveva tranquillo nella sua comfort zone. Dalla quale oggi è prepotentemente chiamato ad uscire, per esplorare il futuro della diagnostica, che parla sempre più il linguaggio dell’intelligenza artificiale. L’IA nella diagnostica radiologica in senologia è stato il tema al centro di un recente Breast Club’, organizzato dal professor Gianluca Franceschini,Ordinario di Chirurgia Generale all’Università Cattolica del Sacro Cuore, Direttore della UOC di Chirurgia Senologica e del Centro Integrato di Senologia di Fondazione Policlinico Gemelli IRCCS.
“L’intelligenza artificiale all’inizio è stata qualcosa che ci ha spaventato – ammette la professoressa Evis Sala, Ordinario di Radiologia all’Università Cattolica del Sacro Cuore e Direttrice del Dipartimento di Diagnostica per Immagini e Radioterapia del Policlinico Gemelli- soprattutto alla luce della ‘profezia’ di Hinton. Eppure a distanza di dieci anni da quelle sue affermazioni, siamo ancora qui a fare i radiologi. Certo, dobbiamo confrontarci ogni giorno con l’IA ormai, ma la dobbiamo usare in modo critico e rivalutarne sempre i risultati, quando la utilizziamo. Perché a oggi il gold standard rimane l’interpretazione del radiologo (esperto). Le novità devono avere un valore aggiunto in clinica; se questo non accade, allora non servono”.
Risk assessment. “Uno dei campi dove prevediamo che l’IA avrà un grosso impatto e una delle sue prime applicazioni – afferma la dottoressa Anna D’Angelo, radiologo di Fondazione Policlinico Gemelli IRCCS, esperta di IA - sarà nello screening mammografico, strumento imprescindibile per la diagnosi precoce di questo tumore, che rappresenta la principale causa di morte nelle donne (se diagnosticato in fase precoce questo tumore ha una sopravvivenza a 5 anni dell’80-90%; se la diagnosi è tardiva invece la sopravvivenza crolla al 28%), ma che si scontra con la penuria planetaria di radiologi senologi e con l’elevatissimo numero di mammografie effettuate ogni anno (solo negli Usa, 40 milioni l’anno). Mancano insomma risorse umane ed economiche per implementare adeguatamente lo screening mammografico. In quest’ambito l’IA potrebbe aiutare in diversi ambiti: dal triage (l’IA consente di fare una valutazione del rischio più accurato), alla diagnosi (migliora accuratezza ed efficacia dello screening soprattutto in caso di tessuto mammario molto denso). L’IA infine potrebbe orientare verso trattamenti personalizzati e strutturati sul singolo paziente.
Lo studio MIRAI sulla valutazione del rischio attraverso lo screening supportato da IA, dimostra una superiorità dell’IA, rispetto al radiologo, nel fare una corretta predizione di rischio di tumore della mammella a 5 anni, basandosi su dati clinici e imaging. Un altro tipo di risk assessment riguarda l’indicazione ad effettuare indagini radiologiche supplementari (ad es. risonanza magnetica con mdc, RMN), ogni 3-4 anni, dai 50 ai 70 anni, nel caso di donne con un seno estremamente denso. Purtroppo è chiaro che non c’è la possibilità di fare RMN ad una popolazione così ampia; è necessario affinare le indicazioni e riservare questo esame supplementare alle pazienti che maggiormente potranno beneficiarne. In questo caso l’IA può essere d’aiuto? Lo studio ScreenTrust-MRI (Salim 2024) suggerisce di sì”.
Cancer detection. Perché un algoritmo di IA riesca a individuare con precisione la presenza di un tumore, magari molto piccolo e in un seno molto denso, deve essere ben ‘istruito’. “Il suo ‘allenamento’ – spiega la dottoressa D’Angelo - viene fatto su un ‘training set’, per poi essere testato su un ‘test set’. Il training set è un po’ la palestra dell’algoritmo, dove impara le cose che deve andare a riconoscere: non solo gli si mostra il caso, ma gli si fornisce anche la risposta. Il ‘test set’ invece è il banco di prova: all’algoritmo viene presentato un caso, chiedendogli di formulare una diagnosi per vedere se ha imparato bene a riconoscere il tumore. Infine c’è il ‘ground truth’, che è solitamente l’esame istologico (o il follow-up a 1-2 anni) che rappresenta la prova del nove, rispetto alla diagnosi”. Il benchmark di tutto questo sistema di apprendimento è il radiologo (si confronta sempre la risposta data dall’IA con quella data da un radiologo esperto, nella fase di ‘istruzione’ dell’IA). Se il sistema di IA è ben istruito, performerà meglio dei radiologi, portando ad una riduzione dei falsi positivi e dei falsi negativi nelle sue letture.
Molto importante a questo riguardo è lo studio MASAI, randomizzato e controllato, che è andato a valutare la lettura di 80.000 mammografie, fatte dall’IA e dal radiologo. “Il tasso di cancer detection – ricorda la dottoressa D’Angelo - è risultato simile tra IA e radiologo, ma il carico di lavoro (umano) è risultato ridotto del 44,3%, con la lettura attraverso l’algoritmo di IA”.
Sulla carta dunque è tutto pronto per il prime time dell’IA nella pratica radiologica quotidiana. Ma è proprio così? “Purtroppo no - ammette la dottoressa D’Angelo -. C’è ancora un gap enorme tra la ricerca e lo sviluppo scientifico dei sistemi di IA e la loro applicazione nella pratica clinica quotidiana. Ancora è tutto molto sbilanciato sul versante della ricerca, mentre l’utilizzo clinico non sembra vicinissimo. Uno dei motivi è che mancano studi di Health Technology Assessment (HTA). Una recente revisione sistematica (Uwimama, 2025) su 104 studi sul machine learning (un tipo di IA) ha evidenziato che solo il 14% di questi studi dimostra la reale riproducibilità di un determinato modello di IA a livello internazionale. Ancora più problematici sono gli aspetti etici e legali dell’applicazione dei sistemi di IA, per non parlare dei costi dello sviluppo di questi sistemi, valutati da meno dell’1% di questi studi”.
I limiti attuali dell’IA. “Questi sistemi – prosegue la dottoressa D’Angelo - hanno delle performance molto forti, limitatamente però agli studi sperimentali e su un gruppo scelto di persone; manca la validazione sul real-world. I sistemi attuali insomma non tengono conto della complessità dei dati del mondo reale e questo crea dunque aspettative non realistiche sull’IA”.
Per traslarli alla pratica clinica c’è bisogno di evidenze forti rispetto ai dati del mondo reale e di una solida costo-efficacia; manca inoltre una standardizzazione nel fare un report dei risultati dell’IA, che non rende trasparenti e comparabili questi dati tra centri diversi.
Qual è l’affidabilità dei risultati radiologici letti dall’IA? Se lo è chiesto il VAI.B study che dimostra come la performance di questi sistemi varia, al variare della popolazione clinica reale. Molto importante inoltre è la scelta del vendor, perché c’è grande variabilità tra un sistema e l’altro.
Per quanto riguarda il versante umano, uno dei problemi da smarcare è il cosiddetto errore di automazione. “Questo si verifica – spiega la dottoressa D’Angelo - quando seguiamo i risultati proposti dall’IA in maniera automatica e acritica. Uno studio ha sottoposto delle mammografie di screening a tre categorie di radiologi (esperti, con esperienza intermedia ed inesperti) supportati dalle letture eseguite da IA (alcune corrette altre volutamente errate). I radiologi esperti hanno impiegato più tempo dei radiologi inesperti nelle letture, e sebbene abbiano riportato un maggior tasso di risposte corrette rispetto alle altre due categorie di radiologi, sono caduti anch’essi nell’errore di automazione, seguendo l’IA nei casi falsi negativi. La performance delle tre categorie di radiologi è risultata invece similare quando l’IA ha suggerito risposte corrette, consentendo al radiologo inesperto di avere una performance simile al radiologo esperto”.
“In conclusione – commenta la dottoressa D’Angelo - l’IA avrà un ruolo cardine nel futuro dello screening senologico, aumenterà la cancer detection rate e ridurrà il carico di lavoro, il tempo di lettura e refertazione, migliorando l’efficienza del work flow. Per ottenere tutto questo però c’è bisogno di arrivare a performance che non siano solo tecniche, ma che siano validare in clinica, in ambito real-world. Sarà necessaria una valutazione accurata anche delle dinamiche di interazione uomo-IA, per assicurare accuratezza e safety per il paziente. Di certo, i radiologi dovranno acquisire nuove skills ed essere educati ad interpretare in maniera critica i risultati generati dall’IA e a gestire i bias di automazione. Ad oggi infine, manca ancora un’approfondita valutazione di costo-efficacia e dell’impatto sull’ecosistema sanitario, che lo sviluppo di questi sistemi di IA comportarà”.
“Oltre all’oncologia di precisione, che ha portato ad una de-escalation chirurgica in senologia – commenta il professor Gianluca Franceschini - probabilmente anche l’IA potrà contribuire ulteriormente a ridurre il ricorso alla chirurgia, individuando ad esempio tra due carcinomi duttali in situ quello che va assolutamente operato e quello passibile di monitoraggio. L’IA probabilmente a breve ci suggerirà anche il tipo di intervento chirurgico più adeguato e il tipo di ricostruzione da effettuare, nel caso di una mastectomia. Un altro ambito di impatto potrebbe essere sulle liste operatorie; l’IA potrebbe aiutarci a dare priorità alle pazienti a maggior rischio, sulla base di una serie di dati oggettivi, semplificando la lista operatoria settimanale”.
“Nei nuovi standard Joint Commission International – rivela l’Ingegner Alberto Fiore, Responsabile UOS Qualità e Accreditamento di Fondazione Policlinico Gemelli - ne è stato introdotto anche uno dedicato all’IA che afferma che l’IA può essere usata, a patto che i suoi risultati vengano valutati, perché bisogna definire bene i suoi limiti. Ma se l’IA è abbastanza sicura per scrivere una lettera di dimissione, più problematico è affidarsi ad una sua diagnosi, ad esempio radiologica. È necessario strutturare un processo di valutazione e studi di HTA. JCI vuole la prova che queste valutazioni siano state effettivamente condotte e che vengano registrati eventuali bias, emergenti da queste valutazioni perché potrebbero essere utili per addestrare l’IA”. L’IA insomma in medicina può già essere utilizzata con prudenza. Ma in maniera consapevole.
Maria Rita Montebelli
Nella foto in anteprima: da sin Francesco Micciché, Gianluca Franceschini, Evis Sala, Anna D'angelo, Maria Antonietta Gambacorta, Graziano Onder.
