AI-based semantic analysis of Italian radiology reports related to oncological diseases for supporting Tumor Board discussions and diagnoses (BioCONCEPTUM)
Brescia, 2023 - 2025
PNRR per la Missione 4, Componente 2, Investimento 1.1 - Avviso 104/2022 - Prot. 2022AEEKXS - CUP J53D23007080008 - Finanziato dall'Unione Europea Next Generation EU
Gli esami di imaging medico, in particolare la Risonanza Magnetica (MRI), interpretati dai radiologi sotto forma di referti testuali, sono utilizzati per produrre e confermare diagnosi nella pratica clinica a diversi livelli. La capacità di identificare in modo accurato e rapido le informazioni disseminate nelle narrazioni dei radiologi ha il potenziale di ridurre i carichi di lavoro, supportare i clinici nei processi decisionali, prioritizzare i pazienti per cure urgenti o identificare e raggruppare i pazienti per scopi di ricerca. Questo aspetto è particolarmente critico nel contesto delle Tumor Board, gruppi multidisciplinari composti da diversi specialisti, che si riuniscono regolarmente per discutere i casi di pazienti oncologici che potrebbero necessitare di trattamenti pre/post-operatori e per prendere decisioni diagnostiche e terapeutiche.
Tuttavia, è ancora difficile accedere e analizzare i referti di radiologia in modo efficace ed efficiente su larga scala, a causa della loro natura non strutturata, della concisione e spesso della cripticità del gergo medico utilizzato, oltre che delle conoscenze di base generalmente richieste per interpretarli correttamente e trarre conclusioni di alto livello.
In questo contesto, il ramo dell'Intelligenza Artificiale dedicato all'elaborazione del linguaggio naturale (NLP) può essere fondamentale per superare queste problematiche e derivare automaticamente conoscenze, con il potenziale di migliorare l'intero processo sanitario. L'obiettivo di BioCONCEPTUM è quindi quello di ricercare e sviluppare uno strumento basato sull'intelligenza artificiale per analizzare i referti di radiologia medica relativi allo screening di disturbi oncologici, con un caso studio relativo a centinaia di referti italiani di Risonanza Magnetica per il cancro colorettale, forniti dai partner clinici del consorzio (ospedali Gemelli e San Raffaele).
Ciò viene realizzato attraverso una combinazione di NLP statistico, corpora e modelli linguistici dipendenti dalla lingua e gli ultimi sviluppi sulle reti neurali, con l'obiettivo di ottenere sia un significativo avanzamento degli strumenti di NLP biomedico sia la creazione di un archivio semantico indicizzato di referti radiologici, consultabile e interrogabile in modo flessibile tramite un'interfaccia dedicata ai medici durante le discussioni delle Tumor Board, supportandoli nella diagnosi e nel trattamento.
BioCONCEPTUM si propone di analizzare semanticamente i referti delle risonanze magnetiche ed estrarre informazioni sulle malattie per la sorveglianza di pazienti e patologie, tra cui caratteristiche dei tumori, etichette anatomiche, misurazioni e descrittori degli organi (forma, dimensioni ecc.) e valutazioni mediche (benignità/malignità ecc.). Tali informazioni saranno anche associate a entità rilevanti provenienti da repository biomedici, inclusi il National Cancer Institute Thesaurus, la Radiology Gamuts Ontology ecc.
Modelli di apprendimento automatico, come i transformer e i meccanismi di self-attention, vengono sfruttati per migliorare l'analisi dello strumento, perfezionandoli tramite l'addestramento su referti radiologici passati e repository biomedici. Questi ultimi saranno accessibili, analizzati e integrati sia per l'addestramento dei modelli sia per fornire una rappresentazione semantica coesa delle informazioni estratte.
Working group:
- Daniele Toti - Responsabile scientifico UCSC
- Francesco Deodato
- Andrea Pozzi
- Ilaria Nacci
- Alessandro Incremona
Partners:
- Università degli Studi di Salerno
- Università degli Studi della Basilicata
- Università Vita-Salute San Raffaele
Sede: Brescia
Area Scientifica: scienze matematiche e informatiche
Responsabile scientifico: Daniele Toti
Periodo di svolgimento della ricerca: 2023 - 2025