Limiti e possibilità dell’IA nel mondo della salute: il progetto SPAS
SUPSI Image Focus
L'applicazione di algoritmi di IA nel mondo della salute presenta sfide e complessità uniche che richiedono una considerazione attenta e l'intervento di gruppi di ricerca specializzati. I dati clinici possono essere estremamente variabili e complessi. Gli algoritmi devono essere in grado di gestire questa diversità e adattarsi a una vasta gamma di scenari clinici.
L’esperienza, la conoscenza e le necessità del medico vanno integrate in questi algoritmi di IA. Le necessità e le prospettive di tutti gli attori coinvolti in un progetto di ricerca in ambito medicale, dal medico al paziente, dal ricercatore al produttore del servizio, vanno attentamente considerate.
Il progetto SPAS è un esempio emblematico di tali problematiche e necessità.
L’esperienza, la conoscenza e le necessità del medico vanno integrate in questi algoritmi di IA. Le necessità e le prospettive di tutti gli attori coinvolti in un progetto di ricerca in ambito medicale, dal medico al paziente, dal ricercatore al produttore del servizio, vanno attentamente considerate.
Il progetto SPAS è un esempio emblematico di tali problematiche e necessità.
I disturbi del sonno sono aumentati notevolmente negli ultimi anni. Un’indagine dell’Ufficio federale di statistica rileva che il 23% della popolazione, una persona su tre, ha disturbi occasionali del sonno, mentre il 5% ne soffre a livello cronico. Considerato l’insieme della popolazione nazionale, sono quindi 300'000 le persone afflitte da questi disturbi.
Gli esperti ne hanno catalogato oltre 80 tipologie differenti, ma quelle principali sono l’insonnia (difficoltà di addormentamento), l’ipersonnia (stato di sonnolenza durante la giornata), i disturbi respiratori (ad esempio apnee notturne), le parasonnie (sonnambulismo), il disturbo sonno-veglia e i disturbi motori.
Gli esperti ne hanno catalogato oltre 80 tipologie differenti, ma quelle principali sono l’insonnia (difficoltà di addormentamento), l’ipersonnia (stato di sonnolenza durante la giornata), i disturbi respiratori (ad esempio apnee notturne), le parasonnie (sonnambulismo), il disturbo sonno-veglia e i disturbi motori.
La polisonnografia
Per i casi ritenuti abbastanza gravi viene raccomandata una polisonnografia. Il paziente dorme in ospedale dove vengono monitorati e registrati una serie di parametri bio-fisiologici come l’attività cerebrale (EEG), i movimenti oculari e muscolari, i livelli di ossigeno, l’attività cardiaca (ECG) e la respirazione. La registrazione polisonnografica è poi suddivisa in “epoche” di 30 secondi ciascuna. Durante un'analisi visiva, a ogni epoca viene assegnata una fase del sonno, seguendo le regole dell’American Academy of Sleep Medicine (AASM). Questo lavoro preliminare di analisi, abbastanza noioso, ripetitivo e regolato da standard ben definiti, può richiedere fino a due ore di tempo.
Sembra quindi un compito adatto per gli algoritmi di intelligenza artificiale, che infatti vengono applicati alla classificazione delle fasi del sonno già da molti anni.
Ad oggi esistono diversi software che offrono servizi di classificazione automatizzati o semi-automatizzati. Tuttavia, la loro diffusione tra i professionisti è ancora piuttosto limitata. Di recente, grazie alla crescente potenza di calcolo a disposizione, è stato impiegato anche il deep learning – una tipologia di machine learning che si concentra sull'utilizzo di reti neurali più complesse - ottenendo risultati superlativi.
Ma allora. come mai questi algoritmi non sono ancora entrati nella routine dei centri del sonno?
Il progetto SPAS
Per tentare di trovare una soluzione a questa domanda decennale è nato il progetto Sleep Physician Assistant System (SPAS).
Ne fanno parte il gruppo di ricerca Biomedical Signal Processing (BSP) dell’Istituto di tecnologie digitali per cure sanitarie personalizzate (MeDiTech), il Centro del sonno dell’Inselspital di Berna, l’Università di Berna, il NeuroTec Center del sitem-insel hanno unito le forze insieme a due ditte Europee Biomax (DE) e Relitech (NE) per la creazione di una piattaforma a supporto del lavoro degli operatori sanitari attivi nell’analisi dei disturbi del sonno.

Francesca Faraci, a capo del gruppo di ricerca BSP, ha spiegato da dove parte SPAS: “il nostro obiettivo è ascoltare le necessità dei medici per velocizzare e migliorare il loro lavoro. Abbiamo automatizzato l’identificazione delle diverse fasi del sonno, raggiungendo altissimi livelli di precisione e accuratezza. Siamo riusciti ad eguagliare risultati simili a quelli degli operatori umani, con la medesima distribuzione di variabilità (hipnodensity-graph). Tuttavia, abbiamo compreso che le reali problematiche dell’adozione di questi strumenti nella routine dei centri del sonno, vanno ben oltre alla performance degli algoritmi”.
Il vero problema: l’incertezza intrinseca dei dati
Le fasi del sonno, secondo il manuale dell’AASM, globalmente riconosciuto, sono cinque: la fase di veglia (W awake); la fase di passaggio tra veglia e sonno che dura solo alcuni minuti (fase N1); la fase di preparazione al sonno profondo (fase N2); la fase del sonno profondo rigenerativo (fase N3); e la fase dove si sogna (fase REM). Un ciclo completo di sonno (dalle fasi 1-2-3-REM) può durare circa 90-110 minuti, e una persona può passare attraverso diversi cicli di sonno (4-5 cicli) durante la stessa notte. La qualità del sonno è influenzata da molti fattori, tra cui la durata complessiva del sonno e la quantità di tempo trascorsa in ciascuna fase.
Se un medico categorizza come N1 una certa epoca di 30 secondi (finestra temporale o fase del sonno), e un suo collega categorizza come N2 la stessa epoca, i dati utilizzati dall’algoritmo saranno discordanti. Questo non significa che uno dei due medici abbia torto: entrambi possono avere ragione, interpretando però in maniera differente e secondo la loro esperienza o prospettiva le direttive standard. Infatti, le direttive dell’AASM lasciano spazio al giudizio soggettivo del medico. Si rileva quindi un margine medio di variabilità di circa il 20%, tra un operatore e un altro, e del 10% tra lo stesso operatore che analizza due volte il medesimo tracciato.
Questa variabilità di valutazione si traduce in una variabilità dei dati di addestramento (in gergo tecnico, training set), e impedisce all’algoritmo di raggiungere dei risultati soddisfacenti per tutti i medici del sonno. Ad oggi è stato possibile ottenere e modellare la stessa distribuzione di incertezza dell’essere umano; è stato raggiunto il massimo possibile con un algoritmo di IA allenato con un approccio di apprendimento supervisionato. Nello specifico, un approccio di apprendimento supervisionato consiste nell’allenare un algoritmo sulla base delle categorie (nel caso specifico fasi del sonno - tecnicamente chiamate classi o labels) che sono state assegnate dall’esperto umano per ogni epoca di 30 secondi.
Come in ogni ambito in cui è impiegata l’intelligenza artificiale la qualità dei dati è centrale.
Luigi Fiorillo ricercatore SUPSI, che ha svolto il suo Dottorato all’interno di questo progetto, evidenzia come “i risultati potrebbero migliorare notevolmente se gli standard fossero più stringenti e non lasciassero spazio a interpretazioni soggettive, diminuendo dunque l’incertezza. Essendo questo impossibile per diverse ragioni, una soluzione potrebbe essere quella di affidarsi agli algoritmi in maniera parziale: agli algoritmi il compito di prendere le decisioni semplici, e al medico la responsabilità di occuparsi delle decisioni più complesse – neii casi in cui sia gli algoritmi che l’essere umano hanno un'incertezza elevata. In questo modo il medico potrebbe velocizzare la valutazione delle polisonnografie, ma mantenere l’ultima parola nell’analisi dei casi complessi”.
Sistemi ancora poco diffusi
Al momento i sistemi automatizzati e semiautomatizzati per la caratterizzazione delle fasi del sonno non sono ancora pienamente adottati nei centri specializzati. Ancora Francesca Faraci “i motivi sono molteplici. C’è sicuramente una certa diffidenza nei confronti della tecnologia da parte del settore sanitario, in particolare quando interviene nel processo di diagnosi. Inoltre, i metodi basati sul deep learning sono considerati una “black-box”, in quanto ad oggi il funzionamento degli algoritmi non è facilmente interpretabile. Molti ricercatori stanno cercando di rendere il funzionamento meno opaco, ma c’è ancora molta strada da fare. Ci sono anche ragioni legate a una bassa usabilità dei software presenti oggi sul mercato, troppo poco intuitivi, e difficilmente integrabili con i sistemi informatici esistenti nei vari ospedali. Altri motivi sono legati alla gestione della sicurezza dei dati, che spesso richiedono di essere caricati nel cloud o in server esterni: un’azione scoraggiata dalle politiche di protezione dei dati e dai fornitori di servizi sanitari. Confidiamo però che nel prossimo futuro si possano superare queste e altre sfide di natura non solo tecnica, al fine di costruire insieme agli esperti del settore una soluzione in grado di agevolare e potenziare il loro lavoro”.
Il progetto ha dato vita a diverse pubblicazioni su riviste scientifiche di alto impatto.