Progetto didattico
Machine Learning per la modellazione dei dati di telerilevamento
SUPSI Image Focus
Il progetto si è svolto in collaborazione tra Istituto Dalle Molle di studi sull’intelligenza artificiale (IDSIA USI-SUPSI) e Sarmap SA, azienda specializzata nel remote sensing.
Lo scopo del progetto è quello di generare automaticamente mappe di uso del suolo, a partire da sequenze di immagini acquisite via satellite.
In particolare, il satellite acquisisce periodicamente (ad esempio una volta alla settimana) l’immagine (optical imagery) di una certa area. L’immagine viene processata, generando per ogni pixel un vettore di misure che ad esempio quantificano la presenza di vegetazione (vegetation index) ed umidità del suolo. Contemporaneamente, vengono acquisiti anche segnali da sistemi SAR (Synthetic Aperture Radar), che vengono a loro volta processati estraendo altri indicatori. I segnali estratti da optical imagery a dal SAR si riferiscono a date diverse e portano informazioni complementari.
Su ogni pixel otteniamo quindi diverse time series, che descrivano come ogni indicatore evolve durante la stagione.
L’obiettivo è di stimare l’uso del suolo associato ad ogni punto dell’immagine (ad esempio, coltura di riso, avena, frumento, girasole, urbanizzato, etc) analizzando all’andamento nel tempo del segnale SAR e del segnale ottico. In machine learning questo problema è noto come time series classification.
Lo studente di Master che ha partecipato a questo progetto ha lavorato alla fase di data engineering, necessaria per gestire le grandi quantità di dati del progetto. Ha poi controbuito a sviluppare la parte di machine learning, svolgendo esperimenti e discutendone i risultati in modo critico con il tutor.
Infine ha partecipato al deployment, che ha richiesto di ingegnerizzare i metodi di machine learning in modo da rispettare dei vincoli di memoria posti dall’azienda.
Si sono ottenuti ottimi risultati, con un’accuratezza di classificazione superiore al 95% nella predizione di anni non inclusi nei dati di training.
Il classificatore rimane molto accurato anche facendo la predizione a metà stagione anziché a fine stagione agricola, e gli errori sono solitamente poco gravi (colture simili vengono confuse).
Gli algoritmi sono stati integrati all’interno dei prodotti sviluppati dall’azienda.
In particolare, il satellite acquisisce periodicamente (ad esempio una volta alla settimana) l’immagine (optical imagery) di una certa area. L’immagine viene processata, generando per ogni pixel un vettore di misure che ad esempio quantificano la presenza di vegetazione (vegetation index) ed umidità del suolo. Contemporaneamente, vengono acquisiti anche segnali da sistemi SAR (Synthetic Aperture Radar), che vengono a loro volta processati estraendo altri indicatori. I segnali estratti da optical imagery a dal SAR si riferiscono a date diverse e portano informazioni complementari.
Su ogni pixel otteniamo quindi diverse time series, che descrivano come ogni indicatore evolve durante la stagione.
L’obiettivo è di stimare l’uso del suolo associato ad ogni punto dell’immagine (ad esempio, coltura di riso, avena, frumento, girasole, urbanizzato, etc) analizzando all’andamento nel tempo del segnale SAR e del segnale ottico. In machine learning questo problema è noto come time series classification.
Lo studente di Master che ha partecipato a questo progetto ha lavorato alla fase di data engineering, necessaria per gestire le grandi quantità di dati del progetto. Ha poi controbuito a sviluppare la parte di machine learning, svolgendo esperimenti e discutendone i risultati in modo critico con il tutor.
Infine ha partecipato al deployment, che ha richiesto di ingegnerizzare i metodi di machine learning in modo da rispettare dei vincoli di memoria posti dall’azienda.
Conclusioni
Si sono ottenuti ottimi risultati, con un’accuratezza di classificazione superiore al 95% nella predizione di anni non inclusi nei dati di training.
Il classificatore rimane molto accurato anche facendo la predizione a metà stagione anziché a fine stagione agricola, e gli errori sono solitamente poco gravi (colture simili vengono confuse).
Gli algoritmi sono stati integrati all’interno dei prodotti sviluppati dall’azienda.