Il contributo, sviluppato dai ricercatori SUPSI Giacomo Del Rio e Alessandro Antonucci e dal dottorando USI Ardian Selmonaj, attivi all’Istituto Dalle Molle di studi sull’intelligenza artificiale (IDSIA USI-SUPSI), in collaborazione con Adrian Schneider, Scientific Project Manager di Armasuisse, analizza la simulazione realistica di combattimenti aerei.
Questi scenari sono caratterizzati da una elevata complessità e incertezza: da un lato ci si confronta con informazioni parziali o incomplete che rendono difficile una valutazione accurata della situazione e degli avversari, dall’altra con dinamiche di volo non lineari, in cui variazioni anche minime nei comandi possono produrre effetti difficilmente prevedibili sul comportamento del velivolo.
Per affrontare queste sfide, il lavoro Coordinated Strategies in Realistic Air Combat by Hierarchical Multi-Agent Reinforcement Learning introduce un nuovo ambiente di simulazione tridimensionale e un framework basato sull’ “apprendimento per rinforzo multi-agente gerarchico”.
L’approccio combina agenti con dinamiche e caratteristiche eterogenee, modalità di apprendimento graduali e progressive (curriculum learning) e meccanismi di league play, che consentono di confrontarsi con strategie diverse e migliorare la propria capacità di adattamento. Il tutto supportato da un algoritmo di addestramento progettato appositamente per rendere i processi decisionali più robusti, scalabili e affidabili.
Il processo decisionale viene così organizzato su due livelli: uno inferiore, dedicato all’apprendimento di manovre di controllo precise e continue per governare le dinamiche del velivolo, e uno superiore per i comandi tattici orientati al coordinamento tra agenti e al raggiungimento degli obiettivi di missione. I risultati sperimentali dimostrano che questa struttura gerarchica migliora sia l’efficienza del processo di apprendimento, sia le prestazioni complessive negli scenari simulati.
La possibilità di testare, analizzare e validare comportamenti complessi in simulazione favorisce un uso più responsabile delle tecnologie, riducendo l’esposizione a situazioni potenzialmente rischiose e promuovendo pratiche di sviluppo più attente alla sicurezza, alla supervisione umana e alle implicazioni etiche.