I circuiti fotonici integrati su microchip di silicio di dimensioni ridotte consentono di realizzare unità di calcolo altamente efficienti dal punto di vista energetico, aprendo la strada alla realizzazione di reti neurali a basso consumo. Lo ha dimostrato uno studio del Politecnico di Milano, condotto insieme all’Università di Stanford e pubblicato dalla prestigiosa rivista Science. Oltre alle applicazioni nel campo delle reti neurali, il dispositivo sviluppato può essere utilizzato come unità di calcolo per molteplici applicazioni in cui sia richiesta elevata efficienza computazionale, ad esempio per acceleratori grafici, coprocessori matematici, data mining, crittografia e computer quantistici. Il Politecnico di Milano collabora a questa attività di ricerca con il Photonic Devices Lab e con Polifab, il centro di micro e nanotecnologie dell’Ateneo.
Circuiti fotonici per reti neurali altamente efficienti dal punto di vista energetico
Le reti neurali costituiscono la tecnologia alla base dei sistemi di apprendimento automatico e di intelligenza artificiale, che ci permettono di creare sistemi in grado di percepire l’ambiente, di intraprendere azioni autonome basate sull’esperienza precedente e di adattarsi rapidamente a condizioni in continuo cambiamento. Dal riconoscimento e sintesi vocale e di immagini, ai sistemi di guida autonoma e realtà aumentata, alla bioinformatica, al sequenziamento genetico e molecolare, alle tecnologie di high performance computing. Queste strutture di calcolo distribuito modellate sul cervello biologico sbloccano un’ampia gamma di applicazioni che mirano a raggiungere prestazioni cognitive di livello umano in tempi record.
Tuttavia, rispetto agli approcci di calcolo convenzionali, per svolgere funzioni complesse le reti neurali hanno bisogno di essere inizialmente addestrate (“training”) con un’elevata quantità di informazioni note, attraverso le quali la rete si adatta apprendendo dall’esperienza. E il training è un processo estremamente costoso dal punto di vista energetico e con il crescere della potenza di calcolo, i consumi delle reti neurali crescono molto rapidamente, raddoppiando ogni circa sei mesi.
I circuiti fotonici costituiscono una tecnologia molto promettente per le reti neurali perché permettono di realizzare unità di calcolo ad alta efficienza energetica. Da anni il Politecnico di Milano lavora allo sviluppo di processori fotonici programmabili integrati su microchip di silicio di dimensioni di pochi mm2 per applicazioni nel campo della trasmissione e dell’elaborazione dei dati, ed ora questi dispositivi sono stati impiegati per la realizzazione di reti neurali fotoniche.
L’acceleratore fotonico che permette di svolgere i calcoli in modo molto rapido ed efficiente
“Un neurone artificiale, come un neurone biologico, deve compiere operazioni matematiche molto semplici, come somme e moltiplicazioni, ma in una rete neurale costituita da molti neuroni densamente interconnessi, il costo energetico di queste operazioni cresce esponenzialmente e diventa rapidamente proibitivo. Il nostro chip – spiega Francesco Morichetti, Responsabile del Photonic Devices Lab del Politecnico di Milano – integra un acceleratore fotonico che permette di svolgere i calcoli in modo molto rapido ed efficiente, sfruttando una griglia programmabile di interferometri di silicio. Il tempo di calcolo è pari al tempo di transito della luce in un chip di pochi mm, quindi parliamo di meno di un miliardesimo di secondo (0.1 nanosecondi)”.
“I vantaggi delle reti neurali fotoniche sono noti da tempo, ma uno dei tasselli mancanti per sfruttarne le potenzialità era l’addestramento della rete. È come avere un potente calcolatore, ma non sapere come usarlo. In questo studio – continua Andrea Melloni, Direttore di Polifab, il centro di micro e nanotecnologie del Politecnico di Milano – siamo riusciti a realizzare strategie di addestramento dei neuroni fotonici analoghe a quelle utilizzate per le reti neurali convenzionali. Il “cervello” fotonico apprende velocemente e accuratamente e può raggiungere precisioni confrontabili a quelle di una rete neurale convenzionale, ma con un notevole risparmio energetico e maggiore velocità. Tutti elementi abilitanti le applicazioni di intelligenza artificiale e quantistiche.”
Articolo originariamente pubblicato il 08 Mag 2023