L'intelligenza artificiale è in grado di scoprire una nuova fisica? Forse dovrebbe prima reimparare tutto da capo

Un nuovo studio illustra come l'intelligenza artificiale possa aiutare a scoprire aspetti della fisica che vanno oltre il modello standard e quali siano le difficoltà che ciò comporta.

Quando un'intelligenza artificiale dipende eccessivamente dai dati di addestramento, può avere difficoltà a riconoscere fenomeni realmente nuovi. Crediti: NASA

Negli ultimi anni, alcuni dei nomi di spicco nel campo dell’intelligenza artificiale (IA), come Sam Altman, Jensen Huang ed Elon Musk, hanno iniziato a sottolineare l’importanza della fisica per il progresso di questo settore. L’idea è che modelli sempre più avanzati siano in grado di apprendere relazioni fisiche a partire da dati osservativi e sperimentali. Ciò consentirebbe di costruire sistemi che contribuirebbero a nuove scoperte e ipotesi scientifiche.

Ciononostante, insegnare la fisica ai modelli di IA rimane una sfida, poiché molti problemi fisici comportano relazioni complesse, scale spaziali e temporali multiple e incertezza. Per questo motivo, università, centri di ricerca e aziende stanno investendo nello sviluppo di architetture in grado di incorporare direttamente le conoscenze fisiche durante l’addestramento.

Questi approcci spaziano dalle reti neurali informate dalla fisica (physics-informed neural networks) ai modelli basati su simulazioni numeriche e sull’apprendimento simbolico.

Un nuovo studio suggerisce che le tecniche attuali possano presentare un limite quando l’obiettivo è scoprire una nuova fisica. I ricercatori hanno analizzato metodi di apprendimento noti come «transfer learning», in cui i modelli riutilizzano conoscenze acquisite in precedenza. Sebbene questa strategia riduca i costi computazionali, l’IA può apprendere i modelli fisici attuali così bene da finire per avere difficoltà a identificare fenomeni che vanno oltre di essi.

Simulazioni cosmologiche

Un esempio di come questo processo venga utilizzato in Fisica è il modo in cui vengono realizzate le simulazioni cosmologiche. Queste simulazioni comportano un elevato costo computazionale poiché devono riprodurre l’evoluzione dell’Universo nel corso di miliardi di anni. Tali simulazioni seguono la dinamica della materia oscura, del gas interstellare, della formazione stellare, dell’evoluzione delle galassie e dell’influenza dell’energia oscura. Ciò comporta l’esecuzione di un numero elevato di operazioni matematiche.

Un’altra sfida è rappresentata dal fatto che molti fenomeni si verificano su scale diverse e devono essere trattati contemporaneamente, dai processi su scala galattica a quelli che coinvolgono centinaia di milioni di anni luce.

Anche il costo computazionale aumenta perché piccole variazioni nei parametri cosmologici richiedono nuove simulazioni. È necessario testare diversi scenari che coinvolgono la materia oscura, l’energia oscura, la formazione galattica e le condizioni iniziali per confrontare i risultati. Il tempo necessario può variare da giorni a mesi, a seconda della risoluzione utilizzata e della complessità del sistema, per ciascuna delle simulazioni.

Uso dell'intelligenza artificiale

Per questo motivo, lo sviluppo di metodi in grado di accelerare tali simulazioni è diventato una priorità per fisici e astrofisici. L’IA si è affermata come uno strumento promettente per accelerare le simulazioni cosmologiche. Anziché risolvere direttamente tutte le equazioni, i modelli di IA possono imparare a riprodurre determinati processi sulla base di grandi insiemi di simulazioni già esistenti. In alcuni casi, simulazioni che richiederebbero ore o giorni di elaborazione possono essere eseguite in pochi secondi o minuti.

Il vantaggio principale è la possibilità di esplorare un numero molto maggiore di ipotesi e scenari fisici. Poiché il costo computazionale è ridotto, diventa fattibile testare diversi valori dei parametri. Inoltre, i modelli di IA possono identificare modelli ricorrenti nei dati e individuare regioni dello spazio dei parametri che in precedenza venivano ignorate. Questa capacità accelera il processo scientifico e aiuta a comprendere meglio i dati, consentendo al contempo l’esplorazione di un maggior numero di scenari.

Il problema attuale

In un nuovo articolo, i ricercatori hanno addestrato una rete neurale utilizzando il transfer learning e i dati delle simulazioni del modello cosmologico standard ΛCDM. Successivamente, la stessa rete è stata adattata per studiare scenari più complessi che includono possibili estensioni della fisica conosciuta. I risultati hanno dimostrato che questa strategia può ridurre di oltre un ordine di grandezza il numero di simulazioni necessarie. Tuttavia, i ricercatori hanno individuato alcune limitazioni quando l’obiettivo è individuare fenomeni nuovi.

Il futuro della Terra non dipende solo dalle dimensioni che il Sole raggiungerà, ma anche da fenomeni quali la perdita di massa stellare e le interazioni gravitazionali che potrebbero alterare l'orbita del pianeta. Crediti: NOIRLab

Il problema si verifica perché l’IA tende a interpretare le nuove informazioni utilizzando gli schemi appresi in precedenza durante il pre-addestramento. Questo fenomeno, noto come “negative transfer”, si verifica quando i segnali prodotti da una possibile nuova fisica assomigliano agli effetti già presenti nel modello cosmologico standard.

Nello studio, i ricercatori hanno osservato questo comportamento in simulazioni di neutrini massivi in cui gli effetti sono stati confusi con variazioni di parametri già noti del modello ΛCDM.

Apprendimento per trasferimento

Di conseguenza, l’articolo ha dimostrato che la rete neurale ha avuto difficoltà a distinguere i due scenari e a identificare correttamente il nuovo effetto fisico. Ciò evidenzia la necessità di nuove tecniche che non dipendano in misura così marcata dai dati di input. Il termine “negative transfer” deriva dal “transfer learning”, una tecnica che si basa proprio sui dati di input. Anziché iniziare l’addestramento da zero, la rete neurale riutilizza modelli, rappresentazioni e relazioni apprese in precedenza.

In fisica, il “transfer learning” è stato ampiamente utilizzato per ridurre il costo computazionale di problemi che comportano simulazioni onerose. Questa strategia consente di esplorare un numero molto maggiore di ipotesi senza la necessità di eseguire altre simulazioni complete o di addestrare nuovamente il modello partendo da zero. Tuttavia, il nuovo studio mostra come il “transfer learning” e tecniche simili possano finire per ostacolare nuove scoperte.