L'intelligenza artificiale viene utilizzata per scoprire la natura della materia oscura

I ricercatori cinesi hanno creato un modello di intelligenza artificiale in grado di individuare schemi nei dati e di descrivere la materia oscura.

La dinamica di un ammasso di galassie è determinata dalla materia oscura, che rappresenta la maggior parte della massa, e ora un modello di intelligenza artificiale può comprenderne le proprietà analizzando i dati dell'ammasso. Crediti: NASA
La dinamica di un ammasso di galassie è determinata dalla materia oscura, che rappresenta la maggior parte della massa, e ora un modello di intelligenza artificiale può comprenderne le proprietà analizzando i dati dell'ammasso. Crediti: NASA

Un modo per studiare la materia oscura è attraverso l’analisi dei dati degli ammassi di galassie. La materia oscura gioca un ruolo importante negli ammassi di galassie perché rappresenta la maggior parte della massa. Negli ultimi anni, modelli di intelligenza artificiale sono stati utilizzati per trovare schemi in questi dati osservazionali e nelle simulazioni, al fine di individuare pattern e nuove informazioni. Tuttavia, la maggior parte di questi modelli ha scarsa interpretabilità fisica, rendendo difficile l’estrazione di conoscenze.

Per aggirare questo problema, fisici e astronomi hanno cercato di utilizzare modelli interpretabili per apprendere rappresentazioni che possano essere analizzate e messe in relazione direttamente con strutture matematiche o fisiche note. Una strategia prevede architetture in cui le funzioni di attivazione non sono fisse, ma vengono apprese dai dati. Ciò facilita l’identificazione delle dipendenze tra grandezze fisiche presenti nei dati e permette un confronto più diretto con i modelli teorici.

Un gruppo di ricercatori cinesi ha sviluppato un nuovo modello denominato Convolutional Kolmogorov–Arnold Network (CKAN). Il modello è stato addestrato con dati provenienti da simulazioni di ammassi di galassie contenenti informazioni sulla distribuzione della massa e sull’emissione di raggi X, per comprendere il comportamento della materia oscura. Il CKAN consente di indagare come le strutture osservabili siano collegate con la distribuzione della materia oscura.

Materia oscura

La materia oscura è una componente dell’Universo che rappresenta circa l’85% della materia totale. Non interagisce con la luce né con alcuna interazione oltre quella gravitazionale.

Per questo motivo, la materia oscura può essere osservata solo indirettamente tramite curve di rotazione galattiche, dinamica degli ammassi, lenti gravitazionali e anisotropie nella radiazione cosmica di fondo. Nonostante ciò, la natura microscopica della materia oscura rimane un mistero nell’Astrofisica.

Non si conosce ancora la natura della materia oscura, cioè non si sa quali particelle la compongano, come si siano formate né se interagiscano oltre la gravità.

Il modello standard assume materia oscura fredda e non interagente, che descrive bene le strutture su grande scala ma non spiega alcuni fenomeni su scale più piccole. Un’alternativa è l’ipotesi della Self-Interacting Dark Matter (SIDM), secondo la quale le particelle di materia oscura interagiscono tra loro con sezioni d’urto ridotte. Queste interazioni possono redistribuire energia e quantità di moto all’interno degli aloni galattici e spiegare alcune osservazioni di galassie e ammassi.

Reti neurali interpretabili

Le reti neurali vengono utilizzate in Astronomia e in Fisica per risolvere problemi di classificazione, regressione e riconoscimento di pattern. Tuttavia, comprendere perché una rete prenda una determinata decisione, che conduce a un certo risultato, rappresenta una limitazione. Nell’ambito scientifico, questa mancanza di interpretabilità rende difficile individuare relazioni fisiche e validare ipotesi. In aree come l’Astronomia, dove i dati sono complessi, i modelli non forniscono alcuna comprensione dei meccanismi fisici reali che governano i fenomeni osservati.

A causa di questa limitazione, un numero crescente di ricercatori sta cercando di creare reti neurali interpretabili che incorporino strutture, vincoli o rappresentazioni che permettano di estrarre significato fisico dai modelli. Esempi includono architetture con funzioni di attivazione apprese, reti ispirate a leggi di conservazione e modelli ibridi. Questi approcci permettono non solo di prevedere proprietà, ma anche di identificare quali variabili dominano il comportamento osservato.

Nuovo modello

Ricercatori cinesi hanno sviluppato un nuovo modello di intelligenza artificiale interpretabile chiamato Convolutional Kolmogorov–Arnold Network (CKAN). Il CKAN è stato progettato per superare i limiti delle tradizionali reti convoluzionali. In questa architettura, le funzioni di attivazione fisse vengono sostituite con funzioni di attivazione addestrabili. Questa caratteristica permette al modello di apprendere rappresentazioni più flessibili e fisicamente interpretabili.

Il modello è stato addestrato con dati provenienti da simulazioni cosmologiche di ammassi di galassie, includendo diverse ipotesi sulla materia oscura. Gli input del modello consistono in immagini con tre canali: distribuzione della massa totale, massa stellare ed emissione nei raggi X. Oltre a classificare i vari modelli fisici, la struttura interna del CKAN può essere estratta e riscritta in forma simbolica. I risultati hanno aiutato i ricercatori a identificare quali caratteristiche spaziali e fisiche siano più rilevanti per distinguere gli scenari della materia oscura.

Risultati ottenuti

L’analisi della rappresentazione del CKAN ha rivelato che la rete neurale ha iniziato a identificare quantità fisiche come lo spostamento tra il centro dell’alone di materia oscura e il centro dell’ammasso di galassie. Questi pattern estratti automaticamente sono coerenti con le previsioni teoriche, indicando che il modello non solo classifica correttamente i dati, ma comprende anche relazioni fisiche reali.

Combinando metriche di errore con diagnosi di interpretabilità, i ricercatori hanno ottenuto un risultato interessante. Hanno scoperto che, su scala di ammassi di galassie, l’ipotesi SIDM richiede una sezione d’urto minima dell’ordine di 0,1–0,3 cm²/g. Questo limite è coerente con le stime basate su recenti simulazioni cosmologiche. Inoltre, includendo rumore osservativo, il CKAN ha mantenuto la propria capacità, riuscendo a mantenere gli errori dello stesso ordine.

Riferimento della notizia

Huang et al. 2025 An Interpretable AI Framework to Disentangle Self-interacting and Cold Dark Matter in Galaxy Clusters: The CKAN Approach The Astronomical Journal