Il sistema di apprendimento automatico “Liquido” si adatta alle mutevoli condizioni

rete neurale
Credito: Pixabay/CC0 di dominio pubblico

I ricercatori del MIT hanno sviluppato un tipo di rete neurale che apprende sul lavoro, non solo durante la sua fase di addestramento. Questi algoritmi flessibili, soprannominati reti “liquide”, cambiano le loro equazioni sottostanti per adattarsi continuamente ai nuovi input di dati. L’anticipo potrebbe aiutare il processo decisionale basato su flussi di dati che cambiano nel tempo, compresi quelli coinvolti nella diagnosi medica e nella guida autonoma.

“Questa è una via da seguire per il futuro del controllo dei robot, dell’elaborazione del linguaggio naturale, dell’elaborazione video e di qualsiasi forma di elaborazione dei dati di serie temporali”, afferma Ramin Hasani, l’autore principale dello studio. “Il potenziale è davvero significativo.”

La ricerca sarà presentata alla conferenza AAAI sull’intelligenza artificiale di febbraio. Oltre a Hasani, un post-dottorato nel MIT Computer Science and Artificial Intelligence Laboratory (CSAIL), i coautori del MIT includono Daniela Rus, direttrice CSAIL e Andrew ed Erna Viterbi Professore di Ingegneria Elettrica e Informatica, e Ph.D. studente Alessandro Amini. Altri coautori includono Mathias Lechner dell’Institute of Science and Technology Austria e Radu Grosu della Vienna University of Technology.

I dati delle serie temporali sono sia onnipresenti che vitali per la nostra comprensione del mondo, secondo Hasani. “Il mondo reale è tutto incentrato sulle sequenze. Anche la nostra percezione: non stai percependo immagini, stai percependo sequenze di immagini”, dice. “Quindi, i dati delle serie temporali creano effettivamente la nostra realtà”.

Indica l’elaborazione video, i dati finanziari e le applicazioni diagnostiche mediche come esempi di serie temporali che sono centrali per la società. Le vicissitudini di questi flussi di dati in continua evoluzione possono essere imprevedibili. Tuttavia, l’analisi di questi dati in tempo reale e il loro utilizzo per anticipare il comportamento futuro può favorire lo sviluppo di tecnologie emergenti come le auto a guida autonoma. Così Hasani ha costruito un algoritmo adatto al compito.

Hasani ha progettato una rete neurale in grado di adattarsi alla variabilità dei sistemi del mondo reale. Le reti neurali sono algoritmi che riconoscono i modelli analizzando una serie di esempi di “formazione”. Si dice spesso che imitino i percorsi di elaborazione del cervello, poiché asani ha tratto ispirazione direttamente dal nematode microscopico, C. elegans. “Ha solo 302 neuroni nel suo sistema nervoso”, dice, “eppure può generare dinamiche inaspettatamente complesse”.

Hasani ha codificato la sua rete neurale prestando particolare attenzione a come i neuroni di C. elegans si attivano e comunicano tra loro tramite impulsi elettrici. Nelle equazioni che ha usato per strutturare la sua rete neurale, ha permesso ai parametri di cambiare nel tempo in base ai risultati di un insieme nidificato di equazioni differenziali.

Questa flessibilità è fondamentale. Il comportamento della maggior parte delle reti neurali viene corretto dopo la fase di addestramento, il che significa che non riescono ad adattarsi ai cambiamenti nel flusso di dati in entrata. Hasani afferma che la fluidità della sua rete “liquida” la rende più resistente a dati imprevisti o rumorosi, come se una pioggia battente oscurasse la visuale di una telecamera su un’auto a guida autonoma. “Quindi, è più robusto”, dice.

C’è un altro vantaggio della flessibilità della rete, aggiunge: “È più interpretabile”.

Hasani afferma che la sua rete liquida aggira l’imperscrutabilità comune ad altre reti neurali. “Solo cambiando la rappresentazione di un neurone”, cosa che Hasani ha fatto con le equazioni differenziali, “puoi davvero esplorare alcuni gradi di complessità che non potresti esplorare altrimenti”. Grazie al piccolo numero di neuroni altamente espressivi di Hasani, è più facile scrutare nella “scatola nera” del processo decisionale della rete e diagnosticare perché la rete ha effettuato una certa caratterizzazione.

“Il modello stesso è più ricco in termini di espressività”, afferma Hasani. Ciò potrebbe aiutare gli ingegneri a comprendere e migliorare le prestazioni della rete liquida.

La rete di Hasani ha eccelso in una batteria di test. Ha superato di pochi punti percentuali altri algoritmi di serie temporali all’avanguardia nel prevedere con precisione i valori futuri nei set di dati, che vanno dalla chimica atmosferica ai modelli di traffico. “In molte applicazioni, vediamo che le prestazioni sono molto elevate”, afferma. Inoltre, le dimensioni ridotte della rete hanno consentito di completare i test senza costi di elaborazione elevati. “Tutti parlano di ampliare la propria rete”, afferma Hasani. “Vogliamo ridimensionare, per avere meno nodi ma più ricchi”.

Hasani prevede di continuare a migliorare il sistema e di prepararlo per l’applicazione industriale. “Abbiamo una rete neurale dimostrabilmente più espressiva che si ispira alla natura. Ma questo è solo l’inizio del processo”, afferma. “La domanda ovvia è come si estende questo? Pensiamo che questo tipo di rete potrebbe essere un elemento chiave dei futuri sistemi di intelligence”.


Leave a Reply