Lo studio mostra che i metodi di apprendimento automatico ampiamente utilizzati non funzionano come affermato

Rete
L’intelligenza artificiale servirà a sviluppare un sistema di controllo della rete che non solo rileva e reagisce ai problemi, ma può anche prevederli ed evitarli. Credito: CC0 Pubblico Dominio

I modelli e gli algoritmi per l’analisi di reti complesse sono ampiamente utilizzati nella ricerca e influenzano la società in generale attraverso le loro applicazioni nei social network online, nei motori di ricerca e nei sistemi di raccomandazione. Secondo un nuovo studio, tuttavia, un approccio algoritmico ampiamente utilizzato per la modellazione di queste reti è fondamentalmente imperfetto, poiché non riesce a catturare importanti proprietà delle reti complesse del mondo reale.

“Non è che queste tecniche ti stiano dando spazzatura assoluta. Probabilmente contengono alcune informazioni, ma non così tante informazioni come credono molte persone”, ha detto C. “Sesh” Seshadhri, professore associato di informatica e ingegneria alla Baskin School di Ingegneria presso UC Santa Cruz.

Seshadhri è il primo autore di un articolo sulle nuove scoperte pubblicato il 2 marzo a Atti dell’Accademia Nazionale delle Scienze. Lo studio ha valutato tecniche note come “incorporamenti a bassa dimensione”, che sono comunemente utilizzate come input per i modelli di apprendimento automatico. Questa è un’area di ricerca attiva, con nuovi metodi di incorporamento in fase di sviluppo a un ritmo rapido. Ma Seshadhri e i suoi coautori affermano che tutti questi metodi condividono le stesse carenze.

Per spiegare perché, Seshadhri ha utilizzato l’esempio di una rete sociale, un tipo familiare di rete complessa. Molte aziende applicano l’apprendimento automatico ai dati dei social network per generare previsioni sul comportamento delle persone, consigli per gli utenti e così via. Le tecniche di incorporamento convertono essenzialmente la posizione di una persona in un social network in un insieme di coordinate per un punto in uno spazio geometrico, producendo un elenco di numeri per ogni persona che può essere inserito in un algoritmo.

“Questo è importante perché qualcosa di astratto come la ‘posizione di una persona in un social network’ può essere convertito in un elenco di numeri concreto. Un’altra cosa importante è che tu voglia convertirlo in uno spazio a bassa dimensione, in modo che l’elenco di numeri che rappresentano ogni persona è relativamente piccola”, ha spiegato Seshadhri.

Una volta eseguita questa conversione, il sistema ignora il social network reale e fa previsioni basate sulle relazioni tra punti nello spazio. Ad esempio, se molte persone vicine a te in quello spazio stanno acquistando un particolare prodotto, il sistema potrebbe prevedere che probabilmente acquisterai lo stesso prodotto.

Seshadhri ei suoi coautori hanno dimostrato matematicamente che in questo processo di incorporamento si perdono aspetti strutturali significativi di reti complesse. Hanno anche confermato questo risultato testando empiricamente varie tecniche di incorporamento su diversi tipi di reti complesse.

“Non stiamo dicendo che alcuni metodi specifici falliscono. Stiamo dicendo che qualsiasi metodo di incorporamento che ti fornisce un piccolo elenco di numeri fallirà fondamentalmente, perché una geometria a bassa dimensione non è abbastanza espressiva per i social network e altri reti complesse”, ha detto Seshadhri.

Una caratteristica cruciale dei social network del mondo reale è la densità dei triangoli, o connessioni tra tre persone.

“Dove hai molti triangoli, significa che c’è molta struttura della comunità in quella parte di un social network”, ha detto Seshadhri. “Inoltre, questi triangoli sono ancora più significativi quando guardi le persone che hanno reti sociali limitate. In un tipico social network, alcune persone hanno tonnellate di connessioni, ma la maggior parte delle persone non ha molte connessioni”.

Nella loro analisi delle tecniche di incorporamento, i ricercatori hanno osservato che molti dei triangoli sociali che rappresentano la struttura della comunità vengono persi nel processo di incorporamento. “Tutte queste informazioni sembrano scomparire, quindi è quasi come se la stessa cosa che volevi trovare fosse andata persa quando costruisci queste rappresentazioni geometriche”, ha detto Seshadhri.

Gli incorporamenti a bassa dimensione non sono affatto gli unici metodi utilizzati per generare previsioni e raccomandazioni. In genere sono solo uno dei tanti input in un modello di machine learning molto ampio e complesso.

“Questo modello è un’enorme scatola nera e molti dei risultati positivi riportati dicono che se includi questi incorporamenti a bassa dimensione, le tue prestazioni aumentano, forse ottieni un leggero urto. Ma se lo usi da solo, sembra che ti mancherai molto”, ha detto Seshadhri.

Ha anche notato che i nuovi metodi di incorporamento vengono per lo più confrontati con altri metodi di incorporamento. Il recente lavoro empirico di altri ricercatori, tuttavia, mostra che tecniche diverse possono dare risultati migliori per compiti specifici.

“Diciamo che vuoi prevedere chi è un repubblicano e chi è un democratico. Ci sono tecniche sviluppate appositamente per quel compito che funzionano meglio degli incorporamenti”, ha detto. “L’affermazione è che queste tecniche di incorporamento funzionano per molte attività diverse, ed è per questo che molte persone le hanno adottate. È anche molto facile collegarle a un sistema di apprendimento automatico esistente. Ma per qualsiasi attività particolare, risulta che c’è sempre qualcosa di meglio che puoi fare.”

Data la crescente influenza dell’apprendimento automatico nella nostra società, Seshadhri ha affermato che è importante indagare se le ipotesi alla base dei modelli sono valide.

“Abbiamo tutte queste macchine complicate che fanno cose che influiscono in modo significativo sulle nostre vite. Il nostro messaggio è solo che dobbiamo essere più attenti nella valutazione di queste tecniche”, ha affermato. “Soprattutto in questo giorno ed età in cui l’apprendimento automatico sta diventando sempre più complicato, è importante avere una certa comprensione di cosa si può e non si può fare”.


Leave a Reply