La qualità dei salti di frase cambia grazie al sistema di traduzione automatica di Google appena annunciato

(Tech Xplore) I titoli dei giornali non sono sempre apprezzati poiché alcuni lettori vogliono solo i fatti senza sorrisi e risatine. Tuttavia, il titolo di questa settimana Coinvolgere era allo stesso tempo divertente e abbastanza descrittivo: “Le traduzioni dal cinese all’inglese di Google potrebbero ora fare schifo di meno.”
Cherlynn Low, Redattrice di recensioni, Coinvolgeredisse, “Il cinese mandarino è una lingua notoriamente difficile da tradurre in inglese e per coloro che si affidano a Google Translate per decifrare informazioni importanti, gli strumenti basati su macchine semplicemente non sono abbastanza buoni.”
Google, tuttavia, sta compiendo un passo in una nuova direzione per tracciare un percorso di traduzione per risultati migliori. Google ha implementato un nuovo sistema di apprendimento nelle sue app di traduzione web e mobile, ha affermato Low.
Si riferiva all’annuncio di Google di martedì su una rete neurale per la traduzione automatica. Il messaggio era intitolato “Una rete neurale per la traduzione automatica, su scala di produzione.” Il messaggio è stato di Quoc Le e Mike Schuster, due ricercatori del Google Brain Team.
Dieci anni fa, c’era l’annuncio del lancio di Google Translate, e l’algoritmo chiave alla base di questo servizio di traduzione automatica basata su frasi. Nel 2016, hanno detto, ancora, “il miglioramento della traduzione automatica rimane un obiettivo impegnativo.”
Ora Google vuole voltare pagina. “Oggi annunciamo il sistema di traduzione automatica neurale di Google (GNMT).” Il sistema sta usando “tecniche di formazione all’avanguardia per ottenere i maggiori miglioramenti fino ad oggi per la qualità della traduzione automatica.”

Cosa stanno facendo di così speciale?
Alcuni anni fa hanno esplorato le reti neurali ricorrenti (RNN) per apprendere la mappatura tra una sequenza di input (una frase in una lingua) e una sequenza di output (quella frase in un’altra lingua). La traduzione automatica basata su frasi (PBMT) suddivide una frase di input in parole e frasi da tradurre in modo ampiamente indipendente. Hanno detto che la traduzione automatica neurale (NMT) considera l’intera frase di input come un’unità di traduzione. “Il vantaggio di questo approccio è che richiede meno scelte di progettazione ingegneristica rispetto ai precedenti sistemi di traduzione Phrase-Based.” Hanno riportato buoni risultati in “dimensioni modeste” set di dati di benchmark pubblici, ma hanno continuato a lavorare sui miglioramenti.
Tuttavia, i miglioramenti non hanno oscurato il fatto “NMT non era abbastanza veloce o preciso per essere utilizzato in un sistema di produzione, come Google Translate.”
Alla fine hanno detto di aver superato le sfide. Hanno detto che erano in grado di far funzionare NMT “set di dati molto grandi e costruito un sistema sufficientemente veloce e accurato da fornire traduzioni migliori per gli utenti e i servizi di Google.”
Quindi il team può imballare le scatole della pizza vuote e passare a un altro progetto? Non proprio. “La traduzione automatica non è affatto risolta,” hanno affermato. “GNMT può ancora commettere errori significativi che un traduttore umano non farebbe mai, come far cadere parole e tradurre male nomi propri o termini rari e tradurre frasi isolatamente piuttosto che considerare il contesto del paragrafo o della pagina.”
Allo stesso tempo, hanno detto che GNMT rappresenta “una pietra miliare significativa. Vorremmo celebrarlo con i numerosi ricercatori e ingegneri, anche all’interno di Google e della comunità più ampia, che hanno contribuito a questa direzione di ricerca negli ultimi anni.”
Un articolo accademico su questa impresa è su arXiv. Il documento è intitolato “Il sistema di traduzione automatica neurale di Google: colmare il divario tra traduzione umana e automatica.”