Live Transcribe 2.1 si prepara ad aggiungere il rilevamento della sirena di emergenza, i segmenti intelligenti e l’ID altoparlante

Live Transcribe 2.1 si prepara ad aggiungere il rilevamento della sirena di emergenza, i segmenti intelligenti e l'ID altoparlante

Live Transcribe 2.1 si prepara ad aggiungere il rilevamento della sirena di emergenza, i segmenti intelligenti e l’ID altoparlante

All’inizio di quest’anno al Google I/O, l’azienda ha introdotto due nuove app per Android per aiutare le persone con disabilità uditive a Trascrizione istantanea e Amplificatore del suono. Sebbene entrambe le app fossero originariamente pensate per i non udenti, Google ha successivamente aggiornato l’app Live Transcribe per aiutare anche studenti e giornalisti. Dopo l’aggiornamento, l’app ha consentito agli utenti di salvare le trascrizioni localmente sul proprio dispositivo e ha persino ottenuto la capacità di rilevare eventi sonori durante la trascrizione. Ora, Google sembra preparare l’app per introdurre altre tre funzionalità.

Uno smontaggio dell’APK può spesso prevedere funzionalità che potrebbero arrivare in un futuro aggiornamento di un’applicazione, ma è possibile che una qualsiasi delle funzionalità che menzioniamo qui non sia disponibile in una versione futura. Questo perché queste funzionalità non sono attualmente implementate nella build live e possono essere ritirate in qualsiasi momento dagli sviluppatori in una build futura.

Uno smontaggio dell’ultimo aggiornamento per Trascrizione istantanea (versione 2.1.276871059) rivela stringhe di codice che suggeriscono funzionalità imminenti, tra cui Mostra sirene di emergenza, Segmento intelligente e ID altoparlante. La funzione Mostra sirene di emergenza consentirà all’app di identificare le sirene di emergenza e avvisare gli utenti delle stesse. Le stringhe includono anche una finestra di dialogo per la funzione che afferma: “Si prega di prestare attenzione quando vengono segnalate le sirene. Ricorda che non tutte le sirene richiedono un intervento o indicano un’emergenza rilevante (ad esempio le sirene in TV). Inoltre, il nostro rilevamento della sirena a volte commetterà errori”.

<string name="show_emergency_siren_dialog_message">Please exercise caution when sirens are reported. Remember that not all sirens require action or indicate a relevant emergency (sirens on TV, for example). Furthermore, our siren detection will occasionally make mistakes.</string><string name="show_emergency_siren_title">Show Emergency Sirens</string><string name="smart_segment">Smart segment</string><string name="smart_segment_summary">Segment transcript based on performance (rather than text length)</string><string name="speaker_id_title">Enable speaker ID</string>

La funzione Smart Segment dividerà le trascrizioni in base alle prestazioni, anziché alla lunghezza del testo, e la funzione Speaker ID aiuterà l’app a identificare ed etichettare gli oratori in una conversazione in corso. Il nostro caporedattore, Mishaal Rahman, ha anche dato un’occhiata al repository GitHub di Live Transcribe che contiene le librerie client Android utilizzate per comunicare con l’API Cloud Speech di Google e ha scoperto che il modulo Automatic Speech Recognition (ASR) ha il supporto per nell’identificazione del parlante. Tuttavia, l’implementazione dell’ID altoparlante non viene fornita e non sembra che l’app attualmente lo abbia, ma ciò potrebbe cambiare nel prossimo futuro.


Grazie a PNF Software per averci fornito una licenza per utilizzare JEB Decompiler, uno strumento di reverse engineering di livello professionale per applicazioni Android.

Leave a Reply