Video egocentrici: ricerca di indizi sull’identità dell’utente

Presupposto rapido: le telecamere montate sulla testa rivelano azioni senza mostrare l’identità del regista. Messaggio degli esperti di visione artificiale: non così in fretta.
Yedid Hoshen e Shmuel Peleg dell’Università Ebraica di Gerusalemme sono gli autori dello studio “Egocentric Video Biometrics”, presentato il mese scorso su arXiv. Hanno affermato che il video egocentrico è diverso dal video tenuto in mano: la videocamera è sull’utente, attaccata alla testa dell’utente e il video può essere registrato in qualsiasi momento, ad esempio quando l’utente sta camminando. Si presume che l’anonimato di chi lo indossa possa essere preservato anche quando il video è distribuito pubblicamente, che la telecamera non registri immagini dell’utente, la cui identità è nascosta. Dopo aver letto questo documento, si potrebbe non esserne così sicuri. Gli autori hanno affermato che è possibile recuperare l’identità dell’utente. Hanno dettagliato il loro metodo per l’apprendimento della biometria dalle telecamere indossate. “Mostriamo che le funzionalità di movimento nei video egocentrici forniscono informazioni biometriche e l’identità dell’utente può essere determinata in modo abbastanza affidabile da pochi secondi di video”, hanno scritto. Hanno affermato che è stato riscontrato che le persone possono essere identificate distintamente da caratteristiche biometriche come altezza, lunghezza del passo e velocità di camminata.
Hanno estratto informazioni biometriche dal video egocentrico, concentrandosi sul video registrato quando l’utente cammina. Il nostro metodo si basava su informazioni biometriche implicite nel movimento della telecamera, che possono identificare gli utenti con precisione. “Il video egocentrico soffre di movimenti rimbalzanti e instabili causati dal movimento della testa e del corpo dell’utente”, hanno scritto. “Sebbene di solito sia una seccatura, dimostriamo che queste informazioni possono essere utili per l’estrazione di caratteristiche biometriche e di conseguenza per identificare l’utente”.
Hanno parlato di “architetture di rete neurale convoluzionale (CNN) su flusso ottico grossolano” come il modo in cui la biometria può essere estratta. Hanno appreso caratteristiche biometriche e classificatori utilizzando l’architettura CNN, che include livelli corrispondenti all’estrazione e alla classificazione di caratteristiche biometriche. Le caratteristiche biometriche sono state apprese automaticamente utilizzando le CNN: è stato dimostrato che queste architetture generalizzano e migliorano le caratteristiche progettate a mano motivate fisicamente.
MIT Technology Review, in “Emerging Technology From the arXiv”, ha spiegato ulteriormente il loro metodo, affermando che si sono concentrati sul flusso ottico nei video: il modello di movimento di oggetti, bordi e superfici nel video da fotogramma a fotogramma. “Questo può essere estratto in tempi relativamente brevi da sequenze della durata di pochi secondi. Hanno utilizzato l’80 percento dei dati estratti in questo modo per addestrare una rete neurale a individuare il modello univoco del flusso ottico associato a ciascun utente. Hanno quindi utilizzato i restanti 20 percentuale dei dati per testare quanto accuratamente la rete addestrata potrebbe individuare ogni singolo regista, confrontando la tecnica con altri approcci di apprendimento automatico”.
Due lezioni dal loro studio sono, in primo luogo, che questo tipo di identificazione biometrica può essere utilizzato per impedire l’uso non autorizzato di queste telecamere se la telecamera è programmata per funzionare solo da un utente. La seconda lezione è che questo metodo biometrico potrebbe identificare un regista. Questo approccio biometrico potrebbe essere utilizzato per identificare il regista che aveva altrimenti sperato di mantenere l’identità sconosciuta. “Un messaggio importante in questo documento”, hanno affermato, “è che le persone dovrebbero essere consapevoli che la condivisione di video egocentrici comprometterà il loro anonimato”.
Questa ricerca è stata supportata da Intel ICRI-CI, dal Ministero della Scienza israeliano e dalla Israel Science Foundation.