“Impronte vocali” e il Speaker Identification Integrated Projet


   Le intercettazioni, nel corso degli ultimi decenni, si sono rivelate uno strumento sempre più necessario nelle investigazioni: ciò che attualmente si vuole ottenere è la creazione di una banca dati dove sia possibile, al momento dell’inserimento di una voce “anonima”, procedere autonomamente all’identificazione del soggetto. A questo tema il Raggruppamento Investigazioni Scientifiche (RACIS) ha dedicato un seminario, presso la Caserma “Salvo D’Acquisto”, lo scorso 13 Luglio, dal titolo “La biometria vocale nelle investigazioni” (https://www.youtube.com/watch?v=IYnj7H7wDx0).

Il riconoscimento biometrico (da bìos = “vita” e métron = “conteggio” o “misura”) è lo studio delle caratteristiche fisiche, chimiche e/o comportamentali di un individuo allo scopo di stabilirne automaticamente l’identità. Le prime applicazioni sono nate nel settore governativo, giuridico e forense, e in seguito il loro utilizzo si è espanso notevolmente anche in campo civile, sostituendo o affiancando i classici sistemi di autenticazione: la biometria vocale consente all’utente di autenticarsi in modo semplice e naturale senza dover digitare una password o un PIN, ma pronunciando semplicemente una breve passphrase come “La mia voce è la mia password”. Questa tecnologia innovativa è già ampiamente usata per migliorare il customer service nell’ambito di sistemi bancari e da grandi organizzazioni  mostrando  ampie prospettive di sviluppo per il futuro. Non solo! La smart home rappresenta oggi il fulcro del mercato delle soluzioni IoT, anche nel nostro Paese: nelle case intelligenti del futuro sarà possibile riconoscere e impostare la playlist desiderata o far trovare le luci accese al rientro a casa.

Una caratteristica umana, biologica o comportamentale, può essere considerata una biometria se soddisfa i requisiti di universalità, unicità, permanenza e misurabilità. Affinché un tratto biometrico possa effettivamente essere utilizzato per il riconoscimento, bisogna considerare anche altri aspetti: la performance (l’accuratezza e la velocità del riconoscimento, così come le risorse necessarie a ottenerlo, sono limitate da fattori esterni e operazionali); l’accettabilità (gli utenti devono essere disposti a presentare al sistema la caratteristica biometrica in questione); l’eludibilità (probabilità che il sistema sia aggirato).

Un sistema di riconoscimento biometrico è un sistema di pattern-recognition che opera in due fasi, enrollement (registrazione) e recognition (riconoscimento). Inizialmente acquisisce i dati in input estraendone le caratteristiche salienti (feature set) e memorizzandole in un database, sotto forma di template, congiuntamente all’identità della persona in questione; dopo la registrazione preliminare di queste informazioni, il sistema può autenticare o identificare un individuo acquisendone i dati biometrici (query) e confrontandoli con quelli già presenti in database (reference o gallery). Questo processo è generalmente indicato come riconoscimento o matching, ma in base alla modalità operativa possiamo operare un’ulteriore distinzione tra verifica e identificazione.

Gli algoritmi biometrici sono metodi automatici che permettono a un sistema di eseguire il riconoscimento di un individuo. Si occupano di migliorare e determinare la qualità dei campioni, di estrarre le caratteristiche salienti dei dati in ingresso, della fusione delle informazioni, del matching con i template richiesti e anche della compressione dei dati per ottimizzare l’utilizzo di banda e memoria disponibile.

L’identificazione di chi parla è un accertamento complesso in quanto la voce può essere camuffata, mutare nel tempo e nello spazio per condizionamenti ambientali e/o emotive. Più nel dettaglio un sistema può commettere due tipi di errori: false match, quando i tratti biometrici di due persone distinte sono associati a una stessa persona; false non-match, quando i tratti biometrici di una stessa persona sono associati a due persone distinte. Entrambi possono essere causati dallo scarso contenuto informativo nei campioni biometrici, da limiti nell’estrazione delle feature oppure da problemi concernenti la varianza dei dati (alta intrauser variation o bassa inter-user variation). La performance di un sistema biometrico si valuta in termini di probabilità attesa di un false match o di un false non-match, ossia rispettivamente il False Match Rate (FMR) e il False Non-Match Rate (FNMR). In caso di sistemi operanti in modalità di verifica, ci si riferisce al False Accept Rate (FAR) e al False Reject Rate.

Purtuttavia è possibile risalire alla cosiddetta impronta vocale, un unicum al pari delle impronte digitali, validissimo per identificare i criminali che utilizzano un nick name e profili falsi (come i terroristi di matrice jihadista)alterando frequentemente le schede dei cellulari oppure per scoprire gli interlocutori sconosciuti di un soggetto noto ed intercettato.

La realizzazione di una banca dati dell’impronta fonica è dunque una meta fondamentale per il riverbero della prova “vocale” nel processo penale ecco perché la ricerca SILP (Speaker Identification Integrated Projet), finanziata dall’Unione Europea al fine di sviluppare un sistema di identificazione dei parlatori “sconosciuti”, ne costituisce una tappa importante.

Auguro pertanto un buon  lavoro all’Arma dei Carabinieri,  all’Interpol, la polizia tedesca, inglese, portoghese che sono operativi per la realizzazione di questo progetto.

dottssa Eva Simola