Voxyl

Quando nell’ormai lontano 1988, Antonello Venditti cantava “In questo mondo di ladri“, non avremmo mai potuto immaginare che un giorno sarebbero stati in grado di sottrarci anche qualcosa di non materialmente tangibile come la nostra voce. E invece, sentite (o leggete!) questo articolo sul software “Lyrebird”!

 Ti piace la voce di questo podcast? Contatta lo speaker Antonio Amoruso

Si è sempre cercato di imitare determinati personaggi, carpirne le particolarità, le inflessioni, al fine di esserne vocalmente più fedeli possibile. Ma, nonostante gli sforzi, siamo risultati sempre e comunque una copia; simili, ma non identici.

Ogni individuo ha la propria voce che lo distingue come un'impronta digitale. Unica perché strettamente legata all’apparato fonatorio ed al suo utilizzo.

“Rubare”, nel vero senso della parola, le peculiarità vocali di un altro essere umano, fino ad oggi è stata sempre una cosa irrealizzabile.

Ma se invece fossimo in possesso di uno strumento per riprodurre la voce di chiunque, cosa accadrebbe?

Per cominciare, tutti quelli che lavorano con la voce come me avrebbero un serio problema, ma il suo utilizzo potrebbe essere ancora più sconsiderato. Ad esempio, sarebbe possibile imitare la voce dei politici per creare falsi allarmismi o vere e proprie crisi internazionali. Dunque, tenevi forte perché è di questi giorni la notizia della creazione di “Lyrebird”, il sintetizzatore vocale che imita la voce di qualunque persona.

Ma partiamo dall’inizio: cos’è un sintetizzatore vocale?

Il suo nome deriva appunto dalla tecnica chiamata “sintesi vocale”, secondo la quale si tende a riprodurre artificialmente tramite software o via hardware il suono della voce umana.

La sua qualità, ad oggi, è stata valutata sulla base della somiglianza generica della voce umana ed alla sua comprensibilità. I primi sintetizzatori, infatti, non ne avevano affatto, presentando talvolta voci metalliche molto simili ai robot prima maniera, per intenderci. Da allora, però, la qualità è aumentata costantemente e la voce prodotta dai moderni sistemi di sintesi vocale è diventata sempre più indistinguibile dalla vera voce umana.



Quello che però promette di fare la startup canadese Lyrebird, il cui nome è stato ispirato dall’uccello Menura (lyre bird è il suo nome in inglese) in grado di riprodurre i suoni che sente in modo molto accurato, ha dello straordinario. La sua tecnologia riesce a copiare qualunque voce partendo da un campione audio della durata di appena un minuto. Per fare un raffronto con tecnologie simili dobbiamo parlare di “Project Voco” di Adobe, con la differenza però che, a quest’ultima, di minuti di ascolto del campione vocale ne occorrono 20 prima della riproduzione della voce.

L’algoritmo di Lyrebird è già riuscito ad imitare la voce di personaggi famosi come Barak Obama, Hillary Clinton e Donald Trump con un discreto livello di accuratezza, riuscendo anche a cambiar tono e a creare emozioni come rabbia comprensione e stress. Sarebbe addirittura capace di aggirare i sistemi di autenticazione che sfruttano l’analisi vocale. Magari non è proprio così e probabilmente basterebbe ad oggi un orecchio esperto per carpirne le differenze ma la possibilità che la voce digitale venga confusa con quella reale esiste già.

Dunque, cosa dobbiamo aspettarci, in un futuro nemmeno tanto lontano?

Per i personaggi pubblici, bloccare la clonazione vocale già risulta impossibile per la presenza delle loro registrazioni diffuse in ogni forma. In epoca di fake-news potrebbero, come detto in apertura, uscire dichiarazioni di guerra dalla voce creata del presidente americano o di quello nord coreano. Oppure, per fare un esempio, nel quotidiano usare le nostre voci per la stipula di contratti telefonici a nostra insaputa o manipolare registrazioni per usarle come prova in un processo. Una nostra “seconda voce“ in giro, identica in tutto e per tutto, sarebbe un’arma dalla potenza inqualificabile. La risposta che hanno dato i creatori di Lyrebird ad un possibile uso fraudolento della loro idea è stata quella di voler rilasciare il software e renderlo noto, proprio come lo sono oggi Photoshop e After Effects, creando la consapevolezza e con essa, una sorta di codice etico, che anche le registrazioni audio potrebbero essere state modificate.

Alexandre De Brebisson di Lyrebird ha inoltre confermato che stanno implementando l’algoritmo includendo il supporto anche ad altre lingue come il Francese. Ma la domanda che ci poniamo è: ce n’era veramente bisogno? Brebisson, giustifica la necessità di una simile invenzione, con il fatto che la tecnologia è in divenire e che se non saranno loro sarà qualcun altro a realizzarla.

Ed ecco qui la "voce" di LYREBIRD: 

Articolo a cura di Antonio Amoruso

mettiti in evidenza
mettiti in evidenza
mettiti in evidenza
mettiti in evidenza