26/04/2017 di Redazione

Voci copiate in meno di un minuto: la potenza di Lyrebird

La tecnologia di sintesi vocale sviluppata da una giovane azienda di Montreal è in grado di creare tracce audio artificiali a partire da sessanta secondi di registrazione, copiando il timbro vocale dell'oratore e anche declinadolo su diverse intonazioni.

immagine.jpg

Prodigiosa e inquietante allo stesso tempo, una nuova tecnologia della canadese (di Montreal) Lyrebird è capace di clonare qualsiasi voce umana a partire da appena un minuto di registrazione. Il campionamento del timbro vocale è un'opera certo non nuova in ambiti come il montaggio e doppiaggio, ma oggi ha raggiunto livelli di perfezionamento e di facilità d'accesso inediti. Il nome dell'azienda, Lyrebird, allude alle capacità di imitazione prodigiose della menura, mentre il riferimento tecnologico più immediato sembra essere VoCo, un nuovo software di Adobe ancora in fase di perfezionamento.

Questa tecnologia, presentata lo scorso novembre, permette di sintetizzare il timbro e l'intonazione di chiunque a partire da una ventina di minuti di registrazione, per poi creare una traccia audio (o inserire frammenti “artificiali” all'interno di quella originaria) semplicemente digitando le parole desiderate su una tastiera. Potere degli algoritmi di apprendimento automatico.

La tecnologia Lyrebird si colloca sul medesimo percorso di Adobe, ma riducendo drasticamente la durata della traccia di partenza: da venti minuti ad appena sessanta secondi. A differenza di VoCo, inoltre, non è stata incorporata in un software commerciale predefinito bensì verrà proposta (quando, ancora non è dato saperlo) come Api integrabile in applicazioni e servizi di terze parti. Gli sviluppatori, insomma, potranno accedervi via cloud e sfruttarla per i propri fini.

Quali fini? Difficile non immaginare possibili utilizzati eticamente scorretti per una tecnologia che potrebbe diventare strumento di mistificazione sia in ambito privato, sia nei rapporti fra le aziendale sia soprattutto nella competizione politica o – peggio – sulla scena diplomatica internazionale. Il giovanissimo team di sviluppatori di Lyrebird dichiara certo intenzioni ben diverse: “Rilasciando pubblicamente questa tecnologia e rendendola disponibile a tutti, vogliamo accertarci che questi rischi non si presentino. Speriamo che presto tutti siano consapevoli dell'esistenza di questa tecnologia e del fatto che copiare la voce di qualcuno sia possibile. Più in generale, vogliamo puntare l'attenzione sul fatto che in un futuro vicino le registrazioni audio potrebbero non avere più valore di prova”.

Colto il lodevole intento di denuncia, resta però da capire perché una tale tecnologia voglia essere diffusa tramite Api e dunque messa anche alla mercé di eventuali malintenzionati (per diventare beta tester è comunque necessario fare richiesta, fornendo i propri dati). Per il momento, gli informatici di Lyrebird si sono divertiti a campionare a scopo dimostrativo alcune voci, inclusa quella del presidente statunitense Donald Trump, Hillary Clinton e Barack Obama. Oltre a riprodurre con una certa (non ancora perfetta) precisione il timbro vocale, questa tecnologia può anche creare frammenti di dialogo “recitati” con diverse intonazioni (per esprimere rabbia, emozione, stress o altro ancora), che quindi dissimulano la propria natura robotica.

ARTICOLI CORRELATI