07/11/2016 di Redazione

VoCo di Adobe fa giochi di prestigio con la voce umana

Un nuovo software per il montaggio audio permette non solo di tagliare e montare spezzoni di registrazioni, ma anche “creare” nuove parole e spezzoni di frasi nel medesimo timbro vocale a partire dalla traccia esistente.

immagine.jpg

Adobe maestro del montaggio audio facile, veloce e anche un po’ “magico”. Un nuovo software chiamato VoCo e presentato la scorsa settimana a San Diego duranta la conferenza Max, potrebbe essere definito come il “Photoshop della voce”, perché al pari del programma di editing fotografico è in grado non solo di ripulire e regolare i contenuti, ma anche di ritoccarli più o meno pesantemente. Addirittura, con VoCo è possibile inserire in qualsiasi punto del file audio parti di testo inesistenti nella traccia originaria, che però suonano esattamente come la voce della persona registrata.

Una prospettiva interessantissima per ambiti artistici, come il videomaking, la pubblicità e il cinema, perché con questo software i contenuti audio diventano editabili con maggiore facilità, dettaglio e in tempi diversi, evitando magari di dover registrare ex novo una frase pronunciata male.  Una prospettiva che però allo stesso tempo appare piuttosto inquietante se applicata in altri ambiti, dal giornalismo (scorretto) agli sgambetti fra rivali in politica.

Su questo punto, Adobe ha cercato di smorzare eventuali timori introducendo nel software un metodo “anti frode”: i passaggi della traccia audio modificati creando artificialmente delle parole vengono segnalati tramite watermark, cioè tramite marchio digitale. Così le possibilità di creare delle falsificazioni non si eliminano del tutto, ma se non altro esiste un metodo di verifica.

 

Foto: TechCrunch

 

Come dimostrato sul palco del Max da Zeyu Jin, un ricercatore di Adobe (nel video qui sotto), i risultati ottenuti finora da Adobe sono già buoni: gli inserti audio fittizi suonano piuttosto naturali. Al programma servono almeno venti minuti di registrazione per poter ricavare una “imitazione” precisa della voce da campionare, sfruttando algoritmi di apprendimento automatico. L’utente, invece, deve soltanto preoccuparsi di digitare sulla tastiera la parola o lo spezzone di frase desiderato, nel punto del testo desiderato. Non è dato sapere quando queste nuove funzionalità saranno rese disponibili da Adobe, né se faranno parte di qualche software esistente (come Audition, Photoshop o Premiere Pro) oppure di un nuovo applicativo.

 

 

ARTICOLI CORRELATI