12/12/2024 di redazione

L’AI diventa anche un doppiatore istantaneo per i video di YouTube

La piattaforma di video streaming lancia una nuova funzionalità di intelligenza artificiale che doppia i contenuti dall'inglese in otto lingue (italiano incluso), e viceversa.

(Immagine: YouTube)

(Immagine: YouTube)

L’intelligenza artificiale ora è anche un doppiatore per i video di YouTube. Per chi non è poliglotta, i sottotitoli non sono più l’unica risorsa utile per fruire di contenuti in lingue straniere: la piattaforma ha lanciato una funzionalità di AI, messa a punto dai ricercatori di Google DeepMind and Google Translate, che permette ai creatori di contenuti di attivare il doppiaggio automatico dall’inglese in otto lingue, e viceversa.

I video in inglese saranno automaticamente doppiati in italiano, francese, spagnolo, portoghese, tedesco, giapponese, hindi e indonesiano; quelli che partono da uno di questi idiomi, invece, saranno doppiati in inglese. La caratteristica interessante (o magari un po’ inquietante) è che il timbro di voce del parlante vengono conservati nel doppiaggio sintetico.

La funzionalità è al momento disponibile per centinaia di migliaia di canali appartenenti allo YouTube Partner Program e focalizzati sulla divulgazione (inclusi quelli di turismo, viaggi e cucina), ma presto sarà estesa ad altri tipi di contenuto. Per verificare l’eventuale disponibilità del doppiaggio automatico, è sufficiente cercare questa voce nelle impostazioni avanzate di YouTube Studio.

L’intelligenza artificiale comprende in automatico la lingua di partenza del video e genera le versioni alternative. Queste vengono poi raccolte nella sezione “Linguaggi” all’interno dell’area personale del content creator, che può ascoltarli e scegliere se pubblicarli o cancellarli, se non graditi. Una volta pubblicato, il contenuto esporrà un’etichetta con la scritta “auto-dubbed” per palesare la natura artificiale della traccia audio.

(Immagine: YouTube)

(Immagine: YouTube)

“È importante ricordare che questa tecnologia è ancora piuttosto nuova e non sempre sarà perfetta”, sottolinea Alphabet, che ieri ha annunciato la nuova versione di Gemini.Stiamo lavorando sodo per renderla il più accurata possibile ma potrebbe succedere a volte che la traduzione non sia perfetta o che la voce non rappresenti in modo accurato chi sta parlando”.

Il team di YouTube continuerà a lavorare con i colleghi di Google DeepMind e Google Translate “per rendere i doppiaggi sempre più accurati, espressivi e naturali”.  La prossima novità all’orizzonte sarà l’integrazione della tecnologia “Expressive Speech,” già mostrata in anteprima, capace di riprodurre il tono di voce, le emozioni comunicate e persino i rumori ambientali.

scopri altri contenuti su

ARTICOLI CORRELATI