21/06/2017 di Redazione

Lo sprint del deep learning aperto di Google

Big G ha introdotto Tensor2Tensor (T2t), nuova libreria che permette di velocizzare l’allenamento dei sistemi di apprendimento approfondito, dando la possibilità ai ricercatori di utilizzare anche i computer meno potenti.

immagine.jpg

L’apprendimento approfondito, noto con il termine inglese deep learning, sta dando la possibilità alle aziende di sviluppare nuove soluzioni “intelligenti” che prima non erano nemmeno immaginabili: riconoscimento vocale e degli oggetti, traduzioni efficaci e in tempo reale e così via. Ma questo insieme di algoritmi ha un problema: richiede dotazioni hardware impegnative per essere addestrato a dovere. Per “allenare” uno di questi sistemi a compiere un determinato compito potrebbero infatti servire anche settimane. Ecco quindi che Google è venuto in aiuto di ricercatori e sviluppatori che vogliono sporcarsi le mani con il deep learning, ma che non possono sfruttare hardware molto potente. Big G è nota per aver creato Tensorflow, libreria di apprendimento automatico resa open source nel 2015, e oggi l’azienda ha pubblicato la documentazione di Tensor2Tensor (T2t).

È uno strumento aperto che consente l’allenamento di modelli di intelligenza artificiale basati su Tensorflow, per creare applicazioni che contengano funzionalità di traduzione, parsing, analisi delle immagini e molto altro. Secondo Google, con T2t è possibile addestrare un sistema, ricorrendo a uno dei migliori modelli, in un solo giorno e sfruttando la potenza di calcolo di una singola scheda grafica.

La nuova libreria open source include i diversi componenti necessari in un sistema di deep learning: data-set, modelli, “ottimizzatori”, tassi di apprendimento, iperparametri e molto altro. L’interfaccia standard è modulare, per favorire l’interazione con gli strumenti e dare la possibilità all’utente di utilizzare praticamente qualsiasi modello di apprendimento, set di dati o parametro sostituendo i componenti a piacere senza per forza ripartire da zero.

Il vantaggio di essere a codice aperto, con un repository già presente su Github, permette poi alla comunità di migliorare e di condividere il lavoro fatto. Secondo Google, i modelli già inclusi nella libreria dovrebbero essere sufficienti per la maggior parte dei compiti di elaborazione del linguaggio naturale, ma il colosso californiano sta invitando gli utenti a definire i propri modelli e ad aggiungere i propri data set a T2t.

 

ARTICOLI CORRELATI