Circa un anno fa Cloudera ha acquisito la startup Sense.io, specializzata nello sviluppo di soluzioni per data scientist. In occasione dell’ultimo Strata+Hadoop World di San Jose l’azienda ha svelato Data Science Workbench, nuovo strumento self-service disponibile ad oggi in beta costruito sulla tecnologia di Sense.io. La soluzione permette ai professionisti del settore di utilizzare librerie e linguaggi open source tra cui R, Python e Scala (praticamente tutti i principali), su una piattaforma sicura (Cloudera Enterprise) con integrazione nativa di Apache Spark e Apache Hadoop, per accelerare i progetti di analisi, dall’esplorazione alla produzione. Il tutto direttamente da un browser Web, tramite cui i data scientist potranno accedere a codici e script, modificarli ed eseguirli senza dover utilizzare linee di comando o Ide.

Gli utenti avranno così accesso diretto ai dati in cluster Hadoop sicuri con Spark e Impala e potranno condividere gli approfondimenti con l’intero team per una ricerca riproducibile e collaborativa. I professionisti It avranno inoltre la garanzia di conformità costante, con supporto immediato e di operatività on-premise o in cloud ovunque si gestiscano i dati.

Ma Data Science Workbench permette anche di sfruttare servizi terzi per migliorare l’analisi delle informazioni. È il caso ad esempio delle piattaforme di deep learning Google Tensorflow, Microsoft Cognitive Toolkit, Mxnet e Bigdl, che daranno netti vantaggi agli utenti in termini di intelligenza artificiale applicabile ai cluster Hadoop.

Fondata nel 2008 da tre ex ingegneri di Facebook, Google e Yahoo, Cloudera sviluppa una delle principali distribuzioni di Hadoop. L'azienda di Palo Alto ha depositato i documenti presso la Sec statunitense per prepararsi alla tanto attesa quotazione in borsa, con un'offerta iniziale stimata a 200 milioni di dollari. Ovviamente si tratta di una prima valutazione, in quanto l'Ipo verrà fissata la notte prima del debuto a Wall Street, con ottime probabilità di raggiungere quota 4,1 miliardi.