08/02/2017 di Redazione

Lo storage di Apache Kudu entra nel “pacchetto” di Cloudera

Il motore di archiviazione open source è stato inserito nella versione 5.10 di Cloudera Enterprise. Kudu è specialmente adatto ai casi d'uso che richiedono analisi rapide su dati raccolti in tempo reale, per esempio dalle interazioni Web o dai sistemi In

immagine.jpg

Apache Kudu fa il suo ingresso all'interno del “pacchetto” di Cloudera, ovvero in Cloudera Enterprise 5.10, la nuova versione – disponibile da pochi giorni – della suite comprensiva di diverse soluzioni di gestione e analisi dei dati. Per tutti gli estimatori dell'open source, Kudu non è un prodotto nuovo: presentato nel 2015 proprio da Cloudera, che lo ha poi donato alla Apache Software Foundation, è il motore di storage “nativo” di Hadoop, adatto sia per le attività accesso ai dati random a bassa latenza, sia per applicazioni di analytics in tempo reale. Può lavorare con applicazioni mission-critical in cluster con centinaia di nodi, che gestiscono diversi milioni di inserimenti al secondo. I casi d'uso supportati includono le analisi su dati storici e statistiche, ma lo storage engine dà il meglio in tutti quei casi che richiedono scansioni analitiche veloci e su larga scala, come il monitoraggio delle infrastrutture IoT e il reporting online.

La novità non è dunque Kudu in sé, ma il suo inserimento all'interno d Cloudera Enterprise, accanto ai programmi Cdh (la distribuzione Hadoop per aziende), Cloudera Manager (per la gestione del cluster Hadoop), Search, Impala (per le query Sql), Spark (motore di analytics) e Cloudera Navigator (gestione e sicurezza dei dati). Grazie a questa aggiunta, i clienti avranno a disposizione uno strumento in più per eseguire analisi in tempo reale, ottenendo visibilità sull'andamento del business o sullo stato di una infrastruttura, anche in ottica predittiva.

 

L’analisi dei dati in tempo reale è una sfida per le imprese”, ha commentato Charles Zedlewski, senior vice president dei prodotti Cloudera, “in quanto richiede un’architettura lambda complessa per integrare insieme l’elaborazione dei flussi e l’analisi dei batch in tempo reale. Kudu facilita notevolmente tale architettura offrendo un unico motore di storage che risolve entrambe le esigenze. I carichi di lavoro impegnati oggi esistenti, tra cui un numero crescente di nuovi modelli di apprendimento automatico, possono identificare le minacce di sicurezza informatica, prevedere problemi di manutenzione nell’Industrial Internet of Things e offrire una maggior precisione per qualsiasi tipo di reporting online”.

 

 

L'analista di Ovum Tony Baer ha sottolineato come Kudu sia l'esempio dell'evoluzione intrapresa dalla piattaforma Apache Hadoop: non più un insieme di prodotti isolati, ma un mix e una combinazione di tecnologie open source che insieme possono crare un veroambiente operativo Big Data”. “Kudu”, ha spiegato Baer, “aggira gli ostacoli associati alle architetture lambda complesse per affrontare i casi di utilizzo che coinvolgono dati in rapida evoluzione, dove è fondamentale la capacità di modificare e aggiornare il database in modo rapido”.

Oltre a questa novità, in Cloudera Enterprise 5.10 esordiscono alcuni miglioramenti: prestazioni migliorate di Apache Hive su Amazon S3, funzioni più complete di auditing e lineage nel cloud (con il supporto single-cluster di Cloudera Navigator per Amazon S3) e la riduzione del tempo necessario per le implementazioni in ambienti cloud dei casi d'uso iniziali.


 

ARTICOLI CORRELATI