26/01/2015 di Redazione

Microsoft è quasi pronta a lanciare i Big Data nel Cosmos

Il progetto basato su Dryad era stato accantonato perché considerato un inutile doppione di Hadoop, ma internamente lo sviluppo è proseguito per analizzare i dati di servizi come Bing e Office 365. E oggi sembra pronto a diventare una realtà commerciale p

immagine.jpg

Si chiama Cosmos. E’ un servizio che Microsoft utilizza esclusivamente al suo interno per elaborare, analizzare e archiviare i Big Data. E ora potrebbe essere reso disponibile al pubblico (a pagamento) tramite la piattaforma Azure. A rivelarlo a stata Mary Jo Foley, giornalista di ZDnet che segue da vicino e da anni le vicende Microsoft, e quindi fonte autorevole. Cosmos è un programma nato nel 2011 e basato sulla tecnologia Dryad per l’elaborazione distribuita che la società aveva deciso di non far evolvere in un prodotto commerciale preferendogli Hadoop. Internamente, però, il progetto è sopravvissuto, tanto da divenire uno strumento capace di gestire dati provenienti da Azure, Bing, AdCenter, Msn, Skype e Windows Live utilizzato, secondo quanto riportato da Foley, da cinquemila sviluppatori e “migliaia” di utenti di Microsoft.

A ritenere che Cosmos possa diventare un’offerta commerciale non è solamente la giornalista di ZDnet. Da tempo si ricorrono le voci, pubblicate anche sul blog statunitense GoLime, che presto questa ipotesi potrebbe diventare realtà. I “segni” che lo confermerebbero sono diversi, a cominciare da diverse offerte di lavoro pubblicate da Microsoft negli ultimi mesi e focalizzate sulla ricerca di ingegneri software da impiegare su questa piattaforma, fino alle caratteristiche intrinseche di Cosmos: la sua capacità di gestire parametri di ricerca, informazioni sui clic, siti visitati e così via lo rendono decisamente appetibile non solo all’interno della società.

Grazie a Cosmos, in Microsoft elaborano e analizzano set di dati di dimensioni enormi (la piattaforma è in grado di gestire decine di petabyte di dati) come quelli creati dal motore di ricerca Bing e da Office 365. Molti di questi dati vengono poi condivisi e le query possono essere elaborate in parallelo su un numero di macchine che può arrivare a quarantamila. Dal punto di vista tecnico, Cosmos si basa sul linguaggio Scope (Structured Computation Optimized for Parallel Execution), inizialmente utilizzato per Dryad, e poi evoluto in Sql-Ip, costituito da un misto di Sql, C# e.Net. Secondo le fonti di Foley, Microsoft potrebbe rendere disponibile un plug-in di Visual Studio capace di supportarlo.

Sul fronte commerciale, invece, la piattaforma Cosmos andrebbe ad affiancare HDInsights, già disponibile su Azure e basato su Hadoop. Gli utenti potrebbero quindi scegliere liberamente tra i due strumenti. Le intenzioni di Microsoft sarebbero quelle di adottare un modello di listino basato sul consumo di risorse: le tariffe di Cosmos sarebbero quindi calcolate sulla potenza di elaborazione e sullo storage utilizzati. Anche se sembra probabile una prossima di disponibilità di Cosmos su Azure, ancora nessuna indiscrezione è trapelata sui tempi.

 

ARTICOLI CORRELATI