Sulla centralità dei dati nei processi di sviluppo delle imprese si sono consumate pagine su pagine da parecchio tempo, per arrivare oggi al possibile nuovo paradigma del data mesh.

Sappiamo che il corretto sfruttamento dei dati può generare informazioni preziose per orientare decisioni o strategie di business. Sappiamo anche che il loro volume è in continua ascesa, così come le fonti di produzione e questo ha generato da un lato la necessità di trovare il modo di memorizzarli e organizzarli secondo criteri funzionali diversi a seconda della tipologia di azienda e dall’altro la capacità di saper estrarre ciò che serve al momento opportuno, esponendolo alle funzioni di business nel modo più chiaro e intelligibile.

Distinguendo fra dati operativi (quelli che fanno funzionare un’azienda) e analitici (ricavati da strumenti di business intelligence e simili tramite arricchimenti e aggregazioni), i primi vengono gestiti di routine il più vicino possibile alle applicazioni, mentre i secondi sono stati fin qui raggruppati in data warehouse o, in tempi più recenti, in data lake, evoluzione quest’ultima che tiene conto degli ecosistemi creati intorno ai cosiddetti big data.

In entrambe le logiche, oggi comunemente applicate nelle aziende che ambiscono a far evolvere il business con strategie data-driven, il punto di partenza è la centralizzazione di tutti i dati che circolano in azienda, in modo da poterli standardizzare, ripulire e organizzare in modo da agevolare la loro estrazione e anche l’attendibilità. Tuttavia, nelle realtà più complesse, questa logica può generare problemi di gestione e qualità, direttamente proporzionali all’aumento del volume.

Ecco perché sta iniziando a prendere piede, per ora soprattutto all’estero, il concetto di data mesh, che propone un modello di gestione dei dati decentralizzato, una sorta di” divide et impera”, già noto agli architetti del software che supportano i microservizi. In questo contesto, l’unità di riferimento è il cosiddetto data domain ed è dall’interconnessione di più “domini” che si forma la “maglia” (mesh in inglese) dei dati di ogni azienda.

Alberto Firpo, co-fondatore e Ceo di Agile Lab

Perché questa evoluzione dovrebbe essere vincente? Abbiamo provato a chiarirci le idee con Alberto Firpo, co-fondatore e Ceo di Agile Lab: “Abbiamo assistito in questi anni alla costruzione di piattaforme monolitiche, certamente utili per obiettivi di razionalizzazione, ma che tengono in scarsa considerazione aspetti come la proprietà dei dati, la garanzia della qualità degli stessi, la governance scalabile, l’usabilità, la fiducia tra consumatore e produttore, la disponibilità e l’accessibilità dei dati. Il paradigma del data mesh sfrutta quanto già implementato e può essere adottato senza essere vincolato a una specifica tecnologia sottostante”.

In pratica, dopo aver raccontato per anni che occorreva razionalizzare, eliminare i silos fra i dipartimenti di un’azienda e creare una sola architettura per governare correttamente il flusso dei dati, ora si dovrebbe di nuovo distribuire tutto? “Per obiettivi di governance, non c’è alternativa alla centralizzazione”, conferma Firpo, “ma il compito di progettare e realizzare i processi di questa migrazione dei dati è stato generalmente affidato al gruppo di ingegneri informatici interni del data lake, senza tener conto che così anche la proprietà dei dati sarebbe passata automaticamente nelle loro mani, quantomeno nei confronti dei consumatori a valle della catena”.

Senza volersi addentrare troppo nei dettagli tecnici (per questo ci sono diversi articoli in Rete (fra i quali l’imprescindibile punto di partenza di chi ha coniato la definizione, Zhamak Dehgani), il paradigma del data mesh tende ad adattarsi a realtà piuttosto complesse, già passate attraverso forme di centralizzazione dei dati, ma alla ricerca di nuove modalità di valorizzazione e monetizzazione delle relazioni di business esistenti: “Non si tratta di un modello adatto a tutti e occorre anche un notevole cambiamento culturale, poiché ogni dominio detiene ruoli al proprio interno ed è responsabile della produzione dei dati”, puntualizza Firpo. “La trasformazione digitale implica per molti diventare software company e saper integrare componenti anche di terze parti. Molte aziende dell’automotive o del retail stanno offrendo servizi finanziari e le banche o le assicurazioni devono essere in grado di reagire entrando nel campo dei nuovi concorrenti. Il data mesh è un concetto di federato e distribuito per supportare questa evoluzione”.