Data mesh, l’autostrada che fa viaggiare veloci i dati Quali sono i vantaggi del data mesh, un’architettura basata sulla decentralizzazione e sul concetto di “dato come prodotto”? Ce lo spiega Giovanni Mazzucato, Project Leader di Axiante. Pubblicato il 04 luglio 2023 da Redazione

Che cos’è il data mesh e perché può essere una risposta al problema della crescita smisurata dei dati? Un problema ben noto nelle aziende di ogni dimensione e settore, ma specie per quelle medie e grandi, dove le tecnologie di data warehouse e data lake non rappresentano più una risposta adeguata. Lentezze e inefficienze nell’accesso ai dati, che spesso si trovano frammentati su numerosi ambienti non comunicanti (in famigerati “silos”) sono all’ordine del giorno. Il data mesh rappresenta un approccio alternativo, che elimina i silos ma ammette la decentralizzazione per velocizzare la consegna e la fruizione dei dati, quelli che servono davvero all’utente. I vantaggi però sono anche altri, come ci spiega Giovanni Mazzucato, project leader di Axiante.



Che cos’è il data mesh, dovendolo spiegare in poche parole?

Il data mesh è un approccio molto recente, non è nemmeno una tecnologia: è un nuovo paradigma, un modo per trattare i dati e i processi riguardanti i dati. In passato, a partire dagli anni Ottanta, le aziende hanno puntato sui data warehouse. In seguito il data lake si è affermato quale approccio alla risposta dei big data, ma spesso si è trasformato in “calderone” di dati. Oggi, per migliorare anche la qualità dei datalake e data warehouse, c’è questa nuova opportunità. Ma è importante che l’azienda capisca che per diventare data-driven company, cioè per prendere decisioni basate sui dati (o meglio buone decisioni) è necessario disporre di dati affidabili e sempre aggiornati. In una grande azienda con un sistema monolitico l’IT non riesce a fornire i dati in tempi rapidi e quel ritardo si paga in termini di competitività.

Negli ultimi anni le aziende si sono accorte della necessità di ridurre il gap tra la richiesta delle varie aree del business di avere determinate informazioni e la capacità di reazione del comparto IT di consegnare quell’informazione, nella forma esatta che il dato deve avere. Lo scopo principale del data mesh è ridurre il tempo fra la richiesta e la consegna delle informazioni, preservando la qualità dei dati.

E come è possibile ottenere questa riduzione dei tempi?

Il data mesh si basa su quattro pilastri: la decentralizzazione dei domini di dati; il concetto di “dato come prodotto”; una infrastruttura software self-service; la governance federata. Per decentralizzazione che cosa si intende? Con altri approcci, prima dell’avvento del data mesh, si è cercato di centralizzare il più possibile con l’implementazione da parte dell’IT di logiche e categorizzazioni. il problema è che la centralizzazione richiede degli sforzi, le attività da svolgere richiedono tempo e sono spesso complicate perché non sempre le figure IT conoscono tutto dell’azienda, specie se è grande e articolata in molte business unit. Il data mesh esprime la decentralizzazione dei domini di dati, cioè di un’area delimitata, su cui “rimbalzano” una o più aree aziendali.

Il data mesh fa in modo che la cattura del dato e la sua consegna avvengano al di fuori dell’IT mediante un team che conosce quel dato. Da qui il concetto di dato come prodotto, che sembra banale ma in realtà serve a responsabilizzare sulla veridicità e affidabilità di un certo dato. All’interno di un’azienda un dominio di dati può essere definito da più aree, per esempio l’anagrafica dei clienti può essere fruita dal marketing, dalla contabilità, dalle vendite. Quindi si responsabilizza il team a consegnare un dato considerando come cliente colui che poi fruirà quel dato.



La decentralizzazione richiede un altro pilastro, cioè che esista una infrastruttura software che permetta la creazione dei dati secondo una logica self-service, con un livello di implementazione di codice ridottissimo. L’utente di solito si relaziona con comandi drag-and-drop e con un’interfaccia Web.

Il quarto pilastro è la governance. L’IT deve avere controllo su chi possa ricevere il dato: la governance è federata perché esiste una decentralizzazione dei domini, e deve essere abbastanza flessibile. Devono esistere delle regole prefissate, con diritti di visibilità (per esempio solo possibilità di lettura o anche di scrittura) e tempistiche di accesso che dipendono dalle necessità dei team rispetto a certi dati pertinenti con il loro ruolo.





Giovanni Mazzucato, project leader di Axiante





Perché e quando è opportuno passare al data mesh?



Quando un’azienda non ha una grande mole di dati, la “gestione a due mani” può magari funzionare. Quando, però, la dimensione aziendale inizia essere rilevante, ecco che la centralizzazione monolitica (come quella realizzata da data warehouse e data lake) può creare dei problemi: tutte le richieste devono inizialmente essere elaborate da un team, dunque si formano delle code senza la possibilità di parallelizzare i processi. Il data mesh, al contrario, consente di parallelizzare e di spostare un insieme di funzioni e di servizi sugli utenti dell’area di business da cui parte la richiesta. In questo modo si evitano colli di bottiglia e si riduce il tempo di consegna dei dati al destinatario.



Inoltre si risolve un altro problema: spesso l’IT in azienda non ha una conoscenza diretta di determinati tipi di dati, quindi per soddisfare le richieste sono necessari un approfondimento dell’ultimo minuto e un re-work continuo. I tempi si allungano anche nello sviluppo. Con il data mesh, al contrario, non ci sono esigenze di rilavorazione né problemi di comprensione. Questo metodo, inoltre, consente un arricchimento e una qualità del dato che difficilmente il team IT centrale potrebbe garantire.



Da dove si parte con un progetto di data mesh?



Serve innanzitutto un cambiamento di mentalità, insieme a uno sforzo congiunto a tutti i livelli aziendali. Dal punto di vista tecnologico il passaggio al data mesh non è complesso. Tutti i maggiori player hanno costruito data fabric per la centralizzazione monolitica del dato ma si stanno adeguando in direzione del data mesh, con un’innovazione che non impedisce di utilizzare i sistemi già esistenti.



L’approccio iniziale è lo stesso dei progetti di data warehouse e data lake. Ci vuole un “passaggio culturale” in più ma il tema è sempre lo stesso per noi: l’affiancamento. Axiante accompagna il cliente, decide con lui un percorso e lo affronta un passo alla volta, avendo però già definito il disegno complessivo e gli obiettivi. Questo ci permette innanzitutto di capire al primo passaggio dove sia necessario “limare” e migliorare. Il piccolo passo ha costi ridotti e risultati visibili, oltre a ridurre al minimo l’impatto sull’azienda e sulla sua operatività.