07/03/2025 di Valentina Bernocco

Se i progetti di AI in azienda falliscono, spesso è colpa dei dati

Secondo uno studio di Gartner, il 63% non ha dati “pronti” per l’intelligenza artificiale o non sa dire di averli. Frammentazione, scarsa qualità e assenza di metadati alcuni dei problemi.

Il 63% delle aziende non ha dati “pronti” per l’intelligenza artificiale o non sa dire di averli oppure no: è quanto emerso da una ricerca di Gartner, condotta su circa 1.200 organizzazioni. L’analisi è abbastanza impietosa: a detta degli autori della ricerca, la maggior parte degli addetti ai lavori intervistati (figure che, in azienda, si occupano della gestione dei dati) non si rende conto della notevole differenza esistente tra la gestione dei dati “tradizionale”, per così dire, e ciò che servirebbe nelle iniziative di intelligenza artificiale. Di conseguenza, secondo Gartner, entro il 2026 fallirà il 60% degli attuali progetti basati su dati inadeguati, non “AI-ready”.

Come spiegato dagli analisti, per chi si occupa di intelligenza artificiale le tradizionali operazioni di data management sono “troppo lente, troppo strutturate e troppo rigide”. Tipicamente nelle aziende i dati transitano da differenti sistemi e piattaforme e vengono raccolti in diversi repository, con la conseguente creazione dei famigerati “silos”. La frequente presenza di compartimenti stagni e, di contro, l’assenza di metadati sono degli ostacoli per le applicazioni di intelligenza artificiale. Alle citate carenze si sommano, poi, le lacune di policy per un utilizzo sicuro, responsabile ed etico dei dati.

La giusta strategia di data management per l'AI

Qual è, allora, una strategia di gestione dei dati corretta e adeguata per l’intelligenza artificiale?  In primo luogo, le aziende dovrebbero capire di quali dati abbiano bisogno in relazione ai casi d’uso e individuare schemi ricorrenti, devianze ed errori. Bisogna, poi, portare un po’ di ordine e rendere i dati fruibili, interrogabili e richiamabili dai motori di interrogazione e analisi: la disponibilità di metadati è quindi essenziale.

Non è necessario ricominciare da zero: Gartner suggerisce di partire dalle pratiche di data management esistenti e aggiungervi, iterativamente, innovazioni di intelligenza artificiale e utili per l’AI: per esempio, archivi di dati vettoriali, tecniche di chunking, di sampling, di embedding e di RAG (retrieval-augmented generation) per migliorare il funzionamento e l’affidabilità degli algoritmi. Gli analisti consigliano anche di preparare delle pipeline di dati che saranno utili sia per addestrare i modelli di AI sia per alimentare il loro funzionamento.

Una volta messa a punto l’applicazione, il lavoro non è finito: è necessario continuare a monitorare la qualità e a lavorare sui metadati, sull’osservabilità e sulla governance dei dati e dell’AI. Niente vieta, anzi, di introdurre poi continui miglioramenti in base ai casi d’uso.

TIG, "Digital Business Transformation Survey 2024", gennaio-febbraio 2024

TIG, "Digital Business Transformation Survey 2024", gennaio-febbraio 2024

I dati nelle aziende italiane

Sono indicazioni utili anche per le aziende italiane, impegnate in buona misura nell’adozione dell’AI generativa. La ricerca “Digital Business Transformation Survey 2024”, condotta da TIG - The Innovation Group tra gennaio e febbraio dell’anno scorso su un campione di 150 Pmi italiane, ha evidenziato che il 46% intendeva investire in GenAI nell’arco dei successivi 12 mesi. Ben l’89% degli intervistati considerava i dati come un “asset fondamentale” per la propria azienda ma solo il 21% pensava di poter introdurre innovazioni data-driven. La stessa percentuale, 21%, aveva già realizzato nel 2023 attività di gestione e miglioramento della qualità dei dati e il 54% programmava di farlo nel 2024.

scopri altri contenuti su

ARTICOLI CORRELATI