06/09/2018 di Redazione

Il Dataset Search di Google fa luce sui dati difficili da trovare

Il nuovo motore di ricerca permette di trovare statistiche e dati di vario tipo, dal meteo alle pubblicazioni accademiche, passando per gli open data governativi.

immagine.jpg

Il Web mette a disposizione una marea di dati, ma non sempre è facile trovare informazioni di qualità o reperire esattamente ciò che serve. Google strizza l'occhio a ricercatori, docenti, studenti, scienziati, giornalisti e a chiunque sia affamato di conoscenza e di dati con Dataset Search, un nuovo motore di ricerca che esplora e cataloga i dataset presenti in pubblicazioni accademiche, scientifiche o governative disponibili in Rete. Come già fatto con Google Scholar, strumento rivolto invece agli studenti, la società di Mountain View vuol dare una mano a chi cerca informazioni in un mare di dati spesso molto dispersi, frammentati.

Esistono molte migliaia di repository di dati nel Web”, scrive l'azienda, “ da cui si può accedere a milioni di dataset. E anche governi nazionali e locali in tutto il mondo pubblicano i propri dati”. Dataset Search è stato creato con l'intento di facilitare l'accesso a questo patrimonio informativo.

Il motore di ricerca segnala la collocazione dei dataset che corrispondono alle query digitate, riportando a siti Web di università, enti pubblici, aziende oppure a siti Web personali e o, ancora, ad archivi e biblioteche digitali. I dati, dunque, rimangolo là dove sono, mentre Google si occupa semplicemente di renderli visibili, specificando la fonte, la data dell'ultimo aggiornamento e i termini di licenza d'uso.

 

 

 

Si possono così reperire statistiche e numeri di vario genere, dati meteo, pubblicazioni accademiche e open data di governi ed enti locali. Per poter essere trovati, i dataset devono contenere metadati e soddisfare le caratteristiche tecniche elencate nelle linee guida di Google, indicando per esempio gli autori, la data di pubblicazione, le modalità di raccolta dei dati, i termini d'uso da parte di terzi e altro ancora. Big G invita i gestori dei siti o piattaforme ad adottare lo standard aperto di schema.org, come già fanno la Nasa, l'agenzia meteo statunitese Noaa, l'Università di Harward (con la piattaforma Dataverse) e il consorzio di università Icpsr.

 


 

ARTICOLI CORRELATI