Google rilascia un motore di ricerca per le banche dati
Google ha creato Dataset Search
, un motore di ricerca specifico per il mondo delle università e dell’informazione, indicizzando circa 25 milioni di dataset accessibili; al contrario di altre banche dati, Google non gestisce direttamente l’accesso ai set di dati ma semplicemente fa quello che sa fare: il motore di ricerca.
Dataset Search consente agli utenti di trovare set di dati archiviati nel Web tramite una semplice ricerca per parola chiave; lo strumento trova le informazioni relative ai set di dati ospitati in migliaia di repository sul Web e rende questi set di dati accessibili e utili a livello globale.
Questo progetto consente, come specificato direttamente dagli sviluppatori, di creare un ecosistema di condivisione dei dati che incoraggi chi pubblica dati a seguire le best practice per l’archiviazione e la pubblicazione dei dati e di fornire ai data scientist un modo per mostrare l’impatto del loro lavoro attraverso la citazione dei set di dati che hanno prodotto.
Google Dataset Search integra Schema.org
, una comunità che lavora sulla gestione e divulgazione dai dati e che permette al motore di ricerca di indirizzare direttamente l’utente ai data set. Man mano che aumenta il numero di repository di set di dati che utilizzano schema.org e standard simili per descrivere i loro set di dati, si amplia anche la varietà e la copertura dei set di dati che gli utenti possono trovare in Dataset Search, dando sempre la priorità agli archivi gratuiti.
Visite: 419