Google rilascia un motore di ricerca per le banche dati

Google ha creato Dataset Search, un motore di ricerca specifico per il mondo delle università e dell’informazione, indicizzando circa 25 milioni di dataset accessibili; al contrario di altre banche dati, Google non gestisce direttamente l’accesso ai set di dati ma semplicemente fa quello che sa fare: il motore di ricerca.

https://developers.google.com/cloud-search/images/architecture-overview.png

Dataset Search consente agli utenti di trovare set di dati archiviati nel Web tramite una semplice ricerca per parola chiave; lo strumento trova le informazioni relative ai set di dati ospitati in migliaia di repository sul Web e rende questi set di dati accessibili e utili a livello globale.

Questo progetto consente, come specificato direttamente dagli sviluppatori, di creare un ecosistema di condivisione dei dati che incoraggi chi pubblica dati a seguire le best practice per l’archiviazione e la pubblicazione dei dati e di fornire ai data scientist un modo per mostrare l’impatto del loro lavoro attraverso la citazione dei set di dati che hanno prodotto.

Google

Google Dataset Search integra Schema.org, una comunità che lavora sulla gestione e divulgazione dai dati e che permette al motore di ricerca di indirizzare direttamente l’utente ai data set. Man mano che aumenta il numero di repository di set di dati che utilizzano schema.org e standard simili per descrivere i loro set di dati, si amplia anche la varietà e la copertura dei set di dati che gli utenti possono trovare in Dataset Search, dando sempre la priorità agli archivi gratuiti.

Visite: 419

 venerdì 31 Gennaio - 2020
Pillole 2.0, Tecnologia
,