Google tiene un buscador de conjuntos de datos para investigadores
Google ha lanzado un sitio web dedicado a la búsqueda de conjuntos de datos para ayudar a los investigadores y periodistas a descubrir datos disponibles públicamente que pueden ser de gran ayuda para sus proyectos.
El sitio web Dataset Search adopta el enfoque y el diseño familiar de Google para la búsqueda y lo aplica a los conjuntos de datos publicados en la web. La herramienta -aun en beta – proporciona acceso a millones de conjuntos de datos en miles de repositorios de datos en la web de todo el mundo.
La búsqueda de set de datos muestra los resultados de los sitios de los editores, las bibliotecas digitales y las páginas web personales de los autores. Además, el nuevo motor de búsqueda se puede utilizar para buscar referencias a la mayoría de los conjuntos de datos en un principio esta compilando grupos de datos de ciencias naturales, ciencias sociales, datos gubernamentales y datos proporcionados por agencias de noticias, pero se espera que en breve estos conjuntos de datos se extiendan al resto de las disciplinas.
El nuevo motor de búsqueda de Google depende en gran medida del esquema de marcado para proveedores de conjuntos de datos que lanzó Google en julio de 2018. De manera que las instituciones que publican sus datos en línea, como universidades y gobiernos, deberán incluir etiquetas de metadatos (Schema.org) en sus páginas web que describan sus conjuntos de datos, incluyendo quién lo creó, cuándo se publicó, cómo se recopiló, etc.; cuyo objetivo es disponer de la información y unificar decenas de miles de repositorios diferentes para conjuntos de datos en línea.