Pangaea, datasets en abierto

Una investigación científica culmina dando a conocer sus hallazgos mediante informes o artículos que son publicados. Sin embargo, en el cuerpo de tales documentos sólo se suelen reflejar, elaborados y tratados, los resultados fundamentales del trabajo, de forma resumida. Gracias a la edición electrónica, ahora muchas revistas publican en internet, junto con los papers, materiales suplementarios que pueden contener, entre otras cosas, datos o resultados algo más extensos. Pero los datos observacionales o experimentales, completos y en bruto, reunidos en el curso de la investigación, que son la base de los artículos, normalmente no se divulgan.

Paralela al movimiento de open access, relativo a los textos científicos, otra tendencia actual es la de crear repositorios comunes, públicos y abiertos con los datos observacionales y experimentales completos: datasets que son archivos numéricos generalmente. De esta manera, quedan a disposición de otros investigadores, se comparten, series de datos en bruto. Incluso, pueden ser objeto de tratamiento matemático o minería de datos para obtener nuevos análisis y conclusiones, realizando nuevas investigaciones sin tener que repetir el trabajo experimental. Una versión aún más decidida de la ciencia colaborativa en internet es la de la Open Notebook Science, que consiste en compartir en la red los cuadernos de laboratorio.

pangaea_logo_150x107.png

Pangaea, Publishing Network for Geoscientific & Environmental Data, es un buen ejemplo de archivo abierto de datos científicos. Reúne datasets de investigaciones básicas realizadas y publicadas en el campo de la oceanografía y ciencias del mar: geología, biología y medio ambiente marinos, climatología, meteorología, paleontología, geoquímica, etc. Se trata de una iniciativa de dos instituciones científicas alemanas, pero con alcance internacional.

Pangaea permite realizar búsquedas fáciles por referencias de las publicaciones y por las descripciones de los datasets depositados, así como por la cobertura geográfica y temporal de los estudios. Inicialmente los archivos se pueden ver en formato html y descargar como texto tabulado. Pero, además, para hacer indagaciones más precisas y minería de datos, Pangea ofrece dos herramientas avanzadas, PanCore y Advanced Retrieval Tool (ART), que requieren un plugin en Java. También se puede descargar freeware adicional para la visualización, exploración e interpretación de datos. No obstante, para consultar algunos datasets restringidos, procedentes de investigaciones en curso, no publicadas, es necesario registrarse.

Pangaea está integrado en el World Data Center System, una red internacional de archivos de datos geofísicos y ambientales bajo los auspicios de la ICSU (International Council for Science).

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: