DATASEA - Datos Abiertos de Investigación - Open Research Data

El proyecto

Presentación

Actualmente la investigación científica se encuentra inmersa en los movimientos Open. Así está plenamente establecido el Open Access en la comunidad de investigadores y es cada vez mayor el número de ellos que incluyen sus trabajos en bibliotecas de acceso abierto. No ocurre lo mismo con los datos de investigación.

Estos datos se encuentran, en gran medida, inaccesibles para el resto de investigadores. Esto impide aprovechar todo su potencial, su reutilización y un avance más rápido y económico de los conocimientos científicos. Hasta la fecha, las políticas han ido más encaminadas a promocionar el acceso libre de las publicaciones financiadas con dinero público y no a promocionar el acceso e intercambio de los datos. El intercambio y reutilización de los mismos son un elemento capaz de estimular la innovación, promover descubrimientos adicionales y mejorar los avances científicos. Esto se puede conseguir a través de políticas que promocionen la puesta a disposición de los datos, seminarios que difundan donde se encuentran los repositorios de datos y guías que establezcan las pautas para el almacenamiento eficiente, la reutilización, distribución y preservación.

En España el acceso a los datos de investigación es escaso, lo que afecta a la eficacia de los grupos de investigación. Un acceso abierto y normalizado podría incrementar la calidad de la investigación por disciplinas. Esta es la razón principal por la que surge el desarrollo de este proyecto que se apoya en nuestra experiencia como especialistas en la disciplina de la documentación en un entorno abierto y que cuenta con la colaboración de investigadores de varias disciplinas.

El objetivo general es, de una parte, determinar políticas sistemáticas enfocadas a incrementar la competitividad de la investigación en nuestro país basadas en la gestión de los datos; y de otra parte, posibilitar la visibilidad de nuestra ciencia y maximizar el retorno de la inversión en investigación al fomentar el intercambio y reutilización de los datos primarios de forma generalizada y normalizada.

 

0
0
0
s2smodern

Descripción

Esta iniciativa ha sido financiada en dos proyectos consecutivos del Programa Estatal de I+D+i 

 

Título del proyectoDatasea MODELOS PARA PUBLICAR, CONSUMIR Y MEDIR LA REUTILIZACION DE LOS DATOS DERIVADOS DE LA INVESTIGACION: MAS ALLA DE LAS FRONTERAS INSTITUCIONALES Y GEOGRAFICAS

Models to publish, consume and measure the reuse of research data: across institutional and geographical boundaries

 Referencia:  CSO2015-65594-C2-1R y 2R (MINECO/FEDER, UE)

Título público: DATASEA Extended - Datos Abiertos de Investigación / Open Research Data

Duración: 36 meses Inicio: 01/01/2016     Fin: 31/12/2018

Subvencionado por: Ministerio de Economía y Competitividad. Gobierno de España y FEDER, UE. Programa Estatal de I+D+i Orientada a los Retos de la Sociedad

Importe: 36.300 euros (UPV) y  39.930 euros (UV)

 

 

 

 

Resumen


Los datos de investigación corroboran los avances de la ciencia, pero el valor de los datos reside en su uso (Bits of power, 1997). Para maximizar su coste económico los organismos nacionales e internacionales están mejorando los mecanismos para compartirlos, analizarlos y preservarlos. Tanto la cumbre de líderes del G8 (2013) como la comunicación de la Comisión europea Hacia una economía de los datos próspera indican que los datos derivados de la investigación y los resultados de experimentos científicos son especialmente valiosos. Además el paradigma actual de la ciencia, basado en las publicaciones y las patentes, paulatinamente incluye los datos como pieza clave de la cadena de valor. Datos de muy diversa naturaleza que en su mayor parte pertenecen a la larga cola, conocida como little data (Borgman 2015).
El objetivo final de este cambio social es construir una economía basada en el uso intensivo de datos. Pero el ecosistema de los datos es complejo. Está relacionado con los avances de la liberación de datos del sector público y la transparencia; también con aspectos de la ciencia abierta, el acceso abierto a las publicaciones y la infraestructura sociotécnica de la ciencia; y por último con las técnicas de análisis que muestran los patrones que esconden, la técnicas de datamining.
De forma periódica se dan a conocer nuevos campos de conocimiento que en poco tiempo se convierten en oportunidades únicas para aquellos países que saben reconocer su importancia. La comunidad científica española ha permanecido al margen de varias revoluciones -biotecnología (60s), digital (70s), genética (90s)- y sus beneficios económicos no han revertido en nuestras instituciones y empresas.
Estamos en el momento mágico en el que comienza una nueva revolución basada en la reutilización de los datos científicos. Nuestra propuesta es adelantarnos a los demás en esta ocasión y explorar las posibilidades de reutilización que en un entorno global se nos ofrecen. No se trata sólo de pedir al científico que deposite sus datos. Para propiciarlo ha de reconocerse. Debemos establecer mecanismos para medir la reutilización y el retorno de la inversión en ciencia. En definitiva tenemos que ser los primeros en descubrir este nuevo petróleo de los datos abiertos. 
Esta propuesta avanza desde los resultados que se obtuvieron durante el proyecto ODASCI. Entre 2013 a 2015 comenzamos una base de conocimiento sobre el comportamiento de los autores españoles, creamos campañas de concienciación y construimos una herramienta de descubrimiento que recolecta las URL que pueden contener datasets: OPENDATASCIENCE.
El objetivo general de DATASEA Extended es describir los modelos de publicación y de consumo de datasets para explorar los métodos adecuados para medir el uso de los datos de investigación; DATASEA aportará soluciones armónicas con el entorno internacional para conocer cómo se descubren y usan los datos. Resumen de los objetivos específicos:
- Desarrollar un portal enfocado a los grupos de interés, prioritariamente científicos y gestores de la investigación. Reunirá información que no está registrada por otro organismo a nivel mundial: revistas que admiten datos y fuentes de datos públicas útiles a la investigación
- Proporcionar conocimiento fidedigno sobre el comportamiento en España con respecto a los datos para elaborar recomendaciones metodológicas para medir el trabajo de compartir, el grado de reutilización de los datos y promover campañas de alfabetización 

 

Abstract:

 

Research data confirm the progress of science, but "the data value lies in its use" (Bits of Power, 1997). To maximize its cost, national and international organizations are improving mechanisms to share, analyse and preserve them. Both, the leaders of the G8 summit (June 2013) as the Communication of the European Commission Towards a thriving data-driven economy, indicate that the data derived from research and the results of scientific experiments are particularly valuable. The current paradigm of science, based on the evaluation of
publications and patents, gradually includes data as a key piece of the value chain. Data are very different and belong to the long tail, or little data (Borgman, 2015).
The ultimate goal of this social change is to build an economy based on data-intensive economy. But the ecosystem of data is complex. It is related to the progress of the release of government data and transparency; also with aspects of open science, open access to publications and the socio-technical infrastructure of science; and finally with the techniques that analyses the patterns that hide the data (data mining).
Periodically, science disclosed new fields of knowledge that soon become unique opportunities for those countries that recognize its importance. The Spanish scientific community as emerged country has remained outside -biotechnology several revolutions (60s), digital (70s), genetic (90s)- and its economic benefits have not reversed in our institutions and companies. We are in the critical moment when a new revolution based on the reuse of scientific data begins. Our proposal is ahead of others and explores the possibilities of reuse in a global environment. It is not only asking our scientists to deposit their data in repositories, but rather to find out
what mechanisms exist to measure the reuse of data. We look forward to be the first of discovering this new potential of open data. This proposal precedes the results obtained during the previous ODASCI project. Between 2013-1015 we started a base of knowledge on the Spanish authors behaviour, advocacy campaigns and a discovery tool to collect URLs that can contain datasets: OPENDATASCIENCE.
The DATASEA overall objective is to describe the data publication and consume models, and to explore appropriate methods to measure the use of research data. DATASEA aims to provide solutions at international level to discover and use the data. Specific objectives:
-- Develop a web portal focused on stakeholders (scientists and research managers). It will gather information not registered by another agency internationally: journals that support data and public data sources
-- Provide reliable knowledge about the researchers behaviour in Spain. It will provide mechanisms to develop recommendations to measure data sharing, level of data re-use, with the aim of delivering advocacy campaigns to help Spanish scientist to take advantage in this special moment

 

 

 

 

 

Título del proyecto: OpenDataScience: Centro de recursos para la preservación y gestión de datos abiertos de investigación (ODASCI) 

 Referencia:  CS02012-39632-C02-01 y 02

Título público: DATASEA - Datos Abiertos de Investigación / Open Research Data

Duración: 36 meses Inicio: 01/01/2013     Fin: 31/12/2015 (prorrogado a octubre 2016)

Subvencionado por: Ministerio de Economía y Competitividad. Gobierno de España

Importe: 23.400 euros (UPV) y 22.000 (UV)

 

Resumen:

Actualmente la investigación científica se encuentra inmersa en los movimientos Open. Cada vez más investigadores incluyen sus trabajos en bibliotecas de acceso abierto. No ocurre lo mismo con los datos de investigación que son la base de esos trabajos.

Con datos poco accesibles no se aprovecha su potencial para la comprobación de resultados y para reutilizarlos. Unos datos accesibles estimulan la innovación, promueven descubrimientos adicionales y mejoran avances científicos más económicos.

DATASEA diseña:

  • políticas para promocionar la puesta a disposición de los datos,
  • herramientas de difusión de los repositorios de datos
  • buenas prácticas para el almacenamiento eficiente, la reutilización, distribución y preservación.

 Abstract (https://wiki.research.data.ac.uk/Datasea):

Datasea is a Spanish initiative to improve the know-how and best practices in research data storage and curation. We built the knowledge basis to study good practices worldwide. Once we done this, we wanted to know the behaviours, tools, expectations and needs of our researchers, scholars and research managers. So, we performed two surveys, one for a quantitative approach and other for the qualitative one. Afterwards, we began an advocacy campaign, with workshops, guidelines and conferences in Spanish. At last, we collected in ODiSEA http://odisea.ciepi.org the journals that are accepting supplementary material and their policies about it. The final aim of the project is to build a discovery tool (OpenDataScience) able to search enriched files into the URLs of the journals.

0
0
0
s2smodern

Objetivos

Determinar políticas sistemáticas adaptadas a nuestro país para incrementar la competitividad de la investigación basadas en la gestión de los datos. Y aumentar la visibilidad de nuestra ciencia maximizando el retorno de la inversión en investigación. En definitiva se trata de fomentar el intercambio y reutilización de los datos primarios de forma generalizada y normalizada.

  1. Identificar sectorialmente las prácticas y necesidades actuales en gestión de datos de investigación por parte de grupos de investigación, instituciones científicas y publicaciones, así como las websites que ofrezcan sus datos abiertos en España y sean susceptibles de ser preservados al tiempo que difundidos (curation).
  2. Desarrollar recursos para la gestión del ciclo de vida digital de los datos científicos de forma sostenible desde los Organismos Públicos de Investigación, mediante la redacción de guías de buenas prácticas para diferentes colectivos: Investigadores, Gestores de investigación, Autoridades académicas, Bibliotecas/CRAI/CRIS.
  3. Promover el uso compartido de datos financiados con fondos públicos, estableciendo políticas adecuadas y propuestas de valorización para los datos, mediante campañas de concienciación y el desarrollo de una herramienta tecnológica libre: el buscador especializado OpenDataScience
0
0
0
s2smodern

Plan de Trabajo

  1. Gestión administrativa del proyecto: Reuniones de funcionamiento para la óptima coordinación de los socios.
  2. Centros productores de datos académicos: Identificar datos de investigación, y centros productores, así como las websites de interés científico que ofrezcan sus datos abiertos en España.
  3. Base de datos de datasets: Explorar y registrar en una base de datos una muestra de los conjuntos de datos que se producen y ofrecen en los centros de investigación nacionales.
  4. Ciclo de vida de los datasets en instituciones: estudio del ciclo de vida digital de los datos científicos (LifeCycle Model).
  5. Guías y recomendaciones: para aumentar el intercambio/exposición abierta de los datos -en repositorios, bases de datos especializadas, websites de editoriales-.
  6. Diseño de Servicios y buscador: diseño del buscador especializado OpenDataScience.
  7. Congreso internacional de resultados y seminarios parciales: para contrastar los avances del proyecto con otros investigadores e instituciones.
  8. Difusión del proyecto y explotación de resultados: acciones de concienciación y publicación de los resultados.
0
0
0
s2smodern

Agenda

Junio 2017
L M X J V S D
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

Agenda Datasea

26 Sep 2017
08:00AM - 05:00PM
36th ADLUG ANNUAL MEETING
26 Sep 2017
08:00AM - 05:00PM
2ªEscuela de verano Catedra Transparencia
26 Sep 2017
08:00AM - 05:00PM
36th ADLUG ANNUAL MEETING
26 Sep 2017
08:00AM - 05:00PM
36th ADLUG ANNUAL MEETING
26 Sep 2017
08:00AM - 05:00PM
36th ADLUG ANNUAL MEETING