Od września 2019 r. istnieje obowiązek dołączania do wniosków o finansowanie projektów przez NCN skróconego planu zarządzania danymi badawczymi, które zostaną w trakcie realizacji projektu wytworzone. Plan ten ma być uzupełniony na etapie składania raportu końcowego i zostanie oceniony po zakończeniu realizacji projektu.

Zarządzenie to stanowi pierwszy etap wprowadzania przez NCN polityki otwartego dostępu do danych naukowych wytworzonych/wykorzystanych w ramach realizacji projektów finansowanych przez Centrum. Stanowi ono odpowiedź na wcześniejsze wytyczne Komisji Europejskiej, zawarte w Zaleceniach z dnia 17 lipca 2012 r. w sprawie dostępu do informacji naukowej i jej ochrony, a także na Dyrektywę Parlamentu Europejskiego i Rady (UE) 2019/1024 z dnia 20 czerwca 2019 r. w sprawie otwartych danych i ponownego wykorzystania informacji sektora publicznego.

 

Dane badawcze

Plan Zarządzania Danymi Badawczymi

Repozytoria danych badawczych

Przydatne linki

 

Image by Gerd Altmann from Pixabay 

Dane badawcze

W nowych przepisach „dane badawcze” zdefiniowano jako „dokumenty w formie cyfrowej, inne niż publikacje naukowe, które są gromadzone lub opracowywane w ramach działalności badawczo-naukowej i są wykorzystywane jako dowody w procesie badawczym bądź też są powszechnie akceptowane w środowisku naukowym jako konieczne do weryfikacji poprawności ustaleń i wyników badań” (Dyrektywa Parlamentu Europejskiego i Rady (UE) 2019/1024, art. 2, p. 9). Są to zarówno surowe dane, czyli takie, które uzyskano bezpośrednio w wyniku zastosowania narzędzia badawczego, jak i takie, które już zostały poddane obróbce. Do danych badawczych zalicza się także informacje na temat pochodzenia wykorzystywanych danych, to znaczy jak, gdzie i kiedy oraz za pomocą jakich narzędzi zostały one zebrane czy wytworzone (czyli obejmują one całą dokumentację badań). W skład danych badawczych wchodzą także metadane (np. nazwa zbioru danych, autorzy), stanowiące podstawowy opis umożliwiający identyfikację i zrozumienie danych.

Dlatego też termin „dane badawcze” nie jest ściśle zdefiniowany, lecz będzie obejmował każdy rodzaj danych stworzonych lub wyprodukowanych w toku badań naukowych.

 

Dane badawcze muszą przestrzegać zasad FAIR (Inicjatywa FAIR Data), czyli powinny być opisane, przechowywane i publikowane zgodnie z międzynarodowym standardem. Zasady FAIR Data służą jako wytyczne dla umożliwienia ponownego wykorzystania danych naukowych w wyraźnie opisanych warunkach zarówno przez ludzi, jak i przez maszyny. Dane, które ze względu na ochronę prywatności nie mogą zostać opublikowane w całości, również mogą spełniać wszystkie zasady FAIR:

  • Findable - łatwo znajdywane i wyszukiwane.
  • Accessible - dostępne dla wszystkich
  • Interoperable - interoperacyjne, czyli możliwe do połączenia z innymi danymi
  • Reusable - wielokrotnego użytku

 
Przykłady danych badawczych: zobacz infografikę

 

Otwarte dane badawcze to dane uzyskane w procesie badawczym i użyte w pracy naukowej, do których każdy ma bezpłatny dostęp. Można je ponownie wykorzystywać, modyfikować i udostępniać z poszanowaniem prawa.

Jak czytamy w tej samej dyrektywie UE, otwarty dostęp przyczynia się do zwiększenia jakości badań oraz ograniczenia konieczności ich zbędnego powielania, do przyśpieszenia postępu naukowego oraz zwalczania oszustw w dziedzinie nauki, a także może ogólnie sprzyjać wzrostowi gospodarczemu i innowacyjności. W tym kontekście powinno się jednak należycie uwzględnić kwestie związane z prywatnością, ochroną danych osobowych, poufnością, bezpieczeństwem narodowym, uzasadnionymi interesami handlowymi, takimi jak tajemnica przedsiębiorstwa, oraz prawami własności intelektualnej osób trzecich zgodnie z zasadą „otwarty, jak to najbardziej możliwe, zamknięty, jak to konieczne”. (Dyrektywa Parlamentu Europejskiego i Rady (UE) 2019/1024, p. (27) i (28).

Jakie powinny być otwarte dane badawcze?

 

O zagadnieniach prawnych dotyczących ochrony i udostępniania danych badawczych przeczytasz tutaj, tutajtutaj.

 Image by ar130405 from Pixabay

 

Plan Zarządzania Danymi Badawczymi (PZD)

Plan Zarządzania Danymi (ang. Data Management Plan – DMP) określa, w jaki sposób dane badawcze mają być zarządzane zarówno podczas projektu badawczego, jak i po jego zakończeniu. PZD powinien zawierać następujące informacje na temat:

  • jakie dane zostaną wytworzone lub zebrane (format i typ plików, liczba danych),
  • jak dane zostaną uporządkowane i opisane (metodologia, standardy, metadane),
  • kwestii etycznych i prawnych (własność intelektualna, prawa autorskie, dane niejawne),
  • w jaki sposób dane zostaną udostępnione (jak, kiedy, komu),
  • które dane będą przechowywane długoterminowo (kwestia sposobu przechowywania i ochrony danych).

Nie jest wymagane udostępnianie wszystkich zebranych danych, ale takich, które są potrzebne do weryfikacji wyników badań zaprezentowanych w publikacji naukowej

 Dobry Plan Zarządzania Danymi powinien być:

  • prosty i konkretny
  • realistyczny, oparty na dostępnych informacjach
  • może się zmieniać

 

Narzędzia pomocne podczas tworzenia Planów Zarządzania Danymi (PZD)

  • ARGOS - zawiera dwie funkcjonalności: szablony PZD oraz opisy zestawów danych
  • DMPtool (US) – narzędzie przygotowujące szablony PZD dostosowane do wymagań amerykańskich grantodawców
  • DMPonline (UK) – narzędzie przygotowujące szablony PZD dostosowane do wymagań instytucji finansujących naukę z Wielkiej Brytanii
  • Lista kontrolna DCC (Checklist for a Data Management Plan) - pozwala szybko określić, jakich informacji może brakować w przygotowywanym PZD

 

 

Image by 200 Degrees from Pixabay 2

 

Repozytoria danych badawczych

Długoterminowemu przechowywaniu danych badawczych służą repozytoria danych badawczych. Powinny one spełniać CoreTrustSeal Trustworthy Repositories Requirements, czyli kryteria określające poziom wiarygodności repozytoriów danych.

Polecane repozytoria to:

  • Zenodo - międzynarodowe repozytorium opracowane dzięki inicjatywie OpenAIRE i CERN, umożliwiające naukowcom zajmującym się wszystkimi dziedzinami wiedzy proste archiwizowanie i dzielenie się opracowanymi przez siebie danymi badawczymi. Przeznaczone dla tzw. małych danych (do 50GB)
  • RepOD - repozytorium otwartych danych opracowane przez ICM UW w ramach działań Platformy Otwartej Nauki, archiwizujące i udostępniające wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych. Przeznaczone dla tzw. małych danych (do 50GB)
  • RDS (Repozytorium Danych Społecznych) - dziedzinowe repozytorium służące do udostępniania jakościowych i ilościowych danych społecznych
  • Re3data.org - globalny rejestr repozytoriów danych badawczych ze wszystkich dyscyplin akademickich, umożliwiający wyszukiwanie repozytoriów według dziedziny wiedzy, kraju oraz typu danych badawczych

NCN zaleca korzystanie w pierwszej kolejności z repozytoriów certyfikowanych lub szeroko uznanych w danej dyscyplinie, a jeżeli takie repozytoria nie istnieją, kierowanie się w swoim wyborze kryteriami zawartymi w dokumencie Practical Guide to the international alignment of research data management.

 

Image by Gerd Altmann from Pixabay

 

Przydatne linki

Instrukcje NCN

Dokumenty unijne

Informatory/prezentacje
polskie:

zagraniczne: