Od września 2019 r. istnieje obowiązek dołączania do wniosków o finansowanie projektów przez NCN skróconego planu zarządzania danymi badawczymi, które zostaną w trakcie realizacji projektu wytworzone. Plan ten ma być uzupełniony na etapie składania raportu końcowego i zostanie oceniony po zakończeniu realizacji projektu.
Zarządzenie to stanowi pierwszy etap wprowadzania przez NCN polityki otwartego dostępu do danych naukowych wytworzonych/wykorzystanych w ramach realizacji projektów finansowanych przez Centrum. Stanowi ono odpowiedź na wcześniejsze wytyczne Komisji Europejskiej, zawarte w Zaleceniach z dnia 17 lipca 2012 r. w sprawie dostępu do informacji naukowej i jej ochrony, a także na Dyrektywę Parlamentu Europejskiego i Rady (UE) 2019/1024 z dnia 20 czerwca 2019 r. w sprawie otwartych danych i ponownego wykorzystania informacji sektora publicznego.
Plan Zarządzania Danymi Badawczymi
Dane badawcze
W nowych przepisach „dane badawcze” zdefiniowano jako „dokumenty w formie cyfrowej, inne niż publikacje naukowe, które są gromadzone lub opracowywane w ramach działalności badawczo-naukowej i są wykorzystywane jako dowody w procesie badawczym bądź też są powszechnie akceptowane w środowisku naukowym jako konieczne do weryfikacji poprawności ustaleń i wyników badań” (Dyrektywa Parlamentu Europejskiego i Rady (UE) 2019/1024, art. 2, p. 9). Są to zarówno surowe dane, czyli takie, które uzyskano bezpośrednio w wyniku zastosowania narzędzia badawczego, jak i takie, które już zostały poddane obróbce. Do danych badawczych zalicza się także informacje na temat pochodzenia wykorzystywanych danych, to znaczy jak, gdzie i kiedy oraz za pomocą jakich narzędzi zostały one zebrane czy wytworzone (czyli obejmują one całą dokumentację badań). W skład danych badawczych wchodzą także metadane (np. nazwa zbioru danych, autorzy), stanowiące podstawowy opis umożliwiający identyfikację i zrozumienie danych.
Dlatego też termin „dane badawcze” nie jest ściśle zdefiniowany, lecz będzie obejmował każdy rodzaj danych stworzonych lub wyprodukowanych w toku badań naukowych.
Dane badawcze muszą przestrzegać zasad FAIR (Inicjatywa FAIR Data), czyli powinny być opisane, przechowywane i publikowane zgodnie z międzynarodowym standardem. Zasady FAIR Data służą jako wytyczne dla umożliwienia ponownego wykorzystania danych naukowych w wyraźnie opisanych warunkach zarówno przez ludzi, jak i przez maszyny. Dane, które ze względu na ochronę prywatności nie mogą zostać opublikowane w całości, również mogą spełniać wszystkie zasady FAIR:
- Findable - łatwo znajdywane i wyszukiwane.
- Accessible - dostępne dla wszystkich
- Interoperable - interoperacyjne, czyli możliwe do połączenia z innymi danymi
- Reusable - wielokrotnego użytku
Przykłady danych badawczych: zobacz infografikę
Otwarte dane badawcze to dane uzyskane w procesie badawczym i użyte w pracy naukowej, do których każdy ma bezpłatny dostęp. Można je ponownie wykorzystywać, modyfikować i udostępniać z poszanowaniem prawa.
Jak czytamy w tej samej dyrektywie UE, otwarty dostęp przyczynia się do zwiększenia jakości badań oraz ograniczenia konieczności ich zbędnego powielania, do przyśpieszenia postępu naukowego oraz zwalczania oszustw w dziedzinie nauki, a także może ogólnie sprzyjać wzrostowi gospodarczemu i innowacyjności. W tym kontekście powinno się jednak należycie uwzględnić kwestie związane z prywatnością, ochroną danych osobowych, poufnością, bezpieczeństwem narodowym, uzasadnionymi interesami handlowymi, takimi jak tajemnica przedsiębiorstwa, oraz prawami własności intelektualnej osób trzecich zgodnie z zasadą „otwarty, jak to najbardziej możliwe, zamknięty, jak to konieczne”. (Dyrektywa Parlamentu Europejskiego i Rady (UE) 2019/1024, p. (27) i (28).
Jakie powinny być otwarte dane badawcze?
O zagadnieniach prawnych dotyczących ochrony i udostępniania danych badawczych przeczytasz tutaj, tutaj i tutaj.
Plan Zarządzania Danymi Badawczymi (PZD)
Plan Zarządzania Danymi (ang. Data Management Plan – DMP) określa, w jaki sposób dane badawcze mają być zarządzane zarówno podczas projektu badawczego, jak i po jego zakończeniu. PZD powinien zawierać następujące informacje na temat:
- jakie dane zostaną wytworzone lub zebrane (format i typ plików, liczba danych),
- jak dane zostaną uporządkowane i opisane (metodologia, standardy, metadane),
- kwestii etycznych i prawnych (własność intelektualna, prawa autorskie, dane niejawne),
- w jaki sposób dane zostaną udostępnione (jak, kiedy, komu),
- które dane będą przechowywane długoterminowo (kwestia sposobu przechowywania i ochrony danych).
Nie jest wymagane udostępnianie wszystkich zebranych danych, ale takich, które są potrzebne do weryfikacji wyników badań zaprezentowanych w publikacji naukowej
Dobry Plan Zarządzania Danymi powinien być:
- prosty i konkretny
- realistyczny, oparty na dostępnych informacjach
- może się zmieniać
Narzędzia pomocne podczas tworzenia Planów Zarządzania Danymi (PZD)
- ARGOS - zawiera dwie funkcjonalności: szablony PZD oraz opisy zestawów danych
- DMPtool (US) – narzędzie przygotowujące szablony PZD dostosowane do wymagań amerykańskich grantodawców
- DMPonline (UK) – narzędzie przygotowujące szablony PZD dostosowane do wymagań instytucji finansujących naukę z Wielkiej Brytanii
- Lista kontrolna DCC (Checklist for a Data Management Plan) - pozwala szybko określić, jakich informacji może brakować w przygotowywanym PZD
Repozytoria danych badawczych
Długoterminowemu przechowywaniu danych badawczych służą repozytoria danych badawczych. Powinny one spełniać CoreTrustSeal Trustworthy Repositories Requirements, czyli kryteria określające poziom wiarygodności repozytoriów danych.
Polecane repozytoria to:
- Zenodo - międzynarodowe repozytorium opracowane dzięki inicjatywie OpenAIRE i CERN, umożliwiające naukowcom zajmującym się wszystkimi dziedzinami wiedzy proste archiwizowanie i dzielenie się opracowanymi przez siebie danymi badawczymi. Przeznaczone dla tzw. małych danych (do 50GB)
- RepOD - repozytorium otwartych danych opracowane przez ICM UW w ramach działań Platformy Otwartej Nauki, archiwizujące i udostępniające wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych. Przeznaczone dla tzw. małych danych (do 50GB)
- RDS (Repozytorium Danych Społecznych) - dziedzinowe repozytorium służące do udostępniania jakościowych i ilościowych danych społecznych
- Re3data.org - globalny rejestr repozytoriów danych badawczych ze wszystkich dyscyplin akademickich, umożliwiający wyszukiwanie repozytoriów według dziedziny wiedzy, kraju oraz typu danych badawczych
NCN zaleca korzystanie w pierwszej kolejności z repozytoriów certyfikowanych lub szeroko uznanych w danej dyscyplinie, a jeżeli takie repozytoria nie istnieją, kierowanie się w swoim wyborze kryteriami zawartymi w dokumencie Practical Guide to the international alignment of research data management.
Przydatne linki
Instrukcje NCN
- Pismo dyrektora NCN z 3.04.2019
- Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym
- Najczęściej zadawane pytania
Dokumenty unijne
- DYREKTYWA PARLAMENTU EUROPEJSKIEGO I RADY (UE) 2019/1024 z dnia 20 czerwca 2019 r.w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego (wersja przekształcona)
- ZALECENIE KOMISJI z dnia 17 lipca 2012 r. w sprawie dostępu do informacji naukowej oraz jej ochrony (2012/417/UE)
Informatory/prezentacje
polskie:
- Jak korzystać z zasobów w repozytoriach danych - Wersja 1.0
- Selekcja i przygotowanie danych badawczych do udostępnienia - Wersja 1.0
- Otwarte, czyli bezpieczne : Analiza prawnych form ochrony danych badawczych i zalecenia w kwestii dostępu i korzystania
- Otwarte dane badawcze w humanistyce - prezentacja
- Warsztaty zarządzania danymi badawczymi - prezentacja
- Otwieranie małych danych badawczych - prezentacja
- Udostępnianie danych badawczych - zagadnienia prawne - prezentacja
- Zarządzanie danymi badawczymi - ogólne informacje i PZD - prezentacja
- Zarządzanie danymi badawczymi - informacje ogólne i plany zarządzania danymi - film
zagraniczne:
- Lafayette - Humanities Research Data
- Science Europe - Practical Guide to the International Alignment of Research Data Management
- Science Europe - Guidance Document Presenting a Framework for Discipline-specific Research Data Management
- Research Data in the Humanities, Arts and Social Sciences: resources, protocols and opportunities
- NC STATE University Libraries - Data Management – poradnik przygotowany przez NC STATE University Libraries
- Data and Donuts: The Impact of Data Management - prezentacja
- Curtin University Library - Research Data Management – szczegółowo opisany plan zarządzania danymi badawczymi
- The Data Curation Center - serwis brytyjskiej instytucji specjalizującej się w zarządzaniu danymi badawczymi, zawierający gotowe plany zarządzania danymi, szablony, przewodniki, wytyczne, informacje na temat formatów zamieszczanych danych badawczych czy metadanych w zależności od dyscypliny oraz listę kontrolną