Otwarte dane badawcze powinny być:

  • Zapisane – w formatach łatwych do otworzenia i odczytania, najlepiej przy pomocy oprogramowania typu open source. W innych przypadkach zalecane jest wskazanie (bądź udostępnienie) oprogramowania umożliwiającego te działania. Format danych powinien być „otwarty”, czyli dawać możliwość ich ponownego wykorzystania (modyfikacji, przetwarzania). Dane powinny być zapisane z wykorzystaniem standardowego kodowania (ASCII, Unicode).
  • Przechowane (bezpieczna archiwizacja) – zdeponowane długoterminowo w repozytorium/archiwum.
  • Dostępne – na określonych warunkach dostępu do danych i oprogramowania. Zalecane licencje dla danych badawczych to Creative Commons Zero (CC 0) – oświadczenie o zrzeczeniu się praw lub Creative Commons By (CC BY) – uznanie autorstwa, choć ta ostatnia niesie ze sobą ryzyko nawarstwiania atrybucji (konieczność podawania autorów wszystkich danych, z których skorzystaliśmy). Pozostałe licencje w pewnych zakresach są niewłaściwe dla udostępniania danych, gdyż w ostatecznym rozrachunku ograniczają ich otwartość.
  • Łatwe do znalezienia – np. poprzez zastosowanie DOI. Powiązanie danych z publikacją oraz innymi materiałami sprawia, że liczba ścieżek dotarcia do danych się zwiększa.
  • Zrozumiałe – to znaczy opisane w sposób kompletny i zrozumiały, tak aby osoby trzecie mogły je odczytać i ponownie wykorzystać. Zalecane jest stosowanie ujednoliconych standardów tworzenia metadanych (Dublin Core, OpenAIRE Guidelines). Należy dołączyć także dokumentację dotyczącą samego zbioru danych (nazwy i opis zmiennych, rekordów, wartości, opisy zastosowanych schematów klasyfikacyjnych, informacje o urządzeniach pomiarowych, dane przetworzone wraz z oprogramowaniem lub algorytmami zastosowanymi do ich uzyskania), jak i całego projektu (opis celu i kontekst badań, sposoby pozyskiwania danych, procedury, struktura plików z danymi, relacje między plikami, formularze zgody, informacje o różnych wersjach zbiorów danych itp.).
  • Zaufane – z określonym autorstwem oraz afiliacją osób odpowiedzialnych za zebranie, przygotowanie czy przetworzenie danych, co pomaga w ocenie ich rzetelności, jakości i wiarygodności.
  • Interoperacyjne – zapewniające możliwość ich swobodnej wymiany między naukowcami, instytucjami i innymi zainteresowanymi, możliwość ponownego wykorzystania w innych kontekstach niż ten, w którym zostały zebrane. Interoperacyjność oznacza także możliwość łączenia ich z innymi danymi (dzięki współpracy różnych systemów).
  • Odtwarzalne – zapewniające możliwość ponownego wykorzystania w dowolnej formie oraz wykonania jakichkolwiek operacji: pobierania, zapisania, maszynowego przetwarzania, modyfikacji, zmiany, redystrybucji.

Źródło: E. Strzelczyk, Otwarte dane badawcze kolejny krok do otwierania nauki, [dostęp 16.03.2020]