Dane badawcze (Research Data) to zarejestrowane materiały o charakterze faktograficznym (w postaci liczbowej, tekstowej, graficznej czy dźwiękowej), powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych. Dane badawcze to zarówno surowe dane, czyli takie, które uzyskano bezpośrednio w wyniku zastosowania narzędzia badawczego oraz takie, które poddane zostały obróbce.
Dane badawcze to: dane liczbowe, dokumenty tekstowe, notatki, kwestionariusze, nagrania audio i wideo, fotografie, oprogramowanie, wyniki symulacji komputerowych, protokoły laboratoryjne, opisy metodologiczne itp.
Otwarte Dane Badawcze (ang. Open Research Data – ORD) to dane, uzyskane w procesie badawczym, użyte w pracy naukowej, do których każdy ma bezpłatny dostęp. Można je ponownie wykorzystywać, modyfikować i udostępniać z poszanowaniem prawa. Stanowią część szerszej idei, jaką jest Otwarta Nauka, na którą składa się również otwarty dostęp do publikacji (ang. Open Access – OA) oraz otwarta komunikacja naukowa (ang. Open Scholarly Communication – OSC).
- Otwieranie danych pozwala innym naukowcom powtórzyć badania lub je zweryfikować albo dowieść, że dane są prawdziwe
- Otwarte dane są gromadzone i udostępniane w repozytoriach danych badawczych
- Nie wszystkie zbiory danych mogą posiadać otwarty charakter, w szczególności dotyczy to danych osobowych, komercjalizacji wyników badań oraz bezpieczeństwa narodowego
- Informacja o istnieniu danych zawsze powinna być publicznie dostępna, co pozwala uniknąć duplikacji badań
FAIR Data to dane badawcze opisane, przechowywane i publikowane zgodnie z międzynarodowym standardem. Zasady FAIR Data służą jako wytyczne, które umożliwiają ponowne wykorzystanie danych naukowych na następujących zasadach:
- Findable - łatwe znajdowanie i wyszukiwanie
- Accessible - dostępność dla wszystkich
- Interoperable – interoperacyjność, czyli możliwość połączenia z innymi danymi,
- Reusable – możliwość wielokrotnego użytku
Coraz częściej agencje finansujące badania naukowe (w Polsce: Narodowe Centrum Nauki) często wymagają planu zarządzania danymi badawczymi (PZD, ang. Data Management Plan – DMP).
Plan zarządzania danymi powinien zawierać informacje:
- jakie dane zostaną wytworzone lub zebrane (format i typ plików, liczba danych)
- jak zostaną uporządkowane i opisane (metodologia, standardy, metadane)
- kwestie etyczne i prawne (własność intelektualna, prawa autorskie, dane niejawne)
- w jaki sposób dane zostaną udostępnione (jak, kiedy, komu),
- które dane będą przechowywane długoterminowo (kwestia sposobu przechowywania i ochrony danych)
Prezentacje i poradniki:
- Selekcja i przygotowanie danych badawczych do udostępniania - broszura ICM UW
- Jak korzystać z zasobów w repozytoriach danych - broszura ICM UW
- Prawne aspekty otwierania danych badawczych – poradnik ICM UW
- Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym – Narodowe Centrum Nauki
- Platforma Otwartej Nauki http://pon.edu.pl/
- Dziedzinowe Repozytoria Otwartych Danych Badawczych https://drodb.icm.edu.pl/
Strony do tworzenia Data Management Plan:
- DMP Tool - narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców.
- DMP online - narzędzie bardzo podobne do DMPtool zawierające bazę instytucji finansującej naukę z Wielkiej Brytanii.
- Przykładowe Plany Zarządzania Danymi Badawczymi dostępne są na stronie Biblioteki UMK https://www.bu.umk.pl/plan-zarzadzania-danymi
Rekomendowane repozytoria otwartych danych badawczych i wyszukiwarki:
- RepOD
- Zenodo
- re3data.org – katalog repozytoriów danych badawczych, można je przeszukiwać według dziedziny, kraju czy typu deponowanych danych.