Dane badawcze
Dane badawcze (research data) to zarejestrowane materiały o charakterze faktograficznym (w postaci liczbowej, tekstowej, graficznej czy dźwiękowej), powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych. Dane badawcze dzielą się na surowe dane (uzyskane bezpośrednio w wyniku zastosowania narzędzia badawczego) oraz dane, które poddano obróbce. Dane badawcze to: dane liczbowe, dokumenty tekstowe, notatki, kwestionariusze, nagrania audio i wideo, fotografie, modele matematyczne, algorytmy, oprogramowanie, wyniki symulacji komputerowych, protokoły laboratoryjne, opisy metodologiczne itp.
Otwarte dane badawcze (open research data) to dane, do których każdy ma dostęp. Można je ponownie wykorzystywać, modyfikować i redystrybuować.
Plan zarządzania danymi (PZD – Data Management Plan, DMP) określa, w jaki sposób dane badawcze powstałe w trakcie realizacji projektu badawczego mają być zarządzane zarówno w czasie jego trwania, jak i po zakończeniu. W programach finansowania badań naukowych oraz w czasopismach coraz częściej wymaga się od naukowców przedstawienia DMP już na etapie składania wniosków grantowych czy przed publikacją artykułu (np. Horyzont 2020).
Narodowe Centrum Nauki (NCN) w 2019 r. wprowadziło do wniosku o dofinansowanie projektów badawczych załącznik, w którym trzeba zamieścić skrócony plan zarządzania danymi badawczymi, który będzie uzupełniany w raporcie końcowym, a po zakończeniu projektu będzie oceniany przez NCN. W DMP należy opisać w języku angielskim:
- typ i formaty danych badawczych i sposób ich pozyskiwania
- sposoby gromadzenia i opisywania danych (standardy metadanych)
- sposoby udostępniania danych oraz możliwości ich ponownego wykorzystania oraz przekształcania
- kwestie etyczne i prawne (własność intelektualna, prawa autorskie)
- sposób ich archiwizacji i zapewnienia dostępu do danych , czyli gdzie i jak długo będą archiwizowane.
NCN udostępnia wytyczne wraz z instrukcją odnośnie przygotowania DMP.
Repozytoria, z których należy korzystać udostępniając dane badawcze powinny przestrzegać zasad FAIR Data, tzn. dane powinny być:
- Findable – łatwo znajdowane i wyszukiwane
- Accessible – dostępne dla wszystkich
- Interoperable – interoperacyjne, tak aby można było je wymienić lub połączyć z innymi danymi
- Reusable – wielokrotnego użytku.
Rekomendowane repozytoria otwartych danych badawczych spełniające te warunki i wyszukiwarki:
- Access Directory Data Repositories
- RepOD
- Zenodo
- re3data.org – katalog repozytoriów danych badawczych według dziedziny, kraju czy typu deponowanych danych.
Przydatne serwisy i materiały
- Plan Zarządzania Danymi Badawczymi (UMK), w tym modele planów dla NCN opracowane przez pracowników UMK
- Poradnik – plan zarządzania danymi badawczymi (KUL)
- prezentacje i poradniki Platformy Otwartej Nauki (ICM UW)
- praktyczny przewodnik dotyczący ujednoliconych europejskich praktyk związanych z zarządzaniem danymi naukowymi (Science Europe)
- kreatory DMP:
- DMPtool (US) – narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców
- DMPonline (UK) – kreator planów zarządzania danymi badawczymi, zawierający bazę instytucji finansującej naukę z Wielkiej Brytanii
- kursy online:
- MANTRA – darmowy kurs dla studentów, naukowców i bibliotekarzy stworzony w Uniwersytecie w Edynburgu
- Research Data Management and Sharing – bezpłatny kurs MOOC dostępny na platformie Coursera prowadzony przez pracowników The University of North Carolina on Chapel Hill i University of Edinburgh
- Checklist for a Data Management Plan – lista kontrolna ułatwiająca sprawdzenie poprawności przygotowanego DMP
- modele metadanych