Dane badawcze powstają lub są wykorzystywane w trakcie realizacji działań naukowych – stanowią ich podstawę i są potrzebne, aby odtworzyć i ocenić otrzymane wyniki. Obejmują one m.in.: dane liczbowe, dokumenty tekstowe, notatki, dzienniki laboratoryjne, kwestionariusze i wyniki ankiet, nagrania audio i wideo, fotografie, zawartość baz danych, wykorzystane oprogramowanie, wyniki symulacji komputerowych, protokoły.

Deponowanie danych i otwieranie dostępu do nich odbywa się za pośrednictwem repozytoriów danych badawczych i może być wymogiem organizacji finansującej działanie naukowe, wydawcy lub przyjętą praktyką danej społeczności naukowej.

Aby dane mogły być jak najdłużej przydatne, należy zwrócić uwagę na tzw. cykl życia danych oraz procesy składające się na zarządzanie danymi badawczymi. Elementem procesu zarządzania danymi jest stworzenie Planu Zarządzania Danymi (tzw. DMP).

Procedury zarządzania danymi zapewniają, że dane badawcze są łatwe do znalezienia i ponownego wykorzystania oraz że są odpowiednio chronione przez cały ich cykl życia danych. W procedurach zarządzania danymi badawczymi bardzo ważną rolę pełnią zasady FAIR (Findable, Accessible, Interoperable, Reusable).

Warto pamiętać, że nawet jeśli dane badawcze nie mogą zostać udostępnione do ponownego wykorzystania, to nadal mogą być zgodne z zasadami FAIR.

Artykuły opisujące zbiory danych w postaci „data descriptors” mogą być publikowane, podobnie do artykułów, w tzw. Data Journals – recenzowanych w czasopismach.

Więcej informacji dotyczących pracy z danymi znajduje się poniżej.

Repozytoria danych badawczych
Politechnika Lubelska posiada instytucjonalne repozytorium, które umożliwia deponowanie danych pracownikom oraz doktorantom Politechniki Lubelskiej:

  • Repozytorium Otwartych Zbiorów i Wiedzy ROCK

Instytucjonalne Repozytorium Politechniki Lubelskiej długoterminowo archiwizuje i udostępnia dane badawcze, publikacje oraz materiały powiązane z działalnością naukową, dydaktyczną i popularyzatorską społeczności akademickiej Politechniki Lubelskiej, a także z historią uczelni i techniki.

ROCK jest zarejestrowany w wyszukiwarkach i agregatorach indeksujących repozytoria: OpenDOAR oraz re3Data. Dzięki temu realizuje zalecenia dotyczące otwartego dostępu do danych badawczych oraz spełnia wymogi polityki otwartego dostępu do publikacji Narodowego Centrum Nauki, której celem jest promowanie otwartego dostępu do wyników badań finansowanych przez NCN przez udostępnienie ich wszystkim zainteresowanym użytkownikom bez ograniczeń.

Politechnika Lubelska posiada w repozytoriach Zenodo oraz RepOD kolekcje instytucjonalne, w których pracownicy PL mogą deponować dane:

  • Zenodo

Repozytorium opracowane dzięki inicjatywie OpenAIRE i CERN jako międzynarodowe repozytorium danych badawczych umożliwiające naukowcom zajmującym się wszystkimi dziedzinami wiedzy proste archiwizowanie i dzielenie się opracowanymi przez siebie danymi badawczymi. Jest ono przeznaczone dla tzw. „małych danych”.

  • RepOD

Repozytorium Otwartych Danych opracowane przez ICM UW w ramach działań Platformy Otwartej Nauki archiwizujące i udostępniające wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych. Przeznaczone jest także dla „małych danych”.

Za przygotowanie i umieszczenie materiałów oraz nadanie im odpowiedniej licencji odpowiada osoba deponująca, która robi to z poziomu indywidualnego konta użytkownika.

Miejsca, w jakich możemy zdeponować dane, nie są ograniczone wyłącznie do tych serwisów. Jeśli nie są one odgórnie wskazane zapisami umów lub zarządzeń, należy wziąć pod uwagę repozytoria dziedzinowe z obszaru realizowanych badań. W tym celu przydatne mogą okazać się wyszukiwarki i agregatory repozytoriów danych:

Wyszukiwarki i bazy (agregatory) indeksujące repozytoria danych badawczych:

  • Re3data

Rzetelna i polecana międzynarodowa baza indeksująca repozytoria danych badawczych z wszystkich dziedzin wiedzy, prowadzona przez German Research Fundation. Umożliwia wyszukiwanie repozytoriów według dziedziny oraz kraju, w którym dane repozytorium jest prowadzone.

  • OpenDOAR

Międzynarodowa baza indeksująca biblioteki cyfrowe, repozytoria instytucjonalne i repozytoria danych badawczych. Baza umożliwia zarówno wyszukiwanie samych repozytoriów, jak i przeszukiwanie ich zasobów.

  • Repository Finder Tool

Wyszukiwarka stworzona w ramach projektu: AGU’s Enabling FAIR Data Project. Rozwijana przez zespoły DataCite i re3data.org.

Ważne, aby repozytorium, na jakie się decydujemy, stosowało stały identyfikator zasobu, tzw. PID. (np. DOI lub handle) oraz zapewniało długotrwałe i bezpieczne przechowywanie danych.

Zarządzanie danymi badawczymi

Zarządzanie danymi badawczymi obejmuje organizację i utrzymanie danych w całym procesie badawczym oraz odpowiednią ich archiwizację po zakończeniu projektu. Jest to działalność ciągła, trwająca przez cały cykl życia danych, który obejmuje:

Planowanie: planowanie może obejmować przegląd istniejących źródeł danych, udzielenie świadomej zgody, rozważenie kosztów i zaplanowanie kolejnych działań.

Plan DMP

  • Gromadzenie: badacze opracowują dane (pochodzące z własnych eksperymentów, obserwacji, pomiarów, symulacji lub od osób trzecich).
  • Przetwarzanie: dane są konwertowane do formatu cyfrowego (transkrybowane, digitalizowane) zgodnie ze standardami zapewnianiającymi najlepszą jakość. Następnie są sprawdzane, walidowane, oczyszczane, ponownie kodowane, wersjonowane i w razie potrzeby anonimizowane. Wszystkie te procesy są dokumentowane, a dane są opisane z wykorzystaniem odpowiedniego standardu metadanych.
  • Analiza: dane są analizowane i interpretowane w celu uzyskania informacji.
  • Przechowywanie: dane są zapisywane w formatach zgodnych z najlepszymi praktykami przechowywania, tworzone są metadane umożliwiające odnalezienie danych, przypisywany jest trwały identyfikator cyfrowy, brane jest pod uwagę bezpieczeństwo przechowywanych informacji.
  • Udostępnianie: uwzględnia prawa dostępu (względy etyczne i własność intelektualną), towarzyszące metadane oraz miejsce udostępniania np. repozytorium.
  • Ponowne wykorzystanie: potencjalnie użyteczne dane i dokumentacja, przygotowane przez twórcę wraz z metadanymi, są odnajdywane i wykorzystywane. Przekształcenia w obrębie tych danych są dokumentowane, a oryginalne źródła są cytowane.

Zasady FAIR

Zasady FAIR Data – odnoszą się do standardu przechowywania i publikowania danych badawczych. Służą one jako wytyczne umożliwiające ponowne wykorzystanie danych w określonych warunkach przez ludzi i maszyny:

  • Findable – dane powinny być możliwe do znalezienia, opatrzone metadanymi, trwałymi identyfikatorami np. DOI,
  • Accessible – dane powinny być dostępne (dostępność tworzą: określone warunki dostępu, wymagane oprogramowanie, dostępność metadanych),
  • Interoperable – dane powinny być interoperacyjne (na interoperacyjność składają się: możliwość przetwarzania danych, możliwość wymiany i połączenia z innymi zbiorami danych, otwartość wykorzystanego oprogramowania, wykorzystanie standardowych metodologii i słowników),
  • Reusable – dane powinny nadawać się do ponownego użycia (powinny być zarchiwizowane na odpowiedniej licencji, uwzględniać okres embarga lub karencji).

Więcej o FAIR Data: Inicjatywa FAIRdata.

Data Journals

Są to recenzowane czasopisma, w których publikowane są opisy danych i sposoby ich pozyskania. Artykuły opisujące zbiory danych najczęściej określa się mianem „data descriptors”, oprócz nich istnieją tzw. data papers.

Recenzja przygotowana jest przez ekspertów z danej dyscypliny i skupia się na jakości i wartości danych – uwzględniając zastosowane procedury i metody – oraz na ich unikalności i użyteczności, czyli potencjalnym wykorzystaniu w badaniach przez innych naukowców.

Czasopisma mogą mieć charakter multidyscyplinarny lub być skupione wokół jednej dziedziny. Oprócz data descriptors, w tego rodzaju czasopismach znaleźć można też nowe sposoby wykorzystania już opublikowanych danych.

Przykłady data journals:
Scientific Data - https://www.nature.com/sdata/

Data in Brief - https://www.sciencedirect.com/journal/data-in-brief

Materiały szkoleniowe

Poniżej znajdują się linki do materiałów, które mogą ułatwić prace z danymi:

Przewodniki Komisji Europejskiej:

  • Przewodnik Komisji Europejskiej dotyczący zasad otwartego dostępu do publikacji naukowych i danych badawczych w programie „Horyzont 2020”,
  • Przewodnik dotyczący zarządzania danymi zgodnie z zasadami FAIR w programie „Horyzont 2020”.

Poradniki i prezentacje Platformy Otwartej Nauki (ICM UW):

Kursy online:

  • MANTRA – darmowy kurs dla studentów, naukowców i bibliotekarzy (Uniwersytet w Edynburgu),
  • Research Data Management and Sharing – bezpłatny kurs MOOC dostępny na platformie Coursera prow (The University of North Carolina on Chapel Hill / University of Edinburgh).

Modele metadanych:

Kontakt
Ośrodek Analiz Bibliometrycznych
Centrum Innowacji i Zaawansowanych Technologii (Rdzewiak)
ul. Nadbystrzycka 36 C, pokój 309 D
20-618 Lublin
e-mail: oab@pollub.pl
tel. 81 538 46 86

fundusze.png

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego, Program Operacyjny Wiedza Edukacja Rozwój 2014-2020 "PL2022 - Zintegrowany Program Rozwoju Politechniki LubelskiejPOWR.03.05.00-00-Z036/17