Plan zarządzania danymi (Data Management Plan – DMP) – określa, w jaki sposób dane badawcze powstałe w trakcie realizacji projektu badawczego mają być zarządzane, zarówno w czasie jego trwania, jak i po zakończeniu.

W 2019 r. NCN wprowadził do wniosku o dofinansowanie projektów badawczych załącznik – plan zarządzania danymi badawczymi.

Wzór DMP wegług Science Europe
1. ZBIERANIE DANYCH LUB PONOWNE UŻYCIE ISTNIEJĄCYCH DANYCH

JAK BĘDĄ ZBIERANE NOWE DANE W TRAKCIE REALIZACJI PROJEKTU NAUKOWEGO?

JAK ISTNIEJĄCE DANE NAUKOWE ZOSTANĄ PONOWNIE WYKORZYSTANE?

Proszę opisać, jaka metodologia lub oprogramowanie zostanie wykorzystane, jeśli zostaną zebrane/wytworzone nowe dane. Proszę wyjaśnić, jak będzie udokumentowane pochodzenie danych. Należy podać wszelkie ograniczenia dotyczące ponownego wykorzystania istniejących danych, jeśli takowe istnieją. Jeśli rozważano ponowne użycie istniejącego źródła danych, ale koncepcję tę odrzucono, należy podać powody tej decyzji.

JAKIE DANE ZOSTANĄ ZEBRANE LUB WYPRODUKOWANE?

Proszę podać szczegóły dotyczące rodzaju danych, określić rodzaj (np. bazy danych, arkusze kalkulacyjne, dokumenty, obrazy, audio, wideo itp.) i format danych. Należy uzasadnić użycie konkretnych formatów (mogą one wynikać z doświadczenia pracownika, preferencji dla otwartych formatów, konieczności uwzględnienia standardów akceptowanych przez repozytoria danych, szeroko rozpowszechnione wykorzystanie formatów w konkretnej społeczności naukowej lub stosowane oprogramowanie czy konkretny sprzęt naukowy). Proszę podać szczegóły dotyczące przewidywanych woluminów danych. Należy preferować otwarte i standardowe formaty, ponieważ ułatwiają one udostępnianie i, długoterminowo, również ponowne wykorzystanie danych (wiele repozytoriów podaje listy takich "preferowanych formatów").

2. DOKUMENTACJA I JAKOŚĆ DANYCH
JAKIE METADANE ZOSTANĄ OPISANE I JAK BĘDZIE PRZEPROWADZONY PROCES DOKUMENTACJI?

Proszę wskazać, jakie metadane zostaną dostarczone w wyniku realizacji projektu i jakie standardy zostaną zastosowane (np. DDI, TEI, EML, MARC, CMDI). Proszę opisać sposób, w jaki będzie się zarządzać danymi podczas realizacji projektu (np. ustalenie konwencji zapisu, kontroli wersji i struktury folderów). Należy się zastanowić, jaka inna dokumentacja jest potrzebna, aby umożliwić ponowne użycie danych, np. informacje na temat metodologii gromadzenia danych analitycznych czy informacje o procedurach, definicje zmiennych czy jednostek pomiarowych. Proszę podać, jak informacje będą zbierane i gdzie zostaną zapisane (np. w bazie danych wraz z linkami do poszczególnych elementów, jako plik tekstowy typu readme, nagłówki plików, książki kodów lub zeszyty laboratoryjne). Należy używać standardów metadanych konkretnych społeczności naukowych, jeśli tylko są dostępne. Proszę pamiętać, że spójne, dobrze uporządkowane dane badawcze będą łatwiejsze do znalezienia, zrozumienia i ponownego użycia!

JAKIE ŚRODKI KONTROLI JAKOŚCI DANYCH ZOSTANĄ ZASTOSOWANE?

Proszę opisać, w jaki sposób będzie kontrolowana i udokumentowana spójność i jakość procesu gromadzenia danych [kalibracja, powtarzanie poboru próbek lub pomiarów, znormalizowany pobór danych, sprawdzanie poprawności wprowadzania danych, wzajemna ocena (peer-review) danych lub przedstawienie zgodne z słownikami kontrolowanymi (ang. controlled vocabularies)].

3. PRZECHOWYWANIE DANYCH I TWORZENIE KOPII ZAPASOWYCH DANYCH PODCZAS PROWADZENIA BADAŃ NAUKOWYCH
JAKIE DANE I METADANE SĄ PRZECHOWYWANE I JAKIE BĘDĄ ZAPISYWANE W FORMIE KOPII ZAPASOWEJ PODCZAS PROWADZENIA BADAŃ NAUKOWYCH?

Proszę opisać, gdzie będą przechowywane dane i kopie zapasowe podczas prowadzonych prac badawczych i jak często będzie wykonywana kopia zapasowa. Zaleca się przechowywanie danych w conajmniej dwóch osobnych lokalizacjach. Należy preferować w pierwszej kolejności zastosowanie sprawdzonego systemu magazynowania danych, z automatyczną kopią zapasową. Nie zaleca się przechowywania danych na laptopach, niezależnych/automatycznych dyskach twardych lub zewnętrznych urządzeniach pamieci masowej, takich jak pamięci USB.

W JAKI SPOSÓB BĘDZIE ZAGWARANTOWANE BEZPIECZEŃSTWO DANYCH I OCHRONA WRAŻLIWYCH DANYCH PODCZAS BADAŃ?

Proszę opisać, w jaki sposób dane zostaną odzyskane w przypadku niespodziewanego zdarzenia. Proszę podać, kto będzie miał dostęp do danych podczas badań i jak dostęp do danych będzie kontrolowany, szczególnie w ramach współpracy z partnerami. Należy zwrócić szczególną uwagę na ochronę danych, jeśli są one wrażliwe i zawierają np.: dane osobowe, informacje wrażliwe politycznie lub tajemnice handlowe. Poleca się opisanie głównych zagrożeń i sposobów zarządzania ryzykiem. Należy wyjaśnić, które polityki ochrony danych znajdują zastosowanie w takich sytuacjach. 

4. WYMOGI PRAWNE I ETYCZNE ORAZ KODEKSY POSTĘPOWANIA
JEŚLI PRZETWARZANE SĄ DANE OSOBOWE, W JAKI SPOSÓB ZAPEWNIONA JEST ZGODNOŚĆ Z KRAJOWYM I MIEDZYNARODOWYM USTAWODAWSTWEM W TYM ZAKRESIE?

Należy się upenić, że w przypadku danych osobowych występuje zgodność z obowiązującymi przepisami dotyczacymi ochrony takich danych (np. RODO). Proszę odpowiedzieć na pytania: Czy uzyskano świadomą zgodę na przechowywanie i/lub udostępnianie danych osobowych? Czy dla upoważnionych użytkowników danych osobowych istnieje procedura dostępu? Należy rozważyć zasadność anonimizacji danych osobowych dla ich zachowania i/lub udostępniania lub zasadność pseudonimizacji danych osobowych. Należy rozważyć wprowadzenie szyfrowania, które jest postrzegane jako szczególny przypadek pseudonimizacji (klucz szyfrujący musi być przechowywany osobno od danych, np.: przez zaufaną stronę trzecią).

JAKIE INNE PRAWNE BĄDŹ FORMALNE ZAGADNIENIA WYSTĘPUJĄ, TAKIE JAK ZARZĄDZANIE PRAWAMI WŁASNOŚCI INTELEKTUALNEJ? JAKIE USTAWODAWSTWO MA ZASTOSOWANIE?

Proszę podać, kto będzie właścicielem danych, kto będzie miał prawo kontrolować dostęp. Jakie będą obowiązywać warunki dostępu do danych? Czy dane będą jawne? Czy dane będą dostępne, czy będą ograniczenia w dostępne do nich? Które dane udostępniane w ograniczonym zakresie? Należy rozważyc wykorzystanie licencjonowania dostępu do danych i na ponowne ich użycie.

W sytuacji prowadzenia projektów w partnestwie z innymi podmiotami proszę opisać kwestie związane z prawami kontroli dostępu do danych dla partnerów projektu. Należy wskazać, czy istnieje związek z prawami własności intelektualnej i czy istnieje ryzyko naruszeń.  Jeśli tak, należy wyjaśnić, jak zostanie potraktowana ta problematyka (np. czy dane gromadzone są w bazach danych podlegających ochronie?). Należy wskazać, czy istnieją jakieś ograniczenia w sprawie ponownego wykorzystania danych stron trzecich. Należy pamiętać o uwzględnieniu kwestii związanych z prawami kontroli dostępu do danych dla partnerów projektu i współtwórstwa przez wielu właścicieli danych w umowie konsorcjum danego projektu.

JAKIE PROBLEMY ETYCZNE MOGĄ WYSTĘPOWAĆ I JAKIE ZAPISY KODEKSÓW POSTĘPOWANIA BĘDĄ BRANE POD UWAGĘ?

Proszę opisać, czy i w jaki sposób problemy etyczne mogą mieć wpływ na przechowywanie danych i ich przekazywanie czy udostępnianie, kto może z nich korzystać oraz jak długo dane są przechowywane. Należy wskazać świadomość istnienia tego aspektu zarządzania danymi i zaprezentować odpowiednie rozwiązania w tym zakresie. Należy przestrzegać krajowych i międzynarodowych kodeksów postępowania i instytucjonalnych wytycznych w zakresie etyki i weryfikowac, czy dla zbierania i gromadzenia danych w trakcie realizacji projektu naukowego wymagana jest ocena etyczna (np. komisji etycznej).

5. UDOSTĘPNIANIE DANYCH I ICH DŁUGOTERMINOWA OCHRONA
JAK I KIEDY DANE BĘDĄ UDOSTEPNIANE? JAKIE SĄ OGRANICZENIA W UDOSTĘPNIANIU DANYCH LUB EWENTUALNE POWODY OBOSTRZEŃ/OGRANICZEŃ?

Proszę podać, w jaki sposób dane będą wykrywane i udostępniane (np. przez umieszczenie ich w wiarygodnym repozytorium danych, indeksowanie w katalogu, korzystanie z usługi zabezpieczającej dane, przez bezpośrednią obsługę zapytań dotyczących danych lub wykorzystanie innego mechanizmu). Proszę przedstawić wstępny plan ochrony danych i podać informację o tym, jak długo dane będą zachowane. Należy również wyjaśnić, kiedy dane będą udostępnione i wskazać oczekiwany termin udostępnienia. Należy wyjaśnić, czy dane będą wykorzystywane wyłącznie przez twórców, a jeśli tak, to dlaczego i w jakim terminie. Istotne jest wskazanie, czy udostępnianie danych będzie przełożone lub ograniczone (np. by umożliwić publikację wyników naukowych czy ochronę własności intelektualnej). Należy wskazać kto bedzie mógł korzystać z danych. jeśli konieczne jest ograniczenie dostępu do niektórych społeczności lub zastosowanie umowy regulującej udostępnianie danych, należy wyjaśnić powody takich decyzji. Należy opisać, jakie działania zostaną podjęte w celu przezwyciężenia lub zminimalizowania ograniczeń czy obostrzeń w tym zakresie.

JAK I GDZIE BĘDĄ PRZECHOWYWANE DANE ZACHOWANE DŁUGOTERMINOWO (NP. W REPOZYTORIUM DANYCH LUB ARCHIWUM)?

Należy wskazać, które dane należy zatrzymać lub zniszczyć, zgodnie z obowiązującymi wytwórców zobowiązaniami prawnymi bądź by dostosować się do wymogów obowiązującego prawa. Należy wskazać, w jaki sposób zostanie podjęta decyzja o wyborze danych do zachowania oraz opisać dane, które będą zachowywane długoterminowo. Należy zaprezentować przewidywalne zastosowania naukowe danych (i/lub ich potencjalnych użytkowników). Należy wskazać, gdzie dane zostaną zdeponowane. Jeśli nie zaproponowano istniejącego repozytorium, należy wskazać w planie zarządzania danymi, iż danymi można skutecznie zarządzać poza okresem realizacji czy trwałości projektu. Zaleca się wykazanie, że zostały sprawdzone zasady i procedury dotyczące repozytoriów (w tym wszelkie standardy metadanych oraz konieczność ponoszenia kosztów).  

JAKIE METODY LUB NARZĘDZIA OPROGRAMOWANIA SĄ POTRZEBNE DO UZYSKANIA DOSTĘPU I KORZYSTANIA Z DANYCH?

Należy wskazać, czy potencjalni użytkownicy potrzebują określonych narzędzi do dostepu i (ponownego) wykorzystania danych. Należy zastanowić się nad trwałością oprogramowania potrzebnego do uzyskania dostępu do danych. Proszę podać, czy dane będą udostępniane za pośrednictwem repozytorium, bezpośredniej usługi zapytań, czy zostanie zastosowany inny mechanizm.

JAK BĘDĄ PRZYPISANE DO KAŻDEGO ZESTAWU DANYCH WYJĄTKOWE I TRWAŁE IDENTYFIKATORY [TAKIE JAK CYFROWY IDENTYFIKATOR OBIEKTU (DOI)]?

Proszę opisać, w jaki sposób dane mogą zostać ponownie wykorzystane w innych kontekstach. Powinny być zastosowane trwałem identyfikatory, aby dane mogły być wiarygodne i skutecznie zlokalizowane i aby umożliwić łatwe odniesienia do nich. Stosowanie trwałych identyfikatorów pomaga również śledzić cytowania i ponowne użycie danych. Należy wskazać, czy zapewniona będzie trwała identyfikacja danych. Zazwyczaj wiarygodne, długoterminowe repozytoria zapewniają użycie trwałych identyfikatorów.

6. ODPOWIEDZIALNOŚĆ W ZAKRESIE ZARZĄDZANIA DANYMI ORAZ ZASOBY POTRZEBNE DO EFEKTYWNEGO ZARZĄDZANIA DANYMI
KTO (NP. FUNKCJA, STANOWISKO I INSTYTUCJA) BĘDZIE ODPOWIEDZIALNY ZA ZARZĄDZANIE DANYMI (TJ. DATA STEWARD)?

Poleca się, aby określić funkcje i obowiązki związane z procesem zarządzania danymi (gromadzenie danych, tworzenie metadanych, dbałość o jakość danych, przechowywanie i tworzenie kopii zapasowych, archiwizacja i udostępnianie danych). Jeśli to tylko możliwe, pożądane jest podanie informacji o wyborze konkretnej osoby odpowiedzialnej za zarządzanie danymi naukowymi. W przypadku projektów dotyczących współpracy należy objaśnić partnerom ich obowiązki w zakresie zarządzania danymi. Należy wskazać, kto jest odpowiedzialny za wdrożenie DMP, zapewni jego realizacji oraz, w razie potrzeby, uaktualnienie. Należy rozważyć i zaplanować regularne aktualizacje DMP.

JAKIE ZASOBY (NP. FINANSOWE I CZASOWE) BĘDĄ PZREZNACZONE NA PROCES ZARZĄDZNIA DANYMI, ŻE DANE BĘDĄ FAIR (DO ZNALEZIENIA, DOSTĘPE, INTEROPERACYJNE, WIELOKROTNEGO UŻYTKU)?

Należy wyjaśnić, w jaki sposób zagwarantowano niezbędne zasoby (np. czas pracy personelu na przygotowanie, udostępnianie, ochronę danych. Należy oszacować i uzasadnić konieczność uwzględnienia kosztów związanych z wszelkimi zasobami niezbędnymi do dostarczenia danych. Mogą to być koszty przechowywania, sprzętu, czasu pracy personelu, koszty przygotowania danych, płaty za przygotowanie danych do złożenia w repozytorium, jak i koszty samego repozytorium. Należy wskazać, czy dodatkowe zasoby będą potrzebne do przygotowania danych do złożenia lub do pokrycia wszelkich opłat związanych z wykorzystaniem repozytoriów danych. jeśli tak, należy wyjaśnic, jakie to będą koszty i w jaki sposób zostaną pokryte.

źródło: Pawłowska Maria M., Wachowicz Marta E. (2020). Wprowadzenie do zarządzania danymi naukowymi. Wydawnictwo Difin

Przydatne strony:
  • DMPTool – narzędzie online służące tworzeniu planów zarządzania danymi; zawiera przykłady planów,
  • DMPonline – kreator planów zarządzania danymi badawczymi,
  • ARGOS – zawiera dwie funkcjonalności: szablony PZD oraz opisy zestawów danych,
  • Lista kontrolna DCC (Checklist for a Data Management Plan) – pozwala szybko określić, jakich informacji może brakować w przygotowywanym PZD.

fundusze.png

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego, Program Operacyjny Wiedza Edukacja Rozwój 2014-2020 "PL2022 - Zintegrowany Program Rozwoju Politechniki LubelskiejPOWR.03.05.00-00-Z036/17