Kéž bych se naučil spravovat svá data dřív, říká data steward Matyáš Hiřman

Matyáš Hiřman je data steward a zároveň vede komunitu data stewardů v České republice. Ta se postupně stává důležitým prvkem v projektu Národní repozitářové platformy a v projektu IPs EOSC-CZ. Jak sám říká, je součástí zajímavého hlasu komunity, která nabízí podporu v péči o výzkumná data. O tom, jak probíhala jeho účast v kurzu správy dat na Vídeňské univerzitě a proč je dnes téma správy a ukládání dat tak aktuální, vypráví v Ústřední knihovně Univerzity Karlovy (UK), kde působí.

Kdo je data steward a co od něj výzkumná komunita může očekávat?
Data steward je v České republice ještě stále nově vznikající pracovní pozice, která by měla dlouhodobě pomoci výzkumníkům v oblasti práce s výzkumnými daty a dodržováním podmínek, které se dnes v rámci výzkumu vyžadují. Rolí data stewarda je mnoho, nicméně tou podstatnou je vytvářet komunikační mosty mezi infrastrukturami a pomoci bezproblémovému chodu managementu dat během výzkumu. Já osobně jsem se v roce 2022 přihlásil do kurzu pro „data stewardy“ na Vídeňské univerzitě. Jednalo se o první pilotní kurz pozice data stewarda vůbec. Smyslem kurzu bylo, mimo praktické části, společně vymyslet a ucelit role a povinnosti data stewardů, které vyplývají ze zvyšujících se nároků na otevřenou vědu a správu výzkumných dat. Do té doby se povinnosti za správu výzkumných dat většinou na někoho „hodily,“ ale momentálně jich rapidně přibývá a je třeba to podchytit lépe. Pilotní kurz měl pomoci nastartovat aktivní podporu tam, kde je potřeba.

Kdo kurz pro data stewardy pořádal?
Bylo to na Uni Wien a kurz organizovala a založila Tereza Kalová, která zde koordinuje program správy dat. Cílem bylo šířit osvětu, že pozice data stewarda vůbec existuje a měla by vznikat napříč nejen Evropou, ale celým světem, aby vědci na správu dat nebyli sami. 

Které konkrétní role má data steward?
Role se převážně odvíjí od toho, kde data steward působí. Na Karlově univerzitě máme tři úrovně data stewarda. V první úrovni řeší data steward obecné záležitosti datové politiky pro univerzitu, vzdělávání, metodickou podporu a zároveň koordinuje data stewardy z jednotlivých fakult. To je i moje pozice. V druhé úrovni jsou to fakultní data stewardi, kteří nastavují standardy na jednotlivých fakultách. Třetí úrovní jsou data stewardi přímo součástí výzkumného týmu, kde už vyloženě daná data zpracovávají a organizují. Obecně by měl data steward pomáhat při dodržování komplexních postupů správy výzkumných dat.

Pamatujete si, jak jste se k otázce správy výzkumných dat dostal poprvé?
Studoval jsem na Přírodovědecké fakultě UK a přirozeně jsem se musel starat o svá výzkumná data. Ne vždy to fungovalo tak, jak bych si asi momentálně představoval. Následně jsem nastoupil do Ústřední knihovny UK na pozici metodik výzkumných dat v přírodních vědách. Když jsem hledal, kde se v oblasti správy dat vzdělat, narazili jsme s kolegy na kurz ve Vídni a přihlásil jsem se na něj. Postupně se ukázalo, že data steward je pozice, která se ve vědecké komunitě začíná pravidelně objevovat a dává smysl. Byla to zpočátku spíše náhoda, ale téma si mě postupně získalo. 

Odkud se rekrutují data stewardi?
To je i pro nás komplikovaná otázka. Problém je v tom, že pozice je relativně nová, vzdělávání pro ni ještě není obvyklé, a tak se ideální kandidáti občas hledají složitě. Možnosti vzdělání v tomto oboru se v současné chvíli rozvíjí... Nicméně, obecně vzato může data steward být každý, kdo je zapálený do správy dat, nebo například někdo, kdo si ve své „laborce“ sám tvoří programy, které mu správu dat usnadňují. Potřebujeme lidi, kteří umí anglicky, nebojí se komunikovat. Komunikace je hlavním předpokladem, protože jejich velkou rolí je vzdělávání ostatních a propojování jednotlivých oddělení. Dále to mohou být lidi, kteří jsou nadšeni pro techničtější obory a mají ideálně „background“ v oboru, ve kterém se budou pohybovat. Počítáme, že spíš nabereme lidi, které si postupně vychováme a vzděláme. V současné chvíli samotné osvětě pomohla EOSC CZ, která povědomí o existenci a důležitosti této pozice výrazně zlepšila, takže se kandidáti hledají o něco lépe.

Inspirujete se někde v zahraničí?
Česká republika do problematiky otevřené vědy a správy dat s ní spjaté skočila tak trochu „po hlavě“, bez dlouhodobější přípravy a systematického vzdělávání. Nyní se to různými iniciativami snažíme dohnat, ale stále se samozřejmě vracíme na univerzitu ve Vídni a inspirujeme se i univerzitami například v Utrechtu, Heidelbergu, Miláně a dalšími. Třeba právě ve Vídni již mají pět fakultních data stewardů a svého koordinátora. To je příklad, který se nám daří implementovat také u nás na Univerzitě Karlově. Jsme součástí mnoha mezinárodních iniciativ, například 4EU+ (European University Alliance), což je asociace sedmi univerzit v Evropě, kde si vzájemně předáváme zkušenosti v oblasti podpory open science.

Existuje speciální komunita data stewardů a stewardek v Evropě?
Zatím jen na úrovni států, univerzit a knihoven. Komunita data stewardů napříč Evropou v současné chvíli pozvolna vzniká, plus pořád máme kontakty s lidmi z vídeňského kurzu a dalšími státy, kde se tahle pozice řeší. Mít organizovanou komunitu bude určitě zajímavé. Na druhou stranu se ale velice rozrostla naše česká komunita data stewardů. Nyní máme v komunitě přes tři sta členů, díky podpoře iniciativy EOSC CZ máme také svůj web, mapu data stewardů, různé podpůrné materiály pro data stewardy, pravidelné workshopy a setkání, a mnoho dalšího. Myslím, že to může být hezký vzor pro podporu této pozice napříč mezinárodním prostředím. 

Již déle figurujete v projektu Národní repozitářové platformy (NRP). Jakou v něm máte roli?
Projekt je rozdělený do několika klíčových aktivit a Univerzita Karlova si vzala na starost klíčovou aktivitu sedm, zaměřenou na vzdělávání a lidské zdroje. V rámci této aktivity vznikly i pozice data stewardů, kde mám svou roli. Konkrétně na pozici data steward science, takže bych se měl starat o témata spojená s přírodními vědami. Jsou tam i pozice data stewardů pro humanitní a sociální vědy a další. 

Jak je tahle pozice koncipovaná v projektu NRP?
Koncipujeme ji jako „train the trainer“ a primárně budeme reagovat na výsledky z jednotlivých klíčových aktivit projektu NRP. Například, vytvoří se software na tvorbu data management plánů a naším úkolem bude vzdělat lidi, kteří tento software budou používat, což jsou konkrétně třeba právě další data stewardi. Budeme nabízet konzultace pro celé instituce. Důležitým prvkem bude již zmiňovaná česká komunita data stewardů, skrze kterou budeme jednotlivé části NRP testovat a reflektovat zpětnou vazbu.

Vnímáte iniciativu EOSC jako žádanou potřebu vědecké komunity, nebo víc tlak „shora“?
Původní myšlenka byla vytvořit prostředí, kde se podpoří komunity oborů a lidí, kteří produkují a spravují data, aby mezi sebou mohli svobodně a efektivně komunikovat podmínky správy dat. Osobně centralizaci a tlak “shora” nemám rád a větší smysl mi dává podpora zmíněných komunit a oborů, na kterou se i v rámci české iniciativy EOSC moc těším, a která se již v současné době v určité podobě děje.

Jak se vám vaše práce data stewarda prolínala do doktorského studia?
Zpětně si sypu popel na hlavu a říkám si, kéž bych se už dřív naučil spravovat svá data a dělat si v nich pořádek. Opakovaně v přírodních oborech narážíme na téma elektronických laboratorních deníků, kde se dají efektivně a jednoduše sdílet data a informace. To by pro naše data bylo nesmírně důležité. Zpětně mě mrzí, že jsem to neznal a nenaučil jsem se různé možnosti efektivní správy dat. Aktivní využití mé práce v rámci mého výzkumu jsem již úplně nestihl...

Vědci ale často vnímají např. data management plány jako byrokratickou zátěž, což je pochopitelné. Já si naopak ale myslím, že to v širším pohledu dává smysl. Je důležité vědět, co se v projektu bude dít, naplánovat si kde a jaká budu mít data, jak efektivně využiji zdroje na jejich správu a podobně, což je něco, na čem se nakonec shodneme i s těmi, kterým se to ze začátku nezdá.

Co byste poradil právě začínajícím doktorandům ohledně správy dat?
To by bylo na hodinovou přednášku. Důležité mi přijde hledat možnosti, třeba softwarové, jak si snadno a kvalitně ulehčit práci. Nebát se přijímat nové věci, kterých je nyní opravdu mnoho. Stačí předem zapřemýšlet nad správou dat, jak data pojmenovávám, kam je ukládám a například, že je dobré mít plán. Poslední věc je nebát se jít proti proudu. Doktorandi by se neměli bát přijímat změny, nebo je přímo navrhovat svým nadřízeným. Často to jsou právě oni, kdo vědeckou komunitu posouvají dále.