Přimět úřady sdílet svoje data je jedna věc, jak na to, je ale věc druhá

Veřejná správa shromažďuje a pracuje s obrovským množstvím dat. I ta, která nepodléhají utajení, jsou cenným zdrojem informací, k nimž by měla mít přístup vědecká a novinářská komunita i široká veřejnost. Za změnou v přístupu veřejné správy a vybudováním datové infrastruktury ČR stojí i Martin Nečaský a Jakub Klímek z Katedry softwarového inženýrství MFF UK.

Rozhovor původně vyšel v magazínu UK Forum.

Ve Spojených státech nebo ve Velké Británii to tehdy bylo žhavé téma. Kolem roku 2010 se začalo napříč státy hovořit o takzvaných otevřených datech a jejich sdílení online. Česká republika se však do systematické správy a zveřejňování dat příliš nehrnula.

„Tehdy jsme s jedním doktorandem pracovali na tématu, které se týkalo zdravotnictví. Potřebovali jsme kvůli tomu veřejná data, která shromažďuje Státní ústav pro kontrolu léčiv. Po dlouhých vyjednáváních jsme je nakonec dostali na cédéčku. Dnes byste si je během chvilky legálně stáhla z internetu,“ vzpomíná Martin Nečaský. A že to jde, je zásluhou iniciativy jeho týmu. Po této zkušenosti totiž začali uvažovat nad tím, jak přimět tuzemskou veřejnou správu, aby data, která nepodléhají utajení, volně sdílela na internetu, a ještě navíc jednotným způsobem. S tím totiž skupina softwarových vývojářů a architektů kolem Nečaského uměla pomoct.

Daty proti korupci

Proč je to potřeba, se rozhodli ilustrovat na konkrétním projektu. „Tehdy se často řešilo téma korupce a boje s ní. Proto jsme začali tlačit na to, aby se zveřejňovala data o veřejných zakázkách. Kontaktovali jsme starosty, kterým bylo téma transparentnosti blízké. Vytvořili jsme doménu Opendata.cz. Zaujalo to média. Přes tuto iniciativu jsme se snažili dostat až na centrální úroveň, a nakonec se to podařilo. V roce 2013 jsme začali spolupracovat s ministerstvem vnitra,“ říká Nečaský, jehož tým dnes stojí za vybudováním české datové infrastruktury, což pomáhá rozvoji vědy a výzkumu, podnikání i zvyšování důvěry občanů ve stát, když transparentně sdílí informace o svém fungování. 

Přimět úřady sdílet svoje data je jedna věc, jak na to, je ale věc druhá. A to byl úkol pro Jakuba Klímka. „Byl jsem Martinův doktorand, věnoval se tématu konceptuálního modelování dat. Když byly úřady konfrontovány s tím, že by měly otevírat data, začaly řešit, jak. Vznikla poptávka po tom, aby data stejného typu různé úřady publikovaly stejným způsobem, aby je pak případný zájemce mohl snadno stáhnout a hned s nimi pracovat. A k tomu se právě principy z datového modelování hodily. Vznikla řada takových jednoduchých standardů a návodů, o tom, jak takovým datovým sadám říkáme a jak mají vypadat,“ vysvětluje Jakub Klímek a ilustruje tím, jak efektivně lze propojit akademický výzkum s praktickým využitím.

Tým z Katedry softwarového inženýrství MFF UK se zapojil i do zákonného zarámování tématu otevřených dat, když se spolu s legislativci z ministerstva vnitra podílel na návrhu novely Zákona o svobodném přístupu k informacím, který pojem otevřených dat v roce 2014 zavedl. Jejich novela pak vyhrála dokonce anketu Zákon roku.

Od roku 2015 se pak tým z Matfyzu zapojil do vývoje softwarového řešení Národního katalogu otevřených dat, jehož smyslem je udělat si takový velký celostátní úklid v otevřených datech. Softwarové řešení katalogu je dostupné jako open-source a stále se na něm učí nové generace studujících. Otázky, které vycházejí z jeho využívání v praxi, se pak zase zpátky promítají do formování výuky už i bakalářského studia na MFF UK. A že se jedná o úspěšný projekt, ukazuje i to, že se na tým, který ho postavil, obrátilo slovenské ministerstvo investic, regionálního rozvoje a informatizace, které by chtělo vytvořit slovenskou verzi.

Digitální trh

V současné době je v legislativním procesu návrh Zákona o správě dat a o řízeném přístupu k datům, který se zaměřuje na obecné povinnosti v oblasti správy všech dat, tedy i těch utajovaných. Pravidla využívání dat veřejné správy musí Česká republika implementovat do své legislativy na základě nařízení Evropské unie Data Governance Act.

„O tomto tématu se tolik nemluví, ale Evropská unie se zabývá sjednocováním i v oblasti digitálního trhu. Všichni známe GDPR, což bylo jedno z velkých témat řešených na úrovni EU, které se týkalo ochrany dat. Od té doby ale vznikají další nařízení, která se týkají naopak sdílení dat, a to nejen otevřených, ale i polozavřených nebo zavřených, abychom je mohli efektivně využívat pro byznys napříč celou Unií, protože v tom Unie ztrácí,“ podotýká Martin Nečaský.

Na základě nového zákona by se měl zmíněný katalog transformovat v Národní katalog dat, v němž už budou katalogizovaná všechna data veřejné správy. Zákon přesně vymezí, kdo a za jakých podmínek se k těm neveřejným bude moci dostat. „Pokud například výzkumník z Univerzity Karlovy bude potřebovat nějaká detailnější data, která nejsou otevřená, a zažádá o ně přesně definovaným mechanismem, který zákon zavede, může je získat,“ říká Nečaský.

A jak pomůže se správou dat v současnosti stále připomínaná umělá inteligence? Dokud je nebudeme mít pořádně uklizené, tak nijak, směje se Martin Nečaský. „Je to trend, který musíme reflektovat ve výuce, zareagovat na to bude ale muset i veřejná správa. Tlak na to využívat umělou inteligenci na automatizaci, a to ve veřejné i komerční sféře, bude stoupat. Dokud budete mít ale v datech nepořádek, umělá inteligence vám v práci s nimi nijak nepomůže. To, co děláme my, je první krok k tomu, aby organizace nebo stát mohly umělou inteligenci na datové sety vůbec nasadit.“