Data governance v éře AI
AI otevřela dveře k firemním datům. Data governance rozhodne, co za nimi skutečně najdeme.
Ještě donedávna byla data governance především oporou pro reporting a self-service analytiku. Jenže s nástupem generativní AI se z ní stává nutná podmínka, aby firemní AI uměla najít správná data, pochopit jejich význam, respektovat přístupová práva a vracet odpovědi, kterým lze věřit.
AI sama o sobě pořádek v datech nevytvoří. Jen velmi rychle ukáže, kde chybí. Nepracuje přitom jen se strukturovanými daty v DWH, ale i s dokumenty, směrnicemi, e-maily nebo znalostními bázemi. A právě tady se naplno projeví, jestli firma ví:
- co její data znamenají,
- odkud pocházejí,
- kdo k nim má přístup,
- a jestli jsou aktuální.
Generativní AI dokáže prohledávat nestrukturované zdroje, kombinovat informace napříč systémy a vracet odpovědi v přirozeném jazyce. Zároveň ale zůstává citlivá na kontext a kvalitu vstupů. Pokud nejsou data dobře popsaná, verzovaná a dohledatelná, AI sice odpoví rychle – ale ne nutně správně.
Problém nebývá v technologii, ale v základech
- Nejednotné definice,
- neaktuální nebo duplicitní obsah,
- chybějící lineage a dohledatelnost,
- nízká datová kvalita,
- sdílené dokumenty bez řízení přístupů,
- nejasné role a nulová motivace se o data starat.
V klasické analytice tyto problémy vedou ke zpožděným nebo nepřesným reportům. S adopcí AI se jejich dopad násobí. Odpověď, která vypadá přesvědčivě, ale stojí na špatném kontextu, je mnohem nebezpečnější než chybějící report.
Co musí fungovat, aby data governance neselhala ani v AI éře
Dobrá zpráva je, že principy se nemění. Jen se zvyšuje jejich důležitost a důslednost.
1. Strategie a záměr
Data governance nezačíná výběrem nástroje, ale rozhodnutím, kde a jak má firma s využitím dat a případně generativní AI vytvářet hodnotu nebo zefektivňovat své procesy. Nároky na governance se přitom liší podle konkrétních use casů, jiná pravidla budou stačit pro interní asistenty, jiná pro scénáře, kde AI přímo ovlivňuje rozhodování.
- Interní knowledge assistant snese určitou míru nepřesnosti.
- Automatizace back-office procesů už vyžaduje vyšší kontrolu.
- HR screening nebo rozhodování podobné credit scoringu vyžadují striktní režim.
Use case tedy neurčuje jen technologii, ale i míru řízení dat.
2. Vlastnictví, role a motivace
Role jako CDO, data owner nebo data steward zůstávají klíčové. V AI éře k nim ale přibývá:
- odpovědnost za konkrétní AI use case,
- průběžná validace výstupů,
- role-based vzdělávání.
Bez jasného vlastnictví dat a odpovědnosti za jejich kvalitu se AI rychle stává nástrojem, který „něco generuje“, ale nikdo za to ve skutečnosti neručí.
3. Význam dat, metadata a kontext
Nestačí mít data. AI potřebuje chápat jejich význam. Přesná definice obratu, marže nebo aktivního zákazníka není pro model samozřejmá. Pokud není popsán v business slovníku, katalogu a metadatech, AI si ho jednoduše „domyslí“.
Moderní AI řešení stojí na práci s indexovaným obsahem, metadaty, verzemi a citacemi zdrojů. Bez tohoto kontextu není možné zajistit, že odpověď je správná – ani že ji lze zpětně vysvětlit.
4. Přístupová práva a riziko oversharingu
Tohle je oblast, která byla často podceňovaná a s AI se stává kritickou.
AI pracuje jen s daty, ke kterým má uživatel přístup. Pokud jsou ale data přesdílená nebo špatně klasifikovaná, AI je bez problémů použije.
Praktický dopad je jednoduchý:
- AI governance nezačíná modelem, ale tím, jak máte nastavené sdílení dat.
- Klasifikace citlivosti, přístupová práva a řízení sdílení se tím dostávají do první linie.
5. Lidský dohled, evaluace a třetí strany
Governance nekončí publikací katalogu ani nasazením AI řešení.
Patří do ní:
- průběžné hodnocení výstupů,
- monitoring chyb,
- incident response,
- měření dopadů,
- kontrola nástrojů a dat třetích stran.
AI systémy jsou adaptivní. Bez průběžné kontroly se jejich chování může postupně odchýlit od očekávání.
Data governance není brzda, ale akcelerátor
Data governance bývá vnímána jako nutné zlo. Něco, co zpomaluje projekty a komplikuje práci. V AI éře je to přesně naopak.

Typickým příkladem je enterprise AI vyhledávání nad firemními znalostmi. Pokud máte kvalitní metadata, řízené přístupy a dobře popsaný obsah, můžete nad nimi postavit řešení, které:
- prohledává strukturovaná i nestrukturovaná data,
- vrací odpovědi s kontextem a citacemi,
- respektuje přístupová práva uživatelů,
- umožňuje dohledat zdroj i verzi informace.

Zajímavý posun je i opačným směrem: AI může pomáhat samotné governance.
Dokáže například:
- generovat dokumentaci,
- pomáhat s datovou kvalitou nebo plnit datové katalogy,
- identifikovat anomálie,
- vytvářet a udržovat metadata.
Governance tak přestává být čistě manuální disciplínou – a zároveň přestává být vnímaná jako něco, co AI „brzdí“. Naopak je to to, co jí umožňuje fungovat správně.
Jak začít bez megaprojektu
Největší chyba je snažit se „zavést data governance“ plošně.
Lepší přístup je pragmatický:
1. Zmapovat současný stav (datový audit).
2. Vybrat 1–2 AI use case s vysokou hodnotou.
3. Opravit význam dat, přístupy a kvalitu v tomto kontextu.
4. Teprve potom škálovat.
Tento přístup odpovídá i tomu, jak dnes firmy AI reálně zavádějí: postupně, iterativně a s důrazem na konkrétní přínos.
Závěrem
Generativní AI je velmi citlivá na kvalitu a popis dat.
Firmy, které mají v datech pořádek, mají náskok, AI pro ně funguje jako multiplikátor hodnoty. Firmy, které ho nemají, získávají totéž, ale v opačném směru.
Data governance tak přestává být „nice to have“. V éře AI je to jedna z podmínek, aby technologie skutečně fungovala tak, jak od ní očekáváme.
Autor: Jakub Holubec


