Data governance v éře self-service a AI
Data governance je v oblasti Business Intelligence tématem od nepaměti. Poslední dobou ale její význam dramaticky stoupá v souvislosti se dvěma fenomény – self-service a AI. V tomto článku rozebereme, proč tomu tak je a v čem může data governance oběma oblastem výrazně přispět.
Tento článek nevygenerovala generativní AI, ale napsal jej člověk na základě svých znalostí a zkušeností z praxe.
Co je to data governance?
Pro začátek připomenutí, co to data governance vlastně je. Data governance je systém řízení dat, který zahrnuje politiky, procesy, role, standardy a metriky zajišťující efektivní využívání dat a informací pro cíle společnosti. Jde o strukturovaný rámec, který pomáhá organizacím spravovat data jako cenné aktivum.
Data governance řeší organizační zajištění práce s daty, zlepšení datové kvality, dodržování nastavených pravidel, dostupnost a dohledatelnost dat, jejich kategorizaci, ochranu a zabezpečení.
Přínosy data governance pro self-service
Aktuálním trendem v oblasti datové analytiky je self-service – umožnění analytikům a poučeným uživatelům vlastními silami analyzovat data a získávat z nich informace, které potřebují pro svou práci. A také vlastními silami vyvíjet reporty a dashboardy pro ostatní uživatele bez většího zapojení IT a Business Intelligence týmu. Pro umožnění self-service společnosti implementují módní koncepty, jako je data mesh nebo data fabric a obecně celou oblast datové analytiky výrazně decentralizují.
Aby si však uživatelé mohli sami analyzovat data, musí:
- Mít přehled o tom, jaké reporty a dashboardy již jsou k dispozici, aby je mohli využít a ušetřit tak cenný čas. Pro tyto účely Data governance standardně poskytuje katalog dostupných reportů včetně jejich dokumentace.
- Znát definice ukazatelů, které se ve firmě sledují tak, aby pro jeden ukazatel nevznikaly různé interpretace a čísla. Tento problém bývá řešen pomocí slovníku byznysových termínů.
- Mít přehled o tom, jaká data jsou k dispozici, co přesně znamenají, jaké jsou mezi nimi vazby a kde se dají najít. Tyto informace by měly být snadno dohledatelné v datovém slovníku.
- Vědět, odkud data pocházejí a co se s nimi v průběhu jejich zpracování děje, aby jim důvěřovali. Tuto problematiku řeší data lineage, většinou jako součást datového slovníku.
- Věřit, že jsou data kvalitní a správná, aby se na jejich výsledky mohli spolehnout. Tento aspekt zajišťuje systematické monitorování a řízení datové kvality, které je nedílnou součástí správy dat.
Každá moderní společnost, která to s daty myslí vážně, by měla mít jak organizačně, tak procesně zajištěno, aby byly všechny výše popsané komponenty data governance uživatelům k dispozici v jednoduše dostupné a aktuální podobě. Z technického pohledu tomu nic nebrání, potřebné technologie jsou na trhu v dostatečné míře k dispozici. Největší brzdou je však pro většinu společností právě organizace, nastavení zodpovědností, procesů, osvěta a vzdělání IT pracovníků a uživatelů a jejich nedostatečná motivace.
Přínosy data governance pro AI
Self-service analýza dat je zaměřená primárně na to, aby uživatelé vizuálně či jinak zkoumali data a snažili se je interpretovat tak, aby jim pomáhala v práci. S nástupem generativní AI bude tato práce čím dál jednodušší a dostupnější i pro uživatele, kteří si data sami zatím analyzují nedokázali, protože kromě výrazného zjednodušení jejich vizualizace také přinese možnost jejich přímé interpretace. Uživatelé se tak budou AI pomocí běžného jazyka ptát na obecné otázky jako „Stalo se v oblasti našich prodejů za poslední měsíc něco zajímavého?“ nebo „Které klienty bych měl oslovit, abych měl nejvyšší šanci prodat produkt XY?“.
Analýzu a interpretaci dat pak již uživatelé ponechají na AI. I AI však musí „vědět“, kde data najít, jak je spojit a jak spočítat ukazatele, na které se uživatelé ptají. Kvalita odpovědí pak bude přímo úměrná jak kvalitě popisu dat, tak i správnosti a kvalitě dat samotných. Jak již bylo popsáno v odstavci o self-service, všechny tyto aspekty opět zajišťuje… Správa dat.
Přínosy AI pro data governance
Kromě toho, že je data governance nutnou podmínkou pro to, aby bylo možno data efektivně zpracovávat pomocí AI, samotná AI je naopak velmi užitečným pomocníkem pro to, aby vznikla efektivní data governance. Lze ji využít pro generování dokumentace k reportům, popisu dat a jejich struktur, data profilingu, analýze a řešení datové kvality, kontrole dodržování procesů, generování data lineage z kódu a existující dokumentace.
Generativní AI pro všechny zmíněné oblasti již nyní dokáže vytvořit velmi kvalitní základ, který uživatelé mohou pouze revidovat, případně upravit, opravit a doplnit. Z pohledu jejich motivace jde o naprosto zásadní přínos, protože místo aby začínali z nuly a velmi pracně vše stavěli od základů, což je činnost vyčerpávající, frustrující a často nudná, začínají s již hotovým základem a mohou se soustředit na zábavnější aspekty práce. Celý proces budování data governance se tak zjednodušuje, zrychluje, zlevňuje a je lépe udržitelný v čase.
Závěr
Data governance je v éře self-service datové analytiky a generativní AI zásadní komponentou Business Intelligence řešení, může výrazně zvýšit využívání dat business uživateli a tím i návratnost investice do jejich sběru a integrace. Kromě toho, že je čím dál důležitější, díky generativní AI je také její nastavení a správa jednodušší a levnější. Pokud je tedy data governance téma, které vaše společnost zatím příliš neřešila, nyní je nejvyšší čas zvážit změnu priorit.
Zajímá vás, jak nastavit data governance procesy, organizačně je zajistit, motivovat uživatele k jejich dodržování, vzdělávat je v jejím využívání, vybrat správné technologie, využít k jejich implementaci AI a konečně celou iniciativu data governance rozjet?
Zanechte nám váš kontakt a rádi vám poradíme.
Autor:
Jakub Holubec – Leading dolphin, CEO
jakub.holubec@dolphinconsulting.cz