Využití AI v data science a datové analytice
V dnešním digitálním světě je umělá inteligence (AI) stále častěji klíčovým nástrojem pro zjednodušení rutinních procesů a zefektivnění práce. O tom, jak pomocí AI šetřit čas, zvyšovat efektivitu a otevírat nové možnosti, jsme si povídali se Ondřejem Broncem, data scientistou ve společnosti dolphin consulting.
Zuzana Pragrová (ZP): Ondřeji, jako data scientista a expert na generativní AI mě zajímá, jak ty využíváš tuto technologii v každodenní praxi. My v marketingu ji používáme k eliminaci rutinních činností, abychom se mohli více soustředit na kreativní práci a strategii. Jak tomu rozumí data science a jak ti AI pomáhá v tvé práci?
Ondřej Bronec (OB): Je to hodně podobné. Idea nahrazení triviální práce je v rámci AI docela transcendentní napříč všemi odvětvími. Například se hodně spoléhám na AI při generování komentářů a dokumentace k mému kódu, což mi ušetří spoustu času a můžu se díky tomu zaměřit na ty části, které jsou pro mě opravdu důležité.
ZP: To je zajímavé. Já mám v marketingu tendenci používat AI jako pomocníka pro tvorbu textů na sociální sítě, kde mi však chybí spousta detailů týkající se unikátnosti brandu a následně musím navržené texty hodně ladit, ale v tvém případě je to asi mnohem víc o práci s daty a kódem. Jaké konkrétní úkoly dáváš AI, které ti ušetří čas a zvýší efektivitu?
OB: AI dokáže skvěle napsat základní kód nebo najít chyby v kódu, což mi výrazně zkrátí čas potřebný na vývoj analytických nástrojů. I u nich může AI skvěle pomoct a s nyní dostupnými nástroji co zvládnou i spouštět kód je například explorativní analýza dat mnohem jednodušší. AI už jí zvládne v podstatě sama a já se můžu soustředit na to proč tu analýzu vlastně děláme – zamyšlení se nad daty co mám před sebou. Dále jakýkoliv brainstorming nebo učení už taky zásadně nedělám bez toho, aniž bych měl někde otevřené AI chatovací okno
ZP: To zní opravdu efektivně. Jakým způsobem využíváš AI pro brainstorming? Zajímalo by mě, jestli ti pomáhá například v předvídání trendů nebo nových možností v oblasti datové vědy.
OB: Určitě. Trendy nejsou něco s čím bych si nechával pomoci. Tam je lepší získat vlastní obrázek, ale brainstorming a zpracování informací o těchto trendech to je něco jiného. AI dokáže okamžitě zpracovat obrovské množství dat, například celou odbornou práci, video nebo článek, a nasměrovat mě na důležité sekce. Pokud mi něco není jasné, vždy se můžu na cokoliv zeptat, a to i pokud dané oblasti nerozumím nebo pokud je práce v jiném jazyce, než kterým mluvím. Všechno mi AI zvládne vysvětlit tak abych to pochopil. V dnešním světě je tolik věcí, které člověk potřebuje znát a rozumět jim. Mít po ruce jednoho „super inteligentního profesora“, který má trpělivost odpovědět na každou otázku, je opravdu k nezaplacení. Navíc díky tomu, jak AI funguje můžu snadno přecházet mezi různými tématy. Může mi klidně osvěžit středoškolskou biologii, abych lépe porozuměl, k čemu autoři použili svůj model a na dalším řádku rozebírat efektivitu jejich kódu. Pokud jste to ještě nezkusili, určitě to doporučuji
ZP: V kontextu AI se často objevuje pojem Prompt Engineering, používáš ho při práci s AI, a pokud ano, můžeš vysvětlit jakou hodnotu přináší?
OB: Ano, určitě. Prompt Engineering je umění, jak správně komunikovat s AI. Jde o to, jak formulovat vstupní požadavky, aby vygenerovala co nejpřesnější výstupy. Všichni jsme si ho alespoň párkrát zkusili žádajíc AI model, aby něco vysvětlil “jednoduše” nebo mluvil jako naše oblíbená celebrita. Prompt Engineering ale není jen o úpravě tónu výstupu a přesnosti. Je to skoro jako nový programovací jazyk, kde místo kódu používáte lidský jazyk. Má široké využití – například pro analýzu technických dat nebo tvorbu AI agentů. Časté je taky formátování výstupu, kdy lze například instruovat model, aby vracel JSON, který pak můžeme posílat do další aplikace v našem ekosystému. Lze jej využít i k odhalení znalostí, které model „nevidí“ nebo si jich není vědom, jako jsou pokročilé schopnosti řešit logické úlohy a jiné komplexní úkoly. Dokonce i společnosti jako OpenAI využívají Prompt Engineering ke zlepšení svých modelů. Například nový model o1 je výsledkem víceméně pouze promyšleného Prompt Engineeringu, kdy se model sám promptuje vícekrát a získá čas “přemýšlet” nad zadáním.
ZP: To mi dává smysl. I v marketingu je základem dobře vyladěný prompt. Využíváš tedy AI jako nástroj pro zjednodušení mnoha aspektů analýzy dat a pro rychlejší získání potřebných výsledků. A co obavy, že by AI mohla nahradit lidskou práci? Co si o tom myslíš v kontextu z podhledu datového vědce?
OB: V oblasti data science to vidím podobně jako ty v marketingu. AI je neocenitelným nástrojem, který nám pomáhá zpracovávat data efektivněji a rychleji, ale lidská kreativita, schopnost se rozhodovat a přemýšlet o komplexních problémech zůstává nenahraditelná. AI je opravdu skvělý pomocník, ale stále potřebujeme odborníky, kteří její výsledky budou interpretovat a rozhodovat o tom, jak ji správně využít a korigovat její výstup.
ZP: Co trochu více specifická otázka. Jedním z hlavních současných využití AI je pomoc nebo úplná generace kódu. Jsme v IT odvětví – nestavíme si vlastní konkurenci?
OB: Rozumím tomuto strachu a lhal bych kdyby mě to nenapadlo. Nicméně si myslím že realita je trochu složitější. Je poměrně reálné nebezpečí nahrazení nebo snížení počtu juniorských a začínajících pozic. AI zvládne velice dobře psát komentáře a řešit základní problémy. Už teď vidíme efekty na pracovním trhu a bude důležité bojovat za to, aby tyto pozice byly udrženy – jinak začne být těžké do odvětví proniknout. Co se ale samotného psaní kódu týče, tak to nepovažuji za problém, ale opět za příležitost. Zaprvé AI je dobrá, ale stále má mezery. Zkušený programátor má znalosti detailů a obskurních jazyků, které je těžké pro AI nabrat a tahle pozice je stále nenahraditelná, dokonce možná ještě cennější kvůli množství AI generovaného kódu, který je potřeba vyžehlit. A co se i nás mediorů týká, tak my stále máme svoje místo a AI nám připomíná o co vlastně v první řadě jde. Ono totiž většinou není ani tak důležité psaní samotného kódu jako spíše analýza a správná definice problému. To je stále skill klíčový pro každého programátora, který AI jen těžko nahrazuje – naopak zvládne se správnými prompty zredukovat čas na přenesení této myšlenky do exaktního kódu.
ZP: To je pravda. A pro naše čtenáře, kteří ještě s AI v oblasti data science nezačali, co bys jim doporučil jako první krok?
OB: V první řadě bych zkoumal Prompt-Engineering abyste z jakéhokoliv modelu mohli vyždímat maximum. Jak jsem řekl výše i OpenAI jej používá místo vytváření nových modelů a ukazuje se překvapivě silný na to, jak jednoduchý je na implementaci. Podíval bych se také na práci s různými API nástroji – taková komunikace s Open AI skrze Python vám otevře úplně nové možnosti. Alternativně pokud chcete jít obráceně a získat znalosti a principy použité ke stavbě AI modelů tak Python a nástroje jako TensorFlow nebo Scikit Learn jsou stále dobrým začátkem. Ostatně právě Python stál za naprogramováním Chatu GPT.
ZP: Ondřeji, díky moc za skvělý rozhovor. Myslím, že mnoho čtenářů si z něj odnese užitečné informace o tom, jak může AI posunout jejich práci v oblasti data science na další úroveň.
OB: Rádo se stalo, Zuzano. O AI mluvím rád a nemám pochyby o tom, že alespoň trochu může usnadnit jakoukoliv práci. Ostatně kdo by odmítl vesměs zdarma asistenta, který mu pomůže se všemi rutinními úkoly?
Autoři: Zuzana Pragrová a Ondřej Bronec, oddělení Data Science