Dolování dat

Pod pojmem Dolování dat (z angl. Data Mining) se rozumí proces hledání informací a znalostí ve velkém objemu dat. Narozdíl od Expertních systémů, kde jsou hlavním zdrojem pro získávání znalostí experti, jsou zde hlavním zdrojem znalostí data. Výrazný zájem o tuto oblast podpořila v 90. let minulého století zejména v USA zvýšená poptávka ze strany komerčních organizací, které již tehdy disponovaly velkými objemy dat, ale nebyly schopné z nich pomocí klasických tabelačních metod získat potřebné podklady pro rozhodování. To napomohlo k rychlému etablování Dolování dat jako svébytného oboru aplikované vědy a k jeho širokému použití v komerční praxi. V současné době zažívá obrovský boom metoda Dolování dat nazývaná hluboké učení, která se zabývá využitím neuronových sítí s velkým počtem vrstev pro reprezentaci analyzovaných dat. Za zásadní milník v této oblasti se považuje vítězství systému AlphaGo postaveném na hlubokých neuronových sítích nad světovým šampiónem Lee Sedolem v roce 2016, viz Wikipedia.

Techniky Dolování dat se dají použít u téměř všech typů firemních aplikací a mohou odpovídat na různé typy otázek. Aplikací Dolování dat může být řízení rizika, rozdělení zákazníků do skupin, cílená reklama, předvídání budoucího vývoje, hledání anomálií (např. hledání pojistných podvodů), tvorba doporučení (nabídka zboží, o které by mohl mít klient zájem v online obchodech) a další.

Dolování dat je také nástroj používaný v rámci Business Intelligence, což je oblast analýzy dat sloužící jako podklady pro manažerské rozhodování a taktéž předmět vyučovaný doc. Suchánkem ve třetím semestru navazujícího studia oboru Manažerská informatika.

Cílem předmětu Dolování dat je seznámit se s procesem samotného dolování, tedy 1) co to je, 2) jak se to dělá, 3) které metody se používají, 4) jak se vyhodnocuje úspěšnost celého procesu a hlavně 5) jak je možno výsledky dolování prakticky využít. Praktickou částí předmětu je tvorba seminární práce, která studentovi umožní si celý proces prakticky "osahat" v nějakém dolovacím software, např. RapidMiner nebo MATLAB.