Obrovské množství dat, které se generuje v současných podnicích, svádí k různým chybám. Datové sklady v řadě podniků fungují neefektivně a nepřinášejí očekávané výsledky. Bobby Beckmann, CTO společnosti Lifesize, uvádí nejčastější přehmaty, jichž se dnes podniky v souvislosti s datovými sklady a business intelligence/analytikou dopouštějí. Soustředí se přitom především na to, jak shromažďovat data pro další zpracování.
V některých případech se důležitá data vůbec neshromažďují, protože v určitý okamžik je už dat moc a kapacita datového skladu vyčerpána, respektive podniky nevědí, jak vůbec zvládnout další zpracování. Big data se stávají příliš velká. Je proto třeba předem definovat, co shromažďovat, co má přednost, co případně i mazat – pokud možno tak, aby se o fungování podniku získal celkový obraz a většinu objemu např. nezabral výstup k jednoho typu zařízení IoT. Naopak se vyplatí třeba sbírat detailní data o způsobem využívání cloudových služeb (pro zákazníka i poskytovatele).
S předstihem je třeba definovat klíčové ukazatele výkonnosti (KPI), respektive z jakých dat se vůbec budou stanovovat nějaké žebříčky/metriky a jak se definují příslušné filtry. Data nestačí „sledovat a analyzovat“, je třeba definovat, jaký stav je žádoucí více a jaký méně. Z množství dat generovaných např. automatizovaným zákaznickým centrem by mělo být hned patrné, jak to aktuálně vypadá s efektivitou souvisejících procesů. Tyto požadavky na metriky je také třeba získat ze všech oddělení dopředu, ještě před samotnou implementací; jinak hrozí, že projekt datového skladu překročí plánovaný rozpočet a bude se zpožďovat.
Data by také měla být v mnohem větší míře používána k prediktivní analýze – konkurenční výhoda znamená nejen umět rychle reagovat, ale také předvídat, jak se změní požadavky zákazníků nebo jakým způsobem budou využívány příslušné služby. Obecně se prediktivní analýza bude stávat stále důležitější úlohou oddělení IT. V minulosti problém spočíval v tom, že pro tyto analýzy vesměs využívala neaktuální data a zpracování trvalo dlouho, takže než byla provedena předpověď, už bylo stejně všechno jinak. Tato technologická omezení však již dnes nehrají takovou roli; on-line transakční systémy i datové sklady lze již provozovat pouze nad jedinou sadou „živých“ dat.
Pozornost by se měla věnovat uživatelskému rozhraní datového skladu a souvisejících systémů. Dnes již téměř všechny podnikové nástroje nabízejí přehledná prostředí s grafickými panely a konzole, které umožňují z jednoho místa přístup i ke složitě strukturovanému prostředí. Většinou stačí využít možnosti, které nástroje již nabízejí.
Beckmann dále upozorňuje, že ani technologické firmy či firmy s rozsáhlými odděleními IT často na budování datových skladů vlastními silami nemají dostatečné know-how. Mnohdy je efektivnější zapojit do projektu třetí stranu.
Samostatnou otázkou pak je, jak datový sklad propojit s dalšími technologiemi a změnami, které probíhají v rámci firemního IT: umělá inteligence/strojové učení, IoT, cloud, dev/ops atd.
Zdroj: InformationWeek a další