Mýty o big data a analytice

Nejdůležitější jsou často odpovědi získané mimochodem. Platformy různých dodavatelů prý dávají odlišné výsledky. A velké objemy dat neznamenají „veškerá data“.
Například podle studie IDC roste trh s nástroji pro big data sice v dvojciferných číslech, jenže na to, kolik se o technologiích mluví, to vlastně není tak mnoho. Mnohé projekty přitom nepřinášejí očekávanou návratnost investic. Přijde celková deziluze?

Andrew Froehlich se společnosti West Gate Networks se na InformationWeek pokouší podrobněji analyzovat nejčastěji opakovaná tvrzení, která se k příslušným technologiím vážou. Celkově mu ovšem nejde ani tak o varování před riziky, ale spíše chce rozptýlit nepříliš opodstatněné obavy, které vedou k tomu, že podniková IT oddělení jsou paralyzována a nasazování inovací vázne.

Jedním z omylů je snaha ukládat opravdu všechno, „protože by se to mohlo jednou hodit“. Ve skutečnosti mnohá data mají smysl pouze pro analýzu v reálném čase (nebo v časovém horizontu, který se tomu alespoň blíží) a nemá smysl je archivovat. A když už se všechno archivuje, je vhodné si uvědomit, že řešení vhodná k zálohování (pro obnovu pro havárii) a pro dodržení předpisů se vůbec nemusí hodit pro předpokládanou práci s daty (analýzu).

Big data nejsou jen pro ty největší

Mnoho organizací přeceňuje náklady. Pod velkými objemy dat si představí něco, s čím pracuje Google, Facebook nebo Microsoft. Přitom řešení pro big data a jejich analýzu v cloudu je dnes již dostupná i menším organizacím a hlavně: řešení – včetně ceny – bývá dobře škálovatelné podle potřeb a možností zákazníka. Podobně jako u jiných cloudových nástrojů nemusí být nijak vysoká ani vstupní investice. Viz i předešlý bod – v big data nemá smysl uvažovat způsobem „všechno, nebo nic“.
Nemá ani smysl si říkat, že „získat konkurenční výhodu už je pozdě“, ani trend prozatím přeskočit a čekat na nějaký další zásadnější zlom. Big data stejně jako umělá inteligence a automatizace se bude do podnikového IT a podnikových procesů vůbec implementovat mnoho příštích let, s postupnými dalšími inovacemi.

Další tipy podle A. Froehlicha:

Stojí za to si nedefinovat veškeré otázky předem a příliš si nezúžit práci. Výhodou analýz nad big data může být i získání neplánovaných poznatků. Stojí za to si s výstupy hrát a zkoumat, zda se kromě odpovědí neobjeví také nové otázky (dozvíme se o tom, co ani nevíme, že nevíme). Pokud si management myslí, že podnikání plně rozumí a chce si jen „exaktně“ potvrdit, co už ví předem, přínosy z technologie budou samozřejmě velmi omezené.

A co lidský faktor? Specialistů na „data science“ je dnes nedostatek, nicméně není nutné čekat na někoho s příslušným univerzitním vzděláním. Kdo má příslušné myšlení (i třeba včetně psychického nastavení – určitá introverze apod.) a pracuje v podnikovém IT, může se přeškolit. Není to i nic zásadnější posun, než když se z databázového správce stane správce virtuálních strojů.

Často se říká, že platformy pro big data od různých dodavatelů jsou prakticky stejné (dejme tomu až na rychlost, náklady na vlastnictví apod.), důležitější je umět nástroje účelně využívat. Andrew Froehlich důrazně nesouhlasí. Pokud různé problémy řešíme na produktech různých dodavatelů, můžeme podle něj klidně dostávat odlišné závěry (nejde o kalkulačku, která musí vždy dát stejný výsledek). Volbě konkrétního řešení je proto třeba věnovat velkou pozornost.

A nakonec, big data nejsou velké datové sklady. Existují zde podstatné rozdíly, v technologiích, nástrojích i požadovaném know-how. Hlavní odlišnost spočívá v tom, zda zpracováváme spíše strukturovaná nebo nestrukturovaná data.

Exit mobile version