Využití big dat lze přirovnat k úpravě surové ropy, během které vznikne cenný benzín, léky, nebo plasty. Velká data se dnes stávají zásadní hybnou silou ekonomik a ten kdo je bude umět lépe pracovat, získá konkurenční výhodu, o jaké se mu dosud ani nesnilo, shodují se Pavel Kysela, CEO společnosti Adastra a Michal Klaus, CEO společnosti Ataccama.

Mohl byste popsat našim čtenářům, co se přesně rozumí pod pojmem big data?

Pavel Kysela

PK: Big data je takový populárně vědecký pojem, který ve zkratce shrnuje asi toto: „Když umíte získatopravdu hodně dat a umíte je rychle a levně zpracovat, můžete z nich získat reálnou hodnotu, zásadně vylepšit váš produkt nebo poskytovanou službu“ – asi jako když z ropy děláte benzín, léky nebo plasty. Díky této zkratce se vlastně disciplína informačního managementu dostává do povědomí podnikatelů, manažerů a obecně netechnické veřejnosti.

MK: Přesně tak, zásadní rozdíl mezi obdobím před „big data“ a nyní je ten, že data se opravdu stávají hybnou silou firem a ekonomik. To, že jsou data velká, je svým způsobem druhořadé, „velká“ je tomto případě zejména ta příležitost. Od Karla Marxe víme, že mezi základní „výrobní prostředky“ patřily hlavně hmotné statky – půda, nemovitosti, výrobní kapacity, suroviny, kapitál, nověji duševní vlastnictví. Éra big dat a souvisejících trendů jako „internet věcí“, přináší zásadní změnu – mezi klíčové suroviny se ode dneška počítají informace. Informace se stávají jednou z hlavních surovin a „továrny“ na jejich zpracování jedním z hlavních výrobních prostředků.

Proč by se o big data měly firmy a jejich management aktivně zajímat, je zde nějaký signifikantní benefit pro core byznys společností, nebo třeba pro řízení podniku?

Michal Klaus

MK: Pokud se na big data díváme pouze jako na schopnost zpracovávat a analyzovat řádově více dat než doposud, tak to pro některé společnosti význam má, pro některé možná menší.

Podívejme se na to ale z jiné perspektivy – přichází doba, kdy schopnost zpracovávat informace bude klíčová konkurenční výhoda, možná otázka existence. Pro lepší představu mám pro vaše čtenáře takové mentální cvičení – vezměte si obor, který znáte (zemědělství, výroba, bankovnictví…) a představte si, co by se stalo, kdyby se v tomto oboru rozhodl začít působit Google – tedy firma, která nemá nic jiného, než tuto novou surovinu a továrny na její zpracování. Peníze můžete ignorovat, ty jsou dnes dostupné relativně snadno. Mimochodem – vše o čem mluvíme, se samozřejmě týká i nekomerčních organizací a státních institucí.

Proč vlastně nelze analyzovat tato data tradičními metodami?

MK: Primárně z důvodu jejich velikosti a rozmanitosti. V některých případech to je technicky nemožné nebo velmi obtížné, v jiných je to neekonomické.

Dovedu si snadno představit využití analýzy velkých dat v leteckém průmyslu, bankovní sféře, nebo ve vědě, jaký je zde ale v současné chvíli potenciál pro, řekněme, průměrnou českou obchodní nebo výrobní společnost? Není to tak trochu kanon na vrabce?

MK: Samozřejmě pokud by si firma s obratem řekněme 50 mil korun, měla budovat technickou infrastrukturu, tým lidí a celkově pokročilé schopnosti práce s velkými daty, nebude to dávat ekonomicky smysl. Na druhou stranu, takový související trend je poskytování IT technologií, produktů, kompetencí takzvaně „jako službu“. To je koncept, kdy i malá firma, za náklady, které odpovídají její velikosti, může naplno využívat tu novou zázračnou surovinu, a může si „pronajímat“ kapacitu továren na její zpracování. Ne nadarmo se mluví o „demokratizaci“ přístupu k datům a analytickým výstupům.

Big data dnes představují jeden z největších obchodních artiklů v ICT, jde o přechodný trend, nebo jejich význam do budoucna ještě více poroste?

PK: Domnívám se, že v této oblasti jsme teprve na začátku. Každý dnem se objevují nové technologie a možnosti. Stále jsme ve fázi, kdy se o této oblasti více mluví, než se v ní realizuje.

Celosvětový dramatický nárůst objemu pořízených dat je objektivní fakt a schopnosti technologií, lidí i společností je efektivně využívat jsou stále omezeny a řekl bych, že zatím stále kulhají v závěsu.

Lze načrtnout přesnou hranici mezi normálními byznysovými daty, tedy těmi, jež lze zpracovávat běžným způsobem, a těmi, která již spadají do sféry big dat?

PK: Z mého pohledu velmi těžko. Moderní řešení postavené na bázi technologie Hadoop jsou totiž v mnoha případech velmi dobře použitelná i pro „klasická“ strukturovaná data a vyžadují řádově nižší náklady na implementaci a provoz než tradiční řešení.

Proto řada průkopnických projektů v oblasti big dat nebyla zaměřena na zpracování nových datových zdrojů, ale na významném zrychlení a zlevnění stávající infrastruktury. Tuto hranici bych tedy viděl spíše ve způsobu zpracování a použitých technologiích než datech samotných. Protože nikde jinde není pojem „velký“ tak relativní jako ve výpočetní technice.

Proč se vlastně o oblasti big dat mluví teprve poslední dva až tři roky, to dříve žádná „big data“ neexistovala?

PK: O big datech se začíná mluvit s příchodem technologií, které umožňují jejich zpracování. Před 10ti lety bylo hlavním úkolem firem vybudovat datový sklad, ve kterém budou konsolidována data z hlavních provozních systémů. Tuto část již většina firem s větším nebo menším úspěchem realizovala. V průběhu času ale došlo k exponenciálnímu růstu objemu dat, objevily se nové zdroje dat, ať už hovoříme o sociálních sítích, zvukových a obrazových záznamech, automaticky generovaných datech atd. Zároveň se začaly dynamicky rozvíjet technologie, které umožňují tato data zpracovávat rychleji a levněji.

Bude v blízké budoucnosti ve světě ještě prostor pro nějaké inovace v oblasti big dat, nebo je trend jasně daný?

MK: Několik obecných trendů je zřejmých: sběr a zpracování dat obecně bude řádově levnější a snadnější, přístupný jako služba širšímu okruhu firem i organizací. To povede ke vzniku nových obchodních modelů, nových firem, možná nových odvětví.

A opravdu se nejedná jen o analýzu dat, mluvíme o tom, na jakých základech jsou postaveny komerční i nekomerční instituce. Bude docházet k akvizicím napříč mezi „kamennými“ a „digitálními“ firmami – viz například agrochemická společnost Monsanto, která vloni koupila „big data“ firmu Climate Corp. K inovacím – celá tato oblast se vyvíjí opravdu nevídanou rychlostí, se zapojením obrovského množství velmi chytrých lidí, v mnoha ohledech by se dalo říci, že je to vývoj „revoluční“.

Mám takový nejasný pocit, že v případě velkých dat může být někdy větší problém s daty samotnými, než s jejich následnou interpretací. Podle čeho mají firmy určit, co jsou pro ně ještě užitečná data a co již nikoli?

PK: Domnívám se, že naopak dochází k postupné změně myšlení. V tradičních přístupech byla cena za uložení dat poměrně vysoká a doba potřebná k implementaci datových transformací dlouhá. Investor si musel dobře dopředu rozmyslet, která data potřebuje a v jaké struktuře. Technologie postavené na bázi řešení Hadoop umožňují velmi rychle a levně data uložit na jedno místo. Firmy tak mohou skladovat velké množství různorodých dat rychle a levně a teprve následně nacházet nové způsoby jejich využití.

Dalo by se podle vás říci, že rozhodnutí na základě velkých dat má blíže spíše intuici než k logické argumentaci?

PK: To bych neřekl. Rozhodování na základě dat je ve většině případů postavené na statistice a s rostoucím objemem dat se statistické výsledky naopak zpřesňují. Z celkového pohledu představují velká data komplement k tradičním datovým skladům a do rozhodovacích procesů tak přinášejí nové informace a pohledy. To by mělo uživatelům přinést širší možnosti využití dat a zároveň komplexnější vypovídací hodnotu.

Děkuji za rozhovor.