Po datových vědcích je tu prý další specializace, o kterou je (nebo bude) v podnicích enormní zájem – lovci dat. Myslí se tím především odborníci na získávání dat z externích zdrojů. Takový „data hunter“ (eventuálně formálněji „data acquisition specialist“) by měl vědět, jaké externí datové sady by byly použitelné pro příslušný byznys, zejména pro obohacení dat vlastních, a to ať už půjde o samotnou analytiku, nebo aplikace se strojovým učením/umělou inteligencí.
V jednodušším případě může nakupování dat samozřejmě obnášet třeba i databázi ověřených kontaktů na potenciální zákazníky, kteří souhlasí se zasíláním marketingových nabídek, to by ovšem nevyžadovalo zrovna datového specialistu.
Na trhu přitom působí řada firem, které externí datové sady nabízejí, lovec by se měl tedy mj. vyznat v těchto nabídkách.
Viz také: Jak nakupovat – nebo prodávat – data
Jessica Davis se na InformationWeek odvolává na studii Forrester Research, podle které je intenzivní zájem o externí data právě tím, co odlišuje rychle rostoucí společnosti od méně úspěšných konkurentů. Podle průzkumu Gartneru v roce 2018 externí data nějak využívalo 46 % podniků. Lovec dat nejenom prostě cosi koupí, ale dokáže také převádět nestrukturovaná data na strukturovaná a vymyslet, jak je vhodně sloučit s daty stávajícími. V případě, že jde o firmu, která s daty dále obchoduje, pak spolupracuje i na tvorbě finální nabídky, tedy nové datové sady k prodeji.
Člověk zodpovídající za nákup dat by měl zabránit tomu, aby různá oddělení ve firmě nakupovala data nezávisle na sobě, aby jednou získanou licenci mohl využívat celý podnik a byla integrována do všech možných softwarových nástrojů; tedy prostě dnes hodně zdůrazňovaná snaha nevytvářet datová sila. Především by ale lovec dat měl vymyslet, jaká data firma potřebuje, a sám aktivně zjistit, jak taková data získat – nejenom pouze vybrat z hotových nabídek. Obvyklou náplní práce bude vytipování firem, které by potřebná data mohla shromažďovat nebo i využívat pro vlastní potřebu (prodejce zmrzliny může např. kontaktovat síť hospod a zkusit zjistit, zda neshromažďují data o závislosti prodeje piva na počasí), a následná práce na obchodní nabídce.
Ve srovnání s data science, respektive analytikou, se stále jedná o podpůrnou roli, nicméně finanční ohodnocení zde může být i vyšší než u těchto pozic.
Analýza Gartneru rozlišuje data do 7 kategorií:
-
Enterprise – podniková: stávající data z podnikových systémů, transakční data, data z dodavatelských řetězců, údaje o zákaznících…
-
Dark – podniková data, ale často nevyužívaná: e-maily, smlouvy, záznamy protokolů, multimédia…
-
Open – otevřená data (takto zamýšlená, publikovaná ze zákona, data z veřejných registrů, data státních institucí apod.). Zdrojů existuje nepřeberně, ale někdy není snadné se o jejich existenci vůbec dozvědět, je třeba analyzovat příslušné API apod.
-
Web – z webu lze více či méně složitě extrahovat např. data o konkurenci, jejích prodejích, ekonomických ukazatelích, náborových a marketingových kampaních atd. Podobné kategorii „open“, až na to, že zde je otevřenost dat k tomuto druhu využití spíše nezamýšleným důsledkem.
-
Social Media – obdobné předešlé kategorii, až na to, že jde speciálně o data na sociálních sítích.
-
Data od partnerů – mohou být dostupná volně (ale ne nutně automaticky, je třeba projevit zájem apod.), zpoplatněně nebo výměnou za jiná data.
-
Syndikovaná data – data kupovaná přímo od poskytovatelů příslušných služeb, mohou kombinovat všechny výše uvedené kategorie.