Strojové učení vytváří nový trh s tréninkovými sadami dat, dosud se ale jeho fungování neustálilo. Pojem „nákup dat“ v minulosti znamenal hlavně údaje o potenciálních zákaznících, tj. např. získání databáze ověřených kontaktů, kde lze očekávat nějakou odezvu a nikoliv to, že obesílající firma bude obviněna ze spamování.
Data o chování lidí jsou hlavním majetkem firem, jako je Google nebo Facebook. Objevil se i koncept „data jako služba“ (DaaS), který v rámci své cloudové nabídky poskytuje např. Oracle. Podle Gartneru (rok 2018) nějak využívá externí data 46 % podniků. Může jít prostě o přidání nějakého typu dat do komplexnější sady/služby – třeba do prodeje finančně-analytických dat se pro doplnění přidá externí zdroj, který monitoruje rizika živelných pohrom.
Nyní ale roste poptávka i po datech jiného typu včetně výsledků technických měření. Firmy totiž potřebují daty krmit systémy strojového učení. Samozřejmě pro trénink mají k dispozici data vlastní (vyvíjejí aplikace pro něco, čím se samy zabývají), nicméně stále zde hrozí, že tato data jsou nějakým systematickým způsobem posunuta/zkreslena. Vzhledem k tomu, jak významná může být příslušná aplikace na bázi umělé inteligence (prediktivní analytika apod.), podniky se často snaží zjistit, co by s modelem udělalo, kdyby se do nějak zahrnula i data třetích stran. Právě tuto otázku zkoumá na InformationWeek Jessica Davis.
Jako hlavním problém se zatím jeví, že trh je relativně nový; chybějí zde hlavně ověření prostředníci, kteří by byli garanty kvality dat, s nimiž se obchoduje. Podle analytiků Deloitte je trh nezralý a roli prostředníků se snaží hrát velmi mnoho nových hráčů. Deloitte nicméně povzbuzuje podniky, aby se této otázce věnoval, a snažily se identifikovat data, která by potřebovaly pro trénink systémů strojového učení. Specialisté na data přitom samozřejmě musejí postupovat ve spolupráci s právním oddělením, protože dosud jde o poměrně nestandardní, nezaběhlé transakce. Je třeba uvážit, zda kupovat spíše data už nějakým způsob zpracovaná, nebo surová a zpracovat je ve vlastní režii. Existují i služby, jimž lze dodat vlastní surová data, a služba pak současně provede jak jejich další zpracování, tak i obohacení.
Z druhé strany, vlastní „technická“ data mohou mít i významnou obchodní hodnotu pro další prodej. Celkem běžný je scénář, že firma nejprve vyvíjí určitou aplikaci pro vlastní potřebu, pak ji ale začne i dodávat třetím stranám. Příkladem jsou dnes podnikové služby, v minulosti takto Software602 začal nabízet vlastní systém CRM. Data (a to nikoliv ve smyslu dat zákaznických) mohou představovat další komoditu a obchodovatelný vedlejší výsledek vlastního podnikání; jakkoliv samozřejmě třeba uvážit, nakolik by firma jejich nabídkou mohla podpořit svou konkurenci. Pokud už firma např. vyvinula pro vlastní potřebu nějaké technologie pro čištění a obohacování dat, může nabídnout jako službu třetím stranám i tohle.
Každopádně je čas, aby podniky začaly dávat dohromady příslušné týmy pro obchodování s daty, protože jde o logickou součást doprovázející implementaci umělé inteligence/strojového učení.