Vývoj nezaměstnanosti lze prý velmi rychle a snadno odhadnout z toho, jak lidé telefonují, respektive jak v tomto ohledu své chování mění – aneb big data v praxi.
David Lazer z Northeastern University, Jameson Toole z MITu a výzkumníci z dalších institucí navrhli vztah mezi telefonováním a vývojem různých makroekonomických ukazatelů. Dokázali takto předpovědět vývoj nezaměstnanosti podle okolností měsíce až týdny dříve, než se objevila oficiální čísla; přitom jejich metoda fungovala mnohem přesněji než jednoduché pokusy o extrapolaci vývoje z historických křivek. Navíc se tyto výsledky prý daly mnohem škálovat, tedy vyextrahovat z nich pouze určitou část.
To všechno zní strašně obecně, takže jak vlastně metoda funguje?
Začalo se tím, že výzkumníci se soustředili na vývoj v evropském automobilovém průmyslu v letech 2006-2007, tedy na začátku krize. Nejprve se nějak dostali k tomu, jak se v jedné evropské zemi (nespecifikováno) měnily sociální interakce těch, kdo byli během této doby z automobilového průmyslu propuštěni. Získali k dispozici např. celkové počty hovorů, počty příchozích i odchozích telefonátů, počty čísel… Ukázalo se, že po ztrátě zaměstnání lidé telefonovali mnohem méně, celkový počet hovorů klesl o 51 %, počet příchozích hovorů o 54 %, také se snížil počet navštívených jedinečných základnových stanic. To se samozřejmě dá zdůvodňovat, ale dal by se zdůvodnit i opak (možných vlivů tu je: lidé více volají, jak si shánějí novou práci; lidé méně volají, protože přestanou telefonovat pracovně; lidé více volají, protože nemají co dělat a klábosí s kamarády…).
Důležitější než psychologické výklady jsou samotná empirická data. Na jejich základě vědci vytvořili matematický model a ten se pak testoval ve druhé evropské zemi, ve stejném období, ale tentokrát plošně. Vše přibližně odpovídalo, vývoj počtu/struktury telefonátů korespondoval s tím, co ukazovaly statistiky o nezaměstnanosti.
Popsaná metoda má řadu výhod, data o telefonování se stejně sbírají automaticky, vše tedy funguje bez dodatečných nákladů.
Samozřejmě se přímo nabízí otázka, zda by se takto nedalo rychle (rychleji než tradičními metodami) zjistit a předpovídat i třeba vývoj HDP, tvorba nových pracovních míst, různé indexy důvěry (bez nutnosti někoho aktivně oslovovat/provádět průzkumy!) nebo i jiné makroekonomické ukazatele. Jistě je zde prostor i pro ty, kdo by chtěli podobná data a modely využít v rámci technické analýzy finančních trhů. Samotní autoři ale vyzývají k opatrnosti, a to sice proto, že telefonování je stále dynamická technologie; lidé v tomto ohledu své návyky mění tak jako tak. Čili metodu by neustále bylo třeba kalibrovat.
Popsaný výzkum vychází z dat starých skoro 10 let (otázka: proč ne z novějších?), leccos se změnilo – je zde vývoj cen (například: mnohem víc lidí dnes bude mít neomezené paušální volání, před 10 lety možná při ztrátě zaměstnání méně volali i kvůli tomu, aby ušetřili, dnes by to bylo jinak?), změnilo se využívání datových přenosů nebo sociálních sítí. To však neznamená, že by nešlo udělat podobný model pro data stará rok a ten pak zkusit nasadit nyní. Možná se pro další roky ani to, jak telefonujeme, už moc měnit nebude. Autoři výzkumu chtějí říct, že těmto modelům by však dnes asi nikdo nevěřil natolik, aby kvůli jejich rychlosti a jednoduchosti přestal sledovat jiné ukazatele.
Hezky to ukazuje, k čemu všemu se dají využívat big data – byť v tomto případě šlo spíše o samotný nápad než o to, jakými metodami pak provést zpracování. Takových dat přitom kolem nás je a s nástupem Internetu věcí bude ještě mnohem víc…