Umělé inteligenci, respektive strojovému učení, se poslední dobou často vytýká, že nikdo přesně neví, na základě čeho se systém vlastně rozhoduje. Jenže – není v tom naopak jeho hlavní přednost?
Vůbec se nechci pouštět do filozofických úvah o tom, co je skutečná umělá inteligence a čemu se dnes jen tak říká. Snad tedy lépe mluvit o strojovém učení: máme systém vyškolený na základě vstupních dat tak, aby maximalizoval nějakou hodnotu, může to dělat lépe nebo hůře.
Co na tom chcete přesně vysvětlovat? Příklad: máme před sebou šachistu. Z toho, jak ze vstupů dojde k výsledku, se odvozuje jeho úspěšnost/síla. Ve skutečnosti šachista jistě nějak vysvětlí, na základě jakých obecných principů postupuje – kdyby to tak nebylo, šachy by se člověk nemohl vůbec učit/trénovat. Na druhé straně se ale výsledná síla hráče odvozuje ne ze znalosti nějakých obecných principů. K tomu, jaký tah je v dané pozici nejsilnější, docházejí různí hráči i v případě shody na základě různého typu úvah, někdo více počítá, někdo spíše zvažuje obecná pravidla, někdo se nechá vést automatem v hlavě (a maximálně pak už předem udělané rozhodnutí může nějak zkoušet zpětně racionalizovat – to je další potíž, protože veškeré výklady mohou být ve skutečnosti až zdůvodněním ex post).
Velice kvalitní šachový program, který se šachy navíc naučil sám, bez lidské asistence, vyvinul Google, respektive jeho firma DeepMind. Mezi vstupem a výstupem funguje v příslušné neuronové síti kdovíkolik abstraktních vrstev. Nejspíš dnes nikdo nerozumí tomu, jaké zde existují struktury, z hlediska herní síly na tom ovšem ani nezáleží. (To celé jen pro příklad, kritici tvrdí, že za silou programu AlphaZero stojí hlavně konkrétní hardware, tenzorové procesory nebo dokonce konkrétní podmínky zápasu s jinými šachovými programy atd.).
Pojďme tedy v úvaze dále: prodáváte-li zboží, roli jistě hraje, jak je v supermarketu rozmístíte. Chcete-li dosáhnout maximálního prodeje, každého jistě napadne, že podle dne v týdnu, denní doby nebo teploty se různé věci budou prodávat různě. Nicméně jaká konkrétně bude ona funkce více proměnných a především abstraktní struktury, které si systém vytvoří, to už může být pro člověka docela nepochopitelné. Ale v tom je nikoliv problém, ale naopak síla strojového učení; kdyby to bylo jednoduché a jednoduše vysvětlitelné, lidé by na to už dávno přišli sami.
Strojové učení je obdobou všemožných evolučních algoritmů a genetického programování. Nějaké zákonitosti jsme dokázali odhalit a logicky vysvětlit (často ale zase i ex post a logicky by někdo vysvětlil i jiné výsledky). Jenže mnohá skutečně cenná pravidla mají spíše povahu matematických heuristik, které fungují, aniž kdo ví proč. Kritériem je právě ono fungování: stačí si přečíst třeba knihy N. Taleba (Černá labuť a další) nebo M. Ridleyho (Evoluce všeho a jiné). Jaký přesně bude matematický vztah mezi inflací a cenou nemovitostí? Jaký bude vztah mezi prodejem cibule a česneku a venkovní teplotou a umístěním chleba na druhém konci prodejny? Jak ovlivní cena rýže cenu akcií Applu, když oboje je evidentním důsledkem dalších skrytých proměnných, podobně jako v neuronové síti? Lidskou logiku v tom příliš nehledejme (protože nějakou logiku dokážeme najít v libovolném vztahu), kritériem prostě je, zda určitý předpis funguje a dokáže být úspěšný i nadále.
Ještě snad v této souvislosti stojí za to zmínit již celkem starou a kultovní knihu Douglase Hofstadtera „Gödel, Escher, Bach“. Autor zde dochází k závěru, že umělou inteligenci (teď se tím myslí něco jiného než program na optimalizaci prodeje cibule, tedy „skutečně myslící stroje“) dokážeme sice sestrojit, ale právě jen různým skládáním a metodou pokus-omyl. Nezjistíme z toho, jaká je třeba podstata naší vlastní inteligence.
Shrnuto, kritériem pro kvalitu samoučícího se systému je právě jeho úspěšnost. Řešit integrály se také naučíte nejspíš tak, že jich hromadu úspěšně vyřešíte.
Otázkou pak spíše zůstává, proč tento jednoduchý princip zpochybňovat, proč by kritéria rozhodování umělé inteligence měla být nějak laicky srozumitelná (pak by na ně přece nebyly potřeba tak složité a výpočetně náročné systémy). AlphaZero hraje šachy tak dobře právě proto, že si vytváří své vlastní abstrakce založené na dlouhé zkušenosti s příslušným procesem. Jiný program bude lepší nebo horší, ale bez ohledu na to, jak nám bude připadat (zejména zpětně) srozumitelný.