Jako vstup má umělá inteligence k dispozici pouze textové popisky, na výstupu z nich vygeneruje film jako celek. Mohla by se tím pořádně zlevnit nejenom filmová produkce, ale podobný nástroj by se mohl uplatnit třeba i při rekonstrukci dopravních nehod nebo kriminálních činů.
Dosud se umělá inteligence používala spíše k rozpoznání obrázků – tedy vytvoření příslušných „štítků“, respektive rozřazení obrázků do kategorií. Zde je postup opačný, přičemž tzv. generativní algoritmy AI dosud svými schopnostmi zaostávaly za těmi analytickými. Kromě vytvoření jednoho záběru do hry vstupuje ještě další schopnost dnešních neuronových sítí – pokusit se o odhad dalších záběrů (respektive obecně dalších „členů řady“) z toho stávajícího. A nakonec zbývá vše propojit plynulým přechodem.
Ačkoliv v podstatě se všemi jednotlivými kroky už vývojáři AI experimentovali, zkombinovat vše do jednoho systému se nyní pokusili poprvé. Příslušný projekt vedla Tinne Tuytelaars z belgické Katholieke Universiteit Leuven. Při zvolené metodě strojového učení jedna z neuronových sítí vytvářela videa daného typu („plavba lodi po moři“), druhá porovnávala takto vytvořená videa s těmi skutečnými. Jakmile se druhá síť vyškolila na poznání rozdílů, první síť se zase snažila generovat videa, která by ta druhá již nedokázala rozlišit od skutečných. Tato iterace se pak opakovala.
Na setkání Asociace pro rozvoj umělé inteligence v New Orleans uvedli tvůrci programu, že dokáží generovat i nesmyslné scény (plachtění na sněhu, hraní golfu v bazénu) – i když zřejmě jen v první fázi a není možné ladění proti scénám skutečným (?). Jako hlavní potřebné vylepšení algoritmu uvedli, že program zatím poměrně zaostává, co se týče věrnosti zobrazení a pohybu lidských postav.
Představme si, jakou obrovskou kompresi by znamenala definice videa pouze několika řádky textu – i když to je jistě nadsázka. Ambicí tvůrců programu ostatně není prozatím zlevnit výrobu filmů v Hollywoodu, ale spíše vytvářet vstupy pro další systémy umělé inteligence. Například software řídící autonomní automobil bude moci být trénován nejen na záznamech skutečných případů, ale mělo by mu takto jít vygenerovat další realistické dopravní scény. A jak už bylo zmíněno v úvodu, uplatnění by bylo i ve forenzních aplikací, kdy na základě líčení svědka půjde třeba vyšetřovatelům nebo soudu přímo ukázat, co se na místě činu odehrálo.
Zdroj: Science AAAS