Umělá inteligence na ČVUT v pražských Dejvicích se společností M Computers (partner IBM), DNS (distributor IBM), Nvidia. Vývoj, současný stav a trendy AI. Otevřené komunity inspirují velké hráče. Záchranářský robot řízený AI pomohl po zemětřesení v Itálii.
Petr Plodík z firmy M Computers seminář na AI (artificial intelligence) uvedl a předal slovo Klausi Rindtorffovi z IBM Research. Společnost M Computers je partnerem IBM, zabývá se také vysoce výkonnými výpočetními systémy (HPC) a ukládáním velkých objemů dat a dodává tyto systémy i do akademické sféry. Firma M Computers se také jako první partner v České republice a na Slovensku nedávno stala certifikovaným partnerem společnosti Nvidia pro oblast Accelerated Computing.
IBM stála u AI od počátku
Klaus Rindtorff seznámil s milníky vývoje výpočetní techniky: 1900 – děrné štítky, 1950 – programování, 2011 – cognitive computing. Aplikace AI jsou něčím, co může generalizovat informace z dat a je snazší je to naučit než něco podobného naprogramovat. Umělá inteligence je založena na řešení neuronových sítí. „Umělý neuron“ byl definován a vynalezen už v roce 1957 na Cornell Aeronautical Laboratory Frankem Rosenblattem. AI je úzce spjata se strojovým učením (ML, machine learning). Pokrok v ML urychlil internet, rychlejší počítače, expanze dat, poptávka po robotizaci, která potřebuje chytřejší řešení apod.
První srovnání výpočetní síly
Klaus Rindtorff přitom uvedl, co jsme měli k řešení složitých výpočetních úloh dříve. Běžně to byl desktop PC AT s 20MHz x386, ti šťastnější jej měli s x386DX (tj. s matematickým koprocesorem) s výpočetním výkonem 0,5 MFlops. Dnes je zapotřebí mít ke složitějším výpočtům počítač s GPU Nvidia Tesla, a ti opravdu šťastní mají k dispozici rovnou takto vybavený celý rack. IBM má k těmto výpočtům k dispozici hardware IBM Synapse.
AI – stroj předčí člověka
Umělá inteligence na základě neuronových sítí (ANN – artificial neural networks) už pokročila tak daleko, že pokud je k dispozici dost dat k učení systému, dochází dokonce k překonání přesnosti rozpoznávání, například (sady) obrazů. Zatímco člověk v jednom testu rozpoznal 94 % obrazů z předložené sady, stroj na základě metody CNN (convolutional neural network) správně rozpoznal 95,5 % obrazů. Využití AI se tedy začíná i v nestrukturovaných datech přibližovat čistě strojové přesnosti, jakou je prohledávání strukturovaných databází (včetně strojového zadávání údajů, např. přes čárové kódy). Pro učení je nutno mít podle Klause Rindtorffa obrovské množství testovacích dat a opravdu rychlé počítače. Řídicími faktory jsou pokrok v testovacích (training) metodách a v architekturách (neuronových) sítí.
Klaus Rindtorff ještě zmínil, co stálo za vítězstvím superpočítače a softwaru IBM v legendární televizní soutěži Jeopardy nad dvěma „všeználky“ – masivní paralelismus a mnoho expertů (tj. dat k naučení systému).
Nvidia je nejrychlejší
Prostě je to tak (a ostatní hráči prominou, konstatuje to tak a bere na vědomí i IBM). Ralph Hinsche z Nvidia představil dvě poslední GPU, a sice Nvidia Tesla P100 a novější Tesla Volta V100, která dosahuje výkonu 7,5 FP 64 TFlops a 15 FP 32 TFlops (FP – floating point, výpočty s plovoucí desetinnou tečkou/čárkou (EN/CZ notace)). Základem rychlosti GPU V100 je interní sběrnice Nvidia NV link. Nvidia Volta V100 je 3x rychlejší ve strojovém učení (deep learning) a má 3x vyšší prostupnost v usuzování výsledku než dřívější P100. Sběrnici NV link Nvidia licencuje pro IBM, a sice pro její procesory Power 9.
Pro co je GPU a jak začít
Využití strojových výpočtů AI a deep learningu s GPU je například v urychlení výsledků výzkumu rakoviny, rozhodování v medicínských diagnózách, kybernetické bezpečnosti, kosmickém výzkumu a výzkumu neutrina, může sloužit jako „mozek“ pro smart cities, pro analýzu a nasbíraných dat ve sportu, výzkumu léků (zkoumání dvou neuronových sítí, kdy se jedna učí od druhé), zkoumání a dopadu emisí na životní prostředí (například na základě satelitních snímků od NASA), obrana Země před asteroidy apod. Třeba společnost SAP už představila novou vlnu obchodních aplikací založených na AI (SAP Leonardo) pro optimalizaci logistiky, řízení pohyb zboží v distribučních skladech (například ve společnosti Zalando použili aplikovali algoritmus AI, který zrychlil pohyb zboží o 11 %).
Nvidia nabízí i program pro startupy a spin-offs, kde se lze přihlásit pro vzdělávací program.
IBM OpenPower
Radek Špimr, IBM Power Systems, seznámil zejména s hardwarem IBM a výhledem na další vývoj procesorů IBM Power (roadmap), nezapomněl však přitom ani na software: „Pokud chcete být experty na strojové učení, měli byste vědět, co je za tím, ať už jde o hardware, nebo o software. Žijeme v hektické době, kde existuje spousta směrů, o kterých ale za pět let nikdo nemusí vědět.“ Svoje slova doplnil ilustrací jednoho z vývojů v IBM, který byl určen pro obchodní řetězce, kdy šlo o to, jak pomoci řetězcům umístit zboží tak, aby bylo prodejnější – do výše očí v regálech nebo přímo u kas.
Druhé srovnání výpočetní síly
„Požadavky na hardware v roce 1999, kdy tento projekt probíhal, byly až směšně malé, sdělil Radek Špimr: „Notebook ThinkPad se 128 MB RAM, 100 MB na (legendárním) serveru IBM F50 s procesorem Power, na stanici 130 MB RAM…,“ ale pak projekt skončil, protože si ‚nejprodejnější‘ pozice v regálech a u kasy zaplatili dodavatelé, kterým tato skutečnost došla.“
IBM OpenPower pro všechny
IBM se však AI rozhodně nevzdala a v roce 2013 založila otevřené konsorcium OpenPower. Výsledkem jsou 7nm, a dokonce 5nm čipy s využitím „nanosheet“ tranzistorů, které přinášejí až 40% nárůst výkonu při 75% snížení energetické náročnosti; 5nm čipy používají stejnou technologii, jako 7nm čipy od IBM už z roku 2015 (EUV, extreme ultraviolet). „Základem je snížit energetickou spotřebu,“ zdůraznil Radek Špimr, a poznamenal: „Dá se předpokládat, že čipy vyrobené takovouto technologií budou brzy i v mobilních telefonech.“
Společně s tím musí jít podle Radka Špimra vývoj softwaru a ukazuje se, že otevřené komunity přinejmenším inspirují velké hráče.
Open source a přidaná hodnota IBM v serverech
Radek Špimr také seznámil, že IBM umí k volně dostupnému softwaru přidat knihovny, které umějí škálovat servery do mnoha nódů. Projekt Exascale, spolufinancovaný EU, má docílit 50násobného navýšení výpočetního výkonu při zachování stávajících energetických nároků do roku 2020. Další projekt EU, Human Brain Project, je zaměřen na vytvoření funkčního modelu lidského mozku.
IBM by měla do konce roku 2017 uvést nové servery s procesory Power 9 se 14nm technologií. „Už se servery s procesory Power 8 a s GPU Nvidia dosáhla IBM výkonových výsledků, které očekávala až od Power 9, takže vše další bude jen dalším posílením výkonu. Nové servery IBM Power vycházejí z návrhu serverů od Google, RackSpace apod., kde je vše kromě procesorové desky zaměnitelné.
Jak Radek Špimr sdělil, IBM dnes také spolupracuje jak s velkými výrobci (Nvidia, Samsung, Mellanox, Google, RackSpace, Hitachi…), kteří dříve byli jejími konkurenty, tak ale i s otevřeným světem open source, včetně akademického světa.
AI a akademický svět
Milan Le představil výsledky společnosti Quantasoft, jehož počátky sahají do roku 2006 na ČVUT. Jednak se Quantasoft zabývá analýzou biometrických údajů (otisků prstů) pro přístupové systémy, jednak rozpoznáváním obrazu. Využití je například pro detekci a přiřazení parkovacích míst na základě kamerového záznamu. „Jde to i přes IoT a puky s vysílači zabudovanými do vozovky, to je však drahé, musí se kopat do země a puky musejí mít baterii,“ sdělil Milan Le. Dalším praktickým využitím AI je analýza obrazu sítnice lidského oka, a z této analýzy (skvrn na sítnici) zjistit cukrovku. Quantasoft je mj. partnerem Nvidia a Intelu.
Radoslav Škoviera z ČVUT nakonec prezentoval lokalizaci a rozpoznání objektů v obrazu na základě analýzy neuronových sítí. Praktické využití je například v záchranářském robotu, který se podílel i na odstraňování následků nedávného zemětřesení v Itálii.
Paralela AI s počátky cloudu
AI je v současné době zřejmě ve fázi, ve které byly počátky cloudu před nějakými patnácti lety. Microsoft a ostatní vývojářské firmy poskytovaly vývojové nástroje prakticky zadarmo, aby přilákaly vývojáře, a z tohoto kvasu pak vznikl dnešní převrat v IT v podobě cloudových aplikací.