Brněnská společnost M Computers s pobočkou v Praze představila na ČVUT CIIRC společně s IBM a Nvidia nejnovější vývoj a ozvěny summitu SuperComputing 2018. M Computers je obchodním partnerem IBM a zastoupením a distributorem Nvidia u nás. M Computers staví i vlastní servery a je významným dodavatelem výkonných sestav do akademické sféry.
Petr Plodík, obchodní ředitel M Computers, přednášku uvedl a seznámil s pokrokem v oblasti supercomputingu. Dosažený výpočetní výkon už překonal mozek myši v roce 2015 a předpokládá se, že v roce 2023 dosáhne výkonu lidského mozku. Ke zrychlení výpočtů 1 000x dochází zhruba jednou za 10 let.
Petr Plodík také uvedl seznam milníků supercomputingu, kde se USA dostaly se superpočítačem IBM postaveném na technologii IBM Power9 opět na první místo na světě:
1979 – první seznam serverů podle Linpacku
1993 – první seznam TOP500
1997 – ASCI Red – první teraflops systém
2008 – IBM Roadrunner – první petaflops system
2010 – Tianhe-1A – Čína obsadila #1
2013—2016 – Tianhe-2 – Čína pokračuje…
2016 – 2017 – Sunway, Čína
2018 – IBM Summit; USA (IBM): 122 -> 143 petaflops
Průměrná doba systému v Top500 je jen něco málo přes sedm měsíců. Největší počet superpočítačů měly vždy Spojené státy, od roku 2015 s nimi soutěží Čína. Ostatní země (Jižní Korea, Itálie, Kanada, Francie, Velká Británie, Německo, Japonsko…) netvoří dohromady oproti USA a Číně v supercomputingu ani třetinu.
Odkázal také na přednášku Raye Kurzweila z roku 2016, který sdělil, že vývoj v elektronice a počítačích je předvídatelný, což platilo už při zmenšování elektronek. Svoji tezi podpořil skutečností, že když provedl projekci údajů z roku 1980 do roku 2050, pak v roce 2016 jsme byli po 30 letech v elektronice přesně tam, kde jsme měli být. Mooreův zákon (Gordon Moore, Intel, 1965), který hovoří, že počet transistorů, které mohou být umístěny na integrovaný obvod, se při zachování stejné ceny zhruba každých měsíců zdvojnásobí, přestává platit. Exponenciální nárůst počtu tranzistorů totiž naráží na fyzikální vlastnosti polovodičů. V roce 2020 bychom se měli dostat na šířku polovodičového kanálu 5 nanometrů, což je šířka 20 atomů uhlíku, a ty už nezmenšíme, takže v tomto okamžiku přestane Mooreův zákon platit.
Východiskem jsou urychlující koprocesory GPU (Graphical Processing Unit), kde hraje velkou roli mj. Nvidia, která vede v podílu těchto akcelerátorů před ostatními (Intel Xeon Phi, Intel Xeon Phi Main, Matrix-2000, PEZY-SC, Kepler/Phi, Clearspeed, IBM Cell, ATI Radeon…) a Intel Xeon Phi Main tvoří v celkovém podílu akcelerátorů na celkovém výkonu do 20 %. Petr Plodík na závěr své přednášky zdůraznil význam softwaru pro superpočítače a zmínil i kvantové počítače od IBM, D-Wave, Googlu, Microsoftu a dalších, a také nadnesl otázku neuromorfických čipů. Naplňuje se argument Raye Kurzweila, že pokrok má exponenciální průmět, nikoliv lineární, kterým reaguje na kritiky například v oblasti vývoje výzkumu genomu, a to jak v rychlosti výzkumu, který se dvakrát zrychluje každým rokem, tak v klesající ceně za genom. Rozlousknutí prvního genomu stálo miliardu dolarů a nyní jsme na pouhých několika tisících.
Trendy storage 2018 v HPC a AI
Peter Dubnický z M Computers seznámil se sbližováním HPC a AI (High Power Computing a Artificial Intelligence) ve storage, kde hraje velkou roli propustnost dat a jejich latence, což jsou i důvody, proč SCSI už pro HPC nestačí. Východiskem jsou hyperkonvergovaná řešení a distribuovaný přístup k ukládání dat. Představil také několik paralelních souborových systémů s vysokým výkonem a propustností, orientovaných na HPC a AI – BeeGFS, Weka IO Matrix a IBM Spectrum Scale (GPFS), kde poslední jmenované řešení je stabilním a prověřeným paralelním souborovým systémem s robustní architekturou s vysokým výkonem a škálovatelností, zvládající pracovní zátěž AI s automatickou optimalizací výkonu a vylepšením GUI 7 AFM.
IBM Sierra
Milan Král a Radek Špimr z IBM seznámil s architekturou nejvýkonnějšího superpočítače IBM Sierra, postavený na procesorové platformě IBM Power9 a představený na summitu SuperComputing 2018. Skládá se v podstatě z běžných komponent, tj. dvouprocesorových uzlů s CPU IBM Power9 AC922 v zástavbě do standardního 19“ racku, propojených rychlou sběrnicí Gen2 NVlink (NVMe) a s čtyřmi akcelerátory Nvidia Volta na uzel. Vzájemné propojení je na bázi Mellanox Interconnect InfiniBand. Celkový počet výpočetních uzlů je 4 320 s 1,29 PB pamětí v 240 výpočetních skříních s vodním chlazením. Dosažený výkon je 125 PFlops a příkon 12 MW. Použité CPU Power9 pro AC922 se liší od CPU pro komerční servery v počtu jader (20/12). Milan Král zdůraznil, že s počtem uzlů s GPU neklesá doba výpočtu lineárně, protože aplikace je obtížnější odladit.
Nvidia a její GPU
Ralph Hinsche, který má v Nvidia region, kam spadá Česká republika na starosti, představil Nvidia jako společnost, dodávající GPU pro náročné výpočty v oblasti počítačové grafiky a umělé inteligence. GPU jsou na scéně už dvanáct let, od roku 2006, kdy byla představena architektura CUDA. Úlohou budoucnosti pro AI je dedukce, které probíhá v řetězci učení -> model DNN -> dedukce. DNN (DoNetNuke – „udělej webovou atomovku“) je systém pro správu webového obsahu a framework pro webové aplikace založený na Microsoft .NET. Platforma DNN je open source. Na summitu SC 2018 byly ukázány aplikace, které má AI podstatně urychlit, jako například věda, přenositelná zkušenost a další.
Systémy Nvidia DGX
Systémy Nvidia DGX, které dodává na náš trh M Computers, jsou superpočítače pro řešení úloh strojové učení a umělé inteligence. Jde aktuálně o nejvýkonnější hardware a vyladěný softwarový stack, který obsahuje nejpoužívanější frameworky machine learning v podobě aplikačních kontejnerů. Server Nvidia DGX-1 je vlajkovou lodí Nvidia mezi systémy DGX a je určený pro datová centra. Nvidia DGX-2 je superpočítačem pro strojové učení s výkonem 2 PetaFLOPS a Nvidia DGX Station je prvním osobním superpočítačem pro strojové učení a umělou inteligenci pro umístění v kanceláři.