Vědecké a výzkumné instituce generují v dnešní době obrovské objemy dat, která neustále narůstají. Masarykova univerzita v Brně v letošním roce rozšířila svůj seznam datových úložišť o novou instalaci s celkovou kapacitou 1 024 TB, tedy 1 PB (petabajt). Ve výběrovém řízení zvítězilo úložiště postavené na technologii IBM Spectrum Scale a diskových polích Infortrend, která dodala specializovaná česká firma M Computers.
Předmětem poptávky byla instalace a konfigurace „clusteru datových služeb“ o čisté kapacitě 1 000 TB. Dodávka zahrnovala montáž hardwaru, jeho zapojení a konfiguraci, instalaci a nastavení softwarových balíků a komponent, vyladění výkonu, ověření bezchybného chodu všech komponent úložiště, a nakonec demonstraci požadovaného výkonu provedením akceptačních testů. Datové úložiště slouží pro ukládání dat zpracovávaných ve výpočetním prostředí CERIT-SC a MetaCentra. Uživatelé jsou jak z Masarykovy univerzity, tak z řad vědecké komunity z celé České republiky. To znamená, že datové úložiště slouží pro zhruba 1 300 aktivních přístupů.
Požadavek na rychlost základem
Zadavatel kladl na úložiště řadu technických požadavků, jako vysoká dostupnost s maximální odolností proti výpadku jednotlivých komponent, přístupy active-active přes protokoly NFSv4 a CIFS z důvodu připojení uživatelů z různých prostředí jako Windows či Linux, nebo využití technologie SSD disků pro maximální zrychlení souborových operací na úložišti. Zvláště důležité byly požadavky na rychlost – 7 GB/s pro čtení a 5 GB/s pro zápis 16 souborů paralelně.
Levnější, přesto výkonnější a rychlejší
Díky svému know-how mohli odborníci společnosti M Computers sáhnout po cenově velmi efektivním řešení založeném na diskových polích Infortrend řady ESDS 1000, v provedení se 16 pozicemi v šasi 3U. Přestože jde o disková pole cílená primárně pro segment SMB, vyznačují se vysokou rychlostí a spolehlivostí, značnou modularitou, zaručují silnou integritu dat, podporují připojení pomocí technologií SAS, Fibre Channel nebo iSCSI, a v neposlední řadě usnadňují práci administrátorů díky uživatelsky otevřenému managementu. Jedno diskové pole dosahuje výkonu až 550k IOPS a propustnosti až 5 500 MB/s, dodává se s duálními řadiči, redundantními zdroji a podporuje až 316 HDD v celkové kapacitě až 1 869 TB. Diskové pole nabízí možnost využití SSD cache pro významné zrychlení čtecích operací I/O a umožňuje až tříúrovňový automatický tiering. Vzhledem k požadavkům na maximalizaci propustnosti celého úložiště využili specialisté společnosti M Computers rychlá rozhraní Fibre Channel pro přístup k datovým polím a Infiniband společně s 10Gb/s Ethernetem pro uživatelský přístup k datům.
Řešení připravené pro velké objemy dat
Další požadavky byly kladeny na funkcionalitu snapshotů, tedy „zamrazení dat“ v určitém časovém okamžiku. V celém řešení úložiště jsou tyto snapshoty s výhodou využívány pro efektivní operativní zálohy, které dovolují uživatelům návrat k předchozí verzi souboru, případně k obnovení omylem smazaných dat. Pro aktuální den jsou pro velmi rychlou obnovu k dispozici snapshoty vytvářené po patnácti minutách, pro dalších až 14 dní je pak k dispozici jeden snapshot denně.
Velký objem a vysoká požadovaná rychlost klade na funkcionalitu snapshotů značné požadavky, které není schopna splnit velká většina systémů dostupných na trhu. Systém IBM Spectrum Scale však i v této oblasti ukazuje své unikátní vlastnosti a umožňuje funkcionalitu snapshotů využít skutečně naplno, bez degradace výkonu či jiných omezení.
Řídicí software
Softwarovým srdcem úložiště se stal systém Spectrum Scale společnosti IBM, který patří ke světové špičce mezi produkty pro softwarově definovanou storage a komplexně řeší problematiku ukládání a přístupu k velkým objemům dat v oblastech vědeckých výpočtů, big dat, analýz, objektů, obecných nestrukturovaných dat a dalších. Vysoká škálovatelnost systému umožňuje maximální velikost souborového systému až 2^99 bytů a maximum 16 384 uzlů v clusteru storage. Systém je od začátku koncipován pro nasazení kategorie enterprise, vykazuje proto velkou robustnost a vysoký výkon. Podporuje technologii hierarchických datových úložišť s unikátní možností integrace diskových, páskových i externích cloudových úložišť, v jednom souborovém systému, s jednotným uživatelským přístupem k datům uložených na různých médiích.
Podpora a servis
Řešení bylo dodáno včetně servisní a záruční podpory na pět let s reakční dobou nejpozději následující pracovní den od nahlášení závady, s výměnou vadných komponent v místě instalace.
Systém je připojen na non-stop dohledové centrum společnosti M Computers. Technici dohledového centra mají k dispozici kompletní sadu náhradních dílů a mohou tak reagovat okamžitě na servisní požadavky.
Parametry dodaného řešení:
Čistá kapacita: 1PB (1 024 TB)
Rychlost zápisu: 5 GB/s
Rychlost čtení: 7 GB/s
Počet přístupových serverů v HA clusteru: 3
Počet storage systémů: 4
Škálovatelnost:
• až 2^99 bytu/fs
• až 16 384 uzlů v clusteru
Počet snapshotů: neomezený
Snadná integrace pro zálohování, do cloudů nebo object storage.
Cena: 4,2 mil Kč bez DPH