Ostrava, 28. dubna 2022 – Datový sál národního superpočítačového centra IT4Innovations se kromě superpočítačů pyšní také velkokapacitními datovými úložišti. Prvním je úložiště PROJECT, které významně ulehčuje práci výzkumníkům, kteří na ostravských superpočítačích počítají své projekty. Ve druhém případě se jedná o úložiště sdružení CESNET, které patří k těm vůbec největším v České republice.
Datové úložiště PROJECT
Hned pět rozváděčových skříní (tzv. racků) zabírá datové úložiště PROJECT, které je uživatelům superpočítačového centra IT4Innovations plně k dispozici od března 2021. Jak již jeho název napovídá, slouží pro uchování a zálohování dat, která jsou zpracovávána nebo generována na ostravských superpočítačích. Kromě toho, že úložiště PROJECT staví na nejmodernějších technologiích, konkrétně na řešení Spectrum Scale od společnosti IBM, je také mnohem vstřícnější k uživatelům, kteří na superpočítačích staví své vědecké bádání. Moderní řešení slibuje dostatek kapacity, spolehlivý a rychlý provoz, a navíc funguje jako centrální, tedy na superpočítačích, nezávislý systém. „To znamená, že po nahrání projektových dat do úložiště k nim mohou uživatelé přistupovat z jakéhokoliv superpočítače, na kterém zrovna své výpočty provádějí. Na rozdíl od předešlé praxe, která předpokládala mít jejich kopie na každém superpočítači, tento systém přináší uživatelům ostravské výpočetní infrastruktury značnou úsporu času,“ uvádí Radovan Pasek, vedoucí provozu a správy HPC v IT4Innovations.
Další výhodou úložiště PROJECT je to, že obslouží nejen specifické datové potřeby stávajících superpočítačů Karolina, Barbora a NVIDIA DGX-2, ale díky své živostnosti, která se pohybuje mezi 8 až 10 lety, nabídne své kapacity i jejich nástupcům. Navíc disponuje dostatečným úložným prostorem pro projekty s dlouhým životním cyklem, obvykle delším než jednoročním, což představuje další z motivů jeho pořízení.
Jedním z nejdůležitějších parametrů úložiště PROJECT je jeho kapacita. Ta činí 15 petabajtů. Jak si toto číslo lépe představit? „Porovnejme si úložiště PROJECT k externímu disku o kapacitě 1TB, který běžný PC uživatel používá pro zálohu svých dat. Pokud by se chtěl tento uživatel vyrovnat našemu velkokapacitnímu úložišti, musel by si takových externích disků nakoupit přesně 15 000 kusů,“ vypočítává Roman Slíva, senior HPC architekt v IT4Innovations.
K dalším parametrům úložiště PROJECT patří:
- Úložiště je tvořeno kombinací rychlejších disků SSD a pomalejších NL-SATA, které jsou společně s dalšími infrastrukturními prvky uspořádány do tří nezávislých bloků s ohledem na vysokou dostupnost a možnost jednoduché replikace dat.
- Celková propustnost systému dosahuje hodnoty 39 GB/s a zvládá až 57 000 I/O operací za sekundu.
- Ačkoliv je kapacita momentálně dostačující, již nyní je jasné, že vzhledem k neustále rostoucímu množství dat, se kterými výzkumné projekty operují, ji bude v budoucnu nutné navýšit. Díky modulárnímu návrhu řešení však bude možné úložiště v případě potřeby dále rozšířit.
Dodavatelem úložiště PROJECT je společnost DATERA, která se specializuje na návrh a implementaci datových úložišť. Nákup byl financován v rámci projektu IT4Innovations národní superpočítačové centrum – Cesta k exascale.
Datové úložiště sdružení CESNET
S kapacitou neuvěřitelných 33,673 petabajtů se jedná o jedno z největších datových úložišť v tuzemsku. Kromě kapacity stojí za zmínku také hmotnost úložiště – 3,3 tuny nebo to, že zabírá celkem 6 racků. Řešení obsahuje 1776 rotačních disků Seagate Exos X18 s kapacitou 18 terabajtů. Pro ukládání dat slouží 74 serverů Lenovo ThinkSystem SR635, dále je k dispozici 12 serverů pro monitoring celého systému.
Za tímto velkoobjemovým datovým úložištěm stojí sdružení CESNET a projekt e-INFRA CZ, jehož součástí je kromě CESNET i IT4Innovations a CERIT-SC. Úložiště bude sloužit vzdělávacím institucím v Česku pro přenos, ukládání, archivaci a zpracování vědeckých dat.
Dodavatelem řešení, které stálo 39,9 milionů korun, je česká společnost M Computers se zkušenostmi s HPC instalacemi. Více informací na www.mcomputers.cz/2022/03/23/datove-uloziste-cesnet.
Úložiště bylo pořízeno v rámci projektu OP VVV s názvem „IT4Innovations národní superpočítačové centrum – cesta k exascale“, registrační číslo projektu: CZ.02.1.01/0.0/0.0/16_013/0001791.
IT4Innovations národní superpočítačové centrum při VŠB – Technické univerzitě Ostrava je předním výzkumným, vývojovým a inovačním centrem v oblasti vysoce výkonného počítání (HPC), datových analýz (HPDA), umělé inteligence (AI) a jejich aplikací do dalších vědeckých, průmyslových i společenských oborů. IT4Innovations provozuje od roku 2013 nejvýkonnější superpočítačové systémy v České republice, které poskytuje jak českým, tak i zahraničním výzkumným týmům z akademické i soukromé sféry. IT4Innovations společně s institucemi CESNET a CERIT-SC tvoří strategickou výzkumnou infrastrukturu České republiky e-INFRA CZ. V současné době IT4Innovations provozuje tři superpočítače: Karolina (15,7 PFlop/s, instalovaný v létě 2021), Barbora (849 TFlop/s, instalovaný na podzim 2019) a specializovaný systém pro výpočty umělé inteligence NVIDIA DGX-2 (2 PFlop/s pro AI, instalovaný na jaře 2019). Superpočítač Karolina, pořízen v rámci celoevropského společného podniku EuroHPC, byl ke dni své instalace nejvýkonnějším superpočítačem v ČR, 69. na světě v žebříčku TOP500 a v žebříčku Green500 energeticky nejúčinnějších superpočítačů obsadil skvělé 8. místo. Prvními superpočítači instalovanými v IT4Innovations byly Anselm (94 TFlop/s, instalovaný v létě 2013) a Salomon (2 PFlop/s, instalovaný v létě 2015), jejichž provoz končí v roce 2021. Stěžejními tématy výzkumu IT4Innovations jsou zpracování a analýza rozsáhlých dat, strojové učení, vývoj paralelních škálovatelných algoritmů, řešení náročných inženýrských úloh, pokročilá vizualizace, virtuální realita, modelování pro nanotechnologie a vývoj nových materiálů. Více na www.it4i.cz.