Vídeo: El 'timelapse' que muestra el paso del MareNostrum 3 al MareNostrum 4 (De novembre 2024)
Actualment, hi ha diversos enfocaments de la informàtica d’alt rendiment, sistemes que normalment s’anomenen supercomputadors. La majoria d’aquests sistemes utilitzen un gran nombre de processadors Xeon, però comencem a veure les màquines noves més interessants amb acceleradors, com Tesla de Nvidia o Intel Xeon Phi. Fins i tot es parla que els sistemes massius basats en ARM podrien ser efectius en el futur. Però, i si pogueu provar totes aquestes arquitectures en un mateix lloc?
Aquest és el repte i la promesa del nou equip MareNostrum 4, que s’està preparant per a la seva instal·lació al Centre de supercomputació de Barcelona. El nou disseny inclou un sistema principal d’ús de propòsit general basat en Xeons tradicionals, a més de tres nous clústers de tecnologia emergents, basats en IBM Power i Nvidia, Xeon Phi i informàtica basada en ARM. Mentre estava a Barcelona per a Mobile World Congress, he tingut l'oportunitat de parlar amb Sergi Girona, director d'operacions del BSC, que ha explicat el raonament dels quatre clústers diferents.
Girona va dir que la missió principal del centre és proporcionar serveis de supercomputació per a investigadors espanyols i altres països europeus, a més de la indústria. Com a part d'aquesta missió, el centre vol tenir almenys tres "clústers tecnològics emergents", de manera que pot provar diferents alternatives.
Per al clúster d’informàtica general, Girona assegura que el centre va escollir un disseny tradicional de Xeon perquè era més fàcil migrar aplicacions que s’executen en l’actual MareNostrum 3, que es podrien desconnectar la setmana que ve. El disseny també havia d’encaixar l’espai existent, dins d’una capella. (Vaig visitar el centre l'any passat i l'actual supercomputador fa un any.)
El nou disseny, que serà creat per Lenovo, es basarà en el nou Xeon v5 (Skylake), amb 3.456 nodes, cadascun amb dos endolls, i cada xip contindrà 24 nuclis cadascun, amb un rendiment teòric màxim de 11, 14 petaflops per segon. La majoria de nuclis tindran 2 GB de memòria, però el 6 per cent tindrà 8 GB, per un total de 331, 7 TB de memòria RAM. Cada node tindrà un SSD de 240 GB, tot i que eventualment hi haurà memòria 3D XPoint, quan estigui disponible. Els nodes s'han de connectar mitjançant la connexió Omni-Path d'Intel i Ethernet de 10 GB. El sistema també tindrà sis racks d’emmagatzematge d’IBM, amb 15 petabytes d’emmagatzematge, incloent una barreja de flash i unitats de disc dur. En general, el disseny ocuparà 62 racks: 48 per a informàtica, 6 per a emmagatzematge, 6 per a xarxes i 2 per a gestió. Omplirà 120 metres quadrats (aconseguint un entorn molt dens) i obtindrà 1, 3 megavatios de potència, a partir dels 1 megavatios dibuixats pel disseny anterior. Es preveu que l’operació comenci l’1 de juliol.
Una cosa que he trobat interessant aquí és la claredat que demostra el pas a la nova generació de la progressió de la tecnologia. La generació anterior va tenir un rendiment màxim d'aproximadament 1 petaflop, i aquest sistema hauria de ser més de 10 vegades més ràpid, alhora que utilitzava només un 30 per cent més de potència. Per comparació, el supercomputador MareNostrum original, instal·lat el 2004, tenia un rendiment màxim de 42 teraflops i utilitzava 640 quilowatts de potència. (Els detalls de les millores de rendiment durant quatre generacions de MareNostrum es troben al gràfic anterior). Girona diu que això significa que el que hauria trigat un any a funcionar al MareNostrum 1 es pot fer en un sol dia al nou sistema. Bastant impressionant.
Per a la tecnologia emergent, el lloc tindrà tres clústers nous. Un d’ells consistirà en processadors IBM Power 9 i GPU Nvidia, dissenyats per tenir una capacitat de processament màxima de més de 1, 5 Petaflop / s. Aquest clúster serà creat per IBM i implica el mateix tipus de disseny que s’està desplegant als supercomputadors Summit i Sierra, que el Departament d’Energia dels Estats Units ha encarregat per als Laboratoris Nacionals Oak Ridge i Lawrence Livermore com a part de la seva col·laboració CORAL a Oak Ridge., Laboratoris nacionals d'Argona i Lawrence Livermore.
El segon clúster estarà format per processadors Intel Xeon Phi, amb Lenovo construint un sistema que utilitza la propera versió de Knights Hill (KNH) i OmniPath, amb una capacitat de processament màxima de més de 0, 5 Petaflop / s. Això també imita el programa americà CORAL i utilitza els mateixos processadors que es trobaran dins del supercomputador Aurora, per encàrrec del Departament d’Energia dels Estats Units per al Laboratori Nacional d’Argonne.
Finalment, es formarà un tercer clúster de processadors ARMv8 de 64 bits que Fujitsu proporcionarà en una màquina de prototips, dissenyat per utilitzar els mateixos processadors que Fujitsu està desenvolupant per a un nou sistema japonès per substituir l'actual supercomputador K. Això també hauria d’oferir més de 0, 5 Petaflop / s de màxim rendiment. El calendari exacte per a l'inici de les operacions en els clústers emergents encara no s'ha de revelar, va dir Girona.
En conjunt, el sistema tindrà un cost de 34 milions de dòlars, en un contracte guanyat per IBM i finançat pel govern espanyol. Un dels motius principals per tenir els quatre tipus d’informàtica in situ és la investigació, va dir Girona. El centre, que dóna feina a 450 persones en total, compta amb 160 investigadors centrats en informàtica, incloses arquitectura i eines. En particular, com a membre de PRACE (Partenariat per a la computació avançada a Europa), BSC tracta de centrar-se en l’optimització de rendiment i la computació paral·lela.
Girona va dir que BSC vol influir en el desenvolupament de les noves tecnologies i té previst utilitzar la nova màquina per analitzar què passarà en el futur, sobretot per assegurar-se que el programari està preparat per a qualsevol arquitectura de la propera màquina. uns 3 anys. Va dir que BSC va treballar en eines per a arquitectures emergents.
Un altre tema que investiguen els investigadors és si val la pena desenvolupar un processador europeu d’informàtica, probablement basat en l’arquitectura ARM.
Barcelona no tindrà el supercomputador més ràpid del món; Actualment els xinesos tenen aquest rècord, amb els nord-americans i els japonesos que intenten posar-se al dia. Però MareNostrum 4 serà el més divers i, possiblement, el més interessant.
Michael J. Miller és cap d'informació de Ziff Brothers Investments, una empresa d'inversions privades. Miller, que va ser redactor en cap de PC Magazine des de 1991 fins a 2005, va escriure aquest bloc per a PCMag.com per compartir les seves reflexions sobre productes relacionats amb PC. En aquest bloc no s’ofereix assessorament sobre inversions. Tots els deures estan rebutjats. Miller treballa per separat per a una empresa d’inversions privades que pugui invertir en qualsevol moment en empreses els productes dels quals es discuten en aquest bloc i no es farà cap divulgació de transaccions de valors.