Casa Endavant pensant Obtenim dos massius nous supercomputadors

Obtenim dos massius nous supercomputadors

2024

Vídeo: Eboni Gilliam i Gennifer Victoria Roy, dos reforços nord-americans per al CN Terrassa (Setembre 2024)

El govern nord-americà ha fet una gran aposta que els supercomputadors més ràpids ajudaran a resoldre alguns dels problemes més importants de la ciència, amb els plans de construir dos grans supercomputadors, cadascun dels quals seria múltiples vegades més ràpid que les màquines més ràpides actuals.

Això inclou 325 milions de dòlars per a la construcció dels nous supercomputadors, incloent-hi una nova màquina anomenada Summit als Oak Ridge National Laboratories (ORNL) i una altra anomenada Sierra al Lawrence Livermore National Laboratory (LLNL), i 100 milions de dòlars per a investigació i desenvolupament en extrem. tecnologia de supercomputació a escala en un programa anomenat FastForward2. Es preveu que la cimera entre 150 i 300 petaflop / s màxims (quadrillions de càlculs de punt flotant per segon), i Sierra de més de 100 petaflop / s en comparació amb els 54, 9 petaflop / s de la màquina més ràpida actual (el Tianhe-2) a la carretera. cap a la "informàtica a escala".

Per dir-ho en perspectiva, la potència de càlcul total dels sistemes Top500 de fa uns mesos era de 274 petaflop / s (una nova llista Top500 sortirà la setmana que ve conjuntament amb el programa SuperComputing 14). Tots dos sistemes estaran construïts per IBM i estaran basats en CPU d'arquitectura IBM Power, GPUs Nvidia Tesla i interconnexions Mellanox.

Tom Rosamilla, vicepresident sènior de IBM Systems & Technology Group, va descriure els sistemes que utilitzen una nova "arquitectura centrada en les dades" dissenyada per eliminar el moviment de dades al màxim possible, situant les dades més a prop de la informàtica. IBM diu que aquesta està dissenyada per proporcionar modelització, simulació, aplicacions i analítiques d’avantguarda a l’entrada de Big Data, i que aprofita la iniciativa OpenPower (de la qual formen part Nvidia i Mellanox).

Com a part d’això, utilitzarà les GPU Nvidia Tesla basades en la seva propera arquitectura Volta (que es farà el 2017, després de l’arquitectura Pascal el 2016) i la tecnologia NVLink de l’empresa per a connexions entre tots els processadors d’un sol node servidor. Sumit Gupta, director general de Tesla GPU Accelerated Computing de Nvidia, va descriure NVLink com la "primera interconnexió d'alta velocitat per a la GPU", permetent comunicacions puntuals entre una GPU i una altra GPU, així com entre la GPU i la CPU d’energia. (La primera generació de NVLink és vàlida el 2016; els nous sistemes faran servir la segona generació.) Els nodes dels sistemes es connectaran mitjançant la interconnexió InfiniBand de Mellanox EDR de 100 Gb / s de propera generació.

IBM va dir que cada sistema tindrà un rendiment màxim "superior a 100 petaflops", equilibrat amb més de cinc petabytes de memòria dinàmica i flash, i que serà capaç de traslladar dades al processador a més de 17 petabytes per segon (que el la companyia diu que equival a moure més de 100 mil milions de fotos per segon).

Jeffrey Nichols, director de laboratori associat per a les informàtiques i les ciències computacionals d’ORNL, va descriure l’arquitectura com “un nombre menor de nodes amb una empremta de memòria compartida molt més gran” i va dir que hauria de permetre als desenvolupadors optimitzar i executar de manera més eficient les càrregues paral·leles que actualment s’executen en l’actual ORNL. Sistema Titan. ORNL diu que el seu sistema Summit inclourà més de 3.400 nodes amb cada node incloent diversos processadors IBM Power 9 i múltiples GPU Nvidia Volta, amb més de 512 GB de DDR4 i una memòria d'ample de banda elevada (amb un disseny coherent, de manera que pot funcionar amb totes les CPU i GPU) juntament amb 800 GB de RAM no volàtil, que proporciona més de 40 teraflops de màxim rendiment. Tindrà un sistema de servidor d'emmagatzematge GPFS amb amplada de banda d'E / S de 1 TB / s i capacitat de disc de 120 PB. Això hauria de substituir l’actual sistema Titan d’ORNL, que és un sistema Cray basat en processadors AMD Opteron i CPU Nvidia Kepler, capaços de 27 petaflop / s, amb Nichols que el Summit hauria d’entregar de 5 a 10 vegades el rendiment de Titan. El Summit està previst per ser lliurat el 2017 i disponible per als usuaris el 2018.

Les aplicacions objectiu del sistema Summit inclouen la ciència de la combustió (intentant augmentar l'eficiència dels motors de combustió en un 25-50 per cent), ciències del canvi climàtic, emmagatzematge d'energia i energia nuclear. Nichols va dir que la cimera hauria de permetre a ORNL "ampliar els horitzons" de la ciència que fan als laboratoris.

El sistema LLNL, anomenat Sierra, està dirigit al programa Advanced Simulation and Computing (NCSA) Advanced National Simulation and Computing Administration Administration (NNSA), dissenyat principalment per a la ciència i l’avaluació d’armes. Segons Mike McCoy, director del programa ASC de LLNL, el superordenador permet al laboratori fer simulacions a la base nuclear del país sense haver de tornar a realitzar proves nuclears. Va dir que el codi de simulació d'armes 3D del laboratori era "una de les aplicacions més complicades del planeta". Va assenyalar que aquest no és un cas que el govern compri un sistema fora de la plataforma, sinó un "co-disseny" on els programadors i dissenyadors de sistemes treballin conjuntament en l'arquitectura.

Tots dos sistemes, que formen part d’un programa del Departament d’Energia conegut com a Col·laboració dels laboratoris nacionals de Oak Ridge, Argonne i Lawrence Livermore (CORAL), estan orientats a accelerar el desenvolupament d’informàtica d’alt rendiment. IBM diu que la programació per a aquests sistemes es pot iniciar avui, però els sistemes no s’instal·laran fins al 2017 o el 2018. Com a part del programa CORAL, Argonne National Lab també obtindrà nou supercomputació, però encara no l’ha anunciat.

En general, Nichols va dir que va veure Summit i Sierra com "primers passos cap a l'excala" i va dir que esperava futurs sistemes pel mateix camí arquitectònic i que esperava una llarga col·laboració amb els venedors. Aproximadament cinc anys després de la publicació de la Cimera, va dir que espera tenir un ordinador a gran escala.

A més, avui AMD ha anunciat que ha rebut 32 milions de dòlars en dos premis DOE, com a part del projecte FastForward2, per investigar l'arquitectura de nodes excasala basada en les seves unitats de processament accelerat basat en Heterogeneous System Architecture (HSA) i per ajudar a dissenyar una nova estàndard per a futures interfícies de memòria. DOE va dir que AMD, Cray, IBM, Intel i Nvidia lideraran els projectes FastForward2. (Intel i Cray no estan involucrats amb els supercomputadors anunciats avui, però segueixen sent grans jugadors a l'espai, per la qual cosa serà interessant veure si estan involucrats en els plans d'Argonne.)