Casa Endavant pensant La supercomputació 17 presenta algunes sorpreses, suggeriments per al futur

La supercomputació 17 presenta algunes sorpreses, suggeriments per al futur

2024

Vídeo: The CIA, Drug Trafficking and American Politics: The Political Economy of War (De novembre 2024)

Hi va haver algunes sorpreses a la conferència Supercomputing 17 d’aquest mes, incloent-hi un molt bon espectacle per a l’accelerador PEZY-SC2, així com el canvi d’orientació d’Intel per la seva línia Xeon Phi. A més, també vam veure els primers sistemes construïts al processador escalable Xeon d’Intel (Skylake) i els primers que van tenir l’accelerador Volta de Nvidia.

Però potser la més destacable és la notícia que els sistemes xinesos representen ara 202 dels 500 supercomputadors de la llista de Top 500 més recent en comparació amb només 143 dels Estats Units. Els sistemes nord-americans han dominat la llista des dels seus inicis fa 25 anys, i fa uns mesos, els Estats Units tenien 169 sistemes fins als 160 de la Xina. El mateix és cert quan es tracta d’un rendiment global, els sistemes xinesos combinats representen el 35, 4 per cent de el rendiment total dels sistemes Top 500.

Els ordinadors més ràpids del món continuen essent les dues masses màquines xineses que han topat la llista des de fa diversos anys: Sunway TaihuLight, del Centre Nacional de Supercomputació de la Xina a Wuxi, amb un rendiment sostingut de Linpack de més de 93 petaflops (93 mil trilions de punts flotants operacions per segon), i el Tianhe-2, del Centre Nacional Super Informàtica de la Xina a Guangzhou, amb un rendiment sostingut de més de 33, 8 petaflops. Aquestes segueixen sent les màquines més ràpides i amb un gran marge. El sistema Piz Daint del Swiss National Supercomputing Center, un sistema Cray que utilitza Intel Xeons i Nvidia Tesla P100s, va ocupar el tercer lloc amb Linpack amb un rendiment de 19, 6 petaflops.

El canvi més important a la part superior és un nou sistema en quart lloc: una versió actualitzada del supercomputador Gyoukou, un sistema ZettaScaler-2.2 desplegat a l'Agència per a la Ciència i la Tecnologia de la Terra-Marina. Aquesta màquina utilitza acceleradors PEZY-SC2, un xip de segona generació de 2048 nuclis que proporciona un rendiment màxim de 4.096 teraflops de doble precisió, així com processadors Intel Xeon convencionals, per a un total de 19.860.000 nuclis. (Una màquina ZettaScaler anterior amb el PEZY-SC2 va fer la llista a un nivell inferior a la versió de juny). Això li proporciona el major nombre de nuclis utilitzats junts, també conegut com el nivell més alt de concurrència, vist fins ara, superant el TaihuLight, que té 10, 6 milions de nuclis. La màquina Gyoukou va aconseguir un rendiment sostingut de Linpack de 19, 14 petaflops, però el que és interessant és que utilitza 1, 35 megawatts de potència, enfront dels 2, 27 megavatios per a PizDaint, 17, 8 megavatios per a Tinahe-2 i 15, 4 megawatts per a Taihulight. Això encara té molta potència, però és una gran reducció en comparació amb els altres sistemes i una forta indicació que les preocupacions de potència són importants, fins i tot per a les màquines més ràpides del món. També val la pena assenyalar que això mostra com les noves arquitectures poden reduir el consum de potència de forma espectacular.

El màxim sistema nord-americà segueix sent el supercomputador Titan del Oak Ridge National Laboratory, un sistema de cinc anys que utilitza acceleradors GPU Nvidia K20x i lliura 17, 59 petaflops, que ara es troba en el cinquè lloc de la llista.

A la llista més recent de Green 500 dels supercomputadors més eficients energèticament, quatre de les cinc primeres ranures (incloses les tres primeres) es van dirigir a sistemes japonesos recentment instal·lats, tots basats en l'arquitectura ZettaScaler-2.2 i l'accelerador PEZY-SC2. El més eficient és el Shoubu System B, instal·lat al Centre Avançat d'Informàtica i Comunicació de RIKEN. El sistema B de Shoubu va aconseguir 17, 0 gigaflops / watt; El sistema B de Shoubu i els dos sistemes següents, que utilitzen respectivament 16, 8 i 16, 7 gigaflops / watt, es troben a la meitat inferior de la llista Top 500. El cinquè sistema del rànquing verd és el sistema Gyoukou esmentat anteriorment, el número quatre de la llista Top 500, amb 14, 2 gigaflops / watt.

Aquests són grans avenços per a l’accelerador PEZY-SC2 i poden apuntar a futures indicacions per a arquitectures de supercomputació.

El quart superordenador més ecològic és el sistema intern DGX SaturnV Volta de Nvidia, que va aconseguir 15, 1 gigaflops / watt i arriba al 149 de la llista Top 500. Aquest sistema compta amb 22.440 nuclis de Volta (que sembla que es comptabilitzen d'una manera una mica diferent a la llista que alguns dels altres nuclis.) Nvidia ha estat un any molt bo per al seu accelerador i té altes esperances per a més màquines que utilitzin la Volta. Arquitectura GPU

Com de costum, els principals venedors tenien un èxit sobre els seus èxits a la llista, Intel va assenyalar que les seves CPU es trobaven en sis dels deu primers sistemes i un màxim rècord de 471 dels 500 sistemes. Intel també va assenyalar que els seus nous processadors escalables Xeon eren en 18 supercomputadors amb més de 25 petaflops de rendiment. Però el que pot ser més notable és que Intel va dir que cancel·la Knights Hill, el successor previst de 10 milions del processador Xeon Phi de 14nm Knights Landing Xeon Phi. La companyia va dir que ara planeja una nova plataforma per a sistemes exescala (1.000 petaflops) per al 2021, però no va divulgar cap detall.

Nvidia va destacar que comptava amb 34 nous sistemes amb els seus acceleradors a la llista, aconseguint el total de la companyia a 87. Nvidia i el seu soci IBM estaven preocupant-se de la possibilitat que, en el moment que la llista següent arribi al juny, la màquina Summit de Oak Ridge El laboratori nacional (ORNL) hauria d'estar entre les màquines de la part superior de la llista. Aquesta màquina inclou 4600 nodes, cadascun amb dues CPU base IBM Power 9 i 6 acceleradors Nvidia Volta, amb un rendiment projectat d’uns 200 petaflops. Això difereix de la solució interna de Nvidia, ja que totes les CPU i les GPU es comuniquen mitjançant NVLink 2.0 de manera coherent amb la memòria cau mitjançant OpenCAPI, de manera que les GPU poden accedir directament a la RAM principal del sistema. La cimera la seguirà la màquina Sierra del laboratori nacional Lawrence Livermore i la màquina AI Bridging Cloud Infrastructure (ABCI) al Japó.

Em va interessar sentir Cray anunciar un supercomputador "preparat per a la producció" basat en el processador Cavium ThunderX2 de l'arquitectura Armv8-A de 64 bits, disponible ara com a part del seu supercomputador XC50. Les màquines basades en ARM s’estan provant al Centre de supercomputadors de Barcelona (la màquina Mare Nostrum que ara ocupa el número 16 de la llista Top 500), així com el supercomputador “Post-K” al Japó i el supercomputador Isambard al Regne Unit. Cavium tenia uns primers punts de referència sobre el ThunderX2, que mostrava el xip de 14nm amb un millor rendiment en aplicacions multi-threaded o amb memòria que Skylake Xeons d'Intel, tot i que Intel continua sent el líder en monofilés i en teràpols bruts. Tingueu en compte que, a més del disseny de Cavium, Qualcomm també ha anunciat un xip de servidor basat en ARM anomenat Centriq.

En altres novetats sobre processadors, AMD va anunciar que havia produït la producció dels seus processadors Epyc, encara que no es troben en cap sistema Top 500, mentre que NEC va anunciar versions de la seva targeta d’accelerador Vector Engine PCIe per a la seva nova sèrie de supercomputadors SX-Aurora TSUBASA, que tenen un ample de banda de memòria especialment ràpid.

Des del punt d'interconnexió, Mellanox va dir que el 77 per cent dels nous sistemes de la llista Top 500 utilitzen InfiniBand, mentre que Intel va promocionar èxits recents amb la seva Omni-Path Architecture, que s'utilitza principalment en els seus sistemes Xeon Scalable Processor (Skylake). Mentrestant, diversos venedors estan buscant Gen-Z, dissenyat per ser un enfocament centrat en la memòria de menor latència per a connexions de gran velocitat entre dispositius de càlcul i memòria / emmagatzematge.

A més, és interessant tenir en compte que, per primera vegada, totes les màquines del Top 500 funcionen amb Linux.

Entre la forta primera impressió de PEZY-SC2, la decisió d’Intel d’abandonar Knights Mill per a una nova arquitectura, la Volta de Nvidia i la nova competència de venedors d’AMD, ARM i NEC, ara és un moment apassionant en el món de la supercomputació. Les llistes de l’any vinent haurien de ser força interessants, ja que veiem quines arquitectures realitzen, i quines són les més eficients, ja que molts dels venedors i els llocs de supercomputadors intenten posicionar-se a la cursa per produir un ordinador exascal (1000 petaflop) amb una sub. Potència de 20 megavatios.

És curiós la teva velocitat a Internet de banda ampla? Prova-ho ara!