Vídeo: El Marenostrum 5, un superordinador a Barcelona (De novembre 2024)
La llista més recent dels supercomputadors més ràpids del món no va canviar gaire, però l’espectacle anual de Supercomputació (SC14) presentava moltes discussions sobre nous sistemes de la llista, així com diversos anuncis informàtics d’alt rendiment, com els nous acceleradors d’Intel i Nvidia.
El supercomputador Tianhe-2 de la Xina, que utilitza CPU Intel Xeon i acceleradors Xeon Phi, es va mantenir en el primer lloc de la llista Top500 amb un rendiment màxim de 54, 9 petaflops (quadrillions d'operacions en punt flotant per segon). Aquest any, de fet, els nou primers sistemes eren idèntics a la nova incorporació en el lloc 10: una màquina del sistema de govern dels Estats Units no especificada que és una Cray CS-Storm alimentada per CPU Intel Xeon E5-2660 v2 i les GPU Nvidia K40, connectades mitjançant Infiniband.
Més avall de la llista, hi havia 78 nous sistemes, tot i que fins i tot es tracta d'un nou rècord baix. I, en general, sembla que estem experimentant una desacceleració de la taxa de creixement de la potència agregada dels 500 sistemes.
Els rànquings d'aquests sistemes es basen en el punt de referència LINPACK, tot i que ara hi ha diversos esforços en la creació de nous punts de referència dirigits a diferents tipus d'informàtica. Em va interessar que en un discurs de la mostra, Horst Simon, editor de la llista Top500, digués que, malgrat l’objectiu d’arribar a un ordinador exascal, 1 exaflops per segon (aproximadament 1.000 petaflops), el 2020, creu que és probable. ens portarà fins a finals del 2024. En part, es deu a que necessitarem més tècniques d’estalvi d’energia (com la fotònica de silici i la integració i embalatge 3D) per mantenir la potència necessària per a un sistema exascal fins a 20 megawatts. Es tracta de grans sistemes.
Tot i la manca de grans canvis a la part superior, vam escoltar un parell de nous anuncis, sobretot els d’Intel i Nvidia, que podrien indicar el camí cap a màquines més ràpides.
Nvidia, les GPU i el llenguatge de programació CUDA van iniciar el moviment cap als acceleradors i coprocessadors en informàtica d’alt rendiment, va ser tot el programa amb molts sistemes. Actualment ofereix l’accelerador K40 i en el saló va anunciar la següent versió, la Tesla K80, que utilitza un enfocament de doble GPU per oferir el que la firma diu que és gairebé dues vegades més gran i duplica l’ample de banda de memòria del seu predecessor.
Nvidia assegura que el K80 ofereix 4.992 nuclis de CUDA i 24 megabytes de RAM i té una capacitat màxima de 2.91 teraflops per placa. És interessant que el K80 estigui disponible ara mateix i que molts dels fabricants de sistemes ja ofereixen sistemes amb la placa. Per exemple, Dell va mostrar els seus nous servidors PowerEdge C4130, que us permeten ajustar fins a quatre plaques d’acceleradors Nvidia (o acceleradors Intel Xeon Phi) en un servidor 1U, amb la versió K80 que ofereix fins a 7, 2 teraflops a cada caixa. Això només és una gran quantitat de potència informàtica en un rack (tot i que és un gran consum d'energia i que necessita molta refrigeració).
Mentrestant, Intel va anunciar que la següent versió del seu xip Xeon Phi, una versió coneguda com Knight's Landing, per la qual els primers sistemes comercials haurien de començar a enviar-se l'any que ve, ara té més de 50 clients que pensen utilitzar la nova versió de processador de la peça (on Xeon Phi actua com a processador del sistema) en nous supercomputadors. Molts sistemes més utilitzen la versió del producte de la targeta PCIe del coprocessador.
Entre els clients de Knights Landing hi ha el supercomputador Trinity, un esforç conjunt entre Los Alamos i Sandia National Laboratories, i el supercomputador Cori, anunciat pel Centre Nacional de Recerca Energètica Científica (DOE) del Departament de l'Energia dels Estats Units (NERSC). Se suposa que Knight's Landing oferirà uns 3 teraflops de rendiment i integrarà la tecnologia Omni-Path Fabric basada en fotònica de silici d'Intel, que la companyia va dir que oferiria una velocitat de línia de 100 Gbps i una latència de teixit interruptor fins a un 56 per cent més baixa que les alternatives InfiniBand. (Tingueu en compte que els proveïdors d’InfiniBand també parlen de versions noves.)
Intel va dir que el seguiment, conegut com a Knight's Hill, es construirà mitjançant la tecnologia de processos d'Intel de 10 milions i utilitzarà la propera generació del teixit Omni-Path. Seguirà el desembarcament de Knight, però no es va revelar el calendari exacte.
No s'ha de deixar fora de l'equació és AMD, que va anunciar i va mostrar la seva targeta FirePro S9150 d'una sola CPU, que segons diu pot oferir 2.53 teraflops de rendiment. Aquest sistema, que està programat mitjançant OpenCL, ja s’envia.
De fet, un nou supercomputador anomenat L-CSC del GSI Helmholtz Center, basat en les GPU S9150 i les CPU de 10 nuclis Intel Xeon 2690v2 va superar la nova versió de la llista Green500, que enumera els superordinadors per ordre de potència de processament per watt. Això va marcar la primera vegada que un sistema era capaç de superar els 5 gigaflops / watt (milers de milions d’operacions per segon per watt). A la llista, el segon lloc era el Suiren, alimentat per acceleradors de molts nuclis PEZY-SC i CPU Xeon; mentre que la resta dels 10 primers utilitzen GPU Nvidia Tesla, mostrant l’abast d’aquests sistemes.
Hi ha altres opcions més inusuals. Micron mostra el seu xip Automata, essencialment un xip amb propòsits especials dissenyat per a la concordança de patrons, per utilitzar-lo en coses com la seguretat de xarxa i la cerca de genòmica. Es desenvolupa en una placa PCIe 3 amb 32 xips i es llança al primer trimestre del 2015, inicialment en volums baixos. (La companyia també està al darrere del seu Hybrid Memory Cube per a la memòria de nova generació per a aquests sistemes.) IBM disposa del seu processador TrueNorth, que espera apuntar cap a una "informàtica similar al cervell". NEC treballa en la propera generació del seu processador vectorial SX-ACE, que segons ell és més fàcil de programar que les GPU. I, per descomptat, ARM està intentant entrar al mercat de servidors també amb X-Gene1 d'Aplicated Micro com a processador que es connecta a diverses targetes de l'accelerador.
Diversos venedors estaven mostrant nous sistemes. A més del sistema Dell que he esmentat anteriorment, Lenovo va mostrar un sistema de processador dual refrigerat per aigua basat en un processador personalitzat Intel Xeon E5-2798A (amb 16 nuclis de fins a 3, 2 GHz), que segons ell proporciona 1.083 teraflops. I va dir que el processador Knights Landing Xeon Phi de l'any que ve permetrà un sistema "peta-cub" que ofereix més d'un petaflop en només dos bastidors estàndard 42U.
Els servidors One Stop mostraven un accelerador de càlculs de gran densitat, que utilitza PCIe Gen3 per suportar fins a 16 plaques d’accelerador d’alta gamma des d’un servidor o diversos servidors, segons la companyia diu que proporciona fins a 89, 6 teraflops mitjançant plaques Tesla K80. Pot funcionar amb el processador Power8 d’IBM. Huawei mostrava la disponibilitat dels seus X6800 Data Center Server als EUA i una versió refrigerada per líquids del seu servidor blade FusionServer 9000.
Per connectar sistemes, Obsidian Technologies va llançar la seva iniciativa InfiniCortex, dissenyada per tenir una connexió 100 gigabit InfiniBand a llargues distàncies. La companyia va anunciar el suport de l'Agència de Ciència, Tecnologia i Recerca de Singapur (A * STAR). I Mellanox va mostrar 100 Gigabit Infiniband treballant més de 100 metres via fibra i 8 metres mitjançant coure.
Per crear els supercomputadors més grans, les organitzacions solen recórrer a empreses com IBM i Cray per unir els sistemes, tot i que sovint triguen anys a crear-se. L’anunci més gran de Cray en el programa va ser un sistema de 80 milions de dòlars conegut com Shaheen II a la Universitat de Ciències i Tecnologia King Abdullah d’Aràbia Saudita per a un Cray XC40, inclòs un aparell d’analítica de gràfics Urika-GD.
I, per descomptat, just abans del saló, la DOE va concedir a IBM (i als venedors de components Nvidia i Mellanox) un enorme contracte per al que serien els dos supercomputadors més grans del país, cadascun amb més de 100 petaflops.
Nota de l'editor: Aquesta publicació es va actualitzar el 26/11. El Tianhe-2 té un rendiment màxim de 54, 9 petaflops, no teraflops.