Casa Endavant pensant Arquitectures alternatives regiran la supercomputació?

Arquitectures alternatives regiran la supercomputació?

2024

Vídeo: 2 PROPUESTAS PARA EL CLIENTE | ARQ. LUCIO MUNIAIN | ARQUITECTURA AVANZADA (De novembre 2024)

En els últims anys, hem vist alguns interessants nous enfocaments de la informàtica d’alt rendiment, en particular un allunyament dels processadors grans tradicionals i cap als clústers de CPU x86 amb acceleradors o coprocessadors per accelerar tipus particulars de càlculs. Sortint del programa de Supercomputació de la setmana passada, vam veure que Intel pressionava a integrar el seu coprocessador Xeon Phi amb el seu tradicional processador de servidor Xeon per facilitar la programació; Nvidia presenta una nova versió del seu accelerador de Tesla GPU; i Micron recolzant un tipus de processador molt diferent per a informàtica encara més especialitzada. I tot això passava en un moment en què els acceleradors i coprocessadors venen a dominar la llista Top 500 dels ordinadors més ràpids del món, portant alguns experts a suggerir que els punts de referència existents donen massa pes a aquests processadors.

Nvidia estava aconseguint els seus èxits amb les seves plaques d’accelerador Tesla, grans grups de GPU connectats a processadors principals d’Intel o AMD. Aquests xips s’utilitzen en una gran varietat de sistemes, inclòs el sistema Titan del laboratori nacional Oak Ridge i el nou sistema Piz Daint al Centre nacional de computació de supercomputació suïssa. Més interessant, la companyia assegura que les plaques Tesla es troben en els 10 primers sistemes de la darrera llista Green 500 dels supercomputadors més eficients energèticament del món. Tots aquests sistemes també utilitzen Intel Xeons, a excepció del Titan basat en AMD Opteron, que és el segon sistema més ràpid del món al Top 500, però és molt inferior a la llista Green 500.

A més, Nvidia va anunciar una col·laboració amb IBM per oferir els seus acceleradors Tesla en sistemes basats en l'arquitectura IBM Power. IBM ha promocionat durant molt de temps el seu rendiment en sèrie i el seu sistema BlueGene / Q basat en processadors Power executen el sistema Sequoia del laboratori nacional Lawrence Livermore i el sistema Mira del Laboratori Nacional Argonne, entre d'altres. El fet que IBM i Nvidia treballin junts hauria de donar lloc a alguns sistemes interessants en el futur.

A la fira, la companyia va anunciar la seva Tesla K40, la propera generació de la seva placa d’accelerador de GPU. La companyia va dir que oferirà 1, 4 teraflops de rendiment de doble precisió, 12 GB de memòria (288 GBps d'ample de banda) i una funció GPU Boost, que li permet funcionar a una velocitat de rellotge més ràpida en algunes situacions. Es tracta d'una actualització de la sèrie Tesla K20 existent, que utilitza el mateix disseny bàsic de la GPU produït amb la tecnologia de 28 nm.

Altres iniciatives inclouen maneres de facilitar la programació de la GPU, inclosa CUDA 6, que ara admet la memòria unificada, permetent als desenvolupadors apropar-se a la memòria com un conjunt únic, tot i que la memòria de CPU i GPU segueixi separada. La companyia també està donant suport a OpenACC, una col·lecció estàndard de directives del compilador que indica al sistema quines parts del programa (escrites en C / C ++ i Fortran) es poden descarregar de la CPU a un accelerador per augmentar el rendiment.

L’enfocament d’Intel, que anomena la seva arquitectura Many Integrated Core (MIC), és molt diferent. Combina múltiples nuclis x86 petits en un sol xip anomenat Xeon Phi. Des de fa uns quants anys, Intel fa tot el que es tracta de x86, ja que facilita la programació, tot i que és evident que els desenvolupadors encara han d’orientar directament l’arquitectura. La versió actual del Xeon Phi, anomenat Knights Corner, està dissenyada per utilitzar-se com a accelerador juntament amb xips de servidor Xeon E més tradicionals, i és utilitzada per diversos sistemes de referència, inclosos els Tianhe-2 de la Xina (actualment el sistema més ràpid). al món) i el sistema Stampede al Advanced Computing Center de la Universitat de Texas.

A la fira, Intel va anunciar una nova versió anomenada amb el nom de Knights Landing, que també funcionarà com a CPU autònoma que pot encaixar en una arquitectura de rack estàndard i executar el sistema operatiu directament, sense necessitat de tenir una CPU host (com el Xeon E). Això pot ser molt important per ampliar l’atractiu de Xeon Phi, especialment en el mercat d’estacions de treball. Una vegada més, aquesta està dissenyada per facilitar que els desenvolupadors de programari la visualitzin com a CPU única. Knights Landing estarà disponible tant com a CPU autònoma com en placa PCI Express que s’adapta als sistemes existents com a actualització de Knights Corner.

Hi ha altres canvis significatius a Knights Landing també, inclòs l’afegit de "memòria propera", efectivament, un DRAM que s’ofereix al paquet amb la CPU i, per tant, pot oferir un ample de banda molt superior a la memòria DDR tradicional, limitada per la velocitat de l'autobús. (També és més ràpid, però no gairebé.) No es tracta del primer pas en aquesta direcció; IBM fa anys que utilitza el DRAM incrustat en la seva arquitectura Power i Intel mateixa està implementant DRAM incrustat per a gràfics a les versions Iris Pro de la seva família Haswell Core. Tot i així, suposo que en els propers anys veurem molts més esforços en aquesta direcció.

Mentrestant, un dels nous enfocaments més interessants prové de Micron, que va anunciar un nou accelerador anomenat Processador Automat dissenyat principalment per fer front a problemes complexos de dades no estructurades.

Micron va descriure això com oferint un teixit format per desenes de milers a milions d’elements de processament connectats per resoldre tasques específiques. L’empresa, un dels majors fabricants de memòria DRAM i NAND, assegura que aquest utilitzarà el processament basat en memòria per resoldre reptes complexos d’informàtica en àmbits com la seguretat de la xarxa, la bioinformàtica, el processament d’imatges i l’analítica. Micron distribuirà inicialment el Processador Automata en una placa PCI-Express per aconseguir que els desenvolupadors treballin amb ell, però la companyia preveu vendre els processadors en mòduls de memòria estàndard, coneguts com a DIMM, o com a xips individuals per a sistemes incrustats. D’alguna manera, això sembla semblant a les matrius de portes programables en camp (FPGA), que s’ajusten per resoldre aplicacions particulars que impliquen la concordança de patrons.

La companyia va dir que treballa amb Georgia Tech, la Universitat de Missouri i la Universitat de Virgínia per desenvolupar noves aplicacions per a Automata. Tot i que la companyia no ha anunciat una data per als productes finals, un kit de desenvolupament de programari es presentarà l'any vinent, juntament amb eines de simulació.

L’autòmata sona com una obra en curs i és probable que sigui massa aviat per saber quina àmplia són les aplicacions, però és un plantejament interessant.

En general, estem veient l'evolució de la informàtica d'alt rendiment. No fa gaires anys, els ordinadors més ràpids eren principalment nombrosos processadors de servidors estàndards. De fet, els sistemes IBM Blue Gene i els basats en Sparc (com l’ordinador K del RIKEN Advanced Institute for Computational Science del Japó, que utilitza processadors Fujitsu Sparc) encara representen una gran part del mercat, inclosos cinc dels deu més ràpids. sistemes al món. Però en els darrers anys, l’impuls ha augmentat cap al coprocessador, els sistemes que utilitzen Tesla i més recentment els acceleradors Xeon Phi conformen més dels sistemes més nous. Amb millores en aquests sistemes, noves col·laboracions, millors programes i alguns nous enfocaments, el mercat de supercomputació pot ser molt diferent en el futur.