AI Can Help Make Recycling Better
“Tout le monde en haut et en bas de la ligne est allé après l’efficacité.”
—Brad McCredie, AMD
En mai au Conférence internationale de supercalcul 2022 à Hambourg, Frontier a révélé une overall performance globale de 1,1 exaflops, soit 1,1 quintillion d’opérations en virgule flottante par seconde, le lançant à la tête de la liste Top rated500 des supercalculateurs les additionally puissants au monde. Il peut devenir encore additionally puissant, avec une overall performance maximale théorique de 2 exaflops.
De in addition, Frontier est classé premier sur la dernière liste Inexperienced500, qui mesure l’efficacité énergétique des supercalculateurs. (Ce qui n’est peut-être pas accessoire à sa performance globale en tant que le additionally rapide du monde.) Alors que le précédent top rated device Eco-friendly500, MN-3 au Japonfourni 39,38 gigaflops par watt, le système de exam et de développement Frontier atteint 62,68 gigaflops par watt.
De in addition, Frontier a remporté la première location dans une catégorie moreover récente, l’informatique à précision mixte, qui évalue les performances dans les formats informatiques couramment utilisés pour l’intelligence artificielle. Sur la dernière Introspection haute efficiency Linpack-Accelerator ou HPL-AI exam, les performances de Frontier ont atteint approximativement 6,86 exaflops.
Un component clé du succès de Frontier est la manière dont ses processeurs et GPU sont liés au sein de chaque nœud via AMD. Tissu infini architecture d’interconnexion. Cela permet de renforcer la cohérence entre le CPU et les GPU, c’est-à-dire de leur donner à tous la même vue des données partagées.
“La cohérence est très importante pour vous permettre d’augmenter les performances”, déclare Brad McCredie, vice-président du centre de données GPU et traitement accéléré chez AMD à Austin. « Cela vous aide à vous assurer que vous pouvez exécuter les bonnes prices de travail sur les bons processeurs. Cela permet aux processeurs d’effectuer très facilement de petits travaux et aux GPU d’effectuer de gros travaux en parallèle.
Au cours du développement de Frontier, AMD a noté que le additionally grand défi auquel il était confronté était les performances énergétiques. “Il y avait beaucoup de documentation sur le fait qu’il faudrait des centaines de milliers de GPU et 150 à 500 MW pour arriver à un exaflop, et nous voulions le faire avec des dizaines de milliers de GPU et 20 MW”, explique McCredie. “Donc, tout le monde en haut et en bas de la ligne est allé après l’efficacité.”
Par exemple, les GPU de Frontier ont chacun 128 gigaoctets de mémoire à bande passante élevéesoudé dessus. Cela les aide à surmonter un goulot d’étranglement critique pour les performances : le brassage des données entre la mémoire et le traitement.
De furthermore, les GPU de Frontier utilisaient chacun le nœud avancé de 6 nanomètres de TSMC (Taiwan Semiconductor Production Co.). Par conséquent, “ils peuvent exécuter opérations en virgule flottante à double précision aussi vite que opérations à virgule flottante simple précisionce qui était une grande innovation », déclare McCredie.
Le classement n ° 1 de Frontier sur la liste Environmentally friendly500 n’est peut-être pas non moreover un point accessoire.
Ces développements apparemment sans conséquence ont en fait aidé Frontier à s’appuyer sur des dizaines de milliers de GPU plutôt que sur des centaines de milliers, “en déplaçant le fardeau du programmeur vers le matériel lorsqu’il s’agit de gérer tout ce parallélisme”, déclare McCredie. “Cela rend le système beaucoup additionally programmable.”
Deux nœuds AMD tiennent sur une « lame de calcul », et 64 de ces lames sont chargées dans chaque armoire. Les lames de calcul sont reliées entre elles par Interconnexions HPE Slingshot, chacun avec un commutateur à 64 ports conçu sur mesure qui fournit 12,8 térabits par seconde de bande passante réseau. Des groupes de lames sont reliés entre eux par un soi-disant topologie libellule dans lequel des centaines d’armoires avec des centaines de milliers de nœuds peuvent toutes communiquer avec seulement trois sauts au maximum entre tous les nœuds.
« Les déploiements Slingshot sont hautement optimisés pour utiliser le câblage le additionally économe en énergie (câbles en cuivre à connexion directe et câbles optiques actifs) adaptés aux distances requises », déclare Mike Woodacre, vice-président et directeur procedure de l’équipe HPC et IA de HPE. L’élimination des composants à utilization général moins efficaces, ajoute-t-il, “réduit considérablement la consommation d’énergie du tissu”.
Les lames dans les armoires sont refroidies à l’aide refroidissement liquide. Selon Gerald Kleyn, vice-président des systèmes HPC et IA chez HPE, le supercalculateur peut atteindre jusqu’à cinq fois la densité d’une architecture traditionnelle refroidie par air. Le résultat est un système compact qui, à son tour, réduit considérablement les besoins en câblage et les dépenses d’exploitation.
“Briser la barrière de l’exaflop était essential, mais le faire tout en atteignant le n ° 1 sur la liste Eco-friendly500 est remarquable”, déclare Kleyn. De plus, accomplir cela au milieu d’une pandémie et de problèmes de chaîne d’approvisionnement mondiale, dit-il, “a nécessité un effort and hard work d’équipe herculéen entre le laboratoire nationwide d’Oak Ridge, HPE et AMD”.
Malgré les défis, notamment les problèmes de chaîne d’approvisionnement liés à la pandémie, la livraison du système de supercalculateur Frontier a eu lieu entre septembre et novembre 2021. Carlos Jones/ORNL/Département américain de l’énergie
Les prochaines étapes pour Frontier incluent la poursuite des tests et la validation du système. Le laboratoire indique qu’il reste sur la bonne voie pour l’acceptation finale et l’accès précoce à la science in addition tard en 2022 et qu’il est prévu d’ouvrir pour la science complète au début de 2023.
Les projets déjà prévus pour Frontier incluent la recherche sur le cancer, la découverte de médicaments, la fusion nucléaire, les matériaux exotiques, les moteurs super efficaces et les explosions stellaires. Le but de la machine est d’accélérer le temps requis pour un tel travail de semaines en heures et d’heures en secondes.
“Frontier permet aux scientifiques de faire additionally de science, ce qui signifie se rapprocher d’une énergie furthermore propre et plus efficace, trouver plus rapidement des vaccins encore plus efficaces contre les virus”, a déclaré McCredie. “Nous avons commencé toute cette aventure avec Frontier pour être le leading à un exaflop, mais en voyant les gens d’Oak Ridge travailler pour résoudre les problèmes climatiques, énergétiques, la pandémie, les principaux défis auxquels l’humanité est confrontée, nous sommes passés de vouloir construire un puissant ordinateur pour construire quelque selected qui aidera tout le monde.
À partir des articles de votre web page
Posts connexes sur le World-wide-web