Las especificaciones de la supercomputadora Kestrel de NREL revelan una combinación de CPU Intel Sapphire Rapids Xeon y AMD Genoa de doble zócalo, 528 GPU NVIDIA H100

Las especificaciones de la supercomputadora Kestrel de NREL, que es diseñado por HPE y cuenta con hasta 44 PFLOP de potencia de cómputo, con Sapphire Rapids Xeon de Intel, CPU AMD EPYC Genoa y aceleradores de GPU H100 de NVIDIA.

Los chips AMD, Intel y NVIDIA potencian la supercomputadora NREL Kestrel: AMD EPYC Genoa, Intel Sapphire Rapids y NVIDIA H100

El Laboratorio Nacional de Energía Renovable (NREL) del DOE de EE. UU. anunció sus planes el año pasado para Kestrel, una nueva supercomputadora que aprovechará las últimas tecnologías de AMD, Intel y NVIDIA, para reemplazar su supercomputadora Eagle existente. La supercomputadora será diseñada por Hewlett Package Enterprise (HPE) y durante una conferencia reciente, dieron a conocer el primer vistazo a las especificaciones del sistema.

La supercomputadora Kestrel utilizará nodos estándar y acelerados. Tendrá un rendimiento máximo de 44 PetaFlops, un aumento de 5,5 veces sobre el sistema Eagle existente. Para los nodos estándar, Kestrel utilizará las últimas CPU Sapphire Rapids ‘Xeon Scalable’ de Intel. La configuración particular utilizada por Kestrel es un SKU de 52 núcleos y 104 subprocesos. Habrá 2304 nodos estándar y cada nodo ejecutará 2 procesadores en una configuración de doble zócalo. Eso es un total de 4608 CPU Intel Sapphire Rapids-SP con un total de 239 616 núcleos y 479 232 subprocesos. El almacenamiento de datos consistirá en 75 PetaByers de almacenamiento Lustre y cada uno de los 2304 nodos se configurará con 256 GB de memoria DDR5 para un total de 560 Petabytes de RAM del sistema.

Pasando a los nodos acelerados, Kestrel implementará 132 de estas configuraciones, cada una con cuatro aceleradores de GPU NVIDIA H100 basados ​​en la arquitectura de gráficos Hopper y una configuración de CPU AMD EPYC Genoa de doble socket. Son 528 GPU NVIDIA Hopper H100 y 264 chips AMD EPYC Genoa empaquetados en estos nodos acelerados.

No conocemos las configuraciones exactas de las GPU NVIDIA H100 o las CPU AMD EPYC Genoa utilizadas en Kestrel, pero si tomamos la configuración superior, obtenemos hasta 8,921,088 núcleos CUDA (H100 SXM5) y un total de 25,344 núcleos Zen 4 ( EPYC Génova Hasta 92 núcleos). El nodo acelerado también tendrá 42 TB de memoria HBM3 y 20 TB de memoria del sistema. También hay 8 nodos DAV que incluyen hasta 16 GPU NVIDIA A40. Todo esto se conectará mediante la interconexión HPE Slighshot Dragonfly. Algunas características de la interconexión HPE Slingshot incluyen:

  • Rendimiento y escalabilidad líderes en la industria
  • Interfaces de 100 GbE y 200 GbE
  • Conmutador de ancho de banda de 12,8 Tb/s de alta base, 64 puertos
  • Escalabilidad a >250 000 puertos host con un máximo de 3 saltos
  • Gestión de congestión de hardware innovadora, enrutamiento adaptable y calidad de servicio
  • Estándares y protocolos de Ethernet, además de funcionalidad HPC optimizada
  • Reintento de nivel de enlace y corrección de errores de reenvío de baja latencia
  • Interfaces de administración de API abiertas y estandarizadas

La supercomputadora Kestrel tiene una capacidad nominal de 10,4 gflops/vatio, lo que no se acerca en nada a la supercomputadora Frontier recientemente anunciada con más de 50 gflops/vatio de eficiencia, pero también es costosa y es mayor que el sistema Exaflop. Se espera que la supercomputadora Kestrel se implemente en 2024.

Fuente de noticias: Momomo_US


Leave a Comment