En este artículo vamos a tratar algunas de los modelos de GPUs que HPE oferta para los servidores Gen11.
Vamos a dividirlas en dos apartados, las GPUs para IA, y aquellas que también podemos usar para VDI.
GPUs para IA
NVIDIA H100 / H100 NVL
El primer modelo que nos puede aparecer seria la H100, o su versión más moderna H100 NVL, con procesador GPU: NVIDIA Hopper, GH100 chip (14592 CUDA cores) a 1125 MHz (base) / 1755 MHz (boost), y un consumo de 300-350W. Memoria de 80GB HBM2e en la H100 y 94GB HBM3 en la H100 NVL.
Ambos modelos permiten la agrupación mediante NVLink.
En el momento de escribir este artículo la H100 está en fin de vida y la H100 NVL tiene problemas de disponibilidad.
Intel® DC GPU Max 1100
Nueva GPU Intel de ancho doble con procesador Intel Ponte Vecchio (56 Xe cores, 448 compute engines) a 1000 MHz (base) / 1550 MHz (boost), consumo: 300W. Memoria tipo HBM2e de 48GB.
Permite agrupar dos tarjetas mediante una conexión Intel Xe Link Bridge.
Qualcomm Cloud AI 100 ultra
Tarjeta GPU de ancho simple (1Slot) diseñada para IA y soporte de Large Language Model (LLM) en servidores HPE ProLiant DL380a Gen11, con 64 cores, Memoria LPDDR4X de 128GB y un consumo de 150w
GPUs para soluciones de entrada gráficas y VDI
NVIDIA A2
Con un consumo de entre 40 y 60W, tamaño compacto (1 Slot) y Tensor cores de 3ª gen., RT cores de 2ª gen. y Secure Root of Trust, esta GPU está pensada como solución para cualquier servidor, incluso aquellos con limitaciones de espació o de consumo eléctrico. Tiene una memoria GDDR6 de 16GB
NVIDIA L4
Tarjeta GPU de ancho simple (1Slot) con procesador NVIDIA Ada, AD104 chip (7680 CUDA cores) a 795 MHz (base) / 2040MHz (boost), con un consumo de 72W. Memoria 24GB GDDR6.
NVIDIA A16
Tarjeta GPU de ancho doble con Arquitectura NVIDIA Ampere con Tensor cores de 3ª gen., RT cores de 2ª gen. y 64GB GDDR6.
Pensada para VDI de alta densidad con hasta 64 usuarios simultáneos.
GPUs con soporte VDI
NVIDIA L40
Tarjeta GPU de ancho doble con procesador NVIDIA Ada, AD102 chip (18179 CUDA cores) a 735 MHz (base) / 2490MHz (boost) y un consumo de 300W. Memoria de 48GB GDDR6
NVIDIA L40S
Versión mejorada de la L40, con un procesador NVIDIA Ada, AD102 chip (18176 CUDA cores) a 1110 MHz (base) / 2520MHz (boost) y un consumo de 300W. Igual que el modelo anterior, cuenta con una memoria de 48GB GDDR6.
NVIDIA RTX 4000
Nueva tarjeta de próximo lanzamiento (junio 2024) de ancho simple, con ventilación activa, 4 puertos DisplayPort 1.4a y procesador NVIDIA Ada, con Tensor cores de 4ª gen. y RT cores de 3ª gen, que triplican y duplican, respectivamente, las prestaciones de la generación anterior. Memoria de 20GB GDDR6.
Es, junto con la L4, una de las dos tarjetas disponibles para ML110.
Para concluir, adjunto una tabla con las distintas tarjetas y su segmentación.