Inicio Comparación de GPU NVIDIA GeForce RTX 4090 vs NVIDIA A100 PCIe 80 GB

NVIDIA GeForce RTX 4090 vs NVIDIA A100 PCIe 80 GB

Comparamos una GPU de plataforma de escritorio: 24GB VRAM GeForce RTX 4090 y una GPU de mercado profesional: 80GB VRAM A100 PCIe 80 GB para ver qué GPU tiene un mejor rendimiento en especificaciones clave, pruebas de referencia, consumo de energía, etc.

Principales Diferencias

NVIDIA GeForce RTX 4090 Ventajas de
Lanzado 1 años y 3 meses tarde
Reloj de impulso ha aumentado en un 79% (2520MHz vs 1410MHz)
9472 núcleos de renderizado adicionales
NVIDIA A100 PCIe 80 GB Ventajas de
Más VRAM (80GB vs 24GB)
Mayor ancho de banda de VRAM (1.94TB/s vs 1.01TB/s)
Menor TDP (300W vs 450W)

Puntuación

Prueba de rendimiento

FP32 (flotante)
GeForce RTX 4090 +323%
82.58 TFLOPS
A100 PCIe 80 GB
19.49 TFLOPS
Blender
GeForce RTX 4090 +232%
12393
A100 PCIe 80 GB
3722
OctaneBench
GeForce RTX 4090 +310%
1274
A100 PCIe 80 GB
310
VS

Tarjeta gráfica

sept. 2022
Fecha de lanzamiento
jun. 2021
GeForce 40
Generación
Tesla Ampere(Axx)
Escritorio
Tipo
Profesional
PCIe 4.0 x16
Interfaz de bus
PCIe 4.0 x16

Velocidades de reloj

2235 MHz
Reloj base
1065 MHz
2520 MHz
Reloj de impulso
1410 MHz
1313 MHz
Reloj de memoria
1512 MHz

Memoria

24GB
Tamaño de memoria
80GB
GDDR6X
Tipo de memoria
HBM2e
384bit
Bus de memoria
5120bit
1.01TB/s
Ancho de banda
1.94TB/s

Config. renderizado

-
-
-
128
Cuenta de SM
108
16384
Unidades de sombreado
6912
512
TMUs
432
176
ROPs
160
512
Núcleos tensor
432
128
Núcleos RT
-
128 KB (per SM)
Caché L1
192 KB (per SM)
72 MB
Caché L2
80 MB
-
-
-

Rendimiento teórico

443.5 GPixel/s
Tasa de píxeles
225.6 GPixel/s
1290 GTexel/s
Tasa de texturas
609.1 GTexel/s
82.58 TFLOPS
FP16 (mitad)
77.97 TFLOPS
82.58 TFLOPS
FP32 (flotante)
19.49 TFLOPS
1290 GFLOPS
FP64 (doble)
9.746 TFLOPS

Diseño de placa

450W
TDP
300W
850 W
PSU sugerida
700 W
1x HDMI 2.13x DisplayPort 1.4a
Salidas
No outputs
1x 16-pin
Conectores de alimentación
8-pin EPS

Procesador gráfico

AD102
Nombre GPU
GA100
AD102-300-A1
Variante GPU
-
Ada Lovelace
Arquitectura
Ampere
TSMC
Fundición
TSMC
5 nm
Tamaño proceso
7 nm
76.3 mil millones
Transistores
54.2 mil millones
609 mm²
Tamaño de dado
826 mm²

Funciones gráficas

12 Ultimate (12_2)
DirectX
N/A
4.6
OpenGL
N/A
3.0
OpenCL
3.0
1.3
Vulkan
N/A
8.9
CUDA
8.0
6.8
Modelo de sombreado
N/A

Comparaciones de GPU relacionadas

Noticias Relacionadas

© 2024 - TopCPU.net   Contáctenos Política de privacidad