NVIDIA GeForce RTX 4090 vs NVIDIA A100 PCIe 80 GB

VS

NVIDIA GeForce RTX 4090 NVIDIA A100 PCIe 80 GB

Comparamos una GPU de plataforma de escritorio: 24GB VRAM GeForce RTX 4090 y una GPU de mercado profesional: 80GB VRAM A100 PCIe 80 GB para ver qué GPU tiene un mejor rendimiento en especificaciones clave, pruebas de referencia, consumo de energía, etc.

Principales Diferencias

NVIDIA GeForce RTX 4090Ventajas de

Publicado 1 años y 3 meses tarde

Reloj de impulso ha aumentado en un 79% (2520MHz vs 1410MHz)

9472 núcleos de renderizado adicionales

NVIDIA A100 PCIe 80 GBVentajas de

Más VRAM (80GB vs 24GB)

Mayor ancho de banda de VRAM (1935GB/s vs 1008GB/s)

Menor TDP (300 W frente a 450 W)

Puntuación

Prueba de rendimiento

FP32 (flotante)

GeForce RTX 4090 +323%

82.58 TFLOPS

A100 PCIe 80 GB

19.49 TFLOPS

Blender

GeForce RTX 4090 +237%

12921

A100 PCIe 80 GB

3823

OctaneBench

GeForce RTX 4090 +312%

1278

A100 PCIe 80 GB

310

GeForce RTX 4090

VS

A100 PCIe 80 GB

Tarjeta gráfica

sept 2022

Fecha de lanzamiento

jun 2021

GeForce 40

Generación

Tesla Ampere

Escritorio

Tipo

Profesional

PCIe 4.0 x16

Interfaz de bus

PCIe 4.0 x16

Velocidades de reloj

2235 MHz

Reloj base

1065 MHz

2520 MHz

Reloj de impulso

1410 MHz

1313 MHz

Reloj de memoria

1512 MHz

Memoria

24GB

Tamaño de memoria

80GB

GDDR6X

Tipo de memoria

HBM2e

384bit

Bus de memoria

5120bit

1008GB/s

Ancho de banda

1935GB/s

Config. renderizado

128

Cuenta de SM

108

-

Unidades de cálculo

-

16384

Unidades de sombreado

6912

512

TMUs

432

176

ROPs

160

512

Núcleos tensor

432

128

Núcleos RT

-

128 KB (per SM)

Caché L1

192 KB (per SM)

72 MB

Caché L2

80 MB

Rendimiento teórico

443.5 GPixel/s

Tasa de píxeles

225.6 GPixel/s

1290 GTexel/s

Tasa de texturas

609.1 GTexel/s

82.58 TFLOPS

FP16 (mitad)

77.97 TFLOPS

82.58 TFLOPS

FP32 (flotante)

19.49 TFLOPS

1290 GFLOPS

FP64 (doble)

9.746 TFLOPS

Procesador gráfico

AD102

Nombre GPU

GA100

AD102-300-A1

Variante GPU

-

Ada Lovelace

Arquitectura

Ampere

TSMC

Fundición

TSMC

5 nm

Tamaño proceso

7 nm

76 mil millones

Transistores

54 mil millones

609mm²

Tamaño de dado

826mm²

Diseño de placa

450W

TDP

300W

850 W

PSU sugerida

700 W

1x HDMI 2.1 3x DisplayPort 1.4a

Salidas

No outputs

1x 16-pin

Conectores de alimentación

8-pin EPS

Funciones gráficas

12 Ultimate (12_2)

DirectX

N/A

4.6

OpenGL

N/A

3.0

OpenCL

3.0

1.3

Vulkan

N/A

8.9

CUDA

8.0

6.7

Modelo de sombreado

N/A

Comparaciones de GPU relacionadas

1

NVIDIA GeForce RTX 4090 vs NVIDIA Tesla V100 PCIe 32 GB

2

NVIDIA GeForce RTX 4090 vs NVIDIA RTX A6000

3

NVIDIA GeForce RTX 4080 SUPER vs NVIDIA GeForce RTX 4090

4

NVIDIA GeForce RTX 4090 vs NVIDIA RTX 6000 Ada

5

NVIDIA GeForce RTX 4090 vs NVIDIA H100 SXM5

6

NVIDIA GeForce RTX 4090 vs NVIDIA L40S

7

NVIDIA RTX A6000 vs NVIDIA A100 PCIe 80 GB

8

NVIDIA GeForce RTX 4090 vs AMD Radeon Pro 5700

9

NVIDIA GeForce RTX 4090 vs NVIDIA GeForce GTX 690

10

NVIDIA GeForce RTX 4090 vs NVIDIA GeForce RTX 4060 AD106