Tenemos detalles técnicos de las GPUs de siguiente generación de AMD y NVIDIA. Las AMD RDNA 3 7900 XT y las NVIDIA Ada Lovelace GeForce RTX 4090 son los modelos tope de gama y, según el filtrador Greymon55, los rumores hablan de configuraciones espectaculares en cuanto a cores se refiere.

Los chips serán los Navi 31 y AD102 para AMD y NVIDIA respectivamente y vendrán con mejoras en el rendimiento así como incrementos en el consumo de energía. NVIDIA tendrá un diseño monolítico en la arquitectura Ada Lovelace para gaming. AMD usará tecnología MCM de múltiples chips que ya se ha visto en las GPUs Aldebaran Mi200 con arquitectura CDNA2 para equipos profesionales y centros de datos.
La GPU AMD Navi 31 de las RX 7900 XT vendrá con menos CUs, aunque favorecerá WGPs (Workgroup Processors) en las GPUs RDNA 3. El chip Navi 31 es MCM con dos tecnologías nuevas: GCD o Graphics Core Die con tecnología TSMC de 5 nm, y MCD o Multi Cache Die, con tecnología TSMC de 6 nm. Parece ser que AMD ya tendría el chip en una fase previa a la producción del silicio propiamente dicho.
El chip Navi 31 tendría dos GCDs y un único MCD. Cada GCD tiene tres Shader Engines para un total de 6 y cada Shader Engine viene con dos Shader Arrays para un total de 2 por SE y 6 por GCD lo cual arroja un valor de 12. Cada Shader Array tiene 5 WGPs (10 por cada SE, 30 por cada GCD y 60 en total). Cada WGP tiene 8 unidades SIMD32 con 32 ALUs (40 SIMD32 por SA, 80 por SE, 240 por GCD y 480 en total). En conjunto tenemos 7.680 cores por cada GCD para un total de 15.360 en dos GCDs.
La velocidad de reloj parece que será de 2,4 - 2,5 GHz con un rendimiento teórico de 75 TFLOPS en FP32. Es una mejora de un 226% frente a la Radeon RX 6900 XT.

El MCD de la GPU Navi 31 está enlazado al GCD dual mediante tecnología Infinity Fabric Interconnect con 256 - 512 MB de Infinity Cache. El ancho del bus de memoria es de 256 bits y habrá hasta 32 GB de memoria GDDR6 a 18 Gbps. El ancho de banda es de 576 GB/s. También parece que tendremos tecnología 3D Infinity Cache con la memoria caché integrada verticalmente en la GPU de un modo similar a como la memoria caché L3 está dispuesta en las CPUs Vermeer-X.

En cuanto a la GeForce RTX 4090 con el chip AD102, tenemos un diseño monolítico con velocidades de reloj de hasta 2,5 GHz con un mínimo de 2,3 GHz. Tendremos 18432 cores CUDA con 144 unidades SM. Es casi el doble de lo que tenemos en Ampere, que a su vez era un avance enorme frente a Turing. El rendimiento teórico de las Ada Lovelace sería de entre 85 y 92 TFLOPS en FP32. Las RTX 3090 actuales tienen un rendimiento de 36 TFLOPS en FP32. El chip Turing TU102 tenía un rendimiento de 13 TFLOPs. De todos modos, más FLOPs no significa un incremento en gaming tan espectacular.

La memoria sería GDDR6X con hasta 21 Gbps de velocidad con un máximo de 24 GB. El rendimiento será parejo al de las RDNA 3 de AMD. Las GPUs Hopper para equipos profesionales vendrían con tecnología MCM, eso sí.