Nvidia GeForce RTX 4070 Ti características técnicas oficiales
NVIDIA GeForce RTX 4070 Ti |
Arquitectura de GPU | Ada Lovelace |
Nodo de fabricación | TSMC 4nm (personalizado para NVIDIA) |
Recuento de transistores | 35.800 millones |
Clusters gráficos | 5 |
Clusters de texturas | 30 |
Streaming Multiprocessors (SM) | 60 |
CUDA Cores | 7680 |
Tensor Cores | 240 de 4ª Gen |
RT Cores (Ray Tracing) | 60 de 3ª Gen |
Unidades de textura | 240 |
ROPs | 80 |
Frecuencia de reloj (Boost) | 2610 Mhz |
Frecuencia de reloj de la VRAM | 10500 Mhz |
Velocidad de la memoria | 21 Gbps |
Caché L2 | 49152 KB |
Total de memoria VRAM | 12 GB GDDR6X |
Ancho de interfaz de memoria | 192-bit |
Ancho de banda de la memoria | 504 GB/s |
Velocidad de textura | 626 Gigatexels/s |
Conectores | 3x DisplayPort y 1x HDMI |
Resolución máxima | 4K @ 240 Hz o 8K @ 60 Hz (con DSC) |
Factor de forma | Varias (AIC) / No Founders Edition |
Conector de alimentación | 2x PCIe 8-pin o cable PCIe Gen5 |
Potencia de la PSU mínima | 700W |
Potencia consumida | 12W Idle, 20W Reproducción de vídeo AV1, 226W AGP, 285W TGP |
Temperatura máxima de la GPU | 90ºC |
Interfaz de conexión | PCIe Gen4 |
RTX 4070 vs RTX 4070 Ti
Como sabes, NVIDIA siempre lanza versiones Ti de sus modelos de GPUs. Ti significa Titanium, y estas versiones suelen ser versiones no recortadas del núcleo de la GPU en la que se basan. En este caso, la GeForce RTX 4070 Ti es una versión potenciada de la GeForce RTX 4070. Es decir, la no-Ti tiene el mismo núcleo que la Ti, pero las no-Ti tienen algunas partes desactivadas o capadas.
Por eso, el rendimiento de las Ti es superior. Por tanto, la nueva GeForce RTX 4070 Ti estaría por encima del rendimiento de la RTX 4070, y ligeramente por debajo de la RTX 4080.
Arquitectura Ada Lovelace
La nueva arquitectura de GPU en la que se basa la NVIDIA GeForce 4070 es la ya conocida Ada Lovelace. Esta arquitectura estrenada por NVIDIA a finales de 2022 ha sido implementada en un chip con tecnología de fabricación de 4nm de TSMC, aunque es un nodo especialmente personalizado para conseguir lo mejor de los chips de NVIDIA.
Esta nueva fotolitografía implica una mayor densidad de transistores por unidad de superficie, menor consumo, y también mayores velocidades. Todo esto se une a las grandes mejoras de la arquitectura Ada Lovelace con respecto a su antecesora. Es decir, en definitiva, se ha conseguido un importante salto en la mejora del IPC y de la eficiencia energética.
Esta arquitectura de GPU en la que se basa la GeForce RTX 4070 Ti sigue apoyándose en los conocidos como SMT (Streaming Multiprocessors), los cuales se dividen a su vez en varios núcleos de procesamiento dedicados a diferentes tareas:
- 128 núcleos CUDA (Compute Unified Device Architecture), que se pueden usar para GPGPU programando éstos de forma adecuada o como unidades de sombreado cuando funcionan normalmente.
- 1 núcleo RT que está dedicado al Ray Tracing o trazado de rayos para acelerar esta tarea y conseguir unos mejores resultados en la calidad gráfica de los videojuegos.
- 4 núcleos Tensor, para acelerar las tareas que tienen que ver con la IA o el aprendizaje profundo.
Como puedes imaginar, al mejorar la arquitectura de la GPU, todas esas unidades citadas anteriormente se mejoran de forma considerable para conseguir mayor rendimiento. Por ejemplo, ahora los sombreadores de la Ada Lovelace es capaz de conseguir una mayor tasa de TFLOPS, incluso doblando a la arquitectura Ampere en este sentido. No obstante, ya sabes que la unidad TFLOPS no es muy indicativa del rendimiento real en el aspecto gráfico… Por ejemplo, AMD Radeon RX puede conseguir más TFLOPS que NVIDIA y sin embargo, la empresa verde consigue superar en rendimiento a la roja.
El aumento de rendimiento en los núcleos de sombreado o CUDA viene en gran medida de la tecnología SER (Shader Execution Reordering) incluida en esta nueva Ada Lovelace. Esta tecnología es capaz de reprogramar el trabajo y las cosas de instrucciones sobre la marca, duplicando así la efectividad. Algo similar a lo que ocurre en las CPUs de Intel o AMD con las instrucciones no secuenciales.
Por otro lado, también hay que destacar que los Tensor Core son ahora de 4ª Generación, por lo que también han mejorado en operaciones matriciales, multiplicaciones y acumulado, que son las que más se demandan en aplicaciones de IA y HPC. De hecho, estos núcleos son el motor de las redes neuronales usadas para la tecnología DLSS.
Te recomendamos la lectura de nuestro guía sobre las mejores tarjetas gráficas.
Los núcleos RT también se han mejorado, ahora se han incluido los de 3ª Gen, más avanzados que los de 2ª Gen incluidos en la arquitectura Ampere. Y eso ha mejorado mucho su rendimiento. Y no solo eso, también se introduce un motor de micro-mapa de opacidad para mejorar la densidad de geometría y dar un mayor realismo.
Tecnologías
Ada Lovelace también tiene otras novedades interesantes en la GPU. Ahora llega con dos encoders AV1 NVENC de 8ª Generación para ofrecer mejor calidad de imagen (4K) con la misma tasa de bits que el codec H.265/H.264. Algo especialmente interesante para los que editan vídeo o trabajan con streaming mientras juegan. Concretamente se ha logrado aumentar el un 40% la eficiencia de Ampere.
DLSS 3.0 es otra de las grandes novedades estrenadas junto a la arquitectura Ada Lovelace. Ahora NVIDIA también usa todo el potencial de la IA para el reescalado de imágenes en esta nueva versión de esta tecnología. En este caso puede crear cuadros completamente nuevos en lugar de solo generar píxeles. Todo gracias a cuatro elementos clave: un nuevo Optical Flow Accelerator (Acelerador de Flujo Óptico) (OFA), vectores de movimiento del motor de juego, un marco IA autoencoder convolucional y el sistema Reflex super-low-latency.
DLSS 3.0 es capaz de comparar el nuevo cuadro junto al cuadro anterior para ver cómo están cambiando la escena. El OFA proporciona a la red neuronal la velocidad y dirección de los píxeles fotograma a fotograma para que esta genere marcos intermedios completamente nuevos sin necesidad de procesar los gráficos, que sería una carga más pesada para la GPU. El rendimiento llega a ser hasta 4 veces superior respecto a DLSS inicia