Hace pocos días, Nvidia anunció que la nueva versión de DLSS basado en modelo de Transformador, estrenada con el lanzamiento de las RTX 50 pero que funciona para todas las RTX, abandonó su fase beta y ahora ya cuenta con una versión final, cuyo número es 310.3.0.
Complementando el anuncio, Nvidia publicó luego cifras comparativas que dan a conocer la reducción de VRAM que trae esta nueva versión de DLSS 4 Transformer con respecto a su previa versión beta (310.2.1.0), como también la diferencia que hay con respecto al viejo modelo CNN (Redes Neuronales Convolucionales), el cual exhibía una calidad visual inferior y comparable a FSR 4 de AMD.
NVIDIA lanzó esta semana un nuevo SDK (Kit de Desarrollo de Software) que incluye bibliotecas DLSS actualizadas para el reescalado, la reconstrucción de rayos y DLAA. La información más importante es que el modelo Transformer, que reemplaza a los antiguos modelos DLSS basados ??en CNN, finalmente ha salido de la fase beta.
Con esta versión, NVIDIA también introdujo optimizaciones en el uso de VRAM. En concreto, la nueva versión requiere menos memoria. Si bien esto solo se mencionó brevemente en el registro de cambios oficial, la Guía de Programación de DLSS actualizada ofrece más detalles sobre estos cambios.
Para los modelos Transformer, el SDK 310.3.0 ahora utiliza 87.77 MB a una resolución de 1080p, lo que supone un uso de VRAM 19.8 % menor a la versión anterior. Esta reducción de VRAM también se aplica a otras resoluciones, como 1440p, 4K y 8K. En promedio, los requisitos de memoria son aproximadamente un 20% menores.
Esto significa básicamente que DLSS requerirá menos VRAM para ejecutar modelos de superresolución y reconstrucción de rayos. Para configuraciones comunes como 8 GB de VRAM y una resolución de 1080p, el uso de memoria para ejecutar el modelo es de apenas el 1%.
Si bien el uso de VRAM con DLSS Tranformer sigue siendo mucho más alto en comparación a CNN, la calidad de imagen con el primero es muy superior, razón por la cual el algoritmo de reconstrucción de imagen es mucho más exacto y minucioso.
Instalación de DLSS Transformer 310.3.0
Dado que el último controlador de Nvidia (586.80) no cuenta actualmente con esta nueva versión de DLSS, la única opción para forzarla es utilizando DLSS Swapper junto con Nvidia Profile Inspector, cuyos enlaces se encuentran debajo.
Para forzar individualmente un juego con DLSS Transformer 310.3.0, simplemente deberán importar el archivo DLL «nvngx_dlss.dll» en DLSS Swapper y luego hacer clic en la versión de DLSS de un juego para cambiarlo. En caso de querer asegurarse de que el juego está funcionando con la versión asignada, pueden activar la opción de indicador en pantalla marcada en la última imagen.
Por último, para forzar DLSS Transformer 310.3.1.0 a través de Nvidia Profile Inspector en todos los títulos que utilizan DLSS (por las dudas no lo utilicen en títulos multiplayer que usan anti-cheat), deberán ejecutar Nvidia Profile Inspector, elegir el perfil Global (el mismo que cuando se inicia la herramienta) y luego ir a la sección Common (5). Allí tendrán que modificar el siguiente valores de DLSS:
- DLSS – Forced Preset Letter – Preset K
Una vez hecho este cambio, simplemente los aplican con el botón Apply que se encuentra arriba a la derecha y todos los juegos que hayan forzado con DLSS Swapper funcionarán con DLSS 310.3.0.
Nota: No forzar ningún preset mediante la App de Nvidia, de lo contrario se anulará el override de Nvidia Swapper y Nvidia Profile Inspector.
Tabla Comparativa de VRAM con DLSS Transformer |
||||
---|---|---|---|---|
Resolución | Versión Anterior (310.2.1.0) | Versión Final (310.3.0) | Reducción | % de Reducción |
1920×1080 | 106.90 MB | 85.77 MB | 21.13 MB | 19.76% |
2560×1440 | 181.11 MB | 143.54 MB | 37.57 MB | 20.75% |
3840×2160 | 387.21 MB | 307.37 MB | 79.84 MB | 20.62% |
7840×4320 | 1517.60 MB | 1225.17 MB | 292.43 MB | 19.26% |
NVIDIA DLSS 4 multiplica hasta por 8 el rendimiento
Con la Serie GeForce RTX 50, DLSS 4 estrena la generación de fotogramas múltiples para aumentar la velocidad de fotogramas utilizando la IA para generar hasta tres fotogramas por fotograma renderizado. Funciona al unísono con el conjunto de tecnologías DLSS para aumentar el rendimiento hasta 8 veces con respecto al renderizado tradicional, al tiempo que mantiene la capacidad de respuesta con la tecnología NVIDIA Reflex.
DLSS 4 también introduce la primera aplicación en tiempo real de la arquitectura de modelos de transformación en la industria gráfica. Los modelos de superresolución y reconstrucción de rayos DLSS basados en transformadores utilizan 2 veces más parámetros y 4 veces más capacidad de cálculo para proporcionar más estabilidad, reducir el efecto fantasma, aumentar el nivel de detalle y mejorar el antialiasing en las escenas de juego. DLSS 4 será compatible con las GPU GeForce RTX Serie 50 en más de 75 juegos y aplicaciones el día de su lanzamiento.
DLSS 4 también introduce la primera aplicación en tiempo real de la arquitectura de modelos de transformación en la industria gráfica. Los modelos de superresolución y reconstrucción de rayos DLSS basados en transformadores utilizan dos veces más parámetros y cuatro veces más capacidad de cálculo para proporcionar más estabilidad, reducir el efecto fantasma, aumentar el nivel de detalle y mejorar el antialiasing en las escenas de juego. DLSS 4 será compatible con las GPU GeForce RTX Serie 50 en más de 75 juegos y aplicaciones el día de su lanzamiento.
Generación de múltiples cuadros con DLSS: multiplique el rendimiento con las GPU GeForce RTX Serie 50
El modelo de IA de la generación de cuadros con DLSS 3 utiliza datos del juego, como vectores de movimiento y profundidad, y un campo de flujo óptico del acelerador de flujo óptico de la serie GeForce RTX 40 para generar un cuadro adicional. La generación de múltiples cuadros era prohibitivamente costosa, ya que se requerirían tanto el acelerador de flujo óptico como el modelo de IA para cada nuevo cuadro generado, y el costo de rendimiento limitaría la GPU, lo que daría como resultado velocidades de cuadros de entrada más bajas.
La generación de múltiples cuadros con DLSS 4 combina múltiples innovaciones de hardware Blackwell y software DLSS para hacer realidad la generación de múltiples cuadros. El nuevo modelo de IA de generación de cuadros es un 40% más rápido, utiliza un 30% menos de VRAM y solo necesita ejecutarse una vez por cuadro renderizado para generar múltiples cuadros.
Por ejemplo, en Warhammer 40,000: Darktide, este modelo proporcionó una velocidad de cuadros un 10% más rápida, mientras usaba 400 MB menos de memoria a 4K, con la configuración máxima, usando la generación de cuadros DLSS. También se ha acelerado la generación del campo de flujo óptico al reemplazar el flujo óptico de hardware con un modelo de IA muy eficiente. Juntos, los modelos de IA reducen significativamente el costo computacional de generar cuadros adicionales.
Velocidades de cuadros más rápidas y menor consumo total de VRAM con el nuevo modelo de generación de cuadros. Capturado en Warhammer 40,000: Darktide en una GeForce RTX 5090, a 4K, con la configuración más alta del juego y la generación de cuadros DLSS.
Incluso con estas eficiencias, la GPU aún necesita ejecutar 5 modelos de IA en Super Resolution, Ray Reconstruction y Multi Frame Generation para cada cuadro renderizado, todo en unos pocos milisegundos; de lo contrario, la generación de cuadros múltiples DLSS podría haberse convertido en un desacelerador. Para lograr esto, las GPU GeForce RTX Serie 50 incluyen núcleos Tensor de quinta generación con hasta 2,5 veces más rendimiento de procesamiento de IA.
Una vez que se generan los nuevos cuadros, se distribuyen de manera uniforme para brindar una experiencia fluida. La generación de cuadros DLSS 3 utiliza un ritmo basado en CPU con una variabilidad que puede combinarse con cuadros adicionales, lo que genera un ritmo de cuadros menos consistente entre cada cuadro, lo que afecta la fluidez.
Para abordar las complejidades de generar varios cuadros, Blackwell utiliza la medición de volteo de hardware, que traslada la lógica de ritmo de cuadros al motor de visualización, lo que permite que la GPU administre con mayor precisión el tiempo de visualización. El motor de visualización Blackwell también se ha mejorado con el doble de capacidad de procesamiento de píxeles para admitir resoluciones y frecuencias de actualización más altas para la medición de volteo de hardware con DLSS 4.
Al trabajar en conjunto, nuestras nuevas innovaciones de hardware y software permiten que DLSS 4 genere 15 de cada 16 píxeles con una excelente calidad de imagen, fluidez y latencia.
El nuevo modelo de transformador: mejoras en la calidad de imagen para todos los jugadores de GeForce RTX
DLSS 4 incluye una importante actualización de la arquitectura para la reconstrucción de rayos DLSS, la súper resolución DLSS y el DLAA, con el primer uso en tiempo real de un modelo basado en transformadores en la industria gráfica.
Anteriormente, DLSS utilizaba redes neuronales convolucionales (CNN) para generar nuevos píxeles mediante el análisis del contexto localizado y el seguimiento de los cambios en esas regiones en fotogramas sucesivos. Después de seis años de mejoras continuas, hemos alcanzado los límites de lo que es posible con la arquitectura CNN de DLSS.
El nuevo modelo de transformador DLSS utiliza un transformador de visión, lo que permite operaciones de autoatención para evaluar la importancia relativa de cada píxel en todo el fotograma y en varios fotogramas.
Al emplear el doble de parámetros del modelo CNN para lograr una comprensión más profunda de las escenas, el nuevo modelo genera píxeles que ofrecen mayor estabilidad, menor efecto fantasma, mayor detalle en movimiento y bordes más suaves en una escena.
En contenido con trazado de rayos intensivo, el nuevo modelo de transformador para Ray Reconstruction ofrece una gran mejora en la calidad de imagen, especialmente en escenas con condiciones de iluminación difíciles.
Por ejemplo, en estas escenas de Alan Wake 2, se aumenta la estabilidad en la cerca de alambre altamente detallada, se reduce el efecto fantasma en las aspas del ventilador y se elimina el brillo en las líneas eléctricas, lo que mejora la experiencia inmersiva del jugador en el juego en tercera persona.
El modelo de transformador para Super Resolution también muestra resultados prometedores y se lanzará como versión beta para permitir que los usuarios exploren las mejoras y brinden comentarios antes del lanzamiento oficial. El modelo ha demostrado una mejor estabilidad temporal, menos imágenes superpuestas y mayor detalle en movimiento.
La nueva arquitectura del modelo de transformador proporcionará años de margen para ofrecer mejoras continuas en la calidad de la imagen, como lo hemos hecho con la arquitectura CNN durante los últimos 6 años.
En Horizon Forbidden West Complete Edition, el nuevo modelo de transformador Super Resolution DLSS beta aumenta el detalle de la textura en la ropa y los accesorios de Aloy, así como la claridad general.