Gracias al lanzamiento de la RTX 4070 Ti SUPER con un búfer de VRAM aumentado a 16GB (en comparación con la RTX 4070 Ti saliente con 12GB), ahora puedes optar por un buen punto intermedio en la línea de productos RTX 40-series de NVIDIA.
Continuando con nuestra primera ronda de pruebas, decidimos poner a nuestros expertos en una tarea más complicada: realizar pruebas de benchmarking de las GPU de NVIDIA utilizando AnimateDiff (
Generación de Texto a Video con AnimateDiff (huggingface.co)) para crear imágenes animadas utilizando entradas de texto y video.
Sin embargo, esta vez enfrentaremos la recién lanzada RTX 4070 Ti SUPER contra los campeones de la generación anterior: la RTX 3080 Ti y la RTX 3080.
¿Qué hace AnimateDiff?
AnimateDiff es un sistema que combina el modelo Stable Diffusion con Motion, lo que te permite generar un video/GIF animado con una entrada de texto o video.
VRAM y Modelos de IA: ¿Cuánto Necesitas?
Aunque la capacidad de VRAM más alta de la RTX 4070 Ti SUPER ayudará con algunas tareas, cualquier cosa por encima de 12GB debería ser suficiente. Con su búfer de VRAM de 16GB y su potencia bruta, la RTX 4070 Ti SUPER debería rendir significativamente mejor que sus competidores de la generación anterior.
El modelo Stable Diffusion XL de Stability AI solicita un "mínimo de VRAM" de 8GB. ¡Así que demos un poco más de potencia y descubramos si podemos acelerar nuestras tareas de generación de imágenes de manera decente!
Benchmark de AnimateDiff: RTX 4070 Ti SUPER 16G vs. RTX 3080 Ti 12G vs. RTX 3080 10G
Además de ejecutar tareas utilizando el sistema de AnimateDiff, también realizaremos algunas pruebas utilizando Stable Diffusion 1.7 (a través de WebUI), lo que te permitirá tener una idea de cómo se comportan estas GPU con diferentes cargas de trabajo.
Stable Diffusion 1.7 + ControlNet*2 + LoRA en WebUI (512x512)
Nuestra primera prueba es una tarea de generación de imágenes utilizando 2 ControlNets y un LoRA.
[Prompt: “masterpiece, best quality, high quality, highres, , cold tone, high tech, diamond, sharp line]
En esta prueba, vemos que la RTX 4080 tiene ciertos problemas frente a la RTX 4070 Ti SUPER por alguna razón, con solo un ligero aumento en el rendimiento. Sin embargo, ambas tarjetas superan fácilmente a los campeones de la generación anterior de NVIDIA.
La RTX 4070 Ti SUPER es 30% más rápida que una RTX 3080 10G, mientras que la RTX 4080 SUPER es casi un 40% más rápida. Es la RTX 4070 Ti SUPER la que ofrece un valor superior aquí gracias a su precio asequible y su gran búfer de VRAM.
Stable Diffusion XL + ControlNet*2 + LoRA en WebUI (1024x1024)
En nuestra próxima prueba, aumentamos la resolución a 1024x1024 para generar algunas imágenes utilizando Stable Diffusion XL y los 2 ControlNets + LoRA de nuestras pruebas anteriores.
[Prompt: masterpiece, best quality, high quality, highres, , cold tone, high tech, diamond, sharp line]
Los resultados vuelven a ser sorprendentes, ya que la RTX 4080 16G supera a la competencia con una formidable ventaja del ~53% sobre la RTX 3080 10G. Es más, también logra superar a la RTX 4070 Ti SUPER en un ~21%.
[Stable Diffusion 1.7 GeForce RTX 4070 Ti SUPER 16G GPU Benchmark_1 por MSI Lab]
Aunque la RTX 4070 Ti SUPER no ofrece demasiadas mejoras con respecto a la RTX 3080 Ti 12G, con una ventaja del 6,5%, consigue generar imágenes un 26,6% más rápido que la RTX 3080 10G.
AnimateDiff Text2Video + ControlNet en ComfyUI (576x1024)
Si bien el uso de VRAM debería aumentar al ejecutar una carga de trabajo de Text2Video utilizando AnimateDiff en ComfyUI, no esperamos que cambie demasiado drásticamente. Sin embargo, este es un comportamiento esperado porque aún estamos probando a resoluciones relativamente más bajas (1024x1024), lo que no estresará demasiado la VRAM.
En esta prueba, estaremos generando una tarjeta gráfica de triple ventilador con ventiladores animados.
[Prompt: masterpiece, best quality, graphics card, fan, 3D, high detail, no human, marble texture]
Aunque no se vea del todo bien (bastante normal para imágenes generadas por IA sin mucho refinamiento), debería funcionar bastante bien para que podamos realizar un seguimiento del rendimiento.
En cuanto a los resultados, es una excelente demostración para la RTX 4070 Ti SUPER. Supera fácilmente al campeón de la generación anterior, rendiendo animaciones un 13% más rápido que la RTX 3080 Ti 12G. ¡Además, supera ampliamente a la RTX 3080 con un resultado un 35% más rápido!
AnimateDiff Video2Video en ComfyUI (512x1024)
El canal de Video2Video para AnimateDiff te permite usar un video como entrada y generar una animación. Usaremos ComfyUI para esta tarea ya que te brinda un poco más de flexibilidad que WebUI.
[Prompt: masterpiece, best quality, graphics card, fan rotating, 3D, high detail, no human]
Los resultados de esta prueba son exactamente los que esperábamos, y la RTX 4070 Ti SUPER vuelve a ocupar cómodamente el primer puesto. En nuestras pruebas, la RTX 4070 Ti SUPER fue un 10,5% más rápida que la RTX 3080 Ti 12G y un 33% más rápida que la RTX 3080 10G.
[Stable Diffusion 1.7 GeForce RTX 4070 Ti SUPER 16G GPU Benchmark_2 por MSI Lab]
Divirtiéndose con AnimateDiff: Dr. Lucky usando LoRA y ControlNet
A continuación, nuestro equipo decidió divertirse un poco y generar un Dr. Lucky animado (abajo). Para ello, tuvimos que utilizar tanto un LoRA como ControlNet.
Te encontrarás con ambos términos o al menos uno de ellos al generar imágenes de IA porque desempeñan un papel integral para obtener resultados utilizables con una fiabilidad mucho mejor. Entonces, ¿qué son?
ControlNet y LoRA: Una breve descripción
Un
ControlNet es una estructura de red neuronal que te permite controlar modelos de difusión mediante condiciones adicionales. Entonces, cuando lo agregas a un modelo, te permite controlar la imagen final sin proporcionarle algo demasiado específico.
Por otro lado, un
LoRA (Ajuste de Representación Localizada) es una forma de alterar las salidas de Difusión Estable basadas en conceptos relativamente más estrechos como estilos artísticos, personajes o temas.
Generando nuestro Animado Lucky!
Llegar a este resultado adorable y con anteojos involucró entrenar nuestro propio
LoRA 'Lucky' - para obtener el resultado perfecto. El proceso incluyó elegir el tipo adecuado de dragón, una pose
adecuada y más. Encontrarás más detalles sobre el proceso en nuestro video
aquí.
[Prompt: masterpiece, best quality, 1dragon, (the dragon is red:1.2), the dragon is standing, the dragon is cute with small wings and one glasses, the wings is yellow, the glasses is black, cute, happy, room, without fur]
[Prompt: masterpiece, best quality, 1dragon, the dragon is talking, red_skin, wings, glasses, the_glasses_is_black, (3D:1.1), (cute:1.2), happy, green_background,]
La Mejor GPU para Generar Videos Animados Usando AnimateDiff
Cuando se trata de generar videos animados, incluso a resoluciones más bajas, la RTX 4070 Ti SUPER 16G supera fácilmente incluso a los mejores rendidores de la línea anterior de NVIDIA. Los requisitos de VRAM aumentan en resoluciones más altas, y esperamos ver una diferencia aún más significativa entre estas GPUs.
Si tu trabajo implica generar estos videos/animaciones/imágenes regularmente, no puedes equivocarte con una GPU que tenga un búfer de VRAM de 16GB, como la RTX 4070 Ti SUPER 16G. No solo tiene un mejor rendimiento que cualquier componente de la generación anterior a resoluciones más altas gracias a su mayor capacidad de VRAM, ¡sino que también los supera en rendimiento bruto!
Mantente atento a nuestra próxima serie de pruebas, donde llevaremos estas GPUs al límite para generar animaciones de mayor resolución y calidad.
Más información sobre el análisis de tarjetas gráficas de Greenskull AI:
https://youtu.be/N5CaqC4bXc0?si=eQLKzJGrsNNiVSXw
Más información sobre Stable Diffusion 1.7 GPU RTX Benchmarks con GeForce RTX 4070 Ti SUPER:
https://youtube.com/shorts/OgOVtgPVJKA
Divirtiéndose con AnimateDiff: Dr. Lucky usando LoRA y ControlNet:
https://youtube.com/shorts/yEX_wZEKKJo
Más información sobre GeForce RTX™ 4070 Ti SUPER 16G GAMING X SLIM:
https://www.msi.com/Graphics-Card/GeForce-RTX-4070-Ti-SUPER-16G-GAMING-X-SLIM