NVIDIA activa soporte inmediato para DiffusionGemma de DeepMind en RTX y DGX

NVIDIA lanza optimizaciones nativas para el modelo de IA abierto DiffusionGemma de DeepMind, alcanzando 150 tokens por segundo en DGX Spark. Una estrategia clave para democratizar la IA generativa.

NVIDIA acaba de anunciar soporte de primer día para DiffusionGemma, el último modelo de generación de imágenes abierto de DeepMind, con optimizaciones nativas en sus plataformas RTX (tarjetas de consumidor) y DGX (servidores empresariales). La velocidad de inferencia alcanza 150 tokens por segundo en DGX Spark, una cifra que subraya el compromiso de la compañía verde con los modelos abiertos frente a alternativas propietarias. Este movimiento cobra relevancia en un momento en que la competencia por el liderazgo en IA generativa se intensifica y la demanda de soluciones accesibles pero potentes crece exponencialmente.

DiffusionGemma: qué es y por qué importa para la IA visual

DiffusionGemma representa un cambio conceptual importante en los modelos de IA abiertos. DeepMind ha desarrollado una arquitectura que combina técnicas de difusión (el mismo principio detrás de sistemas como Stable Diffusion) con la eficiencia computacional de Gemma, la familia de modelos ligeros de Google. A diferencia de soluciones propietarias como DALL-E 3 o Midjourney, DiffusionGemma se distribuye bajo licencia abierta, permitiendo que investigadores, startups y empresas lo adapten sin depender de APIs comerciales ni pagar por cada generación de imagen.

Para el usuario español interesado en aplicaciones de IA, esto significa poder ejecutar generación de imágenes localmente sin conexión a internet, sin límites de uso por suscripción y con total control sobre los datos. El soporte inmediato de NVIDIA garantiza que funcione eficientemente incluso en tarjetas RTX de gama media-alta, no solo en infraestructuras de datacenter. Esto abre la puerta a que desarrolladores y pequeños estudios creativos integren capacidades de síntesis visual en sus aplicaciones sin costes recurrentes prohibitivos.

Especificaciones técnicas y rendimiento

NVIDIA ha optimizado DiffusionGemma para aprovechar al máximo sus arquitecturas CUDA y Tensor RT. Los datos clave del lanzamiento incluyen:

Velocidad de inferencia en DGX Spark: 150 tokens por segundo, permitiendo generar imágenes en tiempos competitivos con soluciones propietarias
Compatibilidad con plataformas RTX: Soporte optimizado para tarjetas GeForce RTX 40 y RTX 50, así como series anteriores con CUDA Compute Capability 8.0+
Optimización TensorRT: Compilación automática del modelo para maximizar velocidad y reducir consumo de VRAM
Resolución y calidad: Generación de imágenes a 512x512 píxeles nativamente, escalable a resoluciones superiores con técnicas de upsampling
Cuantización soportada: Versiones INT8 y BF16 para reducir requisitos de memoria sin penalización significativa en calidad

150 tokens por segundo en DGX Spark sitúan a DiffusionGemma al nivel de alternativas comerciales, pero con la libertad de un modelo completamente abierto.

Posicionamiento estratégico frente a la competencia

La rapidez con que NVIDIA ha optimizado DiffusionGemma (soporte de «día 1») revela una estrategia deliberada: mantener su hegemonía en el software de IA mientras proliferan modelos abiertos que desafían a proveedores de APIs privadas. Mientras Meta abre Llama, Google libera Gemma y ahora DeepMind presenta DiffusionGemma, NVIDIA se posiciona como el facilitador técnico imprescindible. Sin sus drivers, CUDA y TensorRT optimizados, estos modelos funcionarían significativamente más lento en hardware GPU, consolidando la ventaja de quien controla tanto el hardware como la cadena de software.

Comparado con la generación anterior de herramientas de síntesis visual abierta (Stable Diffusion XL, por ejemplo), DiffusionGemma promete mejor ratio calidad-velocidad gracias a arquitecturas más eficientes. En el mercado español, donde las startups de IA y los estudios de diseño buscan alternativas a los servicios SaaS estadounidenses, este soporte representa una oportunidad concreta para reducir dependencias tecnológicas y costes operativos. Empresas como Telefónica o startups del ecosistema madrileño y barcelonés podrían integrar estas herramientas en pipelines internos sin suscripciones recurrentes.

¿Qué supone para el comprador en España?

En términos prácticos, si posees una GPU RTX de gama media-alta (RTX 4060 Ti, RTX 4070 o superior) con al menos 8 GB de VRAM, podrás ejecutar DiffusionGemma con rendimiento cercano a las plataformas online comerciales. El coste de entrada es únicamente el de la tarjeta gráfica (no hay suscripción mensual ni créditos por uso). La disponibilidad en tiendas españolas como PcComponentes, Amazon.es o distribuidores locales es inmediata para modelos de NVIDIA actuales. No hay coste adicional de software: el modelo y las herramientas de NVIDIA son accesibles desde sus repositorios oficiales. Si planeas montar un PC o actualizar tu estación de trabajo para tareas creativas con IA, el soporte de DiffusionGemma suma valor sin incrementar el precio del hardware que necesitabas de todos modos.

Nuestra valoración

Este movimiento refuerza la posición de NVIDIA como imprescindible en cualquier stack de IA, incluso cuando los modelos son abiertos y gratuitos. Merece la pena para desarrolladores, studios creativos y cualquiera que vea valor en independencia tecnológica. La velocidad de 150 tokens/s en DGX no es marketing vacio: es suficientemente rápida para workflows profesionales. Sin embargo, el verdadero ganador aquí es DeepMind y el ecosistema abierto: consigue visualización instantánea de su modelo en la base instalada más grande de aceleración IA del mundo. Para el comprador medio en España, si tu presupuesto ronda los 800-1200 euros en componentes de PC gaming o workstation, asegúrate de elegir RTX y no alternativas (como las AMD Radeon que, aunque mejoran, aún adolecen de soporte software inferior en IA).

La pregunta no es si DiffusionGemma es bueno—lo es—sino si necesitas generar imágenes con IA frequentemente como parte de tu trabajo. Si la respuesta es sí, esta arquitectura abierta combinada con soporte NVIDIA nativo te permite escapar de las garras de OpenAI, Midjourney o Anthropic. Si es ocasional, sigue siendo más cómodo usar una API online. Pero el punto de inflexión está claro: la IA visual abierta, rápida y ejecutable localmente ya es viable. NVIDIA lo sabe y ha actuado en consecuencia.