DeepSeek lanzará su modelo V4 y estrena la tecnología DSpark

DeepSeek lanzará su modelo V4 y estrena la tecnología DSpark

DeepSeek lanzará su modelo V4 a mediados de julio y estrena DSpark para acelerar la IA hasta un 85%.

Por Humberto Toledo el 29 de junio del 2026 a las 8:40 am PDT

✨︎ Resumen (TL;DR):

  • DeepSeek prepara el lanzamiento de su modelo V4 a mediados de julio con tarifas dinámicas en su API.
  • Presentan DSpark, un sistema que acelera la velocidad de respuesta de la IA entre un 60% y 85%.
  • El desarrollo optimiza el uso de tarjetas gráficas (GPU) sin alterar la calidad del texto generado.

DeepSeek lanzará su nuevo modelo de inteligencia artificial V4 a mediados de julio, acompañado de un esquema de tarifas dinámicas para su API. Como antesala, la firma china presentó DSpark, una herramienta de código abierto que acelera el procesamiento de sus modelos hasta un 85% sin perder calidad.

Investigadores de la Universidad de Pekín y DeepSeek liberaron este desarrollo el 27 de junio, marcando el primer gran movimiento técnico de la empresa tras asegurar una ronda de inversión de 7 mil millones de dólares.

DSpark es un framework de decodificación especulativa que optimiza la generación de texto. En lugar de procesar cada palabra de forma individual, utiliza un modelo secundario rápido para proponer fragmentos de texto que el modelo principal aprueba en un solo paso.

DeepSeek tumba precios de IA: descuenta 75% en V4-Pro
Te podría interesar:
DeepSeek tumba precios de IA: descuenta 75% en V4-Pro
Fotos de stock gratuitas de acuático, agua, agua clara
Foto: Jake Houglum / Pexels

Una arquitectura que ahorra recursos de GPU

El sistema destaca por dos integraciones clave. Primero, añade un cabezal de especulación ligero directamente sobre el modelo existente, evitando entrenar un modelo desde cero y manteniendo la calidad original intacta.

Segundo, emplea un sistema de puntuación de confianza y un planificador que detecta la carga de trabajo de las tarjetas gráficas (GPU). Si el tráfico en los servidores es bajo, el sistema procesa más texto de golpe; si se satura, descarta las predicciones dudosas para ahorrar poder de cómputo.

En pruebas reales con usuarios, DSpark aceleró la generación un 60% a 85% en V4-Flash y un 57% a 78% en V4-Pro en comparación con su estándar anterior. Bajo escenarios específicos de latencia, el rendimiento se disparó hasta 661% en la versión Flash y 406% en Pro.

Compatibilidad abierta y nuevo modelo en camino

Esta tecnología no se limita a la plataforma interna de la compañía. El framework es compatible con otros modelos del sector, como Qwen3 de Alibaba y Gemma de Google. Además, el equipo liberó el código de DeepSpec bajo licencia MIT en GitHub para facilitar su adopción.

Esta infraestructura ya opera en los servicios en línea de DeepSeek, justo a tiempo para el debut de V4 en unas semanas, el cual introducirá tarifas diferenciadas para las horas de mayor y menor demanda en su API.

+ Temas Relacionados

Más de AI

Feed