✨︎ Resumen (TL;DR):
- DeepSeek prepara el lanzamiento de su modelo V4 a mediados de julio con tarifas dinámicas en su API.
- Presentan DSpark, un sistema que acelera la velocidad de respuesta de la IA entre un 60% y 85%.
- El desarrollo optimiza el uso de tarjetas gráficas (GPU) sin alterar la calidad del texto generado.
DeepSeek lanzará su nuevo modelo de inteligencia artificial V4 a mediados de julio, acompañado de un esquema de tarifas dinámicas para su API. Como antesala, la firma china presentó DSpark, una herramienta de código abierto que acelera el procesamiento de sus modelos hasta un 85% sin perder calidad.
Investigadores de la Universidad de Pekín y DeepSeek liberaron este desarrollo el 27 de junio, marcando el primer gran movimiento técnico de la empresa tras asegurar una ronda de inversión de 7 mil millones de dólares.
DSpark es un framework de decodificación especulativa que optimiza la generación de texto. En lugar de procesar cada palabra de forma individual, utiliza un modelo secundario rápido para proponer fragmentos de texto que el modelo principal aprueba en un solo paso.

Una arquitectura que ahorra recursos de GPU
El sistema destaca por dos integraciones clave. Primero, añade un cabezal de especulación ligero directamente sobre el modelo existente, evitando entrenar un modelo desde cero y manteniendo la calidad original intacta.
Segundo, emplea un sistema de puntuación de confianza y un planificador que detecta la carga de trabajo de las tarjetas gráficas (GPU). Si el tráfico en los servidores es bajo, el sistema procesa más texto de golpe; si se satura, descarta las predicciones dudosas para ahorrar poder de cómputo.
En pruebas reales con usuarios, DSpark aceleró la generación un 60% a 85% en V4-Flash y un 57% a 78% en V4-Pro en comparación con su estándar anterior. Bajo escenarios específicos de latencia, el rendimiento se disparó hasta 661% en la versión Flash y 406% en Pro.
Compatibilidad abierta y nuevo modelo en camino
Esta tecnología no se limita a la plataforma interna de la compañía. El framework es compatible con otros modelos del sector, como Qwen3 de Alibaba y Gemma de Google. Además, el equipo liberó el código de DeepSpec bajo licencia MIT en GitHub para facilitar su adopción.
Esta infraestructura ya opera en los servicios en línea de DeepSeek, justo a tiempo para el debut de V4 en unas semanas, el cual introducirá tarifas diferenciadas para las horas de mayor y menor demanda en su API.
