DeepSeek V4 Preview es una actualización importante, pero no debería leerse como un simple «V4 siempre gana a V3.2». Para un equipo que mantiene una integración real, la diferencia práctica se concentra en cinco frentes: ventana de contexto, separación de modelos, coding agentivo, lectura de benchmarks y plan de migración de API.[3][
16][
23]
Comparativa rápida: dónde cambia V4 Preview frente a V3.2
| Área | DeepSeek V3.2 | DeepSeek V4 Preview | Qué implica al actualizar |
|---|---|---|---|
| Estado | DeepSeek-V3.2 aparece en el release del 1 de diciembre de 2025.[ | DeepSeek-V4 figura en el changelog del 24 de abril de 2026 y tiene su propia página de Preview Release.[ | V4 es más reciente, pero conviene tratarlo como preview antes de sustituir producción. |
| Enfoque | V3.2 se presenta alrededor de reasoning, thinking y tool-use para agentes.[ | V4 pone el acento en contexto de 1 millón de tokens, dos variantes —V4-Pro y V4-Flash— y coding agentivo.[ | V4 es especialmente interesante para repositorios grandes, documentación extensa o agentes con muchos pasos. |
| Contexto largo | DeepSeek-V3.2-Exp ya había introducido DeepSeek Sparse Attention para hacer más eficientes el entrenamiento y la inferencia con contexto largo.[ | V4 Preview convierte la ventana de 1 millón de tokens en uno de sus puntos principales.[ | Es el cambio más relevante si tu aplicación necesita meter mucho contexto en una sola llamada. |
| Línea de modelos | El changelog menciona DeepSeek-V3.2 y DeepSeek-V3.2-Speciale.[ | V4 se divide en DeepSeek-V4-Pro y DeepSeek-V4-Flash.[ | Facilita probar una opción más potente frente a otra más ligera. |
| API | La documentación de API indicaba que deepseek-chat y deepseek-reasoner correspondían a DeepSeek-V3.2.[ | V4 Preview dice que esos dos alias ahora enrutan a deepseek-v4-flash y dejarán de estar disponibles después del 24 de julio de 2026 a las 15:59 UTC.[ | No conviene depender a largo plazo de los alias antiguos. |
1. La ventana de contexto de 1 millón de tokens es el cambio más visible
La diferencia más llamativa de DeepSeek V4 Preview es su ventana de contexto de 1 millón de tokens.[3] En la práctica, esto importa cuando una sola llamada al modelo debe incluir muchos archivos de un repositorio, documentación técnica larga, logs extensos, historial conversacional o una cadena de tareas de agente con varios pasos.
Eso no significa que el contexto largo empiece con V4. DeepSeek-V3.2-Exp ya había introducido DeepSeek Sparse Attention, descrita como una técnica para hacer más eficientes el entrenamiento y la inferencia con contexto largo.[20] La lectura más prudente es esta: V4 coloca el contexto largo en el centro de la nueva generación, mientras V3.2-Exp fue una rama experimental importante en la misma dirección.[
3][
20]
2. V4-Pro y V4-Flash separan mejor calidad y eficiencia
En la generación V3.2, el changelog de DeepSeek lista DeepSeek-V3.2 y DeepSeek-V3.2-Speciale.[22] Con V4, la página Preview separa la familia en DeepSeek-V4-Pro y DeepSeek-V4-Flash.[
3]
Según la página de V4 Preview, V4-Pro tiene 1,6 T de parámetros totales y 49.000 millones de parámetros activos, mientras que V4-Flash tiene 284.000 millones de parámetros totales y 13.000 millones de parámetros activos.[3] Esto permite una evaluación más práctica: probar V4-Pro para tareas difíciles en las que prima la calidad, y probar V4-Flash cuando haya que medir equilibrio entre calidad, latencia, coste y throughput en muchas solicitudes.
La recomendación sencilla: no elijas solo por el nombre del modelo. Ejecuta el mismo conjunto de prompts, con los mismos datos, límites de tokens y criterios de evaluación, contra V3.2, V4-Flash y V4-Pro antes de cambiar el modelo por defecto.
3. El coding agentivo pasa a primer plano
DeepSeek V3.2 ya era una versión relevante para agentes: su release destacaba la combinación de thinking y tool-use.[16] Es decir, V3.2 no estaba pensada únicamente para respuestas de una sola vuelta, sino también para flujos en los que el modelo razona, llama herramientas, lee resultados y continúa el proceso.
V4 Preview sigue esa línea, pero enfatiza más el coding agentivo: flujos donde el modelo debe leer contexto de código, planificar, editar y coordinar varios pasos, en lugar de limitarse a generar un fragmento corto de código.[3]
Por tanto, la diferencia no es que V3.2 no sirva para agentes y V4 sí. La diferencia razonable es que V3.2 asentó la base de reasoning y tool-use, mientras que V4 intenta ampliar esa dirección hacia agentes de programación y workflows de contexto largo.[3][
16]
4. Los benchmarks son una señal, no una garantía de rendimiento
DeepSeek publica benchmarks y posicionamiento de rendimiento tanto en la página de V3.2 Release como en la de V4 Preview Release.[3][
16] Además, un análisis técnico externo sobre los modelos DeepSeek de V3 a V3.2 considera que V3.2 merece atención por su rendimiento y por estar disponible como modelo de pesos abiertos.[
1]
La cautela es importante: las fuentes disponibles aquí son, sobre todo, release notes, documentación de API y análisis técnicos basados en información publicada. Sirven para orientar una decisión de actualización, pero no sustituyen un benchmark interno sobre tu workload real.[3][
16][
23]
En producción, la pregunta útil no es si V4 suena más nuevo. Es qué modelo funciona mejor con tus prompts, tus datos, tu presupuesto de tokens, tu SLA de latencia y tu propia escala de calidad. Si eso aún no está medido, V4 debería verse como un candidato fuerte para pruebas, no como un reemplazo automático.
5. La migración de API no es un detalle menor
La parte menos vistosa, pero probablemente más delicada, está en los nombres de modelo. DeepSeek indica en V4 Preview que deepseek-chat y deepseek-reasoner ahora enrutan a deepseek-v4-flash en modos non-thinking y thinking, y que quedarán totalmente retirados después del 24 de julio de 2026 a las 15:59 UTC.[3]
Esto importa porque la documentación anterior de la API decía que deepseek-chat y deepseek-reasoner correspondían a DeepSeek-V3.2.[23] Si tu sistema de producción llama a un alias en lugar de a un ID de modelo específico, el comportamiento del modelo puede cambiar sin que tú lo controles de forma explícita.
En integración, la documentación de DeepSeek señala que su API usa un formato compatible con OpenAI, de modo que puede utilizarse el SDK de OpenAI o software compatible ajustando el endpoint.[23] DeepSeek también tiene documentación de compatibilidad con la API de Anthropic, donde enumera el soporte para campos como
max_tokens, stream, system, temperature y thinking.[13]
Checklist mínimo de migración:
- Revisa código, configuración y secretos para detectar si el sistema llama a
deepseek-chat,deepseek-reasonero a un ID de modelo concreto.[3]
- Vuelve a probar los prompts en modo thinking y non-thinking si tu workflow usa reasoning.[
3]
- Mide de nuevo latencia, coste, tasa de errores, timeouts y calidad de respuesta con datos reales.
- Sal de los alias antiguos antes del 24 de julio de 2026 a las 15:59 UTC.[
3]
- Revisa los campos de API si utilizas capas de compatibilidad con OpenAI o Anthropic.[
13][
23]
Entonces, ¿conviene pasar de DeepSeek V3.2 a V4?
Tiene sentido probar V4 si necesitas una ventana de contexto muy larga, estás construyendo agentes de programación, quieres comparar V4-Pro en tareas difíciles o quieres evaluar V4-Flash para cargas con muchas solicitudes.[3]
Tiene sentido mantener V3.2 como base de referencia si tu pipeline actual es estable, aún no necesitas contexto de 1 millón de tokens o producción exige más benchmarks internos antes de cambiar de modelo.[16]
En resumen: V3.2 fue un salto importante en reasoning y tool-use; V4 Preview es el siguiente paso en contexto largo, división V4-Pro/V4-Flash y coding agentivo.[3][
16] Para un equipo técnico, el punto crítico no es solo la calidad del modelo: también es planificar la salida de los alias de API antiguos antes de su retirada oficial.[
3]




