Soberanía de la IA: por qué DeepSeek V4 cambia el cálculo estratégico de las grandes empresas
Continuación de La IA gratuita no existe. El artículo anterior planteaba que la ventana actual es la más barata que veremos en mucho tiempo, y que la vía que de verdad rinde pasa por un modelo premium y un sistema agéntico serio. Este artículo abre la tercera vía evocada en el cierre: para las grandes organizaciones, la posibilidad de desplegar un modelo de clase SOTA sobre infraestructura propietaria — y todo lo que eso abre, y todo lo que eso exige.
Enero de 2026, comité de TI de un gran grupo industrial francés. Veintidós participantes alrededor de una mesa ovalada, dos pantallas murales que aún muestran las diapositivas de la última revisión trimestral. El director de sistemas proyecta un mapa de los flujos de datos — los corpus de negocio que parten diariamente hacia las API de Anthropic en Dublín, de OpenAI en Fráncfort, de Google en Eemshaven. Tres años que la pregunta se plantea y se aplaza: «¿quién posee nuestros datos cuando nuestra IA funciona sobre servidores que no controlamos?». Tres años de respuestas comerciales tranquilizadoras — los SLA, las certificaciones, los compromisos contractuales. Ninguna resiste una auditoría RGPD seria ni una pregunta parlamentaria algo precisa.
Tres meses más tarde, el 24 de abril de 2026, el equipo de DeepSeek publica DeepSeek V4. Código fuente MIT, pesos descargables, contexto de un millón de tokens en estándar, rendimientos que pisan los talones a Claude Opus 4.7 y GPT-5.5 sin igualarlos todavía — pero a una séptima parte del precio en uso propietario, y desplegables sobre infraestructura interna. Por primera vez desde la erupción de la IA generativa en 2022, un modelo cercano a la cima es abierto y desplegable fuera de los servidores de los tres editores propietarios estadounidenses. El cálculo estratégico de las grandes empresas, que parecía bloqueado sobre esta dependencia, se abre a una tercera vía.
Esta vía sigue siendo estrecha, exigente y ajena a toda lógica de ahorro inmediato. Cambia la naturaleza del debate sobre la soberanía de la IA en la empresa — y redistribuye, para las organizaciones que pueden franquear su umbral, las cartas del control de los datos, la resiliencia operativa y la ventaja competitiva.
Modelo propietario, modelo open source: la diferencia concreta
Una parte significativa de los responsables de TI sigue confundiendo dos distinciones que no tienen nada que ver: propietario / open source por un lado, gratuito / de pago por el otro. Clarificar la primera es la condición de toda discusión seria sobre la soberanía.
Un modelo propietario — Claude Opus 4.7 en Anthropic, GPT-5.5 en OpenAI, Gemini Pro en Google — es un sistema cuyo código y cuyos pesos permanecen bloqueados en los servidores del editor. El usuario nunca accede a ellos directamente. Interroga al modelo mediante una API: envía su texto, el modelo procesa la petición sobre la infraestructura del editor, y la respuesta regresa. Los datos transitan por los servidores del editor. El editor puede, en todo momento, modificar el modelo, limitar la capacidad de la sesión, retirar una funcionalidad, aumentar el precio o interrumpir el servicio. Los episodios de marzo-abril de 2026 — limitación de las sesiones Claude Max, retirada efímera de Claude Code del plan Pro, duplicación del precio de la API GPT-5 en el paso a GPT-5.5 — lo recordaron brutalmente.
Un modelo open source — DeepSeek V4 en DeepSeek, Llama en Meta, Mistral Large en Mistral — es un sistema cuyo código y cuyos pesos se publican, se descargan y se despliegan sobre cualquier clúster GPU que disponga de la potencia necesaria. El usuario tiene dos opciones: interrogar al modelo mediante la API del editor (y entonces sus datos transitan como con un modelo propietario), o descargar los pesos y hacer funcionar el modelo sobre su propia infraestructura. Esta segunda opción lo cambia todo. Los datos ya no salen de la organización. El modelo ya no puede ser modificado, limitado ni retirado por un tercero. El precio ya no lo controla un editor expuesto a las condiciones de financiación del capital riesgo, sino que es igual al coste de inferencia físico de la infraestructura interna.
La distinción es operativa antes que ideológica. Abre, por primera vez en 2026, una opción estratégica que los modelos propietarios excluían por construcción.
DeepSeek es chino — y lo que eso implica realmente
Un matiz que los análisis superficiales descartan demasiado rápido: DeepSeek es una empresa china con sede en Hangzhou, cuyo modelo V4 fue entrenado en China. Esto tiene dos consecuencias que hay que sostener simultáneamente.
Si una organización europea utiliza DeepSeek V4 mediante la API oficial de DeepSeek — api.deepseek.com — entonces sus datos de negocio transitan por servidores en China, son procesados sobre la infraestructura de una empresa sometida al derecho chino, y salen del perímetro de protección RGPD. Para datos sensibles — propiedad intelectual industrial, datos personales, expedientes estratégicos, contratos públicos, datos de defensa — es inaceptable. La opción API DeepSeek es estrictamente equivalente, en el plano de la soberanía, a una transferencia de datos hacia un país tercero sin marco adecuado. Ninguna empresa seria debería poner ahí sus corpus de negocio.
Si la misma organización descarga los pesos de DeepSeek V4 y los despliega sobre su propio clúster GPU, en Francia, en Alemania, o en una nube soberana europea — la situación se vuelve radicalmente diferente. El modelo es un objeto inerte que se ejecuta localmente. Ningún dato sale de la infraestructura de la organización, ni hacia Estados Unidos, ni siquiera hacia el operador de origen. Esta configuración es, en la práctica, más segura desde el punto de vista de la soberanía de los datos que un uso por API de Anthropic, OpenAI o Google, porque elimina la condición misma de la transferencia.
El origen chino del modelo subsiste, sin embargo, en forma de un riesgo residual a evaluar: sesgos de entrenamiento ligados al corpus chino, límites de cobertura en ciertos contextos culturales o jurídicos europeos, posibilidad teórica — no demostrada hasta la fecha — de comportamientos inesperados inyectados en los pesos. Estos riesgos son serios, exigen una revisión técnica en profundidad antes de todo despliegue, y prohíben el uso ciego. No obstante, son de una naturaleza diferente, y significativamente más medible, que una transferencia diaria de datos hacia una entidad extranjera mediante API.
La lección es precisa: usar DeepSeek mediante API china = transferencia de datos hacia China = inaceptable para la mayoría de los casos de uso empresarial. Desplegar DeepSeek internamente = ninguna transferencia de datos = la configuración más protectora. Son dos decisiones opuestas sobre el eje de la soberanía, tomadas sobre el mismo modelo.
El rendimiento: no confundir disponibilidad y paridad
Reconocer que DeepSeek V4 es abierto y desplegable deja intacta la cuestión de su calidad. Esta merece una respuesta precisa, porque condiciona el buen uso del modelo.
Los benchmarks publicados al día siguiente de la salida de V4-Pro y V4-Flash, a mediados de abril de 2026, dibujan un cuadro coherente. En programación competitiva (Codeforces), V4-Pro toma la cabeza. En coste de inferencia, V4 aplasta literalmente a la competencia — V4-Pro a 1,74 dólares por millón de tokens en entrada y 3,48 dólares en salida, frente a 5 y 25 de Opus 4.7, frente a 5 y 30 de GPT-5.5. En la relación coste-calidad, es la mejor oferta del mercado en abril de 2026.
En el razonamiento de vanguardia, en cambio, Claude Opus 4.7 sigue por delante. En GPQA Diamond, que prueba el razonamiento científico de nivel doctoral, Opus 4.7 obtiene un 94,2 % frente al 90,1 % de V4-Pro-Max. En Humanity's Last Exam sin herramientas, Opus 4.7 alcanza el 46,9 % frente al 37,7 % de V4. En SWE-bench Pro, que mide la capacidad de un modelo para resolver bugs reales en grandes bases de código, Opus 4.7 va en cabeza con un 64,3 % frente al 55,4 % de V4-Pro. GPT-5.5, por su parte, encabeza las tareas agénticas de larga duración y ciertos benchmarks de conocimiento.
La diferencia se cuenta en unos pocos puntos porcentuales — de cuatro a nueve según las pruebas — sin ceder nada de su estructura. En los actos más exigentes en razonamiento profundo, en coherencia sobre largas cadenas de inferencia, en capacidad de resistir las trampas de las preguntas retorcidas, Opus 4.7 conserva una ventaja. Un margen real, jamás un abismo.
Este margen tiene una consecuencia operativa decisiva. DeepSeek V4 está destinado a otra cosa que a hacer «más barato» en los actos críticos. Elegir un modelo menos eficaz para tratar un análisis estratégico de licitación con el pretexto de que cuesta una séptima parte del precio equivale a contratar a un consejero delegado júnior porque cuesta menos que un consejero delegado experimentado. El arbitraje es falso por construcción. En el acto crítico, se toma la mejor herramienta disponible, porque la diferencia de calidad final compensa con creces la diferencia de coste de inferencia.
Por qué incluir entonces a DeepSeek en la arquitectura
Si V4 no es la elección correcta en los actos críticos, ¿para qué sirve? Cinco razones estratégicas justifican su integración en una arquitectura seria.
Optimizar ciertas tareas. En los actos intermedios de una cadena agéntica — extracción de los requisitos de un CCTP, síntesis de un párrafo, verificación ortográfica, primer esqueleto de capítulo, producción de una rejilla de pruebas a partir de una especificación — el margen de calidad de Opus 4.7 deja de traducirse en valor operativo. El resultado se sostiene. En estos actos, bascular hacia V4-Pro o V4-Flash divide el coste de inferencia por cinco a veinte para una calidad equivalente. Es optimización del spending dentro de la cadena, a distinguir de una lógica de ahorro sobre el spending total.
Aportar resiliencia frente a los proveedores. Abril de 2026 acumuló las señales de inestabilidad: limitación Max en Anthropic, retirada efímera de Claude Code del plan Pro, duplicación del precio GPT-5 → GPT-5.5, capacidad GPU saturada en todos los hyperscalers, lista de espera para los chips. Cuando una cadena de producción depende de una sola API propietaria, su continuidad depende de la salud de un editor tercero — y puede romperse sin previo aviso. Disponer de un fallback open source desplegado internamente, aunque sea de una calidad ligeramente inferior, garantiza la continuidad.
Tomar una opción sobre las generaciones futuras. La diferencia de rendimiento entre el open source y el SOTA propietario se ha reducido constantemente desde 2023 — Llama 2, Llama 3, Mixtral, DeepSeek V2, V3, V3.2, V4. La trayectoria se prolonga en el mismo sentido, sin señal de inversión. Una organización que invierte en 2026 en la infraestructura y las competencias para explotar un modelo open source de clase SOTA instala las condiciones para cosechar, en 2027 y 2028, sobre modelos probablemente en paridad real, y siempre significativamente más baratos en su uso. La verdadera cuestión estratégica se desplaza por tanto de «¿es V4 tan bueno como Opus hoy?» hacia «¿será la próxima generación open source lo bastante buena, a un coste mucho menor, para convertirse en el estándar?». La apuesta racional responde que sí.
Conservar un margen de soberanía. Para los corpus de negocio más sensibles — propiedad intelectual industrial, expedientes de fusiones y adquisiciones, datos de defensa, contratos públicos, investigación farmacéutica temprana — desplegar el procesamiento de IA sobre infraestructura interna con un modelo open source es la única opción que garantiza que ningún dato salga de la organización. La sensibilidad del dato, no el coste de inferencia, es el árbitro correcto.
Preservar la confidencialidad reglamentaria. Más allá de la sensibilidad de negocio, ciertos datos están sometidos a obligaciones reglamentarias (RGPD para los datos personales, secreto médico, secreto bancario, secreto de defensa, datos de identificación estratégica en el sentido del reglamento europeo IA Act 2024) que vuelven jurídicamente frágil la transferencia hacia una API tercera, incluso asegurada por contrato. La opción de un modelo open source interno coloca el procesamiento dentro del perímetro de conformidad de la organización y simplifica el expediente de auditoría.
Ninguna de estas cinco razones es «costar menos» tomada aisladamente. La cuarta y la quinta son las más estructurantes; las tres primeras son optimizaciones serias que se miden a la escala del uso.
Tres posicionamientos estratégicos en 2026
La llegada de DeepSeek V4 deja a los modelos propietarios en su sitio y abre, junto a ellos, una rejilla de tres posicionamientos, calibrada según el tamaño de la organización, la sensibilidad de los datos tratados y la madurez de las competencias MLOps internas.
Nivel 1 — Consumidor. Suscripción empresarial con un editor SOTA propietario (Claude Enterprise, ChatGPT Enterprise, Gemini for Workspace), sin infraestructura interna. Es el arbitraje correcto para las pymes, las empresas de tamaño intermedio y las grandes empresas cuyos datos tratados por IA no responden ni a una sensibilidad de negocio crítica ni a una obligación reglamentaria fuerte. Es la opción C del artículo anterior — la vía que rinde para las organizaciones que no tienen ni el cálculo, ni las competencias, ni la presión de soberanía para ir más allá.
Nivel 2 — Híbrido. Modelos propietarios en los actos críticos que tratan datos poco sensibles (análisis de licitaciones públicas, lectura de documentos comerciales no confidenciales, soporte a la redacción sobre corpus público), y modelos open source internos en los actos que tratan datos sensibles. Esta arquitectura combina la calidad SOTA allí donde rinde y el dominio de los datos allí donde se exige. Conviene a las consultoras tecnológicas serias, a los despachos de consultoría con fuertes compromisos de confidencialidad, a las empresas industriales con una parte de propiedad intelectual estratégica.
Nivel 3 — Soberano. Despliegue completo de un modelo open source de clase SOTA sobre infraestructura propietaria o soberana europea, finetuning sobre corpus de negocio interno, cadena de inferencia dominada de extremo a extremo. Es el posicionamiento de los bancos centrales, de los operadores de defensa, de los grandes grupos farmacéuticos en su investigación temprana, de los operadores públicos sobre los datos soberanos, y de algunos industriales estratégicos. Es también el posicionamiento hacia el cual la directiva europea IA Act empujará, a término, a ciertos sectores.
Ningún nivel es «mejor» en términos absolutos. Corresponden a configuraciones objetivas — tamaño, sensibilidad, competencias, reglamentación. El gran error de los próximos dos años será pretender pasar al nivel 3 sin tener sus condiciones.
La trampa de la ilusión soberana
Muchas direcciones de TI van a anunciar en 2026 y 2027 que despliegan «su IA soberana». Tres patrones de fracaso ya observados en los primeros despliegues open source.
El despliegue sin MLOps serio. Descargar DeepSeek V4 y hacerlo funcionar sobre dos H100 queda muy lejos de lo necesario. El rendimiento de un modelo de clase SOTA depende de una cadena de optimización — cuantización, atención eficiente, batching, gestión del kv-cache, routing MoE, monitorización de la deriva — que exige un equipo MLOps dedicado y experimentado. A falta de este equipo, la organización se encuentra con un modelo desplegado internamente que rinde por debajo de un uso torpe del SOTA propietario, a coste de infraestructura pleno. Lo peor de ambos mundos.
La ausencia de finetuning de negocio. Uno de los argumentos más sólidos del open source es la posibilidad de hacer finetuning del modelo sobre el corpus interno de la organización — histórico de respuestas a licitaciones, documentación de producto, jurisprudencia de negocio, retornos de experiencia. A falta de este esfuerzo, el modelo desplegado internamente sigue siendo genérico. Se ha pagado una infraestructura costosa para reproducir lo que la API propone, peor. El finetuning, exigente — supone datos limpios, una metodología, una infraestructura de evaluación continua —, constituye precisamente la justificación económica del nivel 3.
El RAG mal arquitecturado sobre el modelo interno. El error más frecuente, y el más traicionero. La organización despliega su modelo open source internamente, pero lo utiliza según una arquitectura RAG mediocre — embeddings mal elegidos, chunking demasiado fino, ausencia de cross-encoder, ausencia de desduplicación. El resultado sobre los corpus largos reproduce internamente todos los defectos que se reprochaban a las herramientas de gran público en la ilusión Copilot, con además el coste de una infraestructura dedicada. La soberanía técnica de los datos queda preservada; la calidad cognitiva del entregable, en cambio, se desploma.
La soberanía se construye más que se decreta. Exige un equipo que domine el ciclo entrenamiento-despliegue-monitorización a lo largo del tiempo, y no un proyecto de dos trimestres.
Conclusión estratégica
Para un director de sistemas, un sponsor de IA, un sponsor ejecutivo de una gran organización, la llegada de DeepSeek V4 ordena menos una decisión inmediata que una pregunta estructurada que llevar al comité en las próximas semanas.
¿Qué datos de negocio salen hoy de la organización hacia una API de IA, y cuál es la sensibilidad real de esos datos — en el sentido RGPD, en el sentido estratégico, en el sentido contractual?
¿Qué nivel de posicionamiento (1, 2, 3) corresponde a nuestra escala, a nuestro sector, a nuestra presión reglamentaria, y a la madurez actual de nuestros equipos MLOps?
Si elegimos ir hacia el nivel 2 o 3, ¿en qué perímetro empezamos, con qué datos, y con qué equipo — interno, aumentado, o en colaboración con un integrador serio?
La ventana 2026-2027 es aquella en la que estas elecciones se vuelven estructurantes. DeepSeek V4 ha abierto la puerta. Las generaciones siguientes — V5, V6, y los competidores open source que van a empujar en la misma estela — la harán cada vez más ancha. Aún hay que decidir si se franquea, a qué ritmo, y con qué medios.
Reservada a una minoría de organizaciones capaces de soportar su umbral, la opción deja de lado a la mayoría del mercado. Para las grandes organizaciones que tratan datos sensibles, en cambio, cambia la naturaleza misma del debate sobre la IA en la empresa. Antes de DeepSeek V4, la soberanía de la IA era una petición de principio. A partir de ahora, es un proyecto de inversión.
Fuentes principales: DeepSeek-AI, «DeepSeek V4 Preview Release», api-docs.deepseek.com, 24 de abril de 2026. Hugging Face, «deepseek-ai/DeepSeek-V4-Pro», huggingface.co, abril de 2026. VentureBeat, «DeepSeek V4 arrives with near state-of-the-art intelligence at 1/6th the cost of Opus 4.7, GPT-5.5», abril de 2026. Artificial Analysis, «DeepSeek V4 Pro (Max) — Intelligence, Performance & Price Analysis», artificialanalysis.ai, abril de 2026. BenchLM.ai, «DeepSeek V4 Pro vs Claude Opus 4.7 vs GPT-5.5: The Frontier in April 2026», abril de 2026. SemiAnalysis, «The Coding Assistant Breakdown», newsletter.semianalysis.com, 2026. Anthropic, «Claude Mythos Preview / Project Glasswing», red.anthropic.com, 7 de abril de 2026. Reglamento (UE) 2024/1689 de 13 de junio de 2024 por el que se establecen normas armonizadas en materia de inteligencia artificial (IA Act). CNIL, «IA et RGPD: recommandations relatives au développement de systèmes d'IA», 2025. Patterson et al., «The Carbon Footprint of Machine Learning Training Will Plateau, Then Shrink», IEEE Computer 2022. Stanford HAI, «AI Index Report 2025», cap. 4 (Economy) y cap. 6 (Policy). Lewis et al., «Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks», NeurIPS 2020.