KI-Souveränität: Warum DeepSeek V4 das strategische Kalkül der Großunternehmen verändert
Fortsetzung von Kostenlose KI gibt es nicht. Der vorangegangene Artikel hielt fest, dass das aktuelle Zeitfenster das günstigste ist, das wir auf lange Sicht erleben werden, und dass der Weg, der sich wirklich auszahlt, über ein Premium-Modell und ein ernstzunehmendes agentisches System führt. Dieser Artikel öffnet den dritten Weg, der zum Schluss angedeutet wurde: für große Organisationen die Möglichkeit, ein Modell der SOTA-Klasse auf eigener Infrastruktur zu betreiben — mit allem, was sich daraus eröffnet, und allem, was es verlangt.
Januar 2026, IT-Komitee eines großen französischen Industriekonzerns. Zweiundzwanzig Teilnehmer um einen ovalen Tisch, zwei Wandbildschirme, die noch die Folien des letzten Quartalsberichts zeigen. Der CIO projiziert eine Karte der Datenströme — die Geschäftskorpora, die täglich zu den APIs von Anthropic in Dublin, von OpenAI in Frankfurt, von Google in Eemshaven abfließen. Seit drei Jahren wird die Frage gestellt und vertagt: „Wer besitzt unsere Daten, wenn unsere KI auf Servern läuft, die wir nicht kontrollieren?". Drei Jahre voller beruhigender kommerzieller Antworten — die SLAs, die Zertifizierungen, die vertraglichen Zusagen. Keine hält einem ernsthaften DSGVO-Audit oder einer halbwegs präzisen parlamentarischen Anfrage stand.
Drei Monate später, am 24. April 2026, veröffentlicht das DeepSeek-Team DeepSeek V4. Quellcode unter MIT-Lizenz, herunterladbare Gewichte, Kontextfenster von einer Million Tokens standardmäßig, eine Leistung, die Claude Opus 4.7 und GPT-5.5 dicht auf den Fersen ist, ohne sie noch einzuholen — aber zu einem Siebtel des Preises im Eigenbetrieb und auf interner Infrastruktur einsetzbar. Zum ersten Mal seit dem Ausbruch der generativen KI 2022 ist ein Modell nahe der Spitze offen und außerhalb der Server der drei amerikanischen proprietären Anbieter einsetzbar. Das strategische Kalkül der Großunternehmen, das in dieser Abhängigkeit verriegelt schien, öffnet sich auf einen dritten Weg.
Dieser Weg bleibt schmal, anspruchsvoll und jeder Logik unmittelbarer Ersparnis fremd. Er verändert die Natur der Debatte über die KI-Souveränität im Unternehmen — und verteilt für die Organisationen, die seine Schwelle überschreiten können, die Karten neu: Datenkontrolle, operative Resilienz, Wettbewerbsvorteil.
Proprietäres Modell, Open-Source-Modell: der konkrete Unterschied
Ein erheblicher Teil der IT-Entscheider verwechselt noch zwei Unterscheidungen, die nichts miteinander zu tun haben: proprietär / Open Source auf der einen Seite, kostenlos / kostenpflichtig auf der anderen. Die erste zu klären ist die Voraussetzung jeder ernsthaften Diskussion über Souveränität.
Ein proprietäres Modell — Claude Opus 4.7 bei Anthropic, GPT-5.5 bei OpenAI, Gemini Pro bei Google — ist ein System, dessen Code und Gewichte in den Servern des Anbieters verriegelt bleiben. Der Nutzer greift niemals direkt darauf zu. Er befragt das Modell über eine API: Er sendet seinen Text, das Modell verarbeitet die Anfrage auf der Infrastruktur des Anbieters, und die Antwort kommt zurück. Die Daten laufen über die Server des Anbieters. Der Anbieter kann jederzeit das Modell verändern, die Kapazität der Sitzung drosseln, eine Funktion entfernen, den Preis erhöhen oder den Dienst einstellen. Die Episoden von März/April 2026 — Drosselung der Claude-Max-Sitzungen, kurzzeitige Entfernung von Claude Code aus dem Pro-Tarif, Verdopplung des GPT-5-API-Preises beim Übergang zu GPT-5.5 — haben es schroff in Erinnerung gerufen.
Ein Open-Source-Modell — DeepSeek V4 bei DeepSeek, Llama bei Meta, Mistral Large bei Mistral — ist ein System, dessen Code und Gewichte veröffentlicht, herunterladbar und auf jedem GPU-Cluster mit der nötigen Rechenleistung einsetzbar sind. Der Nutzer hat zwei Optionen: das Modell über die API des Anbieters befragen (und dann laufen seine Daten wie bei einem proprietären Modell durch dessen Server) oder die Gewichte herunterladen und das Modell auf der eigenen Infrastruktur betreiben. Diese zweite Option verändert alles. Die Daten verlassen die Organisation nicht mehr. Das Modell kann von einem Dritten nicht mehr verändert, gedrosselt oder entfernt werden. Der Preis wird nicht mehr von einem Anbieter kontrolliert, der den Finanzierungsbedingungen des Risikokapitals ausgesetzt ist — er entspricht den physischen Inferenzkosten der internen Infrastruktur.
Die Unterscheidung ist operativ, bevor sie ideologisch ist. Sie eröffnet zum ersten Mal 2026 eine strategische Option, welche die proprietären Modelle ihrer Bauart nach ausschlossen.
DeepSeek ist chinesisch — und was das tatsächlich bedeutet
Eine Nuance, die oberflächliche Analysen zu schnell beiseiteschieben: DeepSeek ist ein chinesisches Unternehmen mit Sitz in Hangzhou, dessen Modell V4 in China trainiert wurde. Das hat zwei Konsequenzen, die man gleichzeitig im Blick behalten muss.
Wenn eine europäische Organisation DeepSeek V4 über die offizielle DeepSeek-API nutzt — api.deepseek.com — dann laufen ihre Geschäftsdaten über Server in China, werden auf der Infrastruktur eines dem chinesischen Recht unterworfenen Unternehmens verarbeitet und verlassen den Schutzbereich der DSGVO. Für sensible Daten — industrielles geistiges Eigentum, personenbezogene Daten, strategische Dossiers, öffentliche Aufträge, Verteidigungsdaten — ist das untragbar. Die Option DeepSeek-API ist im Hinblick auf die Souveränität strikt gleichbedeutend mit einer Datenübermittlung in ein Drittland ohne angemessenen Rahmen. Kein ernstzunehmendes Unternehmen sollte seine Geschäftskorpora dorthin legen.
Wenn dieselbe Organisation die Gewichte von DeepSeek V4 herunterlädt und sie auf ihrem eigenen GPU-Cluster betreibt, in Frankreich, in Deutschland oder in einer europäischen souveränen Cloud — wird die Lage radikal anders. Das Modell ist ein träges Objekt, das lokal ausgeführt wird. Keine Daten verlassen die Infrastruktur der Organisation, weder in die Vereinigten Staaten noch zum ursprünglichen Betreiber. Diese Konfiguration ist in der Praxis aus Sicht der Datensouveränität sicherer als eine API-Nutzung von Anthropic, OpenAI oder Google, weil sie die Bedingung der Übermittlung selbst beseitigt.
Der chinesische Ursprung des Modells bleibt gleichwohl bestehen, in Gestalt eines verbleibenden Risikos, das es zu bewerten gilt: Trainingsverzerrungen im Zusammenhang mit dem chinesischen Korpus, Abdeckungsgrenzen bei bestimmten kulturellen oder rechtlichen europäischen Kontexten, die theoretische — bis heute nicht nachgewiesene — Möglichkeit unerwarteter, in die Gewichte eingeschleuster Verhaltensweisen. Diese Risiken sind ernst, sie verlangen eine gründliche technische Prüfung vor jedem Einsatz, und sie verbieten die blinde Nutzung. Sie sind jedoch anderer Natur und deutlich messbarer als eine tägliche Datenübermittlung an eine ausländische Einheit per API.
Die Lektion ist präzise: DeepSeek über die chinesische API nutzen = Datenübermittlung nach China = inakzeptabel für die Mehrheit der Anwendungsfälle im Unternehmen. DeepSeek intern betreiben = keine Datenübermittlung = die schützendste Konfiguration. Das sind zwei entgegengesetzte Entscheidungen auf der Souveränitätsachse, getroffen am selben Modell.
Die Leistung: Verfügbarkeit nicht mit Parität verwechseln
Anzuerkennen, dass DeepSeek V4 offen und einsetzbar ist, lässt die Frage seiner Qualität unberührt. Diese verdient eine präzise Antwort, denn sie bestimmt den richtigen Einsatz des Modells.
Die Benchmarks, die am Tag nach der Veröffentlichung von V4-Pro und V4-Flash Mitte April 2026 erschienen sind, zeichnen ein stimmiges Bild. Bei der kompetitiven Programmierung (Codeforces) setzt sich V4-Pro an die Spitze. Bei den Inferenzkosten zerschmettert V4 die Konkurrenz buchstäblich — V4-Pro zu 1,74 Dollar je Million Eingabe-Tokens und 3,48 Dollar in der Ausgabe gegenüber 5 und 25 bei Opus 4.7, gegenüber 5 und 30 bei GPT-5.5. Im Verhältnis von Kosten zu Qualität ist es im April 2026 das beste Angebot des Marktes.
Beim Spitzenniveau des Schließens hingegen bleibt Claude Opus 4.7 vorn. Bei GPQA Diamond, das wissenschaftliches Schließen auf Doktorandenniveau prüft, erzielt Opus 4.7 94,2 % gegenüber 90,1 % für V4-Pro-Max. Bei Humanity's Last Exam ohne Werkzeuge erreicht Opus 4.7 46,9 % gegenüber 37,7 % für V4. Bei SWE-bench Pro, das die Fähigkeit eines Modells misst, reale Fehler in großen Codebasen zu beheben, führt Opus 4.7 mit 64,3 % gegenüber 55,4 % für V4-Pro. GPT-5.5 seinerseits führt bei agentischen Langzeitaufgaben und bestimmten Wissens-Benchmarks.
Der Abstand bemisst sich in wenigen Prozentpunkten — vier bis neun je nach Test — ohne dass sich an seiner Struktur etwas änderte. Bei den anspruchsvollsten Akten, im tiefen Schließen, in der Kohärenz über lange Schlussketten, in der Fähigkeit, den Fallstricken verzwickter Fragen zu widerstehen, behält Opus 4.7 einen Vorsprung. Eine reale Marge, niemals ein Abgrund.
Diese Marge hat eine entscheidende operative Konsequenz. DeepSeek V4 ist zu etwas anderem bestimmt, als bei den kritischen Akten „billiger" zu sein. Ein leistungsschwächeres Modell für die strategische Analyse einer Ausschreibung zu wählen, unter dem Vorwand, dass es ein Siebtel kostet, läuft darauf hinaus, einen Junior-Vorstandschef einzustellen, weil er weniger kostet als ein erfahrener. Die Abwägung ist von ihrer Bauart her falsch. Beim kritischen Akt nimmt man das beste verfügbare Werkzeug, weil der Unterschied in der Endqualität den Unterschied bei den Inferenzkosten weitaus mehr als aufwiegt.
Warum dann DeepSeek in die Architektur aufnehmen
Wenn V4 bei den kritischen Akten nicht die richtige Wahl ist — wozu dient es? Fünf strategische Gründe rechtfertigen seine Integration in eine ernstzunehmende Architektur.
Bestimmte Aufgaben optimieren. Bei den Zwischenakten einer agentischen Kette — Extraktion der Anforderungen eines CCTP, Zusammenfassung eines Absatzes, Rechtschreibprüfung, erstes Gerüst eines Kapitels, Erstellung einer Testmatrix aus einer Spezifikation — hört die Qualitätsmarge von Opus 4.7 auf, sich in operativen Wert zu übersetzen. Das Ergebnis hält stand. Bei diesen Akten teilt der Wechsel zu V4-Pro oder V4-Flash die Inferenzkosten bei gleichwertiger Qualität durch fünf bis zwanzig. Das ist Optimierung des Spending innerhalb der Kette, zu unterscheiden von einer Logik der Ersparnis beim gesamten Spending.
Resilienz gegenüber den Anbietern schaffen. Der April 2026 hat die Signale der Instabilität gehäuft: Max-Drosselung bei Anthropic, kurzzeitige Entfernung von Claude Code aus dem Pro-Tarif, Verdopplung des Preises GPT-5 → GPT-5.5, ausgelastete GPU-Kapazität bei allen Hyperscalern, Warteschlangen für die Chips. Wenn eine Produktionskette von einer einzigen proprietären API abhängt, hängt ihre Kontinuität von der Gesundheit eines dritten Anbieters ab — und kann ohne Vorwarnung abreißen. Über einen intern betriebenen Open-Source-Fallback zu verfügen, sei er auch von leicht geringerer Qualität, sichert die Kontinuität.
Eine Option auf die künftigen Generationen nehmen. Der Leistungsabstand zwischen Open Source und proprietärem SOTA hat sich seit 2023 stetig verringert — Llama 2, Llama 3, Mixtral, DeepSeek V2, V3, V3.2, V4. Die Bahn setzt sich in dieselbe Richtung fort, ohne Signal einer Umkehr. Eine Organisation, die 2026 in die Infrastruktur und die Kompetenzen investiert, um ein Open-Source-Modell der SOTA-Klasse zu betreiben, schafft die Bedingungen, um 2027 und 2028 zu ernten, auf Modellen, die wahrscheinlich tatsächlich gleichauf liegen und im Betrieb stets deutlich günstiger sind. Die wahre strategische Frage verschiebt sich also von „Ist V4 heute so gut wie Opus?" hin zu „Wird die nächste Open-Source-Generation gut genug sein, zu weit geringeren Kosten, um zum Standard zu werden?". Die rationale Wette antwortet mit ja.
Eine Souveränitätsmarge bewahren. Für die sensibelsten Geschäftskorpora — industrielles geistiges Eigentum, M&A-Dossiers, Verteidigungsdaten, öffentliche Aufträge, pharmazeutische Grundlagenforschung — ist der Einsatz der KI-Verarbeitung auf interner Infrastruktur mit einem Open-Source-Modell die einzige Option, die garantiert, dass keine Daten die Organisation verlassen. Die Sensibilität der Daten, nicht die Inferenzkosten, ist der richtige Schiedsrichter.
Die regulatorische Vertraulichkeit wahren. Über die geschäftliche Sensibilität hinaus unterliegen bestimmte Daten regulatorischen Auflagen (DSGVO für personenbezogene Daten, ärztliche Schweigepflicht, Bankgeheimnis, Verteidigungsgeheimnis, strategisch identifizierende Daten im Sinne der europäischen Verordnung KI-Verordnung 2024), die eine Übermittlung an eine Dritt-API, selbst vertraglich abgesichert, rechtlich brüchig machen. Die Option eines Open-Source-Modells im Hause legt die Verarbeitung in den Compliance-Perimeter der Organisation und vereinfacht das Audit-Dossier.
Keiner dieser fünf Gründe lautet für sich genommen „billiger sein". Der vierte und der fünfte sind die strukturierendsten; die ersten drei sind ernstzunehmende Optimierungen, die sich auf der Ebene der Nutzung messen.
Drei strategische Positionierungen 2026
Die Ankunft von DeepSeek V4 lässt die proprietären Modelle an ihrem Platz und eröffnet daneben ein Raster mit drei Positionierungen, kalibriert auf die Größe der Organisation, die Sensibilität der verarbeiteten Daten und die Reife der internen MLOps-Kompetenzen.
Stufe 1 — Konsument. Unternehmensabonnement bei einem proprietären SOTA-Anbieter (Claude Enterprise, ChatGPT Enterprise, Gemini for Workspace), ohne interne Infrastruktur. Das ist die richtige Abwägung für KMU, Mittelstand und Großunternehmen, deren von KI verarbeitete Daten weder einer kritischen geschäftlichen Sensibilität noch einer starken regulatorischen Auflage unterliegen. Das ist die Option C aus dem vorangegangenen Artikel — der Weg, der sich auszahlt für Organisationen, die weder die Rechenleistung noch die Kompetenzen noch den Souveränitätsdruck haben, um darüber hinauszugehen.
Stufe 2 — Hybrid. Proprietäre Modelle bei den kritischen Akten, die wenig sensible Daten verarbeiten (Analyse öffentlicher Ausschreibungen, Lektüre nicht vertraulicher Geschäftsdokumente, Schreibunterstützung auf öffentlichem Korpus), und Open-Source-Modelle im Hause bei den Akten, die sensible Daten verarbeiten. Diese Architektur verbindet die SOTA-Qualität dort, wo sie sich auszahlt, mit der Beherrschung der Daten dort, wo sie verlangt ist. Sie passt zu ernstzunehmenden IT-Dienstleistern, zu Beratungshäusern mit starken Vertraulichkeitsverpflichtungen, zu Industrieunternehmen mit einem Anteil strategischen geistigen Eigentums.
Stufe 3 — Souverän. Vollständiger Einsatz eines Open-Source-Modells der SOTA-Klasse auf eigener oder europäischer souveräner Infrastruktur, Finetuning auf internem Geschäftskorpus, durchgängig beherrschte Inferenzkette. Das ist die Positionierung der Zentralbanken, der Verteidigungsbetreiber, der großen Pharmakonzerne in ihrer Grundlagenforschung, der öffentlichen Betreiber bei den hoheitlichen Daten und einiger strategischer Industrieunternehmen. Es ist auch die Positionierung, zu der die europäische KI-Verordnung bestimmte Branchen mittelfristig drängen wird.
Keine Stufe ist „besser" im Absoluten. Sie entsprechen objektiven Konfigurationen — Größe, Sensibilität, Kompetenzen, Regulierung. Der große Fehler der nächsten beiden Jahre wird darin bestehen, zur Stufe 3 übergehen zu wollen, ohne deren Bedingungen zu erfüllen.
Die Falle der souveränen Illusion
Viele IT-Leitungen werden 2026 und 2027 ankündigen, sie betrieben „ihre souveräne KI". Drei Muster des Scheiterns wurden bei den ersten Open-Source-Einsätzen bereits beobachtet.
Der Einsatz ohne ernsthaftes MLOps. DeepSeek V4 herunterzuladen und auf zwei H100 laufen zu lassen, bleibt weit unter dem Nötigen. Die Leistung eines Modells der SOTA-Klasse hängt von einer Optimierungskette ab — Quantisierung, effiziente Attention, Batching, KV-Cache-Management, MoE-Routing, Drift-Monitoring —, die ein dediziertes und erfahrenes MLOps-Team verlangt. Ohne dieses Team findet sich die Organisation mit einem intern betriebenen Modell wieder, das eine ungeschickte Nutzung des proprietären SOTA unterbietet, bei vollen Infrastrukturkosten. Das Schlechteste aus beiden Welten.
Das Fehlen von geschäftlichem Finetuning. Eines der stärksten Argumente von Open Source ist die Möglichkeit, das Modell auf dem internen Korpus der Organisation zu finetunen — Historie der Ausschreibungsantworten, Produktdokumentation, geschäftliche Praxis, Erfahrungsrückmeldungen. Ohne diese Anstrengung bleibt das intern betriebene Modell generisch. Man hat eine teure Infrastruktur bezahlt, um nachzubilden, was die API anbietet, nur schlechter. Das Finetuning, anspruchsvoll — es setzt saubere Daten, eine Methodik, eine Infrastruktur zur fortlaufenden Evaluation voraus —, bildet gerade die wirtschaftliche Rechtfertigung der Stufe 3.
Das schlecht aufgebaute RAG auf dem internen Modell. Der häufigste und tückischste Fehler. Die Organisation betreibt ihr Open-Source-Modell im Hause, nutzt es aber nach einer mittelmäßigen RAG-Architektur — schlecht gewählte Embeddings, zu feines Chunking, fehlender Cross-Encoder, fehlende Deduplizierung. Das Ergebnis auf langen Korpora bildet intern alle Mängel nach, die man den Massenwerkzeugen in der Copilot-Illusion vorwarf, obendrein zu den Kosten einer dedizierten Infrastruktur. Die technische Souveränität der Daten bleibt gewahrt; die kognitive Qualität des Liefergegenstands aber bricht zusammen.
Souveränität baut sich auf, statt dass man sie dekretiert. Sie verlangt ein Team, das den Zyklus Training–Einsatz–Monitoring auf Dauer beherrscht, und kein Projekt von zwei Quartalen.
Strategisches Fazit
Für einen CIO, einen KI-Sponsor, einen Executive-Sponsor einer großen Organisation gebietet die Ankunft von DeepSeek V4 weniger eine unmittelbare Entscheidung als eine strukturierte Frage, die in den kommenden Wochen ins Komitee zu tragen ist.
Welche Geschäftsdaten verlassen heute die Organisation in Richtung einer KI-API, und wie hoch ist die reale Sensibilität dieser Daten — im Sinne der DSGVO, im strategischen Sinne, im vertraglichen Sinne?
Welche Positionierungsstufe (1, 2, 3) entspricht unserer Größenordnung, unserer Branche, unserem regulatorischen Druck und der aktuellen Reife unserer MLOps-Teams?
Wenn wir uns für Stufe 2 oder 3 entscheiden, mit welchem Perimeter beginnen wir, mit welchen Daten und mit welchem Team — intern, erweitert oder in Partnerschaft mit einem ernstzunehmenden Integrator?
Das Zeitfenster 2026–2027 ist jenes, in dem diese Entscheidungen strukturierend werden. DeepSeek V4 hat die Tür geöffnet. Die folgenden Generationen — V5, V6 und die Open-Source-Konkurrenten, die in derselben Spur nachdrängen werden — werden sie immer weiter aufmachen. Es bleibt zu entscheiden, ob man sie durchschreitet, in welchem Tempo und mit welchen Mitteln.
Vorbehalten einer Minderheit von Organisationen, die deren Schwelle tragen können, lässt die Option die Mehrheit des Marktes außen vor. Für die großen Organisationen hingegen, die sensible Daten verarbeiten, verändert sie die Natur der Debatte über KI im Unternehmen selbst. Vor DeepSeek V4 war die KI-Souveränität eine Grundsatzerklärung. Von nun an ist sie ein Investitionsvorhaben.
Hauptquellen: DeepSeek-AI, „DeepSeek V4 Preview Release", api-docs.deepseek.com, 24. April 2026. Hugging Face, „deepseek-ai/DeepSeek-V4-Pro", huggingface.co, April 2026. VentureBeat, „DeepSeek V4 arrives with near state-of-the-art intelligence at 1/6th the cost of Opus 4.7, GPT-5.5", April 2026. Artificial Analysis, „DeepSeek V4 Pro (Max) — Intelligence, Performance & Price Analysis", artificialanalysis.ai, April 2026. BenchLM.ai, „DeepSeek V4 Pro vs Claude Opus 4.7 vs GPT-5.5: The Frontier in April 2026", April 2026. SemiAnalysis, „The Coding Assistant Breakdown", newsletter.semianalysis.com, 2026. Anthropic, „Claude Mythos Preview / Project Glasswing", red.anthropic.com, 7. April 2026. Verordnung (EU) 2024/1689 vom 13. Juni 2024 zur Festlegung harmonisierter Vorschriften für künstliche Intelligenz (KI-Verordnung). CNIL, „IA et RGPD : recommandations relatives au développement de systèmes d'IA", 2025. Patterson et al., „The Carbon Footprint of Machine Learning Training Will Plateau, Then Shrink", IEEE Computer 2022. Stanford HAI, „AI Index Report 2025", Kap. 4 (Economy) und Kap. 6 (Policy). Lewis et al., „Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks", NeurIPS 2020.