Warum die Verneinung wirksamer ist als eine Behauptung — und warum das nicht intuitiv ist
Fortsetzung des Artikels „Die Formel ‚nicht X, sondern Y‘ ist kein KI-Tic, sondern eine semantische Optimierung“. Dort vertraten wir die These, dass die Correctio strukturell wirksam ist. Hier steigen wir unter die Motorhaube: warum sie es mechanisch gesehen ist.
Bis 2024 beherrschte eine verstörende Tatsache die NLP-Literatur: Die großen Sprachmodelle vervollständigten den Satz „Vögel können nicht ___“ in der überwältigenden Mehrheit der Fälle mit „fliegen“. Allison Ettinger hatte dies als Erste in What BERT Is Not (TACL, 2020) nachgewiesen. Nora Kassner und Hinrich Schütze bestätigten es im selben Jahr in Negated and Misprimed Probes for Pretrained Language Models (ACL 2020, arXiv:1911.03343).
Ein Modell, trainiert auf Milliarden von Sätzen, fähig zur Lösung subtiler Inferenzaufgaben, ignorierte massenhaft das Wort „nicht“.
Diese Ära ist vorbei. Die Frontier-LLM von 2025-2026 — Claude Opus 4.6, GPT-5, Gemini 3 und ihre Nachfolger — bewältigen das Vögel-Beispiel und die meisten einfachen Verneinungen korrekt. Der qualitative Sprung ist real. Die Geschichte könnte hier enden.
Sie endet nicht. Denn der zugrunde liegende Mechanismus wurde nicht gelöst, er wurde kompensiert. Und genau dieser Mechanismus erklärt, warum die Correctio — „nicht X, sondern Y“ — selbst bei den jüngsten Modellen strukturell wirksamer bleibt als eine bloße Behauptung. Diesen Punkt zu verstehen, heißt zu verstehen, wie KI tatsächlich denkt.
Das historische Paradox, in Zahlen
Vier Studien waren zwischen 2020 und 2023 zu einem robusten Befund konvergiert.
Ettinger (2020) hatte gezeigt, dass BERT „A robin is a bird“ und „A robin is not a bird“ nahezu identische Wahrscheinlichkeiten zuwies. Das „not“ verschob die Ausgabeverteilung nicht signifikant.
Kassner & Schütze (2020) dokumentierten: BERT vervollständigte „Birds cannot ___“ in 85 % der Fälle mit „fly“. Die Unempfindlichkeit war strukturell bedingt.
Truong, Baldwin, Verspoor & Cohn (2023) erweiterten in Language Models Are Not Naysayers (arXiv:2306.08189) den Benchmark auf GPT-3, InstructGPT und Flan-T5. Das Instruction-Tuning verbesserte die Verarbeitung der Verneinung, löste sie aber nicht.
García-Ferrero et al. (2023) testeten in This is not a Dataset (EMNLP 2023, arXiv:2310.15941) 400.000 negative Sätze an LLaMA und GPT-3.5. Die Trefferquote stagnierte bei 50-60 %, in zahlreichen Kategorien also auf dem Niveau des Zufalls.
Das Muster war eindeutig: bis zu jenem Zeitpunkt verstanden LLM die isolierte Verneinung nur schwach.
Was die Frontier-Modelle verändert haben — und was nicht
Das schrittweise Aufkommen der Modelle mit explizitem Reasoning (o1, dann o3 von OpenAI, Claude Opus 3.5, dann 4.x von Anthropic, Gemini 2.5, dann 3 von Google) hat die Grenze verschoben. Bei den einfachen Verneinungs-Benchmarks stieg die Leistung in zwei Jahren von 55-65 % auf über 90 %. Das Vögel-Beispiel ist keine Falle mehr.
Dieser Sprung speist sich aus drei kombinierten Faktoren: der Skalierung (Parameter, Trainings-Tokens), den gezielt auf die Verneinung ausgerichteten Fine-Tuning-Datensätzen und dem Aufkommen zwischengeschalteter Reasoning-Durchläufe (Chain-of-Thought, Reasoning-Tokens), die es dem Modell erlauben, langsamer zu werden, zu explizieren, zu prüfen.
Der grundlegende Mechanismus selbst hat sich nicht verändert. Ein Transformer bleibt eine Architektur, in der jedes Token durch eine verteilte Attention gewichtet wird, in der die Ausgabe eine Wahrscheinlichkeitsverteilung über das Vokabular ist, in der die im großen Maßstab gelernten Assoziationen robuste lexikalische Priors bilden. Die Verneinung ist nach wie vor nicht als einheitlicher logischer Operator kodiert. Sie bleibt über mehrere Attention-Köpfe verstreut, deren Beitrag durch den Kontext gewichtet wird.
Bei komplexen Verneinungen — verschachtelte Reichweite, quantifizierte Verneinung, kontextuelle Verneinung in einem langen Dokument — bleiben die Frontier-Modelle deutlich unzuverlässiger als bei den äquivalenten Behauptungen. Der Gewinn von 2024-2026 stammt aus dem Training, nicht aus einer strukturellen Lösung des Problems.
Mit anderen Worten: Die heutigen LLM haben gelernt zu kompensieren. Sie haben nicht gelernt, die Verneinung anders zu verarbeiten. Und diese Kompensation bleibt fragil bei Fällen außerhalb der Trainingsverteilung.
Die andere, weniger bekannte Tatsache
Dieselben Modelle, die mit der isolierten Verneinung kämpften, verarbeiteten explizite kontrastive Strukturen bereits bemerkenswert gut — lange vor dem jüngsten qualitativen Sprung. Die Correctio gehört dazu.
Mishra et al. (2022) zeigten in Reframing Instructional Prompts to GPTk's Language (ACL Findings, arXiv:2109.07830), dass eine von „not X“ in „not X, do Y“ umgewandelte Anweisung die Leistung substanziell verbesserte, selbst bei GPT-2 und GPT-3.
Jang, Ye & Seo (2023) bestätigten dies in Can Large Language Models Truly Understand Prompts? A Case Study with Negated Prompts (arXiv:2209.12711). Rein negative Prompts („do not X“) verschlechterten die Leistung. Kontrastive Prompts („don't X, instead Y“) verbesserten sie, besonders nach RLHF-Alignment.
Der Grund für diese Asymmetrie ist kognitiv tiefgreifend. Ein LLM denkt nicht mit logischen Operatoren. Es denkt mit Wahrscheinlichkeitsverteilungen über Tokens, gewichtet durch einen Attention-Mechanismus. In diesem Regime übt eine isolierte Verneinung nur schwachen Druck auf die Ausgabeverteilung aus. Ein expliziter Kontrast hingegen mobilisiert dedizierte Attention-Köpfe und schränkt das Feld der wahrscheinlichen Fortsetzungen aktiv ein.
Attention, Wahrscheinlichkeiten und das Feld des Möglichen
Steigen wir in die Mechanik ein.
Ein Transformer erzeugt Text, indem er bei jedem Schritt eine Wahrscheinlichkeitsverteilung über das Vokabular produziert — typischerweise 30.000 bis 100.000 Tokens. Der Attention-Mechanismus gewichtet Schicht für Schicht die Eingabe-Tokens, um diese Verteilung zu beeinflussen. Clark, Khandelwal, Levy & Manning kartierten in What Does BERT Look At? (arXiv:1906.04341, BlackboxNLP 2019), was die verschiedenen Attention-Köpfe tun: einige folgen der Syntax, andere der Anapher, wieder andere spezifischen semantischen Relationen.
Geiger, Richardson & Potts (arXiv:2004.14623, BlackboxNLP 2020) zeigten, dass bestimmte Köpfe die Reichweite der Verneinung teilweise kodieren, aber nur einige und nur teilweise. Das Signal „not“ ist verstreut, niemals als einheitlicher Operator kodiert.
Konfrontiert mit einem isolierten negativen Satz wie „Vögel können nicht fliegen“ geschieht in einem Modell vor 2024 Folgendes:
Das Modell sieht „Vögel ... fliegen“. Der Kontext drängt massiv zur probabilistischen Assoziation Vögel → fliegen, gelernt aus Milliarden positiver Sätze. Das Token „nicht“ übt, Attention-Kopf für Attention-Kopf, nur schwachen Druck auf die Ausgabeverteilung aus. Die Mehrheit der Köpfe ignoriert das Signal. Eine Minderheit berücksichtigt es. Die Ausgabe bleibt vom Prior dominiert: „fliegen“.
Die Frontier-Modelle haben diese spezifische Schlacht durch gezieltes Training gewonnen. Sie haben gelernt, dass genau dieses Beispiel ihre Vorgänger in die Falle lockt, und haben sich angepasst. Doch die zugrunde liegende Mechanik — die Asymmetrie zwischen negativem Druck und lexikalischem Prior — ist nicht verschwunden. Sie taucht bei komplexeren oder verteilungsfremden Fällen wieder auf.
Sehen wir uns nun an, was mit einer Correctio geschieht, „Vögel sind keine Säugetiere. Es sind eierlegende Wirbeltiere.“
Drei Mechanismen kombinieren sich:
-
Auf die Verneinung folgt unmittelbar eine Alternative. Das Modell muss keinen Prior umkehren; es genügt ihm, die Wahrscheinlichkeit der richtigen Kategorie zuzuweisen, eierlegend, die ihm der zweite Satz explizit liefert.
-
Die pragmatische Asymmetrie (Horn, Levinson) aktiviert sich. Die Struktur „not X, but Y“ ist ein hochsalientes Markierungssignal im Trainingskorpus. Die Attention-Köpfe, die den Kontrastsignalen gewidmet sind — und die existieren, Geiger und Potts haben es gezeigt — lösen stark aus.
-
Das Feld der wahrscheinlichen Fortsetzungen schränkt sich durch explizite Eliminierung ein. Was das Modell an Konfidenz auf Säugetiere verliert, gewinnt es an Konfidenz auf eierlegend.
Die Verneinung allein kämpft schwerlich gegen den lexikalischen Prior. Die Correctio mobilisiert eben diesen Prior in die richtige Richtung.
Warum es eine Frage der Information ist, nicht der Logik
Diese Asymmetrie wurzelt in der Informationstheorie und der Pragmatik.
Laurence Horn hatte in A Natural History of Negation (University of Chicago Press, 1989) festgestellt, dass die Verneinung markiert ist: Sie ist kostspieliger in der Produktion und der Verarbeitung als die äquivalente Behauptung, doch sie trägt mehr Information in einem Kontext, in dem eine Standarderwartung existiert. Stephen Levinson formalisiert dieses Prinzip in Presumptive Meanings (MIT Press, 2000) mit seinen M-Heuristiken: „eine markierte Äußerung signalisiert eine Abweichung vom Erwarteten“.
Frank und Goodman gehen in Predicting Pragmatic Reasoning in Language Games (Science 336, 2012) mit dem RSA-Framework (Rational Speech Acts) noch weiter. Sie formalisieren mathematisch, dass die von einem Satz übermittelte Information ebenso sehr von dem abhängt, was er sagt, wie von den alternativen Sätzen, die der Sprecher hätte sagen können und nicht gesagt hat. Zu sagen „das ist nicht X“ signalisiert, dass X eine hinreichend saliente Hypothese war, um eine Widerlegung zu verdienen. Allein „das ist Y“ zu sagen, verliert dieses Signal.
Ein LLM, trainiert auf der menschlichen Sprache, verinnerlicht diese pragmatischen Muster, ohne deren Theorie zu besitzen. Die Correctio funktioniert, weil sie die informationelle Struktur der Sprache respektiert, so wie der Korpus sie gelehrt hat.
Die isolierte Verneinung ist arm an computationeller Information. Die Correctio ist reich an Informationsdichte pro Token.
Die tiefe Analogie: Contrastive Learning
Es gibt eine strukturelle Analogie zwischen der Correctio und einer Familie von Deep-Learning-Techniken, die seit 2020 explodiert ist: dem Contrastive Learning.
CLIP (Radford et al., 2021, arXiv:2103.00020), das Modell, das bei OpenAI Text und Bild verband, lernt durch kontrastive Paare. Ein Bild wird mit der korrekten Beschreibung assoziiert gegen eine Menge inkorrekter Beschreibungen. Das Lernsignal kommt aus der Differenz.
SimCSE (Gao, Yao & Chen, EMNLP 2021, arXiv:2104.08821) wendet dieselbe Idee auf die Produktion von Satz-Embeddings an. Zu lernen, was ein Satz nicht ist — was ihm nicht synonym ist, was nicht seinen Sinn teilt — ist ein informativeres Signal als zu lernen, was er ist.
Die Correctio ist die menschliche Version dieses Prinzips. Zu sagen „das ist keine Zusammenfassung“ heißt, dem Leser das negative Beispiel zu zeigen, seinen Kontrast zu aktivieren, bevor man ihm das positive Beispiel liefert. Der Leser lernt schneller, weil sich sein Repräsentationsraum explizit einschränkt. Es ist exakt die Operation, die CLIP und SimCSE mechanisch an Millionen von Paaren ausführen.
Die KI ist gut in der Correctio, weil das moderne Deep Learning in seiner Architektur selbst ein kontrastives Lernsystem ist. Die Correctio ist die linguistische Cousine seiner eigenen Verlustfunktion.
Die Implikation für die Praktiker
Die praktischen Konsequenzen sind unmittelbar.
Für das Prompt-Engineering. Eine isolierte negative Vorgabe („tu X nicht“) bleibt ein schwaches Signal, selbst bei den Frontier-Modellen. Eine kontrastive Vorgabe („tu X nicht, tu stattdessen Y“) bleibt ein starkes Signal. Die Prompting-Dokumentation von OpenAI und Anthropic empfiehlt im Übrigen ausdrücklich, Vorgaben positiv zu formulieren. Gemäß der Literatur (Mishra, Jang) ist diese Empfehlung suboptimal: Die kontrastive Formulierung übertrifft sowohl die rein negative als auch die rein positive, wenn beim Modell eine Standarderwartung existiert. Die RLHF-Alignment-Prompts und die Verfassungen moderner Agenten nutzen diese Struktur massiv.
Für das professionelle Schreiben. Die Correctio bleibt ein Präzisionsmarker, der dem Leser signalisiert, dass der Autor die Standardlesart verworfen hat, bevor er seine Aussage aufbaute. In einem Executive Summary, einer kommerziellen Argumentation, einer technischen Klärung — „das ist nicht X, das ist Y“ zu verwenden, wenn X die saliente Standardlesart ist, übertrifft eine bloße Behauptung. Vorausgesetzt, man übersättigt nicht: Ein Post, ein Absatz oder ein Abschnitt, der drei oder vier Correctiones aufeinanderstapelt, wird mechanisch und ermüdet den menschlichen Leser, der die repetitive Struktur schnell erkennt.
Für die Konzeption kognitiver Systeme. Ein explizites kognitives Modell — eines, das sein Reasoning prüfbar macht — gewinnt, wenn es seine Hypothesen in kontrastiver Form formuliert. Statt „ich interpretiere diese Klausel als H“ zu schreiben „ich schließe die Interpretation H1 aus (Grund 1), ich schließe H2 aus (Grund 2), ich behalte H3“. Der menschliche Leser, der gegenliest, gewinnt an Zeit und Präzision für die Abwägung. Genau diese Disziplin erlegen wir bei TenderGraph auf: die verworfenen Hypothesen vor der behaltenen Hypothese sichtbar machen.
Die Rückkehr der klassischen Rhetorik
Quintilian hatte keinen Zugang zur Informationstheorie. Er hatte weder Shannon noch Horn oder Levinson gelesen. Er hatte kein neuronales Netz mit einer Contrastive Loss trainiert.
Er hatte beobachtet, dass die Correctio funktionierte. Dass die Redner, die sie nutzten, besser überzeugten. Dass das Gedächtnis der Zuhörer sie stärker behielt. Er hatte das Optimum durch den Gebrauch identifiziert, neunzehn Jahrhunderte bevor man es durch die Mathematik erklärte.
Die klassischen rhetorischen Figuren operieren wie kognitive Optima — empirisch entdeckt durch Generationen von Praktikern der Rede, später ratifiziert durch die moderne Linguistik, schließlich wiedergefunden von den KI-Modellen, weil ihre Architektur selbst kontrastiv ist.
Wenn Sie „das ist nicht X, das ist Y“ schreiben, reaktivieren Sie eine Figur, die Quintilian beschrieben, die Horn theoretisiert, die Frank und Goodman formalisiert und die CLIP fest in der Architektur des zeitgenössischen Deep Learning implementiert hat. Was die KI instinktiv tut, kann der Mensch bewusst tun. Und vor allem mit Maß — eine gut platzierte Correctio ist mehr wert als fünf, die übersättigen.
Genau das ist der Kern dessen, was wir bei TenderGraph bauen: kognitive Systeme, die explizit machen, was die KI im Stillen tut, damit der Mensch validieren, abwägen und übertreffen kann.
Die nächsten Artikel der Serie werden weitere von der KI massenhaft genutzte rhetorische Figuren erkunden — Anapher, Trikolon, Chiasmus — und andere, die sie nutzen sollte und nicht nutzt: die Litotes, die Aposiopese, die feine Ironie. Der gemeinsame Nenner: verstehen, wie die Form den Inhalt beeinflusst, und wie die rhetorische Meisterschaft, selbst im Zeitalter der LLM, ein Wettbewerbsvorteil für jene bleibt, die schreiben, um zu überzeugen.
Hauptquellen
- Ettinger, A. (2020). What BERT Is Not: Lessons from a New Suite of Psycholinguistic Diagnostics for Language Models. TACL 8, 34-48. DOI: 10.1162/tacl_a_00298.
- Kassner, N. & Schütze, H. (2020). Negated and Misprimed Probes for Pretrained Language Models. ACL 2020. arXiv:1911.03343.
- Truong, T. H., Baldwin, T., Verspoor, K. & Cohn, T. (2023). Language Models Are Not Naysayers: An Analysis of Language Models on Negation Benchmarks. StarSEM 2023. arXiv:2306.08189.
- García-Ferrero, I. et al. (2023). This is not a Dataset: A Large Negation Benchmark to Challenge Large Language Models. EMNLP 2023. arXiv:2310.15941.
- Mishra, S. et al. (2022). Reframing Instructional Prompts to GPTk's Language. ACL Findings. arXiv:2109.07830.
- Jang, J., Ye, S. & Seo, M. (2023). Can Large Language Models Truly Understand Prompts? A Case Study with Negated Prompts. arXiv:2209.12711.
- Clark, K., Khandelwal, U., Levy, O. & Manning, C. (2019). What Does BERT Look At? An Analysis of BERT's Attention. BlackboxNLP. arXiv:1906.04341.
- Geiger, A., Richardson, K. & Potts, C. (2020). Neural Natural Language Inference Models Partially Embed Theories of Lexical Entailment and Negation. BlackboxNLP. arXiv:2004.14623.
- Horn, L. R. (1989, Neuaufl. 2001). A Natural History of Negation. University of Chicago Press / CSLI.
- Levinson, S. (2000). Presumptive Meanings: The Theory of Generalized Conversational Implicature. MIT Press.
- Frank, M. C. & Goodman, N. D. (2012). Predicting Pragmatic Reasoning in Language Games. Science 336 (6084), 998.
- Radford, A. et al. (2021). Learning Transferable Visual Models From Natural Language Supervision (CLIP). arXiv:2103.00020.
- Gao, T., Yao, X. & Chen, D. (2021). SimCSE: Simple Contrastive Learning of Sentence Embeddings. EMNLP 2021. arXiv:2104.08821.