Thought Leadership·27 de marzo de 2026·9 min de lectura

Codificación cognitiva óptima: ingeniería de prompts de alta precisión

La mayoría de las guías de ingeniería de prompts se limitan a recetas. Esta guía sienta las bases teóricas —teoría de la información, arquitectura de los transformers, pragmática de Grice— y extrae ocho principios operativos para pasar de la artesanía del prompt a su ingeniería rigurosa.

Por L'equipe TenderGraph

EC

Principio 0 — Lo que el modelo "ve"

El LLM no recibe palabras. Recibe tokens — fragmentos de texto cortados por un algoritmo estadístico (BPE, SentencePiece). Estos tokens se convierten en vectores numéricos en un espacio de miles de dimensiones. Todo su prompt forma una matriz de contexto que el mecanismo de atención del transformer procesa de manera no lineal.

Consecuencia directa: una palabra mal elegida no crea simplemente una ambigüedad local. Propaga una distorsión a lo largo de toda la generación, token tras token. El error se acumula, como un sesgo sistemático en una cadena de cálculo.


Principio 1 — Reducir la entropía condicional, no la entropía bruta

La mayoría de los profesionales confunden "ser preciso" con "usar muchas palabras descriptivas". En teoría de la información (Shannon, 1948), la métrica relevante no es la entropía bruta del prompt, sino la entropía condicional: la incertidumbre que subsiste en el espacio de posibles respuestas después de que el modelo haya procesado su prompt.

La falsa precisión:

"Dame un análisis detallado, exhaustivo y profundo de la situación geopolítica".

Cada adjetivo añade tokens pero no ayuda al modelo a converger. "Detallado", "exhaustivo", "profundo" son casi sinónimos desde el punto de vista del espacio vectorial. La señal informativa es nula.

La verdadera precisión:

"Analiza la situación geopolítica desde el punto de vista de los flujos energéticos Rusia-UE desde 2022. Estructura: causas → situación actual → 3 escenarios a 5 años".

Aquí, cada token restringe el espacio de posibles respuestas. "Flujos energéticos" excluye la política interior, lo militar, lo cultural. "Desde 2022" delimita temporalmente. La estructura impuesta elimina la incertidumbre organizativa.

La prueba mental: para cada palabra de su prompt, pregúntese: "¿Esta palabra elimina respuestas que no quiero?". Si la respuesta es no, la palabra es ruido. Elimínela.


Principio 2 — Aprovechar la estructura arbórea de la atención

Un LLM genera secuencialmente, pero su mecanismo de "comprensión" es jerárquico gracias a las capas de atención multi-cabeza. Por lo tanto, es más eficiente estructurar la información de lo general a lo particular, en forma de árbol, en lugar de hacerlo en una lista plana.

Los mecanismos de atención asignan sus recursos en función de la relevancia posicional y semántica. Una información de encuadre colocada al principio "colorea" la interpretación de todo lo que sigue. La misma información enterrada en medio de una lista se ponderará menos.

Jerarquía óptima de un prompt:

NivelFunciónEjemplo
1. OntológicoQué es la cosa solicitada"Produce un memo estratégico"
2. TeleológicoPara qué"destinado al comité directivo"
3. DelimitaciónLo que está incluido Y excluido"Ámbito: solo UE; excluir Asia"
4. FormaEstructura, longitud, formato"2 páginas, 3 secciones, viñetas"
5. CalibraciónNivel de detalle, registro"Tono fáctico, nivel experto, sin divulgación"

Este orden sigue la lógica de reducción progresiva del espacio de posibilidades: cada nivel divide el espacio restante. Invertir este orden obliga al modelo a costosos reajustes retroactivos a través del mecanismo de atención.


Principio 3 — Definir por exclusión

En teoría de la información, una señal es tanto más informativa cuanto más excluye alternativas. Corolario contraintuitivo: decir lo que no quieres a menudo es más informativo que decir lo que quieres.

El modelo, durante la generación, se ve atraído por atractores: patrones de respuesta sobrerrepresentados en sus datos de entrenamiento. Una solicitud abierta como "explica la mecánica cuántica" convergará casi invariablemente hacia la analogía del gato de Schrödinger y la dualidad onda-partícula, porque estos motivos son estadísticamente dominantes.

Las restricciones negativas ("sin usar la analogía del gato de Schrödinger; parte del formalismo de los espacios de Hilbert") bloquean los atractores de poco valor y fuerzan al modelo hacia caminos menos probables pero cognitivamente más ricos.

Las restricciones negativas tienen una mejor relación información/token que las restricciones positivas cuando apuntan a los atractores estadísticos del modelo.

Esto es exactamente lo que hace un buen pliego de condiciones técnicas: los requisitos más discriminatorios son a menudo los que excluyen - "sin solución SaaS", "sin subcontratación para el lote 2".


Principio 4 — Minimizar la distancia semántica de anclaje

El modelo organiza sus conocimientos en un espacio vectorial donde los conceptos semánticamente cercanos forman clusters. Si usa un término situado en la frontera de dos clusters, introduce una ambigüedad que propaga ruido en la respuesta.

El objetivo es utilizar términos de anclaje: palabras que se ubican en el centro de un cluster semántico denso:

  • Los términos técnicos canónicos de un dominio (nombres exactos de teorías, métodos)
  • Los nombres propios (autores, marcos nombrados, publicaciones de referencia)
  • Los términos encontrados con frecuencia en contextos coherentes y unívocos

Decir "la cosa de Kahneman sobre los dos modos de pensar" es semánticamente vago. Decir "la teoría Sistema 1 / Sistema 2 (Kahneman, Pensar rápido, pensar lento)" ancla el modelo en un cluster preciso. El sobrecosto en tokens es marginal; el beneficio en precisión es desproporcionado.

Regla derivada: el jerga como compresión. El jerga técnico no es ruido. Es una codificación de alta densidad: una palabra técnica comprime una definición entera en uno o dos tokens. En gestión de ofertas, decir "MECE" activa una red semántica densa que "estructurar de forma exhaustiva y mutuamente excluyente" lleva 30 tokens en describir.


Principio 5 — Controlar la temperatura implícita mediante la sintaxis

Más allá del parámetro de temperatura explícito, la propia estructura sintáctica de su prompt influye en la "temperatura efectiva" de la respuesta: el grado de exploración versus convergencia del modelo.

En el corpus de entrenamiento, los textos factuales utilizan oraciones declarativas cortas en presente (SVO), mientras que los textos especulativos emplean estructuras condicionales complejas. El modelo ha interiorizado estas correlaciones.

Estructura sintácticaEfecto en la generaciónUso óptimo
Imperativo / indicativo presenteConvergencia, determinismoHechos, listas, datos
Frases paratácticas (yuxtapuestas)Concisión, focoInstrucciones, especificaciones
Condicional, subordinadasExploración, matizAnálisis, creatividad
Modalizadores (quizás, parece)Alta entropía, permisividad de la ambigüedadEvitar si se requiere precisión

Para una precisión máxima: indicativo presente, estructuras paratácticas, cero modalizadores. Cada "quizás" en su prompt es una autorización dada al modelo para ser impreciso.

Esto es lo que distingue un resumen ejecutivo con impacto de uno que diluye el mensaje. La sintaxis es una instrucción implícita sin costo en tokens.


Principio 6 — La no linealidad posicional de la atención

Los trabajos sobre los transformers (Vaswani et al., 2017) revelan que la atención del modelo no se distribuye uniformemente. Presenta un marcado sesgo hacia el principio y el final del contexto —el efecto llamado de primacía-recencia— con un valle significativo en el medio, particularmente pronunciado en contextos largos (Liu et al., "Lost in the Middle", 2023).

Implicaciones para sus prompts:

  • La instrucción más crítica debe figurar al principio O recordarse al final
  • La información de contexto voluminosa (documentos de referencia, datos en bruto) se coloca en el medio
  • Nunca enterrar una instrucción crucial en un largo bloque de contexto

Este fenómeno tiene implicaciones importantes en los sistemas de respuesta a licitaciones que inyectan cientos de páginas de DCE en el contexto de un LLM. La información enterrada en el medio se pondera literalmente menos por el mecanismo de atención: un requisito P0 en la página 37 de un CCTP de 150 páginas tiene menos probabilidades de ser procesado que un requisito trivial en la página 3.


Principio 7 — El isomorfismo prompt-respuesta

El modelo tiende a reproducir la estructura de lo que recibe. Es un sesgo estadístico poderoso y estratégicamente explotable.

El efecto va más allá de la simple imitación de formato. El nivel de abstracción, la granularidad, el registro léxico del prompt calibran directamente los de la respuesta. Si hace una pregunta con vocabulario universitario, el modelo responde a ese nivel. La misma pregunta formulada con vocabulario de colegio producirá una simplificación proporcional.

El registro de su prompt es una instrucción implícita sin costo en tokens. Es el palanca de control más subestimada de la ingeniería de prompts.

Corolario: si su prompt es un flujo de conciencia desordenado, la respuesta heredará ese desorden. Si su prompt está estructurado en secciones claramente delimitadas con marcadores explícitos, la respuesta adoptará un rigor comparable. Es la razón por la que un informe técnico redactado por un agente bien instruido es estructuralmente diferente de un informe producido por un chatbot genérico: el prompt actúa como un molde.


Principio 8 — La compresión semántica mediante referencia nombrada

El principio más poderoso para los expertos. En lugar de describir un concepto, nómbrelo. Cada referencia nombrada — un teorema, un marco, un autor canónico— es una compresión semántica extrema: dos o tres tokens activan en el modelo una densa red de miles de conocimientos asociados.

Formulación larga (~30 tokens)Referencia comprimida (~5 tokens)Ratio
Estructurar el análisis de manera exhaustiva y mutuamente excluyente, sin omisiones ni solapamientosUsar el marco MECE6:1
Actualizar sus creencias según las nuevas pruebas, de manera proporcional a su fuerzaRazonar de manera bayesiana6:1
Considerar que los agentes son racionales y maximizan su utilidad esperada en un contexto de interacciones estratégicasMarco de la teoría de juegos5:1

Condición de eficacia: este mecanismo solo funciona si la referencia está bien representada en los datos de entrenamiento. Para conceptos oscuros, combine la referencia con una breve definición operacional: "Usa el marco MECE (exhaustividad + exclusión mutua de categorías)".


Meta-principio — El prompt óptimo es un programa, no una conversación

La síntesis de los ocho principios conduce a un cambio de paradigma. El prompt óptimo no se parece al lenguaje natural conversacional. Se asemeja a un programa declarativo: especifica un estado deseado (la salida), restricciones, exclusiones, un orden de prioridad y una estructura de resultados.

Eso no significa que haya que escribir en pseudocódigo. Pero cada frase debe tener una función identificable:

FunciónRol informativoEjemplo
EnmarcarDefinir el espacio ontológico"Produce una nota de síntesis"
RestringirReducir el espacio de posibles"800 palabras, registro experto"
ExcluirBloquear los atractores"Sin lugares comunes ni analogías simplistas"
EstructurarImponer la arquitectura de salida"Estructura: diagnóstico → opciones → recomendación"
CalibrarAjustar el nivel y el tono"Para una audiencia de científicos de datos senior"

Si una frase de su prompt no cumple ninguna de estas funciones, es ruido informativo. Elimínela.


Conclusión: el prompt como acto de pensamiento

Estos ocho principios no son

Etiquetas

#ingeniería-de-prompts#IA#teoría-de-la-información#LLM#formación#cognición#optimización#Shannon#transformers

Siguiente paso

¿Listo para transformar sus respuestas a licitaciones?

Seguir leyendo

Artículos recomendados