Codificación cognitiva óptima: ingeniería de prompts de alta precisión

Este artículo amplía La revolución informacional, donde se establecía el marco teórico de la señal y el ruido en las licitaciones. Aquí, bajamos un nivel: ¿cómo codificar la información para que un LLM la procese con la máxima precisión? La respuesta se encuentra en la intersección de Shannon, Grice y la arquitectura de los transformers.

Más allá de las recetas

Asignar un rol. Proporcionar contexto. Mostrar un ejemplo. Estos consejos son útiles pero superficiales. No responden a la pregunta fundamental: ¿por qué algunas formulaciones producen resultados radicalmente superiores a otras?

Un LLM no entiende su intención. Calcula, token por token, la distribución de probabilidad del siguiente token, condicionada por todos los tokens anteriores. Cada palabra que escribe deforma el paisaje de probabilidad de la respuesta. Optimizar un prompt es esculpir un campo de probabilidades.

Esta guía sintetiza los fundamentos teóricos en ocho principios operativos: para quien quiera pasar de la artesanía del prompt a su ingeniería rigurosa.

Principio 0 — Lo que el modelo "ve"

El LLM no recibe palabras. Recibe tokens — fragmentos de texto cortados por un algoritmo estadístico (BPE, SentencePiece). Estos tokens se convierten en vectores numéricos en un espacio de miles de dimensiones. Todo su prompt forma una matriz de contexto que el mecanismo de atención del transformer procesa de manera no lineal.

Consecuencia directa: una palabra mal elegida no crea simplemente una ambigüedad local. Propaga una distorsión a lo largo de toda la generación, token tras token. El error se acumula, como un sesgo sistemático en una cadena de cálculo.

Principio 1 — Reducir la entropía condicional, no la entropía bruta

La mayoría de los profesionales confunden "ser preciso" con "usar muchas palabras descriptivas". En teoría de la información (Shannon, 1948), la métrica relevante no es la entropía bruta del prompt, sino la entropía condicional: la incertidumbre que subsiste en el espacio de posibles respuestas después de que el modelo haya procesado su prompt.

La falsa precisión:

"Dame un análisis detallado, exhaustivo y profundo de la situación geopolítica".

Cada adjetivo añade tokens pero no ayuda al modelo a converger. "Detallado", "exhaustivo", "profundo" son casi sinónimos desde el punto de vista del espacio vectorial. La señal informativa es nula.

La verdadera precisión:

"Analiza la situación geopolítica desde el punto de vista de los flujos energéticos Rusia-UE desde 2022. Estructura: causas → situación actual → 3 escenarios a 5 años".

Aquí, cada token restringe el espacio de posibles respuestas. "Flujos energéticos" excluye la política interior, lo militar, lo cultural. "Desde 2022" delimita temporalmente. La estructura impuesta elimina la incertidumbre organizativa.

La prueba mental: para cada palabra de su prompt, pregúntese: "¿Esta palabra elimina respuestas que no quiero?". Si la respuesta es no, la palabra es ruido. Elimínela.

Principio 2 — Aprovechar la estructura arbórea de la atención

Un LLM genera secuencialmente, pero su mecanismo de "comprensión" es jerárquico gracias a las capas de atención multi-cabeza. Por lo tanto, es más eficiente estructurar la información de lo general a lo particular, en forma de árbol, en lugar de hacerlo en una lista plana.

Los mecanismos de atención asignan sus recursos en función de la relevancia posicional y semántica. Una información de encuadre colocada al principio "colorea" la interpretación de todo lo que sigue. La misma información enterrada en medio de una lista se ponderará menos.

Jerarquía óptima de un prompt:

Nivel	Función	Ejemplo
1. Ontológico	Qué es la cosa solicitada	"Produce un memo estratégico"
2. Teleológico	Para qué	"destinado al comité directivo"
3. Delimitación	Lo que está incluido Y excluido	"Ámbito: solo UE; excluir Asia"
4. Forma	Estructura, longitud, formato	"2 páginas, 3 secciones, viñetas"
5. Calibración	Nivel de detalle, registro	"Tono fáctico, nivel experto, sin divulgación"

Este orden sigue la lógica de reducción progresiva del espacio de posibilidades: cada nivel divide el espacio restante. Invertir este orden obliga al modelo a costosos reajustes retroactivos a través del mecanismo de atención.

Principio 3 — Definir por exclusión

En teoría de la información, una señal es tanto más informativa cuanto más excluye alternativas. Corolario contraintuitivo: decir lo que no quieres a menudo es más informativo que decir lo que quieres.

El modelo, durante la generación, se ve atraído por atractores: patrones de respuesta sobrerrepresentados en sus datos de entrenamiento. Una solicitud abierta como "explica la mecánica cuántica" convergerá casi invariablemente hacia la analogía del gato de Schrödinger y la dualidad onda-partícula, porque estos motivos son estadísticamente dominantes.

Las restricciones negativas ("sin usar la analogía del gato de Schrödinger; parte del formalismo de los espacios de Hilbert") bloquean los atractores de poco valor y fuerzan al modelo hacia caminos menos probables pero cognitivamente más ricos.

Las restricciones negativas tienen una mejor relación información/token que las restricciones positivas cuando apuntan a los atractores estadísticos del modelo.

Esto es exactamente lo que hace un buen pliego de condiciones técnicas: los requisitos más discriminatorios son a menudo los que excluyen - "sin solución SaaS", "sin subcontratación para el lote 2".

Principio 4 — Minimizar la distancia semántica de anclaje

El modelo organiza sus conocimientos en un espacio vectorial donde los conceptos semánticamente cercanos forman clusters. Si usa un término situado en la frontera de dos clusters, introduce una ambigüedad que propaga ruido en la respuesta.

El objetivo es utilizar términos de anclaje: palabras que se ubican en el centro de un cluster semántico denso:

Los términos técnicos canónicos de un dominio (nombres exactos de teorías, métodos)
Los nombres propios (autores, marcos nombrados, publicaciones de referencia)
Los términos encontrados con frecuencia en contextos coherentes y unívocos

Decir "la cosa de Kahneman sobre los dos modos de pensar" es semánticamente vago. Decir "la teoría Sistema 1 / Sistema 2 (Kahneman, Pensar rápido, pensar lento)" ancla el modelo en un cluster preciso. El sobrecosto en tokens es marginal; el beneficio en precisión es desproporcionado.

Regla derivada: la jerga como compresión. La jerga técnica no es ruido. Es una codificación de alta densidad: una palabra técnica comprime una definición entera en uno o dos tokens. En gestión de ofertas, decir "MECE" activa una red semántica densa que "estructurar de forma exhaustiva y mutuamente excluyente" lleva 30 tokens en describir.

Principio 5 — Controlar la temperatura implícita mediante la sintaxis

Más allá del parámetro de temperatura explícito, la propia estructura sintáctica de su prompt influye en la "temperatura efectiva" de la respuesta: el grado de exploración versus convergencia del modelo.

En el corpus de entrenamiento, los textos factuales utilizan oraciones declarativas cortas en presente (SVO), mientras que los textos especulativos emplean estructuras condicionales complejas. El modelo ha interiorizado estas correlaciones.

Estructura sintáctica	Efecto en la generación	Uso óptimo
Imperativo / indicativo presente	Convergencia, determinismo	Hechos, listas, datos
Frases paratácticas (yuxtapuestas)	Concisión, foco	Instrucciones, especificaciones
Condicional, subordinadas	Exploración, matiz	Análisis, creatividad
Modalizadores (quizás, parece)	Alta entropía, permisividad de la ambigüedad	Evitar si se requiere precisión

Para una precisión máxima: indicativo presente, estructuras paratácticas, cero modalizadores. Cada "quizás" en su prompt es una autorización dada al modelo para ser impreciso.

Esto es lo que distingue un resumen ejecutivo con impacto de uno que diluye el mensaje. La sintaxis es una instrucción implícita sin costo en tokens.

Principio 6 — La no linealidad posicional de la atención

Los estudios empíricos sobre el comportamiento de los transformers (Liu et al., "Lost in the Middle", 2023, y trabajos posteriores sobre contextos largos) revelan que la atención del modelo no se distribuye uniformemente. Presenta un marcado sesgo hacia el principio y el final del contexto —el efecto llamado de primacía-recencia— con un valle significativo en el medio, particularmente pronunciado en contextos largos. La arquitectura transformer original (Vaswani et al., 2017) sentó las bases; este sesgo posicional es una limitación caracterizada por los estudios de comportamiento posteriores.

Implicaciones para sus prompts:

La instrucción más crítica debe figurar al principio O recordarse al final
La información de contexto voluminosa (documentos de referencia, datos en bruto) se coloca en el medio
Nunca enterrar una instrucción crucial en un largo bloque de contexto

Este fenómeno tiene implicaciones importantes en los sistemas de respuesta a licitaciones que inyectan cientos de páginas de DCE en el contexto de un LLM. La información enterrada en el medio se pondera literalmente menos por el mecanismo de atención: un requisito P0 en la página 37 de un CCTP de 150 páginas tiene menos probabilidades de ser procesado que un requisito trivial en la página 3.

Principio 7 — El isomorfismo prompt-respuesta

El modelo tiende a reproducir la estructura de lo que recibe. Es un sesgo estadístico poderoso y estratégicamente explotable.

El efecto va más allá de la simple imitación de formato. El nivel de abstracción, la granularidad, el registro léxico del prompt calibran directamente los de la respuesta. Si hace una pregunta con vocabulario universitario, el modelo responde a ese nivel. La misma pregunta formulada con vocabulario de colegio producirá una simplificación proporcional.

El registro de su prompt es una instrucción implícita sin costo en tokens. Es la palanca de control más subestimada de la ingeniería de prompts.

Corolario: si su prompt es un flujo de conciencia desordenado, la respuesta heredará ese desorden. Si su prompt está estructurado en secciones claramente delimitadas con marcadores explícitos, la respuesta adoptará un rigor comparable. Es la razón por la que un informe técnico redactado por un agente bien instruido es estructuralmente diferente de un informe producido por un chatbot genérico: el prompt actúa como un molde.

Principio 8 — La compresión semántica mediante referencia nombrada

El principio más poderoso para los expertos. En lugar de describir un concepto, nómbrelo. Cada referencia nombrada — un teorema, un marco, un autor canónico— es una compresión semántica extrema: dos o tres tokens activan en el modelo una densa red de miles de conocimientos asociados.

Formulación larga (~30 tokens)	Referencia comprimida (~5 tokens)	Ratio
Estructurar el análisis de manera exhaustiva y mutuamente excluyente, sin omisiones ni solapamientos	Usar el marco MECE	6:1
Actualizar sus creencias según las nuevas pruebas, de manera proporcional a su fuerza	Razonar de manera bayesiana	6:1
Considerar que los agentes son racionales y maximizan su utilidad esperada en un contexto de interacciones estratégicas	Marco de la teoría de juegos	5:1

Condición de eficacia: este mecanismo solo funciona si la referencia está bien representada en los datos de entrenamiento. Para conceptos oscuros, combine la referencia con una breve definición operacional: "Usa el marco MECE (exhaustividad + exclusión mutua de categorías)".

Meta-principio — El prompt óptimo es un programa, no una conversación

La síntesis de los ocho principios conduce a un cambio de paradigma. El prompt óptimo no se parece al lenguaje natural conversacional. Se asemeja a un programa declarativo: especifica un estado deseado (la salida), restricciones, exclusiones, un orden de prioridad y una estructura de resultados.

Eso no significa que haya que escribir en pseudocódigo. Pero cada frase debe tener una función identificable:

Función	Rol informativo	Ejemplo
Enmarcar	Definir el espacio ontológico	"Produce una nota de síntesis"
Restringir	Reducir el espacio de posibles	"800 palabras, registro experto"
Excluir	Bloquear los atractores	"Sin lugares comunes ni analogías simplistas"
Estructurar	Imponer la arquitectura de salida	"Estructura: diagnóstico → opciones → recomendación"
Calibrar	Ajustar el nivel y el tono	"Para una audiencia de científicos de datos senior"

Si una frase de su prompt no cumple ninguna de estas funciones, es ruido informativo. Elimínela.

Conclusión: el prompt como acto de pensamiento

Estos ocho principios no son "trucos y consejos". Son las consecuencias lógicas de la arquitectura de los transformers y de la teoría matemática de la información. Aplicarlos es pasar de una relación ingenua con el modelo ("le hablo como a un humano") a una relación instrumentada ("configuro un sistema de procesamiento de la información").

La paradoja final es elegante: para sacar el máximo de una inteligencia artificial, primero hay que ejercer rigurosamente la propia. La calidad de un prompt refleja la calidad del pensamiento que lo precede. Ningún modelo, por potente que sea, compensará un pliego de condiciones impreciso.

El prompt óptimo no pide. Especifica. No sugiere. Restringe. No divaga. Codifica.

Lo que TenderGraph hace con estos principios

Los ocho principios descritos en este artículo no son teoría para nosotros. Están en el código. Cada instrucción que nuestro sistema envía al modelo está construida según estas reglas — reducción de la entropía condicional, jerarquía ontológica, restricciones negativas, anclaje semántico, control sintáctico de la temperatura, posicionamiento atencional, isomorfismo estructural, compresión por referencia.

Pero TenderGraph va más lejos. Nuestra arquitectura aplica mecanismos que este artículo no aborda: compresión editorial adaptativa de los documentos fuente, preinyección de contexto estratégico en cada fase de trabajo, prompt caching para mantener la coherencia a lo largo de cientos de iteraciones, gestión de la memoria de trabajo con contexto fresco por fase y persistencia de las decisiones del usuario.

El resultado: un sistema cognitivo que lee un DCE de 200 páginas, extrae la señal estratégica, construye una propuesta de valor anclada en los hechos, y redacta un informe técnico donde cada argumento es trazable a un requisito, cada compromiso está fundamentado, cada sección está calibrada para maximizar la puntuación.

Es la diferencia entre una herramienta que genera texto y un sistema que piensa el expediente. Y por eso las propuestas producidas con TenderGraph no se parecen a nada de lo que el mercado ofrece hoy.

Para ir más lejos: descubrir TenderGraph · hablar con nuestro equipo.

Lea también:

Referencias teóricas:

Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal.
Zipf, G. K. (1935). The Psycho-Biology of Language. Houghton Mifflin.
Grice, H. P. (1975). Logic and Conversation. In Syntax and Semantics, Vol. 3.
Levy, R. & Jaeger, T. F. (2007). Speakers optimize information density through syntactic reduction. NIPS.
Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS.
Délétang, G. et al. (2024). Language Modeling Is Compression. ICLR.
Liu, N. F. et al. (2023). Lost in the Middle: How Language Models Use Long Contexts. arXiv.

Codificación cognitiva óptima: ingeniería de prompts de alta precisión

Codificación cognitiva óptima: ingeniería de prompts de alta precisión

Más allá de las recetas

Principio 0 — Lo que el modelo "ve"

Principio 1 — Reducir la entropía condicional, no la entropía bruta

Principio 2 — Aprovechar la estructura arbórea de la atención

Principio 3 — Definir por exclusión

Principio 4 — Minimizar la distancia semántica de anclaje

Principio 5 — Controlar la temperatura implícita mediante la sintaxis

Principio 6 — La no linealidad posicional de la atención

Principio 7 — El isomorfismo prompt-respuesta

Principio 8 — La compresión semántica mediante referencia nombrada

Meta-principio — El prompt óptimo es un programa, no una conversación

Conclusión: el prompt como acto de pensamiento

Lo que TenderGraph hace con estos principios

¿Listo para transformar sus respuestas a licitaciones?

Artículos recomendados

El conocimiento del cliente — la llave de doble vuelta de la licitación

Cómo va el expediente — la pregunta que mata la preventa

Una herramienta para diez — por qué la preventa se ahoga en software y cómo salir de ello