El prompt no hace las veces de método — por qué formalizar la propia experiencia tácita se ha convertido en el verdadero trabajo
Sexto texto del bloque cognición / doctrina. Tras la agéntica verdadera, una pregunta que se plantea a todas las organizaciones que han invertido dieciocho meses de formación en prompt engineering sin ver el retorno: qué debería haber producido esa inversión para alcanzar la productividad prometida.
La auditoría que no encontró nada
En una gran firma de consultoría francesa, en abril de 2026, una dirección decide llevar a cabo una auditoría interna sobre el uso de la IA en misión. El perímetro es restringido, treinta consultores, seleccionados por su exposición regular a las herramientas. Todos están formados en prompt engineering desde hace dieciocho meses, algunos desde el principio. Varios han obtenido certificaciones externas. La dirección quiere saber, tras semejante volumen de inversión, qué cambió realmente la IA en la producción de sus misiones.
El informe cabe en tres páginas. Ninguna ganancia de tiempo medible en la duración de las misiones. Ninguna mejora medible de la calidad de los entregables. Ninguna diferencia de productividad entre los consultores formados y los que no lo estaban. Algunos testimonios anecdóticos de ganancias puntuales, jamás convertidas en efecto de organización.
La dirección encarga una segunda lectura del informe. No encuentra error metodológico. Encarga entonces una tercera lectura, a un gabinete externo, pensando que un sesgo de autojustificación había falseado la medición. El gabinete externo lo confirma. La formación en prompt engineering, medida con la vara de la productividad operativa, no produjo nada que se viera.
Este resultado no es una anomalía local. Las encuestas publicadas en 2025 por McKinsey, BCG y el BCG-Henderson Institute, pese a su tono oficialmente entusiasta, convergen hacia la misma cifra incómoda: menos del quince por ciento de las organizaciones que han desplegado formación interna en prompt engineering han visto una mejora de su productividad global. La media del sector ronda el cero. Y nadie, ni los editores ni los gabinetes formadores ni las direcciones formadas, formula claramente por qué.
Este artículo sostiene una hipótesis. El prompt engineering, tal como se enseña desde 2024, optimizó la variable equivocada. Enseñó a los operadores a formular mejor, cuando lo que les faltaba no era la formulación, sino una capa por debajo, más fundamental, que ninguna formación podía entregar.
Cuatro capas de un mismo gesto
Para entender adónde se ha desplazado el trabajo, hay que mirar en qué se ha convertido un prompt desde hace tres años. La palabra ha recubierto cuatro objetos distintos que las formaciones siguen, erróneamente, tratando como uno solo.
La primera capa es la de la instrucción directa. Resume este texto. Traduce este párrafo. Enumera los argumentos principales. Esta capa, que constituía lo esencial del uso en 2023, no exige ninguna competencia particular. Cualquier modelo por encima de cierto umbral produce hoy lo que se espera, y el margen de progresión dejó de ser significativo hace dieciocho meses.
La segunda capa es la del currículum. Se le dice al agente quién es. Eres un consultor sénior en estrategia. Tienes quince años de experiencia en cuestiones de transformación industrial. Dominas los marcos Porter, McKinsey 7S y el análisis de cadena de valor. Esta capa, popularizada por las guías de prompt engineering en 2024, produjo un salto de calidad real. El agente se vuelve más preciso en su vocabulario, más prudente en sus afirmaciones, más alineado con un registro profesional.
Pero el currículum tiene un límite que pocos han nombrado. Enumerar competencias no produce una decisión. Un consultor sénior no se distingue de un júnior por los marcos que conoce, que dominan tanto el uno como el otro. Se distingue por la secuencia de arbitrajes que opera en silencio cuando aborda una situación nueva. Qué elementos mirar primero, qué señales descartar, en qué momento bascular de una lectura diagnóstica a una lectura prescriptiva. Esos gestos no figuran en ningún currículum.
La tercera capa, que se impuso a partir de finales de 2024, es la del modo operatorio. En ella se describe lo que el agente debe hacer, en qué orden, fijando las condiciones de paso de una etapa a la siguiente. Primero, analiza el historial. Luego, identifica las tres variables críticas. Después, cruza con el contexto sectorial. Por último, propón tres escenarios. Esta capa produce otro salto, más profundo que el anterior, porque empieza a transferir ya no una identidad sino un desarrollo, es decir, un fragmento de proceso.
Y sin embargo, el modo operatorio sigue siendo insuficiente. Describe las etapas, no los arbitrajes. No dice, por ejemplo, ante qué señal hay que interrumpir el análisis y cambiar de encuadre porque la pregunta inicial estaba mal planteada. No dice cómo resolver la tensión que aparece cuando dos restricciones del encargo entran en concurrencia. No dice nada de la operación más típica del juicio experto, que consiste precisamente en saber cuándo salirse del plan.
La cuarta capa, que los mejores equipos empezaron a experimentar en 2025 pero que aún se duda en nombrar, es la de la jerarquía de principios. En ella se inscribe ya no lo que el agente hace, sino aquello a lo que concede prioridad cuando dos objetivos entran en tensión. Prioridad absoluta al rigor contractual sobre la elegancia retórica. Prioridad a la trazabilidad sobre la concisión. Si dos opciones se equivalen en el fondo, retener la que mejor soporta la contradicción pública. Es esta cuarta capa, y solo ella, la que produce un agente capaz de juzgar.
Estas cuatro capas no se apilan linealmente. La cuarta presupone las tres anteriores, pero exige además algo que ninguna de las otras pedía. Una experiencia tácita previamente formalizada por quien la posee.
Del currículum al modo operatorio
El deslizamiento de la segunda a la tercera capa se mide en el caso concreto del bid management. Un bid manager sénior interrogado sobre su método, en 2024, enumera lo que conoce. La estructura tipo de una licitación pública. Los ratios habituales de scoring. Las trampas clásicas de un CCTP mal leído. Su currículum se deja redactar en unas pocas páginas, y un agente así instruido produce, sobre un expediente sencillo, una primera respuesta aceptable.
El mismo bid manager, interrogado en 2025, percibe que su currículum no basta. Empieza a describir un desarrollo. Primero, leo el reglamento de consulta para identificar los criterios y su ponderación. Luego, leo el CCTP buscando las exigencias ocultas en la prosa. Después cruzo con lo que conozco del cliente para adivinar lo que el scoring publicado no dice. Este modo operatorio, mucho más rico que el currículum, permite al agente estructurar su trabajo, dejar de producir respuestas que parecen un copiar-pegar de marketing.
Pero el modo operatorio muestra pronto sus propios límites. Sobre un expediente complejo, el agente así instruido desarrolla concienzudamente las etapas y produce, al final, un entregable que pasa por alto lo esencial. ¿Por qué? Porque se le escapó la señal débil que el bid manager sénior habría captado en la tercera página, la que habría llevado a este último a abandonar el plan inicial y a reconstruir el encuadre. El agente sigue el plan. El experto humano, en cambio, sabe cuándo salirse del plan. Y ese cuándo no se guarda en ningún sitio de un modo operatorio.
Este límite se hace particularmente visible en lo que aquí llamaremos el modo pilotaje. Para los bid managers que intervienen a mitad de misión, después de que un agente de IA haya producido ya una primera versión sobre la que ahora hay que decidir, el modo operatorio del agente nunca basta. Hay que explicitar, en cada arbitraje, sobre qué principio se decide, porque el agente no puede heredar esa intuición.
La jerarquía de principios
Es aquí donde la cuarta capa, la de la jerarquía de principios, empieza a producir un efecto cualitativamente distinto. En lugar de prescribir al agente lo que debe hacer, se le transmite aquello sobre lo que debe arbitrar cuando se presentan dos direcciones en concurrencia. Cuando el CCTP es ambiguo en un punto crítico, no rellenar nunca con una interpretación favorable, formular la ambigüedad como una hipótesis explícita. Cuando el encargo comercial entra en tensión con la exigencia contractual, prima la contractual, salvo alineamiento explícito del sponsor sobre la diferencia.
Estas formulaciones, que se parecen más a una doctrina que a una instrucción, exigen a quien las escribe una operación que nunca antes había sido requerida. Identificar, en su propia práctica, los momentos en que decidió, y reconstruir con palabras el arbitraje que hizo. Esta operación es lo opuesto de lo que se pide en un currículum. El currículum enumera lo que se sabe. La jerarquía de principios formaliza lo que se hace sin decirlo.
Y es ahí, en ese paso del saber al hacer-tácito-formulado, donde la productividad de la IA bascula. Los escasos equipos que producen resultados espectaculares con la IA en 2026 no son los que tienen los mejores prompts. Son aquellos cuyos expertos han dedicado un número considerable de horas, aguas arriba, a formalizar su propio método. El prompt no es más que la transcripción final de un trabajo de explicitación que lo ha precedido.
La paradoja Polanyi
Esta operación de explicitación choca con una dificultad que la filosofía del conocimiento identificó hace sesenta años. Michael Polanyi, en su obra de 1966 The Tacit Dimension, defendía la tesis de que lo esencial de lo que sabe un experto no puede ser formulado. Su fórmula célebre, we know more than we can tell, postulaba que el saber tácito resiste estructuralmente a la puesta en palabras, y que es esa resistencia la que lo constituye. Un experto que hubiera verbalizado la integridad de su método habría dejado de ser experto para volverse manual de instrucciones.
Hubert Dreyfus, en la estela de Polanyi, prolongaba la tesis aplicándola a los límites de la inteligencia artificial de los años ochenta. Sus argumentos contra la formalización algorítmica de la experiencia eran tan sólidos que durante mucho tiempo parecieron vedar a la IA todo acceso a los oficios de juicio. Los LLM han vuelto esos argumentos parcialmente obsoletos, pero en un solo punto. Han mostrado que un sistema entrenado sobre cantidades masivas de prácticas puede producir salidas que imitan el juicio, sin por ello haber formalizado nada en absoluto. El método sigue siendo tácito, tanto en el modelo como en el experto humano.
La paradoja se reformula, por tanto. La IA, para producir un trabajo de calidad experta sobre una misión dada, debe heredar un método que nunca ha sido escrito. El editor entrenó el modelo sobre lo tácito. El usuario, por su parte, debe transmitir explícitamente lo que, en su propia práctica, distingue su oficio de una media sectorial. Y esa operación de transmisión exige precisamente lo que Polanyi tenía por imposible: la formalización de lo tácito.
Dónde acertaba Polanyi, y dónde se equivocaba. Acertaba en que el saber tácito resiste a la formalización completa. Ningún experto puede escribir la integridad de su método sin perder algo por el camino. Pero subestimó un hecho empírico. La formalización parcial, por imperfecta que sea, basta para transformar la producción de un agente. No hace falta decirlo todo. Hay que decir lo que nunca se ha dicho, y lo que el agente no podía deducir por sí solo de su entrenamiento.
Ese esfuerzo de formalización parcial es lo que separa, en 2026, a las organizaciones que extraen un rendimiento real de la IA y las que han tocado techo. Las primeras aceptaron pagar el coste de un trabajo nuevo, pesado, ingrato. Las segundas creyeron que una formación en prompt engineering podía ahorrárselo.
Lo que TenderGraph llama la capa método
Este análisis, conducido sobre la observación de los últimos dieciocho meses, ha estructurado el diseño de TenderGraph TITAN. Tomamos la decisión, desde la primera versión entregada en 2025, de no pedir al usuario que escriba él mismo su jerarquía de principios. La apuesta era sencilla. Si la formalización de lo tácito es lo que frena la adopción, entonces hay que entregar el método ya formalizado, y dejar al usuario la única responsabilidad de aportar la materia del expediente.
Este método prediseñado, que llamamos internamente la capa método, codifica trece fases de análisis de licitación, una jerarquía de principios que decide sobre los arbitrajes típicos del oficio, y reglas duras de divergencia cuando el expediente presenta una configuración atípica. Fue escrito con bid managers séniores que aceptaron, durante meses, volver sobre sus propias decisiones para extraer de ellas las reglas silenciosas.
El usuario, así, ya no tiene que aprender prompt engineering. No tiene que formalizar su oficio. Aporta el DCE, sigue el desarrollo, y decide en los momentos en que el método le devuelve la mano. Esta elección arquitectónica, que parece evidente una vez formulada, contradice la doctrina dominante de los editores de IA en 2025, que consiste en entregar un agente generalista y pedir al usuario que produzca su propio método por prompt.
Sostenemos que este último modelo no puede funcionar a gran escala, porque subestima lo que Polanyi había señalado. La gran mayoría de los practicantes no son capaces, ni tienen por vocación volverse capaces, de explicitar su propio método. Pedirlo equivale a pedir a los médicos que se vuelvan epistemólogos, a los abogados que se vuelvan gramáticos del derecho, a los bid managers que se vuelvan doctrinarios de la contratación pública. Es posible en teoría. Es raro en la práctica. Es masivamente costoso en las organizaciones.
La buena pregunta en el mal momento
Volvamos a la auditoría del gabinete de consultoría con la que se abrió este artículo. Por qué la formación en prompt engineering, entregada a treinta consultores durante dieciocho meses, no produjo nada medible. Tres lecturas del informe buscaron un sesgo metodológico. Ninguna lo encontró. La cuarta lectura, la que nadie se atrevió a conducir, habría sido la buena.
La formación en prompt engineering enseñó a los consultores a formular. No podía, estructuralmente, enseñarles a explicitar su propio método. Esa operación exige un trabajo de introspección profesional, seguido de una puesta en palabras laboriosa, que no se hace en dos jornadas de formación interempresarial. Se hace a lo largo de varias semanas, con acompañamiento, volviendo sobre expedientes reales para reconstruir los arbitrajes operados. Ningún catálogo de formación de 2024 o 2025 propone semejante formato. Y por buena razón. Eso no es prompt engineering.
Las direcciones que creyeron comprar productividad de IA comprando formación en prompt engineering plantearon la buena pregunta en el mal momento. Deberían haber empezado preguntándose si el método de sus expertos estaba formalizado, y por tanto era transmisible a un agente. Como la respuesta es casi siempre no, la inversión siguiente debería haber recaído sobre la explicitación, no sobre la formulación. Es retrospectivamente evidente. No lo era en 2024.
La lección no es solo presupuestaria. Es doctrinal. El prompt engineering, como disciplina, descansa sobre el presupuesto de que la calidad de la salida de IA depende de la calidad de la formulación. Ese presupuesto era cierto en las capas 1 y 2. Es falso en las capas 3 y 4. Y es en estas últimas capas donde se aloja, en adelante, la productividad real.
Coda — lo que formalizar le hace al experto
Una última observación, quizá la más interesante, merece plantearse. Los expertos que aceptaron, por obligación o por curiosidad, formalizar su propio método para poder transmitirlo a un agente salen de ello transformados, y esa transformación no había sido anticipada.
La operación de explicitación, en efecto, obliga a revisitar arbitrajes que se operaban sin pensar en ellos. A nombrar las excepciones que uno hacía a sus propias reglas. A identificar los sesgos que la práctica había sedimentado. Varios bid managers séniores con los que hemos trabajado dijeron, tras el ejercicio, que se habían vuelto mejores en su propio oficio por haber intentado enseñárselo a una máquina. Habían descubierto, al forzarse a formalizar, inflexiones de su práctica que no habrían visto de otro modo.
Es, quizá, el beneficio principal de esta década que se abre. La IA fuerza lo que las organizaciones nunca habían logrado hacer espontáneamente, la explicitación sistemática del saber tácito de los séniores. Lo fuerza no por pedagogía ni por cultura del knowledge management, sino por una necesidad operativa simple. Sin esa explicitación, el agente no produce nada útil. Y allí donde la pedagogía fracasó durante treinta años, la restricción técnica triunfa.
El prompt no hace las veces de método. Es solo su escritura final. El método, en cambio, vive en la cabeza de los expertos que nunca tuvieron la ocasión ni la necesidad de escribirlo. El trabajo que se abre no es formular mejor. Es redescubrir lo que se hacía, sin saberlo, desde hace años.
Bibliografía
Sobre el saber tácito y sus límites
- Michael Polanyi, The Tacit Dimension, 1966.
- Michael Polanyi, Personal Knowledge, 1958.
Sobre la crítica filosófica de la IA clásica
- Hubert L. Dreyfus, What Computers Still Can't Do, 1992.
Sobre las encuestas de ROI del prompt engineering 2025-2026
- McKinsey Global Institute, The State of AI in 2025, informe anual.
- BCG Henderson Institute, Generative AI in the Enterprise: Beyond the Hype, 2025.
Sobre la formalización de la experiencia en los oficios de juicio
- Donald Schön, The Reflective Practitioner, 1983.
- Richard Sennett, The Craftsman, 2008.