Thought Leadership·24 de junio de 2026·22 min de lectura

Lo que el evaluador nunca le dirá — anatomía del proceso de calificación

Todo el corpus del bid management está escrito desde el punto de vista del licitador. Nadie describe lo que ocurre del otro lado — la lectura en tres pasadas, el baremo ponderado, los sesgos del evaluador, la dinámica de comisión. Este artículo invierte la perspectiva.

Por L'equipe TenderGraph

QE

Lo que el evaluador nunca le dirá — anatomía del proceso de calificación

Este artículo prolonga Cómo redactar una memoria técnica que gana licitaciones, donde describíamos la codificación de la señal para maximizar la nota, y Sesgos cognitivos y licitaciones, donde mostrábamos que el bid manager es su propio peor enemigo. Aquí, cambiamos de bando. Pasamos al otro lado de la mesa — a la cabeza de quien le puntúa.

El punto ciego

Tome cualquier guía de bid management. Cualquier artículo. Cualquier consultor. El tema es siempre el mismo: cómo redactar, cómo estructurar, cómo ganar. El punto de vista es sistemáticamente el del licitador.

Nadie habla del otro lado.

Cómo se le lee. Cómo se le puntúa. Cómo se le compara. Cómo funciona la comisión. Qué sesgos operan en la cabeza de quien atribuye 14/20 en lugar de 16/20. Por qué la misma memoria técnica obtiene notas diferentes según se lea en primer o en quinto lugar. Por qué un expediente técnicamente superior acaba a veces detrás de un expediente más débil.

Es un punto ciego masivo. Y es estructural.

Los evaluadores de contratación pública no escriben guías. No publican retornos de experiencia. No tienen ni el tiempo, ni el incentivo, ni a veces el derecho de hacerlo. El proceso de calificación es una caja negra — y los licitadores optimizan sus respuestas para una caja que nunca han abierto.

Es como preparar un examen sin haber visto nunca un modelo de corrección. Conoce el programa. Estudia. Pero no sabe cómo el corrector lee su copia, en qué orden la puntúa, qué le irrita, qué le impresiona, qué busca cuando no encuentra. Optimiza a oscuras.

Conclusión clave: Todo el corpus existente habla de "cómo escribir una buena respuesta". Nadie habla de "cómo esa respuesta se lee, se puntúa y se compara". Mientras no haya comprendido el proceso de calificación, optimiza su memoria técnica para un objetivo que nunca ha visto.


Cómo el evaluador lee su oferta — el proceso real

Olvide la imagen del lector concienzudo que recorre su memoria de la página 1 a la página 200. Eso no ocurre nunca. El evaluador tiene cinco expedientes que puntuar. A veces siete. Cada expediente tiene entre 80 y 300 páginas. Dispone de dos a tres días. Tiene un baremo impreso, un bolígrafo y una fatiga creciente.

Esto es lo que ocurre realmente.

Pasada 1 — El triaje

El evaluador abre el archivo. Mira el índice. Verifica que el documento está estructurado, paginado, conforme al formato solicitado. Lee el resumen ejecutivo — si existe. Sobrevuela las primeras páginas de cada sección para hacerse una idea de conjunto.

Lo que busca: "¿De qué trata esto? ¿Es serio? ¿Este candidato ha comprendido el mercado?"

No es una lectura. Es un escaneo. Dura entre 10 y 20 minutos para un expediente de 150 páginas. Y al final de esta pasada, el evaluador ya tiene una impresión. No una nota. Una impresión — positiva, neutra o negativa. Esta impresión va a colorear todo el resto de la lectura.

Es el sesgo de anclaje en acción: la primera impresión pesa más que las informaciones siguientes. Un resumen ejecutivo genérico — "Nuestro equipo pluridisciplinar se compromete a acompañar su transformación" — ancla al evaluador en lo negativo. Un resumen ejecutivo preciso — que nombra los desafíos específicos del contrato, los riesgos identificados, la estrategia de respuesta — ancla en lo positivo. El resto del expediente se lee a través de ese filtro.

Pasada 2 — La calificación

Es aquí donde todo se decide.

El evaluador toma su baremo de calificación. Criterio por criterio, busca en la memoria la sección que lo responde. Escanea los títulos, los subtítulos, las primeras frases de cada párrafo, las tablas, los recuadros. Busca elementos de respuesta direccionables — una información que pueda vincular a una línea de su baremo y a la que pueda atribuir una nota.

Si encuentra la información fácilmente, puntúa. Si no la encuentra en 30 segundos, ocurren dos cosas. O bien busca un poco más — si el expediente dejó buena impresión en la pasada 1. O bien anota "insuficiente" o "no tratado" y pasa al criterio siguiente — si la impresión fue neutra o negativa.

Treinta segundos. Es el tiempo que tiene para que cada respuesta a cada criterio sea encontrada y comprendida. No porque el evaluador sea perezoso. Porque tiene 1 500 páginas que procesar en dos días y el funcionamiento por escaneo es una restricción de capacidad del canal, no una elección.

Pasada 3 — La relectura en profundidad

Esta es rara. Solo concierne a los 2-3 expedientes preseleccionados — los que están en la carrera por el primer puesto. El evaluador vuelve sobre las secciones clave, verifica las cifras, compara los enfoques entre expedientes. Busca elementos de desempate.

La mayoría de los expedientes nunca verán esta tercera pasada. Son eliminados — o clasificados definitivamente — en la pasada 2.

PasadaDuraciónFocoLo que elimina
Pasada 1 — Triaje10-20 minÍndice, resumen ejecutivo, sobrevuelo de seccionesSin índice, resumen ejecutivo genérico, formato no conforme, impresión de copia-pega
Pasada 2 — Calificación2-4 horasCriterio por criterio con el baremoInformación imposible de encontrar en 30 seg, sección fuera de tema, afirmación sin prueba, estructura no alineada con el baremo
Pasada 3 — Desempate30-60 min (si aplica)Secciones clave de los 2-3 mejores expedientesIncoherencia interna, ausencia de prueba cifrada, posicionamiento difuso

Conclusión clave: El evaluador no lee su oferta. La escanea en tres pasadas. La primera ancla una impresión. La segunda produce la nota. La tercera — que la mayoría de los expedientes nunca ven — desempata a los finalistas. Si su memoria no está construida para sobrevivir a un escaneo de 30 segundos por criterio, está construida para perder.


El baremo ponderado — lo que nadie explica

Todo licitador serio conoce los criterios de calificación y sus ponderaciones. Son públicos — el Código de Contratación Pública lo impone (artículo R2152-7). "Valor técnico: 60 %. Precio: 40 %." O bien: "Metodología: 40 pts. Recursos humanos: 30 pts. Comprensión de la necesidad: 30 pts."

Lo que nadie dice es que esos criterios son solo la capa visible. Debajo, están los subcriterios — y es ahí donde se fabrica la nota.

La granularidad interna

El pliego de licitación muestra "Metodología — 40 puntos". Pero, ¿cómo se distribuyen esos 40 puntos? El poder adjudicador elige. Puede descomponer en:

  • 8 subcriterios de 5 puntos (granularidad fina)
  • 4 subcriterios de 10 puntos (granularidad media)
  • 2 subcriterios de 20 puntos (granularidad gruesa)
  • Ningún subcriterio — 40 puntos atribuidos en bloque (evaluación global)

La descomposición lo cambia todo.

Con 8 subcriterios de 5 puntos, un expediente medio puede acumular 3/5 y 4/5 regulares y acabar en 28/40. Un expediente excelente en algunos aspectos pero débil en otros puede acabar con la misma puntuación — los picos y los valles se compensan.

Con 2 subcriterios de 20 puntos, la varianza explota. Un evaluador que pone 18/20 en el primer subcriterio y 10/20 en el segundo produce el mismo total de 28/40 — pero la nota refleja un perfil radicalmente diferente.

Con una nota en bloque de 40 puntos, la subjetividad es máxima. El evaluador lee el conjunto de la sección y atribuye una impresión global. Ninguna trazabilidad fina. Ningún medio de saber qué elementos han contado.

El problema para el licitador

Los subcriterios no siempre se publican. El poder adjudicador no está obligado a ello (salvo si constituyen criterios autónomos verdaderos — jurisprudencia CE, 2016). Resultado: conoce los criterios pero no el baremo fino de calificación.

El bid manager que no sabe cuántos subcriterios componen "Metodología — 40 pts" tiene dos opciones. O bien cubre todo uniformemente — es la estrategia del 12/20 garantizado. O bien identifica los subcriterios probables analizando las expectativas detalladas del pliego de condiciones y estructura su memoria en espejo — es la estrategia de la memoria calcada sobre el baremo que apunta al 17/20.

El pliego de condiciones da las pistas. Si la sección de metodología del cuaderno de cargas detalla ocho temas distintos (gobernanza, proceso de cualificación, gestión de incidencias, gestión de cambios, reporting, gestión documental, plan de calidad, transferencia de competencias), es razonable anticipar que el baremo interno refleja esos ocho temas.

Granularidad del baremoEfecto sobre la calificaciónRiesgo para el licitador
Fina (8 x 5 pts)Notas suavizadas, poca varianzaDifícil diferenciarse — hay que ser bueno en todo
Media (4 x 10 pts)Varianza moderada, algunos temas pesan másRiesgo de pasar por alto un bloque de alto peso
Gruesa (2 x 20 pts)Varianza elevada, nota muy dependiente de los temas elegidosUna mala elección de posicionamiento cuesta 20 puntos
En bloque (1 x 40 pts)Nota de impresión globalSubjetividad máxima — la forma influye tanto como el fondo

Conclusión clave: El bid manager que no estructura su memoria en espejo del baremo obliga al evaluador a buscar. Y un evaluador que busca es un evaluador que penaliza — no por mala fe, sino por restricción de tiempo. El baremo ponderado no es un detalle administrativo. Es la arquitectura invisible que determina su nota.


Los sesgos del evaluador

El bid manager tiene sus sesgos — hemos hecho la anatomía detallada. Pero el evaluador también tiene los suyos. Y los suyos impactan directamente su nota.

La diferencia fundamental: el bid manager puede trabajar sobre sus sesgos. Puede formalizar su proceso, usar checklists, apoyarse en un sistema cognitivo. El evaluador, por su parte, opera en un marco restringido — tiempo limitado, múltiples expedientes, presión institucional — donde los sesgos no solo están presentes sino que son estructuralmente inevitables.

Sesgo de anclaje — el primer expediente calibra la nota

El evaluador lee los expedientes en un orden. El primer expediente que abre se convierte, inconscientemente, en su referencia. Si es el mejor expediente del lote, todos los siguientes sufren por comparación. Si es el más débil, los siguientes se benefician de un efecto de contraste favorable.

El evaluador no elige el orden de lectura. Toma la pila. Y la primera impresión del primer expediente calibra la escala de calificación que aplicará a todos los siguientes. Es el sesgo de anclaje de Tversky y Kahneman aplicado en condiciones reales — y ningún baremo de calificación, por fino que sea, lo elimina.

Sesgo de halo — una sección brillante colorea el resto

El evaluador que lee una sección "Comprensión de la necesidad" excepcional — precisa, factual, que nombra los riesgos, que reformula los desafíos — desarrolla una impresión positiva sobre el conjunto del expediente. Cuando llega a la sección "Recursos humanos", que es correcta pero sin brillo, tiende a sobreevaluar. "Este candidato es serio, su sección de equipo también debe ser sólida."

Lo inverso es cierto. Una sección débil — genérica, reciclada, sin prueba — contamina la evaluación de las secciones siguientes. El evaluador lee el resto con un prejuicio negativo. Incluso una buena sección de metodología será leída con más escepticismo después de una comprensión de la necesidad descuidada.

El halo funciona en ambas direcciones. Y opera con más fuerza en las primeras secciones leídas — lo que explica por qué el resumen ejecutivo y la comprensión de la necesidad son las secciones más estratégicas de la memoria. No porque pesen más en el baremo. Porque calibran la lectura de todo lo demás.

Fatiga cognitiva — el 5.o expediente no tiene la misma oportunidad

Un evaluador que comienza su jornada está atento. Lee los detalles. Anota los matices. Distingue un 14 de un 15. Cuatro horas y tres expedientes después, su capacidad de discriminación ha caído. Los estudios en psicología cognitiva (Baumeister, R.F. et al., Ego Depletion, Journal of Personality and Social Psychology, 1998) muestran que la calidad de las decisiones se degrada significativamente tras una serie de tareas exigentes.

El quinto expediente se lee con el 60 % de la atención del primero. Las sutilezas se pierden. Los argumentos finos se sobrevuelan. Las secciones largas se escanean aún más rápido. La nota refleja no solo la calidad del expediente, sino también el momento en que se lee en la pila.

El licitador no puede hacer nada al respecto — no controla el orden de lectura. Pero puede adaptarse: un expediente construido para ser comprendido en modo degradado — con primeras frases que portan el mensaje, tablas que concentran las pruebas, títulos que resumen la sección — resiste mejor a la fatiga cognitiva que un expediente que exige una lectura atenta para ser apreciado.

Sesgo de conformidad — el ponente influye en la comisión

En comisión de evaluación, los miembros no son independientes. El ponente — el que ha leído el expediente en profundidad y presenta su análisis — influye en los coevaluadores. Es el sesgo de conformidad de Asch: en situación de grupo, los individuos tienden a alinear su juicio con el de quien se expresa primero.

Si el ponente es entusiasta, los coevaluadores tenderán a confirmar. Si es crítico, buscarán los defectos en lugar de las cualidades. La nota final refleja menos la opinión colectiva que la opinión del ponente amplificada por el conformismo.

SesgoMecanismoEfecto sobre la notaCómo el licitador puede adaptarse
AnclajeEl primer expediente leído calibra la escalaLos expedientes leídos tras un excelente primer expediente son infrapuntuadosConstruir un expediente que imponga su propia escala desde la primera página — resumen ejecutivo impecable
HaloUna sección fuerte/débil colorea el restoSobre/infravaloración de las secciones siguientesInvertir masivamente en las primeras secciones leídas — comprensión de la necesidad, resumen ejecutivo
FatigaLa discriminación baja con el tiempoLos expedientes leídos al final del día se puntúan más groseramenteEstructurar para la lectura degradada: títulos portadores, tablas, recuadros, primeras frases que resumen
ConformidadEl ponente influye en el grupoLa nota de comisión converge hacia la opinión del ponenteHacer el expediente "fácil de defender" — argumentos límpidos, pruebas incontestables, sin ambigüedad

Conclusión clave: El evaluador no es una máquina. Está sometido a los mismos sesgos cognitivos que el bid manager — anclaje, halo, fatiga, conformidad. La diferencia: el licitador no puede corregir los sesgos del evaluador, pero puede construir un expediente que les resista. Un expediente que ancle positivamente, que no dé pie al halo negativo, que sobreviva a la fatiga, y que sea fácil de defender en comisión.


La dinámica de comisión

La comisión de evaluación es el momento en que su nota se cristaliza. Es también el momento menos comprendido de todo el proceso.

El ponente presenta — los demás han sobrevolado

En la mayoría de las comisiones, cada lote o cada criterio tiene un ponente. Es él quien ha leído realmente los expedientes en detalle. ¿Los demás miembros de la comisión? Han sobrevolado. A veces leído el resumen ejecutivo. A veces nada en absoluto. Llegan con el baremo vacío y escuchan al ponente.

No es negligencia. Es una restricción de tiempo. Un contrato con cinco lotes y cinco expedientes son 25 evaluaciones a conducir. Si cada evaluador tuviera que leer cada expediente en profundidad para cada criterio, harían falta tres semanas. Se dispone de tres días.

Resultado: el ponente tiene un peso desproporcionado. Su análisis, sus formulaciones, su entusiasmo o su reserva — todo ello estructura el debate. Los coevaluadores reaccionan a su presentación, no al expediente directamente.

Los debates versan sobre los casos límite

Lo que no genera debate en comisión: el expediente excelente y el expediente mediocre. El 17/20 y el 9/20 rara vez se cuestionan. Todo el mundo lo ve.

Lo que genera debate: los expedientes entre 12 y 15. Los que son "correctos pero..." Los que tienen secciones fuertes y secciones débiles. Los que hacen dudar al evaluador entre dos notas.

El debate en comisión sigue un esquema previsible. El ponente presenta. Un miembro hace una pregunta — "¿Qué han previsto para la transferencia de competencias?" El ponente busca en sus notas. Si no encuentra de inmediato, la respuesta es "no está claro en el expediente". No "no está en el expediente" — "no está claro". El matiz es importante: significa que la información quizá esté ahí, pero no se ha encontrado. Y en comisión, información no encontrada = información ausente.

El consenso blando

Un expediente que provoca debate es un expediente en peligro. No porque el debate sea negativo — sino porque el mecanismo de resolución del debate es el consenso blando.

El ponente dice "15". Un miembro dice "13". Otro dice "14". Nadie quiere ser el outlier. Nadie quiere bloquear la comisión. Se encuentra un punto medio — 14. El punto medio es casi siempre inferior a la nota del ponente, porque las objeciones tiran hacia abajo y los argumentos positivos no tiran con la misma fuerza hacia arriba.

Es la asimetría fundamental de la comisión: es más fácil justificar una bajada ("falta tal elemento") que justificar una subida ("su sección de metodología es realmente excepcional" — "sí, pero falta el plan de transferencia"). El defecto es concreto. La calidad es subjetiva.

La mejor nota no es la que impresiona a un evaluador. Es la que es indiscutible — la que no ofrece asidero a una objeción, ningún ángulo de ataque a un miembro de comisión que quisiera bajarla. Cada hueco, cada ambigüedad, cada afirmación sin prueba es una puerta abierta al consenso blando.

Conclusión clave: En comisión, un expediente que provoca debate es un expediente que pierde puntos. El consenso blando tira hacia abajo. El objetivo no es impresionar — es ser incontestable. Cada sección sin huecos, cada criterio cubierto, cada prueba aportada es un punto que nadie puede quitarle.


Lo que el evaluador no puede puntuar — pero que influye

Hay una categoría de elementos que no aparece en ningún baremo de calificación, que no corresponde a ningún subcriterio, que no tiene ningún punto dedicado — y que sin embargo influye en la totalidad de la nota.

La maquetación y la legibilidad

El evaluador no puntúa la maquetación. Pero la ve. Un documento aireado, con títulos claros, tablas legibles, una paginación limpia, márgenes suficientes — es un documento que dice "nos hemos tomado este contrato en serio". Un documento comprimido, en fuente 9, con tablas que desbordan, títulos inconsistentes y erratas — es un documento que dice "hemos cumplido el trámite".

La maquetación no tiene puntos dedicados. Pero actúa como un multiplicador silencioso del sesgo de halo. Colorea la impresión de la pasada 1. Facilita o dificulta la pasada 2. Influye en la nota de cada criterio sin aparecer nunca en el baremo.

La coherencia interna

El evaluador detecta las contradicciones. No siempre conscientemente — pero la señal es potente. Si su sección "Comprensión de la necesidad" identifica un riesgo de subdimensionamiento y su sección "Recursos humanos" propone un efectivo mínimo sin mencionar ese riesgo, el evaluador registra la incoherencia. No la puntúa explícitamente. Pero la confianza en el expediente baja un escalón.

La coherencia interna es el test invisible: ¿este expediente ha sido escrito por una sola inteligencia que domina el conjunto, o por tres personas que no se han comunicado? Las memorias recicladas son las más vulnerables — al provenir cada sección de un expediente diferente, las contradicciones son inevitables.

El sentimiento de comprensión

El factor más poderoso y el menos formalizable. Cuando el evaluador lee un expediente y se dice "esta gente comprende mi problema", la nota sube. No 2 puntos. De 3 a 5 puntos. Sobre el conjunto de los criterios. Porque el sentimiento de comprensión no es un criterio — es un filtro que amplifica o atenúa todos los criterios.

Este sentimiento nace de detalles acumulados: un riesgo nombrado que nadie más nombra, una reformulación que muestra que ha leído entre líneas del pliego, una pregunta formulada en Q&R que ha dado en el clavo, un vocabulario que refleja el del cliente en lugar de una jerga de consultor.

No está en el baremo. No es medible. Pero es el factor que separa los 14/20 de los 17/20 cuando el fondo es comparable. El evaluador no puede justificar "he puesto 17 porque sentí que comprendían". Pero puede justificar — y lo hace — "la comprensión del contexto es profunda, los riesgos específicos están identificados, la metodología está adaptada a la necesidad". Son los síntomas medibles de un sentimiento que no lo es.

Factor invisibleSin puntos dedicados pero...Cómo responder
Maquetación / legibilidadAmplifica el halo positivo o negativo desde la pasada 1Documento aireado, títulos claros, tablas legibles, cero erratas
Coherencia internaDegrada la confianza con cada contradicción detectadaRelectura cruzada, un hilo conductor único, sin secciones recicladas contradictorias
Sentimiento de comprensiónMultiplica la nota en todos los criterios de 3 a 5 puntosNombrar los riesgos específicos, reformular los desafíos, usar el vocabulario del cliente

Conclusión clave: Los elementos fuera del baremo — legibilidad, coherencia, sentimiento de comprensión — no tienen ningún punto dedicado pero influyen en cada nota. Son multiplicadores silenciosos. Un expediente que los domina transforma un 13/20 de fondo en 16/20 de nota. Un expediente que los descuida transforma un 16/20 de fondo en 13/20 de nota.


Lo que hay que recordar

El proceso de calificación no es el espejo del proceso de redacción. Comprender cómo su oferta se lee, se puntúa y se compara cambia fundamentalmente la manera en que la construye.

Cinco lecciones del otro lado de la mesa:

  1. El evaluador escanea, no lee. Tres pasadas. La primera ancla una impresión. La segunda produce la nota en 30 segundos por criterio. La tercera — que la mayoría de los expedientes nunca ven — desempata a los finalistas. Cada información debe sobrevivir al escaneo.

  2. El baremo ponderado es un iceberg. Los criterios son visibles. Los subcriterios — que determinan realmente la nota — son a menudo invisibles. Estructurar su memoria en espejo del baremo probable es la decisión arquitectónica más rentable de todo el expediente.

  3. Los sesgos del evaluador son estructurales. Anclaje, halo, fatiga, conformidad — no se corrigen, se sortean. Un expediente construido para resistirles obtiene de 3 a 5 puntos más que un expediente de la misma calidad que los ignora.

  4. La comisión tira hacia abajo. El consenso blando penaliza los expedientes que generan debate. El objetivo no es impresionar a un evaluador — es ser incontestable para la comisión entera.

  5. Los factores invisibles son los más poderosos. Legibilidad, coherencia, sentimiento de comprensión — ningún punto dedicado, pero un efecto multiplicador sobre el conjunto de las notas.


TenderGraph construye la memoria técnica en espejo del proceso de calificación — no del proceso de redacción. Cada sección está alineada con el baremo probable. Cada criterio tiene su respuesta direccionable en menos de 30 segundos. Cada afirmación está respaldada por una prueba trazable. El sistema no optimiza para el bid manager que escribe — optimiza para el evaluador que puntúa. Es la única perspectiva que cuenta.


Leer también:

Etiquetas

#licitaciones#evaluación#calificación#comisión#gestión-de-ofertas#sesgos#baremo#contratación-pública

Siguiente paso

¿Listo para transformar sus respuestas a licitaciones?

Seguir leyendo

Artículos recomendados