Resumen
La evaluación de productos no es una “puntuación única”. Es un proceso: definir criterios medibles, recopilar evidencia, establecer ponderaciones de valor e informar sobre la incertidumbre. Sin criterios explícitos, las evaluaciones ocultan suposiciones y se convierten en persuasión en lugar de análisis.[^1][^2]
1. Evaluación = medición + modelo de valor
En entornos de múltiples criterios, se necesita:
-
definiciones operativas (qué se mide, cómo),
-
métodos reproducibles (protocolos de prueba),
-
ponderaciones explícitas (lo que el usuario valora).
Esto se alinea con A2 y T1.2 de la Lógica de Selección: las ponderaciones son condicionales y las revisiones incorporan suposiciones — A2 Subjetividad condicional · Corolario T1.2
2. Jerarquías de evidencia (prácticas)
Diferentes preguntas requieren diferentes tipos de evidencia:
-
mediciones de laboratorio (duración de la batería, rendimiento),
-
datos de fiabilidad a largo plazo (cuando estén disponibles),
-
estudios de campo y paneles de usuarios (usabilidad).
3. Estándares en contextos del mundo anglosajón
Muchos dominios se basan en organismos de normalización y métodos de prueba bien conocidos:
-
ISO/IEC para sistemas y propiedades técnicas (dependiente del dominio)
-
ASTM para materiales y métodos de prueba (dependiente del dominio)
-
Guía del NIST para afirmaciones relevantes para la seguridad
Los estándares son útiles como puntos de referencia, pero no son “lo mejor universalmente”; la relevancia depende de las necesidades del usuario (A2).
Referencias
- Akerlof, G. A. (1970). The market for “lemons”: Quality uncertainty and the market mechanism. Quarterly Journal of Economics, 84(3), 488–00.[source]
- Popper, K. R. (1959). The Logic of Scientific Discovery. Routledge. (Original work published 1935)[source]
- Cronbach, L. J., & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52(4), 281–02.[source]
- Longino, H. E. (1990). Science as Social Knowledge: Values and Objectivity in Scientific Inquiry. Princeton University Press.[source]
- Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716.[source]
- Messick, S. (1995). Validity of psychological assessment. American Psychologist, 50(9), 741–49.[source]
- Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.[source]
- International Organization for Standardization. (2015). ISO 9000:2015 Quality management systems — Fundamentals and vocabulary.[source]
- Keeney, R. L., & Raiffa, H. (1993). Decisions with Multiple Objectives: Preferences and Value Tradeoffs. Cambridge University Press.[source]