Logo Passei Direto
Material
¡Estudia con miles de materiales!

Vista previa del material en texto

MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 1 
 
 
 
 
 
 
 
L e c t u r a 1 
Buela, G. y Sierra, J. (1997). Evolución histórica de 
la evaluación psicológica. En G. Buela y 
Sierra (dirs.). Manual de evaluación 
psicológica. Madrid:Siglo XXI. 
 
 
 
 
 
 
 
UU NN II DD AA DD II 
 
AA NN TT EE CC EE DD EE NN TT EE SS HH II SS TT ÓÓ RR II CC OO SS DD EE 
LL AA EE VV AA LL UU AA CC II ÓÓ NN CC OO NN DD UU CC TT UU AA LL 
 
Introducción ...............................................................................................2 
La evaluación psicológica en la antigüedad..............................................2 
Antecedentes científicos de la evaluación psicológica .............................4 
Constitución y desarrollo de la evaluación psicológica .............................7 
La contribución de Galton......................................................................7 
La contribución de Cattell ......................................................................8 
La contribución de Binet ........................................................................8 
Aportaciones de otros autores.................................................................10 
La repercusión de la primera y de la segunda guerra mundial ...............10 
Período de crisis de la evaluación psicológica....................................14 
La evaluación conductual ........................................................................17 
La evaluación psicológica en la actualidad .............................................20 
Crisis de la evaluación conductual ......................................................20 
Otros aspectos de actualidad..............................................................21 
Futuro de la evaluación psicológica ........................................................25 
 
 
 
 
 
 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 2 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
IINNTTRROODDUUCCCCIIÓÓNN 
El estado actual de la evaluación psicológica es, sin duda, un producto 
de la evolución histórica de la disciplina y de su interacción con el 
desarrollo de la propia psicología y otras ciencias afines. Por tanto, no 
cabe adentrarse en el concepto de evaluación psicológica, sin pasar 
previamente por un análisis histórico. De hecho, los distintos autores, 
tanto españoles (Pelechano, 1976, 1988; Silva, 1982, 1985; Blanco, 
1986a, 1990; Martorell, 1988; Avila, 1992a; Fernández-Ballesteros, 
1992; Peñate, Matud e Ibáñez, 1993) como extranjeros (Anastasi, 1973, 
1988; Aiken, 1985; Nelson y Hayes, 1986; Goldstein y Hersen, 1990a; 
Thorndike y cols., 1991; Kaplan y Saccuzzo, 1993) que han tratado el 
concepto de evaluación psicológica, han comenzado por un minucioso 
análisis histórico. 
 
McReynolds (1986) justifica este análisis histórico argumentando varias 
razones; en primer lugar, un conocimiento de la evolución histórica de 
la evaluación ofrece una amplia información y una mejor apreciación 
del estado actual de la evaluación psicológica; en segundo lugar, el 
pasado es importante por sí mismo, ya que forma parte de la herencia 
de la humanidad; y, en tercer lugar, hace posible que algunas 
aproximaciones o directrices empleadas por nuestros antecesores, y 
olvidadas desde entonces, vuelvan a ser descubiertas. 
LLAA EEVVAALLUUAACCIIÓÓNN PPSSIICCOOLLÓÓGGIICCAA EENN LLAA AANNTTIIGGÜÜEEDDAADD 
 
Al examinar la historia de la humanidad, McReynolds (1986) pretende 
poner de manifiesto que, desde los tiempos más antiguos, en todas las 
sociedades civilizadas se utilizó algún procedimiento de evaluación. 
Así, dentro de una primera etapa, que podría etiquetarse como mágica 
o mítica, aparece en muchas culturas la adivinación o predicción del 
futuro, donde podría incluirse la astrología. Ésta es considerada por 
diversos autores (McReynolds, 1986; Silva, 1985; Pelechano, 1988) 
como uno de los primeros antecedentes de la evaluación psicológica. 
Según McReynolds (1975), el comienzo de la astrología podría situarse 
en el siglo v. a C. con el Tetrabiblos (libro de los signos zodiacales) de 
Ptolomeo. Los astrólogos plantean que de igual forma que los astros 
regulan la ritmicidad del ciclo día-noche, de las mareas, de las 
cosechas, etc., también determinan una gran parte de la conducta 
humana -entiéndase carácter humano-. En otras palabras, los individuos 
son particularmente sensibles a la influencia de los astros, estando dicha 
influencia determinada por la posición relativa de los planetas en el 
momento del nacimiento. A primera vista, parece que se dan las 
condiciones necesarias para un proceso diagnóstico, puesto que existe 
un evaluador, un evaluado, unos instrumentos, una intención por la 
explicación y el pronóstico y una teoría que lo sustenta. Sin embargo, un 
análisis más detallado nos lleva a entender la astrología como algo 
considerablemente distinto de la evaluación psicológica, para que pueda 
considerarse un antecedente. En primer lugar, la astrología es una 
práctica que podría incluirse dentro de lo mágico; en segundo lugar, el 
sujeto objeto de evaluación no es el individuo en sí, ni su ambiente 
inmediato, sino tan sólo una fecha, una hora y un lugar, de hecho se 
puede hacer una predicción sin la presencia de la persona 
supuestamente evaluada; en tercer lugar, no tiene ninguna utilidad so-
cial, puesto que se limita a predecir el destino determinado por los 
astros; y, por último, la astrología ha tenido una mínima o escasa 
evolución desde sus inicios hasta la actualidad, sin darse ningún tipo de 
interacción con la evolución de la psicología, es decir, la psicología se ha 
desarrollado con total independencia de la astrología. Muestra de ello es 
que ningún astrólogo ha ido desarrollando su teoría hasta convertirla en 
una escuela o corriente psicológica. Por tanto, no hay aspectos de la 
astrología que se hayan transformado hasta convertirse en un constructo 
psicológico. En definitiva, en nuestra opinión, aunque aparentemente 
tienen aspectos comunes, consideramos que la astrología no ha sido un 
antecedente de la actual evaluación psicológica. 
 
DuBois (1970) sitúa el nacimiento de la evaluación psicológica en la 
antigua China, donde se realizaba una selección de los niños que en el 
futuro podrían ejercer funciones en la administración pública. Los 
seleccionados eran sometidos a un intenso programa de aprendizaje, al 
final del cual se evaluaba si habían conseguido la capacitación para 
ocupar los puestos que les serían asignados. Por tanto, parece un claro 
antecedente de la selección de personal. Otro hecho aislado que se 
suele citar como antecedente de la evaluación psicológica son los 
procedimientos de la escuela de Pitágoras para seleccionar a sus 
alumnos (Martorell, 1988). 
Otro antecedente en el que suelen coincidir los autores que han 
estudiado la evolución histórica de la evaluación psicológica es la 
fisiognomia (las características psicológicas de un individuo pueden 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 3 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
evaluarse por sus rasgos físicos), que tiene sus raíces en el 
pensamiento filosófico griego. Según Rubinstein (1981), la historia de la 
ciencia demuestra cómo las antiguas ideas de los filósofos griegos se 
formaron en el proceso cognoscitivo prácticodel hombre, con la 
acumulación de conocimientos de los naturistas, médicos y filósofos. 
Dichas ideas se desarrollaron en oposición a las ideas mitológicas sobre 
el mundo en general y sobre el hombre en particular. En este contexto, 
resulta de especial importancia la concepción filosófica de Aristóteles, 
quien aspira a vencer el dualismo de su maestro Platón. Aristóteles 
entiende el cuerpo y el alma como algo indivisible. Por tanto, cada una 
de las funciones orgánicas tiene su alma, considerando al cuerpo un 
organismo compuesto por órganos e instrumentos del alma. Por ello, la 
teoría del alma es la teoría general de la vida y sus funciones, lo que 
implica tanto sus funciones orgánicas como la vida consciente 
(Rubinstein, 1981). Con Aristóteles, lo psíquico se aproxima a lo físico, 
lo que implica una base biológica del carácter. Las ideas de Aristóteles 
tuvieron su continuidad en su discípulo Teofrasto. Este hace una 
sistematización de los principios de la fisiognomia que lleva a plantear 
distintos caracteres que se establecen por medio de la observación de 
la conducta manifiesta de los individuos. Se establece así una nosología 
de los caracteres, en la que se incluyen diversos adjetivos tales como 
arrogantes, estúpidos, avaros, cobardes, etc., que servían para 
clasificar a los individuos según sus hábitos. Esta interacción cuerpo-
psique es defendida posteriormente por Cicerón y Séneca en la Roma 
Clásica, así como por autores árabes como Averroes o Avicena. La idea 
de la evaluación de las características psicológicas a través de las 
características somáticas está presente en tiempos más recientes en las 
tipologías de Kretschmer y Sheldon. Siguiendo en este contexto, nos 
encontramos con la teoría de Hipócrates que postula cuatro tipos 
(sanguíneo, flemático, colérico y melancólico) a partir de cuatro clases 
de humores. 
 
Esta concepción naturalista manifestada por una evaluación 
psicológica a partir de características somáticas (propia de la 
fisiognomía y del pensamiento hipocrático) será frenada en la Edad 
Media por la filosofía teológica, que tendrá su máximo exponente en la 
concepción de la locura como una posesión diabólica. Con el fin de dife-
renciar a los sujetos poseídos de aquellos que no lo estaban se publica 
en 1486 el libro Malleus Malleficarum [El martillo de los herejes], en cuya 
segunda parte se describen los signos que permitían identificar a las 
brujas. Estos procedimientos utilizados por la Inquisición para evaluar, o 
mejor dicho para interrogar, a sus víctimas podrían ser considerados un 
antecedente remoto de la entrevista estructurada (Zubin, 1989). 
 
A caballo entre los antecedentes filosóficos y biológicos se encuentra 
la contribución más importante de este período a la evaluación 
psicológica, la obra de Juan Huarte de San Juan Examen de ingenios 
para las ciencias, publicada en 1575 y traducida al inglés, en 1698, con el 
título The tryal of wits (McReynolds, 1986). En España se reeditó en cinco 
ocasiones hasta que en 1581 fue incluida en el catálogo de libros 
prohibidos de Lisboa y dos años después en el de Madrid. Siguiendo 
las correcciones de la Inquisición, Huarte redacta una nueva versión que 
es publicada por su hijo Luis Huarte en 1594. Esta versión tiene 
bastantes erratas, quizás debido a lo desordenado que dejó el material 
antes de morir. Sin embargo, fue la versión utilizada en las ediciones 
posteriores que se hicieron en España, mientras que las ediciones 
realizadas en Holanda fueron de la edición original. Este libro fue 
traducido al latín, inglés, holandés, italiano, francés y alemán (García 
Vega, 1989; Velarde, 1993). En esta obra se plantea por primera vez la 
evaluación de una forma explícita. Se considera que las personas 
difieren en cuanto a su talento y que dichas diferencias deben eva-
luarse para conseguir una adecuación entre las habilidades, las distintas 
ocupaciones y los tipos de educación. Así, considera que el ambiente 
influye en el aprendizaje, por lo que recomienda que los estudios 
deben realizarse en una ciudad diferente de la que se es natural, pues 
la influencia de familiares y amigos es un estorbo para el aprendizaje 
(Pérez-Alvarez, 1991). Su libro es una profesiografía en la que incluye 
las principales ocupaciones de su tiempo (véase Gondra, 1994). Es, por 
tanto, el precursor más claro de la selección de personal. En opinión de 
Carpintero (1989), Huarte de San Juan fue un discípulo de Vives, puesto 
que ambos compartían la idea de que el ingenio deriva de los humores. 
Vives ya había planteado anteriormente el tema de la diversidad de los 
ingenios, las diferentes adaptaciones a los estudios y la importancia 
social de una educación adaptada a las dotes de los educandos. En su 
obra El tratado del alma propone la práctica de la observación 
introspectiva y objetiva para llegar a conocer las funciones del alma. 
Vives fue considerado por Watson como el padre de la psicología 
moderna, aunque actualmente se le considera más como un 
antecedente de la modificación de conducta (Pérez-Álvarez, 1991). 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 4 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
Dentro del ámbito universitario, la evaluación surge de forma paralela a 
la creación de las primeras universidades europeas, donde se 
realizaban exámenes regulares para la obtención de títulos y 
distinciones (Anastasi, 1988). 
 
En definitiva, quizás el antecedente más claro de la evaluación 
psicológica sea la tendencia natural del hombre a evaluar a los demás. 
Podría señalarse un sinfín de posibles antecedentes de la evaluación 
psicológica; sin embargo, para contextualizar los principales 
acontecimientos que dieron lugar a los actuales instrumentos de evalua-
ción, no necesitamos remontarnos más allá del siglo XVIII. 
AANNTTEECCEEDDEENNTTEESS CCIIEENNTTÍÍFFIICCOOSS DDEE LLAA EEVVAALLUUAACCIIÓÓNN 
PPSSIICCOOLLÓÓGGIICCAA 
 
Los importantes avances científicos ocurridos durante el siglo XVIII, y 
sobre todo en el xlx, harán que la psicología se separe de la 
especulación filosófica y se acerque al método científico. Los 
antecedentes científicos de la evaluación psicológica podrían situarse en 
el desarrollo de disciplinas como la frenología, la matemática, la 
psicofísica, la psiquiatría, la psicología educativa y el evolucionismo. 
 
La frenología surge a finales del siglo XVIII y pronto alcanza una gran 
popularidad. Su creador, Gall (1758-1828), proporciona la primera 
conceptualización sistemática de los rasgos, la cual se apoya en los 
siguientes enunciados: 
 
a) Las facultades mentales son innatas. 
b) El cerebro es el órgano de la mente. 
c) La forma y el tamaño del cerebro se pueden conocer según la 
forma y medida del cráneo. 
d) La mente posee facultades separadas, el cerebro está 
compuesto de órganos separados y cada facultad mental se 
manifiesta por medio de un órgano cerebral distinto. 
e) El tamaño de cada órgano puede ser estimado durante la vida y, 
con las restantes condiciones iguales, el tamaño es una medida 
de la capacidad del órgano. 
f) Todo órgano, si es predominantemente activo, imprime al cuerpo 
ciertas actitudes y movimientos, que se denomina "su lenguaje 
natural". 
 
Aunque la frenología ya forma parte de la historia, sirvió para asentar la 
idea de que la conducta y el organismo no son entidades 
independientes, sino que están íntimamente unidas. Gall practicaba un 
sistema de diagnóstico basado en la palpación del cráneo para conocer 
las facultades dominantes en cada individuo. Entre las aportaciones que, 
según McReynolds (1986), la frenología aporta a la evaluación psicoló-
gica destacan las siguientes: 
 
a) Se crea una taxonomía mental, según la cual se pueden explicar 
las diferencias individuales 
b) Se hace énfasisen las diferencias individuales. 
c) Se postula una vertiente aplicada de la psicología. 
d) Se propone el paradigma de la evaluación, diferenciando los 
elementos incluidos en una sesión de evaluación (evaluados, 
sujetos evaluado, perfiles…). 
e) Se elaboran escalas para evaluar variables de personalidad. 
f) Se hace énfasis en la objetividad de los datos. 
En España la frenología estuvo representada por Cubí, quien realizó 
algunas aportaciones teóricas a esta disciplina y propagó estas ideas 
hasta el punto de llegar a crear una escuela. Mediante la craneoscopia 
se diagnosticaban dimensiones y facultades psicológicas en los 
individuos, de acuerdo con un sistema preestablecido. Según 
Carpintero (1989), la obra de Cubí ha tenido su importancia en la historia 
de la evaluación psicológica en España. 
 
La matemática tuvo cierta influencia en la constitución y el posterior 
desarrollo de la evaluación psicológica. La primera aportación está 
representada por Quetelet, un matemático belga que hoy es considerado 
como uno de los fundadores de la aplicación de la estadística a las 
ciencias sociales (Silva, 1982). Quetelet estudió variables biológicas y 
sociológicas, observando que ambas seguían una distribución gaussia-
na, por lo que desarrolló normas y medidas de tendencia central. Su 
influencia sobre la evaluación psicológica se centra en dos aspectos 
importantes: ser uno de los autores que se interesó de forma 
sistemática por las diferencias individuales y que sus métodos tuvieron 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 5 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
gran influencia en autores importantes como Galton, Pearson y 
Spearman. 
 
La psiquiatría ha sido otra disciplina que ha contribuido en buena 
medida al desarrollo de la evaluación psicológica. El esfuerzo por 
diferenciar los trastornos mentales se traduce en la necesidad de 
técnicas de evaluación para establecer diagnósticos diferenciales. Así, 
Pinel (1745-1826) introduce una breve clasificación de las enfer-
medades mentales que posibilitaba un tratamiento más diferenciado. 
Pinel defiende el valor de las historias clínicas para el diagnóstico. 
Pero, sin duda, su contribución más importante fue el cambio de actitud 
sobre los enfermos mentales, pasando a considerarlos como enfermos 
con derecho a un tratamiento y a la libertad, y no como sujetos que 
había que separar y encerrar, tal como se consideraban hasta en-
tonces. Las ideas de Pinel llegaron a Italia, encontrando su máximo 
defensor en Lombroso, quien centró su obra en la relación entre lo penal 
y lo psiquiátrico, planteando la posible eximente en los delitos cometidos 
por enfermos mentales. El estudio de la relación entre delincuencia y 
enfermedad le llevó a postular su famosa teoría sobre la "delincuencia 
innata". Según esta teoría, la conducta delictiva puede tener un origen 
degenerativo del organismo, debido al efecto de factores como la sífilis, 
el alcohol, la epilepsia, la edad avanzada de los padres, etc., los cuales 
actuarían durante el desarrollo fetal produciendo una degeneración de 
los centros nerviosos superiores, que posteriormente serían la causa 
del comportamiento delictivo. La obra de Pinel alcanza su culminación 
en la figura de Kraepelin (1856-1926), quien se interesó por la 
problemática de la clasificación de los trastornos mentales, conside-
rando que para poder hacer una buena evaluación e intervención era 
necesario contar previamente con una clasificación. Quizás su 
contribución más importante fue el cambio de una concepción 
sintomática de la enfermedad a una concepción evolutiva, es decir, las 
manifestaciones externas de la enfermedad son secundarias respecto a 
su origen y evolución. Su aportación a la evaluación psicológica se 
centra de forma más concreta en su interés constante por evaluar de 
forma objetiva la conducta de sus pacientes. Así, evaluaba funciones o 
aptitudes como memoria, atención, capacidad de aprendizaje, tiempo de 
reacción, asociaciones verbales, etc. Paralelamente a esta etapa 
aumenta el interés por los retrasados mentales, creándose en Europa y 
América numerosas instituciones para su cuidado. El interés por un trato 
adecuado a los retrasados mentales puso de manifiesto la necesidad de 
criterios diagnósticos y de clasificación que permitiesen diferenciar entre 
sujetos normales, enfermos mentales y retrasados. Dentro de este 
contexto hay que destacar a Esquirol (1772-1840), médico francés que 
en 1838 publicó una obra de dos volúmenes, en la que dedicó más de 
un centenar de páginas al retraso mental. Otra contribución importante 
de Esquirol fue su concepción del retraso mental. Para este autor, el 
retraso variaba a lo largo de un continuo desde la normalidad hasta el 
retraso más profundo. Por ello, realizó varios intentos para evaluar y 
clasificar los distintos grados y tipos de retraso mental, llegando a la 
conclusión de que el mejor criterio para evaluar el nivel de deterioro 
intelectual es el uso del lenguaje. Es importante considerar que los 
criterios actuales sobre el retraso mental son en gran parte lingüísticos, y 
que los tests de inteligencia suelen estar bastante saturados de 
contenidos verbales (Anastasi, 1988). Las aportaciones de Seguin, otro 
médico francés, supusieron un nuevo avance al considerar el retraso 
mental como curable. En 1837 crea la primera escuela dedicada a la 
educación de niños retrasados mentales. Muchos de los procedimientos 
de intervención que se utilizan en la actualidad en los centros de 
educación especial están fundamentados en las técnicas propuestas 
por Seguin para el adiestramiento de los sentidos y de la actividad 
muscular. Pero sin lugar a dudas, su gran aportación a la evaluación 
psicológica fue la incorporación de las pruebas de inteligencia manipula-
tiva. Una buena muestra ha sido su Test de ajuste de formas, que 
consiste en una especie de puzzle en el que hay que insertar varias 
piezas de formas diversas y en el menor tiempo posible. 
La psicofísica puede considerarse como una disciplina precursora de la 
psicología científica. Los métodos ideados por Fechner permiten 
relacionar las experiencias subjetivas con medidas objetivas. Por tanto, 
se plantea que las experiencias psicológicas se pueden verbalizar y en 
consecuencia clasificar en escalas de intensidad o discriminación. La 
psicofísica tenía como postulado inicial el descubrimiento de leyes 
generales para describir las relaciones mente-cuerpo. Su contribución a 
la evaluación psicológica se puede observar en el estudio concreto de 
fenómenos psíquicos, relacionando la experiencia subjetiva con 
medidas objetivas, la creación de nuevos métodos para la 
investigación de dichos fenómenos y su sistematización teórica (Za-
brodin, 1985). Aunque autores como Fechner y Weber estaban más 
interesados en leyes generales que en diferencias individuales, con 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 6 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
ellos nace la situación de examen psicológico; así por ejemplo, 
Fechner ya utiliza el autoinforme del sujeto como instrumento de 
evaluación. 
La psicología educativa muestra su auge con los planteamientos 
innovadores producidos en relación al creciente interés por la 
educación, con la consiguiente escolarización obligatoria, naciendo así 
la necesidad de aplicar los principios psicológicos a la escuela y, por 
tanto, la demanda de evaluación del rendimiento académico. 
 
Este interés por la evaluación en el ámbito escolar tuvo su continuidad 
en autores tan relevantescomo Thorndike, Hall y Binet. 
 
El evolucionismo marca un hito importante en la historia de las ciencias 
humanas. El parentesco entre Darwin y Galton propició aún más la 
influencia de las teorías evolucionistas para tratar de explicar las 
diferencias individuales y, en último término, la inteligencia humana. La 
base del evolucionismo consiste en admitir la variabilidad de los 
miembros de una misma especie, donde las características pueden 
heredarse. Por tanto, en la naturaleza se produce una selección natural 
a través de la supervivencia de los miembros más fuertes o mejor 
adaptados. En la especie humana, la diferente capacidad de adaptación 
se denomina inteligencia. Las diferencias de inteligencia eran 
perfectamente asumidas en la sociedad del siglo xIX. Así, el darwi-
nismo social servía para justificar el orden social establecido. En este 
contexto el estudio y evaluación de la inteligencia adquiere gran 
relevancia (Marrero, Espino y Gámez, 1989). 
 
Los antecedentes más científicos de la evaluación psicológica tienen 
sus raíces en los primeros laboratorios de psicología. En 1877 se 
produjo el primer intento para fundar un laboratorio de psicofisiología 
por parte de los científicos británicos Venn y Ward. Sin embargo, el 
Senado de Cambridge rechazó esta iniciativa, calificando a dichos 
científicos de ateos (Yakunin, 1985). Dos años más tarde, Wundt 
inauguraba en Leipzig (1879) el primer laboratorio de psicología, 
considerándose este momento como el nacimiento de la psicología 
científica. La idea de Wundt de acercar la psicología a la fisiología, a 
pesar de encontrar una clara oposición en los círculos filosóficos, 
pronto ganó adeptos. Sin embargo, esta idea no era nueva, ya que 
Séchenov, un destacado científico ruso, había tratado de interpretar los 
fenómenos psíquicos desde un punto de vista fisiológico. De hecho, su 
libro Reflejos del cerebro fue editado en 1863, es decir, once años 
antes de que Wundt publicara Bases de la psicología fisiológica. En un 
artículo escrito en 1873, Séchenov, partiendo de la tradición materialista 
de los pensadores rusos, defiende la tesis sobre la determinación 
objetiva de la psiquis. Las ideas de Séchenov tuvieron una gran 
acogida entre los psiquiatras y neurólogos rusos, lo cual llevó a una 
reestructuración de la psicología desde una vertiente fisiológica. Una 
muestra de ello es la creación del primer laboratorio de psicología en 
Rusia, fundado por Béjteriev en 1886 en la clínica de enfermos alienados 
y enfermedades nerviosas en la ciudad de Kazán. Pocos años 
después, en 1891, se constituía la Sociedad Rusa de Psicología 
Experimental (Yakunin, 1985). Desde su creación y hasta el principio 
del siglo xx el laboratorio de Wundt se consideró el centro de la 
psicología experimental, siendo el ejemplo a seguir en la creación de 
nuevos laboratorios. El objeto de estudio de los nuevos psicólogos 
experimentales era llegar a plantear descripciones generales de la 
conducta humana. Las diferencias individuales no sólo no interesaban, 
sino que llegaban a considerarse como "errores de medida". En la 
elección de los temas y en algunos métodos utilizados se plasmaba la 
influencia de la medicina y de la fisiología. Coincidimos con Pelechano 
(1988) al considerar que el tipo de psicología experimental practicada 
por Wundt y sus seguidores supuso en realidad una limitación al 
desarrollo de la evaluación psicológica. Wundt negó la importancia de 
la psicología diferencial, no autorizaba la utilización de cuestionarios 
para la investigación psicológica, no aceptaba la posibilidad de una 
psicología científica fuera del laboratorio ni los estudios filogenéticos y 
ontogenéticos del psiquismo humano. Sin embargo, no todo fue 
negativo, puesto que la psicología experimental del siglo XIX sirvió para 
poner de manifiesto la importancia de controlar de forma rigurosa las 
condiciones en las que se hacían las observaciones. Por ejemplo, se 
controlaban las características del estímulo, el contexto en el que se 
presentaba, las instrucciones que recibía el sujeto, etc. En definitiva, se 
trataba de evaluar a todos los sujetos en las mismas condiciones 
tipificadas. Como es bien sabido, esto fue totalmente asumido en el 
proceso de construcción y en la aplicación de tests (Anastasi, 1988). 
 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 7 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
CCOONNSSTTIITTUUCCIIÓÓNN YY DDEESSAARRRROOLLLLOO DDEE LLAA EEVVAALLUUAACCIIÓÓNN 
PPSSIICCOOLLÓÓGGIICCAA 
 
Existe un cierto consenso en considerar a Galton, Cattell y Binet como 
los autores que configuraron la evaluación psicológica como disciplina 
científica. A continuación se hará referencia a ellos, así como a otros 
autores que también han contribuido de modo relevante a la constitución 
de la evaluación psicológica. En segundo lugar, se hará un recorrido por 
los diferentes acontecimientos que han supuesto el desarrollo de esta 
disciplina. 
La contribución de Galton 
 
Galton (1822-1911) es considerado como el padre de la psicometría y 
de la psicología diferencial. A pesar de ser un hombre polifacético en 
cuanto a sus intereses científicos, supo centrar su investigación sobre la 
herencia de la inteligencia humana. Pensaba que ésta es innata y, por 
tanto, mediante el carácter hereditario podía conseguirse una mejora de 
los individuos a través de la eugenesia. Su laboratorio antropométrico 
del Kensington Museum en Londres se hizo famoso en todo el mundo. 
En el año 1884, coincidiendo con la celebración de un congreso 
internacional de higiene, establece un laboratorio antropométrico y 
propone a los visitantes conocer, por el precio de tres peniques, la 
medida de algunos de sus rasgos físicos, la agudeza visual y auditiva, el 
tiempo de reacción, la fuerza muscular y algunas funciones sensoriales. 
Con estos datos publicó la primera tabla de baremos, donde podían 
comparar sus resultados los posteriores visitantes del laboratorio 
(DuBois, 1970). La mayoría de los instrumentos que se utilizaban en su 
laboratorio antropométrico fueron creados por él mismo, y algunos 
siguen vigentes aún en la actualidad, como es el caso de la barra de 
Galton para la discriminación visual de la longitud y la serie de pesos 
graduados para medir la discriminación cinestésica. Dio especial 
importancia a la discriminación sensorial, pues pensaba que ésta servía 
para evaluar la capacidad intelectual. Así, en las múltiples evaluaciones 
realizadas encontró que los idiotas tendían a presentar deficiencias en la 
capacidad de discriminación de la temperatura y del dolor (Anastasi, 
1988). 
 
Como se ha dicho anteriormente, Galton estaba influido por las ideas de 
su primo Darwin, influencia que queda plasmada en su primera obra 
Hereditary genius [La herencia de la genialidad] publicada en 1869. 
Diez años después, y coincidiendo con el año en que Wundt inauguraba 
el primer laboratorio de Psicología, Galton publica dos artículos sobre 
psicometría titulados «Psychometric experiments» y «Psychometric 
facts». En 1883 publica su obra más importante Inquiries into human fa-
culty and its development [Investigaciones sobre la facultad humana y su 
desarrollo], que con el transcurso del tiempo se convertiría en un clásico 
de la evaluación psicológica. Las aportaciones más relevantes de Galton 
podrían resumirse en los siguientes puntos (Pelechano, 1988): 
 
a. Interés por hacer un análisis cuantitativo de las 
características y diferencias humanas. En este aspecto se 
notaba una influencia del matemático Quetelet, quien en el año 
1846 ya había demostrado cómo ciertos indicadores 
antropométricos seguían una distribución gaussiana. Por tanto, 
Galton defendía que las diferencias individuales se podían 
explicar de forma adecuada si seconcebían como continuos 
cuantitativos que seguían la distribución de la curva de Gauss. 
b. Interés por la recopilación empírica y sistemática de la 
información. Esto se demuestra en su infatigable labor en el 
laboratorio antropométrico del South Kensington Museum de 
Londres, donde llegó a recopilar datos correspondientes a 9 377 
personas que eran evaluadas en un número considerable de 
pruebas (tiempo de reacción, medidas físicas, respuestas a 
escalas de calificación...). 
c. Aplicación de la estadística para interpretar la 
información. Además de utilizar algunas medidas de tendencia 
central, Galton introdujo el índice de correlación (de hecho, en 
el año 1888 llegó a publicar un artículo sobre «Corelations and 
their measurement, chiefly from antropometric data») que 
posteriormente sería completado por Pearson, dando lugar al 
coeficiente de correlación y sobre el cual se asentaría el modelo 
correlacional. 
d. Interés por el estudio de las diferencias individuales. 
Siguiendo la teoría evolucionista, Galton entendía las 
diferencias individuales como resultado de mecanismos y 
procesos hereditarios. Para demostrar esto utilizó el estudio de 
los árboles genealógicos y las correlaciones de pruebas 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 8 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
psicológicas entre padres e hijos. Por medio de esta 
metodología pudo llegar a plantear la ley de regresión a la 
media. Galton se vio obligado a plantear esta ley para poder 
explicar algunos datos tales como que padres muy inteligentes 
tendían a tener hijos menos inteligentes, mientras que padres 
poco inteligentes tendían a tener hijos más inteligentes. 
 
El pensamiento de Galton y un buen resumen de su obra pueden verse 
en el libro Herencia y eugenesia, en el que se recoge una recopilación de 
textos procedentes de diversas obras suyas. 
La contribución de Cattell 
 
James McKeen Cattell (1861-1934) fue un psicólogo estadounidense 
con una sólida formación adquirida en Europa. Su tesis doctoral trató 
sobre las diferencias individuales en el tiempo de reacción y fue 
realizada en el laboratorio de Wundt (Leipzig). Posteriormente, trabajó 
con Galton en el laboratorio antropométrico del South Kensington 
Museum de Londres. En 1888 fue nombrado profesor de psicología en la 
Universidad de Pensilvania. Dos años después publica en la revista 
Mind un artículo titulado «Mental tests and measurements», el cual 
marca un hito en la historia de la evaluación psicológica, puesto que es 
la primera vez que se utiliza el término "test" en la literatura psicológica 
(McReynolds, 1986) y en él se describían los tests que se aplicaban 
anualmente a los estudiantes universitarios con la intención de evaluar 
su nivel intelectual. Posteriormente se trasladó a la Universidad de 
Columbia, donde creó la primera batería de pruebas de evaluación 
psicológica. En poco tiempo la metodología y el procedimiento para 
elaborar los tests se hicieron muy populares. En la última década del 
siglo xIx los tests se aplicaban, en Estados Unidos, a todo tipo de 
sujetos (escolares, estudiantes universitarios, adultos...). Sin embargo, 
la fulgurante trayectoria de Cattell se detiene, al menos parcialmente, 
ante las críticas planteadas por Wissler y Sharp. El primero, que había 
sido discípulo de Cattell, presentó un detallado estudio en el que 
analizaba los resultados de Cattell, demostrando la poca validez 
alcanzada por los tests. En concreto, demostró que los coeficientes de 
correlación entre los tests psicológicos y las calificaciones escolares 
eran relativamente bajos. Lo mismo ocurría cuando se contrastaban 
distintos tests que supuestamente evaluaban lo mismo. Por otra parte, 
Sharp demostró la baja fiabilidad y el poco valor predictivo que tenían 
los tests de Cattell (Pelechano, 1988). Estas críticas unidas al hecho de 
que Cattell sigue vinculado a procedimientos de laboratorio y a la 
evaluación de procesos psicológicos básicos hace que destaque la 
figura de Binet (Silva, 1982). 
 
La contribución de Binet 
 
Binet (1857-1911) era un licenciado en leyes y doctor en ciencias 
naturales que entró en la psicología de la "mano" de Ribot, el gran 
promotor de la psicología experimental en Francia. Ribot entendía que el 
progreso de la psicología estaba en los métodos experimentales 
(aunque no era un investigador), no en vano fue el fundador del primer 
laboratorio de psicología en la Universidad de la Sorbona, en el año 
1889. Este laboratorio estuvo dirigido por Bonin hasta 1895, a partir de 
entonces la dirección pasa a Binet (Yakunin, 1985). En el año 1895, 
Binet funda L'Année Psychologique, la primera revista francesa de 
psicología. En esta revista publica un artículo, «La psychologie 
individuelle», en el que presenta las bases para una nueva aproximación 
a la evaluación de la inteligencia. Binet compartía con Galton el interés 
por la evaluación de las diferencias individuales, pero rechazaba la idea 
de que la inteligencia humana podía evaluarse por medio de los 
procesos sensoriomotores. En su artículo, Binet y Henri defienden que la 
inteligencia debe evaluarse según el rendimiento de los sujetos en 
diversas tareas que impliquen una variedad de procesos mentales 
complejos (McReynolds, 1986). Binet y Henri comenzaron evaluando 
procesos como la memoria, la atención, la imaginación, la 
comprensión, la sensibilidad artística y moral, la sugestibilidad, la fuerza 
de voluntad y la habilidad motora. Binet incluye como características de 
la conducta inteligente el tomar y mantener una dirección definida, el 
adaptarse para alcanzar un fin y la autocrítica (Cronbach, 1990). 
 
La gran oportunidad de Binet llega cuando es nombrado por el 
Ministerio de Educación francés miembro de la comisión que se 
encargaría de buscar una solución para los niños deficientes que habían 
entrado en la escuela pública como consecuencia de la puesta en vigor 
de la enseñanza obligatoria en Francia. En respuesta a esta petición, 
Binet, en colaboración con Simon, desarrolla una escala que contiene 30 
 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 9 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
problemas con grado de dificultad creciente. Para calcular el nivel de 
dificultad se aplicó la escala a 50 niños normales con edades 
comprendidas entre 3 y 11 años y a algunos con retraso mental. El 
contenido de los ítems cubría gran variedad de funciones, aunque 
predominaban los problemas relativos a comprensión y razonamiento. 
La prueba resultante que se conoce como la escala de 1905 fue 
considerada como un instrumento de evaluación provisional (Anastasi, 
1988). Como señala Pichot (1994, p. 120) «por primera vez se había salido 
de la era de las experiencias de laboratorio para entrar en la vida 
concre ta» . Binet y Simon siguen trabajando en esta escala, y en 1908 
presentan una segunda versión en la que se habían adaptado series de 
ítems para grupos de edad. La edad mental se establecía según la edad 
correspondiente a la serie más elevada resuelta totalmente. Puesto que 
cada serie, que se corresponde con una edad mental determinada, 
consta de cinco problemas, se añadía a la edad base (la de la serie 
correctamente realizada en su totalidad) 1/5 de año por cada test bien 
resuelto perteneciente a series superiores. La edad mental obtenida se 
ponía en relación con la edad cronológica, viendo de esta forma si el niño 
seguía una evolución normal, retrasada o adelantada. En 1911, se 
presenta una tercera versión de la escala, se aumentó el número de ítemsen algunos niveles y se extendió a la edad adulta. Sin embargo, la versión 
más difundida fue la realizada por Terman en la Universidad de Stanford, 
conocida como la Escala de Stanford-Binet. En ésta se utiliza por pri-
mera vez el término de «cociente intelectual» (CI), como razón resultante 
de dividir la edad mental por la edad cronológica. Posteriormente, 
aparecieron otras versiones, pero resulta de especial interés la realizada 
por Kuhlmann en 1912 (Escala Kublmann-Binet) que extendió la 
escala por su parte inferior hasta la edad de tres meses, siendo revisada 
posteriormente en 1937 y 1960'. Terman efectúa otras dos revisiones y, 
finalmente, Thorndike realiza la última hasta la fecha, en 1986 (Rogers, 
1995). 
 
Sin embargo, estas escalas no estaban exentas de problemas. Así, 
mientras Galton postulaba la medida de una inteligencia innata o 
biológica, Binet defiende la evaluación de una inteligencia de origen social 
(Luján, 1991). Pronto el movimiento eugenísta toma como instrumento el 
test de Binet y Símon identificando la inteligencia innata con la social. 
Pelechano (1988) señala que la lógica utilizada por Binet en la 
construcción e interpretación de la escala era correcta, pero vista desde 
una óptica actual tenía algunos problemas importantes: 
 
a. No se demostró que las conductas muestreadas fuesen 
representativas de lo que se pretendía evaluar (la capacidad 
intelectual). 
b. La muestra utilizada para la tipificación de las puntuaciones no 
era representativa de la población a la que luego se aplicaba. 
c. La utilización de la edad cronológica como variable criterio para 
graduar la edad mental, haciendo así implícito que cada doce 
meses se produce un cambio en la capacidad intelectual. 
d. El modelo acumulativo según el cual cada problema resuelto 
equivale a un período de edad mental no fue demostrado. 
e. El supuesto de que la distribución de las puntuaciones es igual 
en cada grupo de edad no es correcto. 
f. Se supone que todos los niños tienen un desarrollo normativo, 
es decir, igual al del grupo de referencia. 
 
Por otra parte, el tipo de problemas que se planteaba estaba 
íntimamente relacionado con los contenidos académicos, por lo que 
la escala era buena predictora del rendimiento académico, que no 
es lo mismo que capacidad intelectual. 
 
A pesar de los problemas metodológicos que se detectan en las 
escalas de Binet, éste debe ser considerado como el gran 
propulsor de la evaluación psicológica. Su actividad ha sido 
realmente la de un evaluador y su influencia ha estado vigente du-
rante varias décadas. Una buena muestra de ello fue la cantidad 
de investigadores que se interesó por la evaluación de la 
inteligencia durante las dos primeras décadas del siglo XX. La 
producción en este campo era tan abundante como diversificada. 
Por ello, en 1921 los directores del Journal of Educational Psychology 
organizaron un congreso bajo el título La inteligencia y su medida e 
invitaron a distintas autoridades en la materia (Terman, Thorndike, 
Peterson, Thurstone, Woodrow, Pinter, Colvin, Henmon...) para 
tratar sobre la naturaleza de la inteligencia (Sternberg, 1986). El 
resultado fue decepcionante; había casi tantas concepciones de 
inteligencia como expertos que opinaban sobre el tema. El 
desconcierto era tal que Binet llegó a pronunciar la famosa frase 
«inteligencia es lo que miden los tests». Sin embargo, el congreso 
sirvió para establecer un cierto acuerdo acerca del camino a seguir 
en la futura investigación de la inteligencia (Marrero y cols., 1989). 
 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 10 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
Desde entonces, han pasado más de setenta años y aún no se ha 
llegado a un acuerdo unánime acerca de lo que es la inteligencia y de 
cómo debe evaluarse (Eysenck, 1991). 
AAPPOORRTTAACCIIOONNEESS DDEE OOTTRROOSS AAUUTTOORREESS 
 
Cuando Cattell abandonó la Universidad de Pensilvania su lugar fue 
ocupado por Witmer (1867-1956) quien, al igual que el anterior, estaba 
interesado en el estudio de las diferencias individuales. Sin embargo, 
su principal interés se centraba en la aplicación práctica de los 
conocimientos psicológicos. En el año 1896, Witmer funda la primera 
clínica psicológica (de hecho suele considerarse esta fecha como el 
nacimiento de la psicología clínica, aunque por ello no debe 
interpretarse que Witmer fue el primer psicólogo clínico). El tipo de 
trabajo que se realiza en esta clínica se recoge en los primeros 
números de la revista The Psychological Clinic, fundada en 1906 y 
dirigida por Witmer. La mayoría de los casos que se trataba procedía 
del ámbito escolar. En los primeros años, no disponía de pruebas 
específicas de evaluación por lo que su diagnóstico se basaba 
fundamentalmente en la entrevista. Posteriormente, cuando aparecen 
los tests, adopta alguno de ellos e incluso crea el Witmer formboard y 
el Witmer cylinders, que fueron utilizados durante varios años en su clí-
nica. Se centraba en la evaluación de conductas específicas de los 
sujetos con vistas al tratamiento de dichas conductas. Por ello, se le ha 
considerado como un antecesor de la evaluación conductual 
(McReynolds, 1986). Witmer fue un autor con una influencia limitada 
en la evaluación psicológica. Sin embargo, su gran mérito fue tratar de 
aplicar la psicología a los problemas que se plantean en la vida real. Por 
otra parte, su clínica psicológica sirvió como modelo a otras muchas 
que se fundaron posteriormente. 
 
Spearman (1863-1945) supone otro paso importante en la constitución 
de la evaluación psicológica por haber aplicado los métodos 
correlacionales a la investigación de la inteligencia. En el año 1904 
publicó un importante artículo titulado «General intelligence, objectively 
determined and measured», donde se sientan las bases de la teoría 
psicométrica. Fue el primer autor que se interesó en buscar una 
explicación a la baja correlación que se obtenía entre distintos tests de 
inteligencia y en plantear la necesidad de utilizar pruebas paralelas para 
su evaluación. La gran aportación de Spearman no sólo fue 
metodológica, sino que además fue el autor de la primera gran teoría de la 
inteligencia, denominada teoría de los dos factores (un factor general y 
unos factores específicos). Según dicha teoría, la capacidad 
representada en el factor general (factor g) está relacionada con todas 
las tareas intelectuales, mientras que las capacidades representadas en 
los factores específicos se relacionan con tareas sencillas. Para explicar 
la naturaleza del factor g Spearman propuso dos teorías. En la primera, 
se decía que el factor g estaba relacionado con el nivel de energía 
cerebral que las personas pueden utilizar para resolver problemas 
intelectuales; la segunda considera que las diferencias en el factor g 
pueden explicarse según las diferencias individuales en la capacidad de 
las personas para utilizar tres principios cualitativos de cognición: 
aprehensión de la experiencia, deducción de relaciones y deducción de 
correlaciones (Sternberg, 1986; Marrero y cols., 1989). En la década de 
los años treinta este esquema bifactorial será sustituido por un modelo 
multifactorial representado por Thurstone. 
 
Por último, Freud (1856-1939) plantea un enfoque diagnóstico basado 
en las técnicas de asociación y en la utilización del simbolismo. En 1909 
sus conferencias en la Clark University of New York propiciarán la 
difusión del psicoanálisis en Estados Unidos (Ávila, 1992b), dando lugar 
al diagnóstico dinámico que se desarrollará a partir de la década de los 
años treinta con el uso de las técnicas proyectivas. 
LLAA RREEPPEERRCCUUSSIIÓÓNN DDEE LLAA PPRRIIMMEERRAA YY DDEE LLAA SSEEGGUUNNDDAA 
GGUUEERRRRAA MMUUNNDDIIAALL 
 
Existeun cierto acuerdo entre los diferentes autores en considerar las dos 
contiendas mundiales como hechos determinantes en la evolución de la 
evaluación psicológica, enmarcándose entre esos dos momentos 
históricos lo que Silva (1982) denomina la "época clásica" del 
diagnóstico psicológico; así, según este autor, tanto la línea psicométrica 
como la proyectiva y la clínica de la actual evaluación psicológica viven 
aún de los grandes hitos de esta época: los grandes tests de 
inteligencia, los primeros cuestionarios de intereses y los primeros tests 
proyectivos. Durante las dos primeras décadas del siglo xx, la evaluación 
psicológica se vio enriquecida por un gran número de investigaciones, 
artículos y manuales sobre el tema, como puede verse de forma 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 11 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
detallada en McReynolds (1986). El desarrollo alcanzado por la 
evaluación psicológica hasta entonces es interpretado por Silva (1982) 
en función de tres aspectos importantes: 
 
a. La construcción y perfeccionamiento de las pruebas 
de Binet-Simon y las posteriores aportaciones de Goddard 
(traductor de las escalas de Binet-Simon al inglés en 1910), 
Stern (introductor del concepto cociente mental) y Terman 
(autor de la versión de la escala Stanford-Binet de 1916 e 
introductor del concepto cociente intelectual). 
b. La importancia que adquiere la educación 
(fundamentalmente a raíz de la entrada en vigor de las leyes 
que regulan la educación obligatoria en varios países) lleva 
consigo un interés creciente de la evaluación psicológica en el 
ámbito educativo. 
c. La gran aportación metodológica de Pearson y 
Spearman que sientan los fundamentos de una teoría 
psicométrica, vigente aún en la actualidad. Por otra parte, la 
teoría de la inteligencia propuesta por Spearman generó 
diversas líneas de investigación acerca de la naturaleza de la 
inteligencia y de los instrumentos para evaluarla. 
 
Con el comienzo de la primera guerra mundial, la industria generada en 
torno a la guerra afecta también a la psicología, y más concretamente a 
la evaluación psicológica. Así, la American Psychological Association 
(APA) nombró un comité que se encargaría de estudiar la posible 
ayuda que podría ofertar la psicología. Era quizás una buena 
oportunidad para demostrar a la sociedad que la psicología podía 
tener una importante vertiente aplicada. El comité estaba dirigido por 
Robert Yerkes y contaba con miembros tan relevantes como Terman, 
Woodworth y Otis, entre otros. Pronto se vio la necesidad de 
seleccionar a más de un millón de soldados, para lo cual era 
imprescindible disponer de pruebas colectivas que permitiesen clasificar 
a los soldados según su nivel intelectual y sus aptitudes para 
desempeñar uno u otro tipo de servicio. Dado que la mayoría de los 
tests existentes era de aplicación individual, fue necesario recurrir a 
todo tipo de tests que se pudiesen aplicar de forma colectiva. Arthur 
Otis puso a disposición del Ejército una serie de tests que estaba ela-
borando, pero que aún no había llegado a publicar. En cierto modo 
podría decirse que la situación era similar a la que se le había 
planteado unos años antes a Binet, aunque había dos diferencias muy 
claras: el equipo de Yerkes tenía que seleccionar sujetos adultos de una 
población general (piénsese que la mayoría de las pruebas estaba 
elaborada para niños y estudiantes universitarios) y además la 
selección debería hacerse "contra reloj". Se necesitaban pruebas de 
dificultad progresiva, con respuestas cortas, corrección rápida y 
objetiva, con diferentes formas (para evitar el aprendizaje) y de 
aplicación colectiva. Las pruebas construidas para evaluar el nivel 
intelectual fueron conocidas como el Army alpha test y el Army beta 
test. La primera se aplicaba a la población general (instruida) y 
constaba de las siguientes subpruebas: cumplir órdenes, problemas 
aritméticos, sinónimos y antónimos, juicios prácticos, analogías, 
información y gramática. Cada subprueba tenía una dificultad creciente 
y debía responderse en un tiempo limitado. La segunda prueba estaba 
pensada para personas analfabetas o personas que no hablaban 
inglés; por tanto, en ésta no se incluían contenidos verbales, sino que 
constaba de laberintos, series, cubos, puzzles, construcciones 
geométricas, cifras, símbolos y números. Por supuesto, el tiempo para 
responder también era limitado. Para evaluar la sintomatología 
neurótica se utilizó el Woodworth personal data sheet, un inventario de 
personalidad elaborado por Woodworth y que llegó a aplicarse a más 
de un millón y medio de personas. 
 
La influencia de todo este proceso ha tenido gran importancia en el 
desarrollo de la evaluación psicológica en diversos aspectos, que 
intentaremos sintetizar en los siguientes puntos: 
 
a. El primero, y quizás el más importante, ha sido 
considerar la figura del psicólogo como un profesional 
cualificado que puede resolver problemas de la vida real. 
b. El perfeccionamiento de la metodología de la 
construcción de tests y la formación de un gran banco de datos 
(más de un millón y medio de sujetos) de la población general. 
c. El tipo de evaluación realizada en el ejército se adaptó 
a campos como el industrial (selección y evaluación de 
personal) y el clínico. 
d. La consolidación de la aplicación de tests con la 
consiguiente connotación del "psicólogo pasador de tests". 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 12 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
 
La evaluación psicológica del período entre las dos guerras mundiales 
es caracterizada por Silva (1982) como de «creciente expansión» y 
«creciente disociación». La «creciente expansión» se refiere a la 
universalización de la evaluación psicológica y su generalización a otros 
ámbitos (distintos del militar) y la especialización de la evaluación en 
áreas tan diversas como inteligencia, aptitudes, motricidad, intereses, 
conducta social, personalidad, etc. La «creciente disociación» hace 
referencia a que, por un lado, se produce un espectacular crecimiento 
del modelo psicométrico y, por otro, surge también con gran fuerza una 
evaluación clínica, principalmente de tipo proyectivo, y que no acepta 
los avances técnicos y metodológicos del modelo psicométrico. Esta 
evaluación de corte clínico no surge al azar después de la primera gue-
rra mundial. Por un lado, los instrumentos de evaluación clínica no 
tenían ninguna utilidad en las tareas de selección y colocación 
requeridas por el ejército estadounidense, pero sí se convierten en 
necesarios después de la guerra para la reinserción de sujetos a la 
sociedad. La difusión de las técnicas proyectivas tiene su inicio en la 
publicación por parte de Rorschach en 1921 de Psychodiagnostik, 
aunque no conviene olvidar que Jung ya había presentado en 1904 la 
prueba de asociación libre de palabras. 
 
Los antecedentes del test de Rorschach pueden remontarse a la antigua 
idea griega de que la interacción de una persona con una entidad 
ambigua facilita información para el conocimiento de la primera. Según 
Álvarez (1972), en sus versiones más primigenias, el test de Rorschach 
es tan antiguo como el hombre de Cro-Magnon, cuando interpretaba 
las "manchas" de aquellos refugios rupestres. En el Renacimiento, 
Leonardo da Vinci aconsejaba a sus discípulos que ejercitaran su 
imaginación contemplando los desconchones o las figuras que la 
humedad dibujaba en las paredes. También puede relacionarse con una 
costumbre arraigada en algunasregiones de Alemania que consistía en 
tirar una gota de plomo fundido en un recipiente de agua fría e 
interpretar la forma resultante al solidificarse. Según la tradición, cuando 
la interpretación se realizaba en la noche de San Silvestre podía 
averiguarse el futuro de la persona que arrojaba el plomo fundido. Pero 
sin duda, el antecedente más claro es la técnica denominada klebsografía 
(desarrollada por Klebs) que consiste en echar unas gotas de tinta 
sobre un papel que posteriormente se dobla por la mitad, 
interpretándose las manchas resultantes. A finales del siglo XIX, Binet 
comienza a utilizar las manchas de tinta para estudiar la capacidad de 
imaginación visual. Algunos años después, Herman Rorschach utiliza 
esta técnica para el diagnóstico de la personalidad y de los trastornos 
psíquicos. De la totalidad de láminas utilizadas selecciona diez con el 
fin de publicar su método, lo cual no consiguió hasta dos años 
después, gracias a la mediación de Morgenthaler, que además sugirió 
a Rorschach que cambiase su título original, «Método y resultados de 
un experimento diagnóstico basado en la percepción e interpretación 
de formas causales» por el de «Psicodiagnóstico». En un principio, el 
libro tuvo muy poca aceptación. Las críticas fueron pocas y en general 
desfavorables, lo cual le produjo una decepción considerable. 
Rorschach murió sin saber la popularidad que llegaría a tener la 
técnica que había creado (Serrate, 1980). En los años siguientes la 
evaluación dinámica irrumpe con fuerza, fundamentalmente en la 
psicología de la personalidad, y la técnica de Rorschach se convierte 
en una de las pruebas más conocidas y utilizadas (Goldstein y Hersen, 
1990b). Una encuesta realizada por Lubin, Larsen y Matarazzo (1984) 
entre psicólogos clínicos estadounidenses sitúa al Rorschach en el 
cuarto lugar entre los tests más usados, detrás del Wechsler adults 
inteligente scale (WAIS), Minnesota multiphasic personality inventory 
(MMP1) y el Test gestáltico de Bender. Pocos años después, Murray 
publica en 1935 el Test de apercepción temática (TAT) como una 
alternativa a la técnica de Rorschach por su subjetivismo y falta de 
fiabilidad y validez. Otra fecha relevante es la de 1939 cuando Frank 
propone el término "método proyectivo" para aludir a estas pruebas, 
caracterizándolas por un material con una estructura mínima y en las 
que el sujeto "estructura" el material proyectando en esta 
estructuración su modo personal de ordenar la realidad. 
 
De forma paralela a este desarrollo de técnicas proyectivas se siguen 
produciendo avances en el área psicométrica manifestados por un 
refinamiento de las técnicas factoriales. Así, Thurstone publica en 1935 
Vectors of the mind y en 1938 Primary mental abilities, en donde la 
inteligencia adquiere una naturaleza multivariable (Rogers, 1995). En 
1939 se publica la Wechsler-Bellevue intelligence scale, la primera escala 
de Wechsler para adultos, con algunas diferencias con respecto a la 
Stanford-Binet: cada subtest incluía ítems para cada grupo de edad, 
hacía menos énfasis en la velocidad de respuesta y contenía bastantes 
componentes no verbales (Rogers, 1995). Otras publicaciones 
relevantes de esta época son el Inventario de intereses vocacionales de 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 13 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
Strong en 1927 y el Test gestáltico de Bender en 1938. La coexistencia de 
estos dos polos (clínico-proyectivo e intelectual-psicométrico), 
aparentemente opuestos, ha conducido, tal como plantea Pelechano 
(1988), a una cierta hibridación; así, la evaluación picométrica intenta ir 
más allá de una simple puntuación y, al mismo tiempo, hay un intento 
de objetivización y cuantificación de las técnicas proyectivas. Sin 
embargo, a pesar de los esfuerzos realizados para aumentar la fiabilidad 
de las técnicas proyectivas [véase, por ejemplo, Exner (1990)], las 
críticas que recibieron fueron contundentes. Ante esta situación, Silva 
(1982, 1985) plantea tres posibles opciones: seguir utilizando estas 
técnicas basándose en una aproximación proyectivodinámica, haciendo 
caso omiso de las críticas científicas; prescindir de ellas; o mantenerlas, 
sustituyendo las interpretaciones psicodinámicas por otras propias de 
enfoques interpretativos diferentes. A pesar de que la opción más 
adecuada es la última (Martorell, 1988), las más frecuentemente 
seleccionadas son las primeras. 
 
En la década de los años treinta comienza una época de discusiones 
teóricas en la psicología soviética —entiéndase el término como 
genérico, y no como la psicología de una determinada escuela. En 1930 
comienza la "discusión reactológica"; la reactología había sido propuesta 
pocos años antes por Kornilov y en ella se trataba de integrar la 
reflexología de Béjteriev y la psicología de la conciencia. Posteriormente, 
en 1932, se amplía la discusión a la teoría del desarrollo cultural de las 
funciones psíquicas superiores (desarrollada por Vigotski). Las 
discusiones sobre la reflexología, la reactología y la teoría del desarrollo 
cultural llevan a una intervención del gobierno. En palabras de 
Rubinstein (1981, p. 103) «sólo la resolución del Comité Central del PC 
de la U.S. del 4 de julio de 1936 desenmascaró algunas teorías 
sumamente perjudiciales y reaccionarias, las cuales inhibían con sus 
falsas frases seudomarxistas el desarrollo de la psicología, 
disgregándola por medio de conceptos acientíficos. Dicha resolución 
eliminó al mismo tiempo varios impedimentos externos de organización 
en el trabajo de la investigación psicológica de la URSS». En esta 
resolución se prohibía la construcción y utilización de los tests en la 
Unión Soviética (tal como estaba constituida hasta 1991). A partir de 
dicha resolución la evaluación psicológica en la Unión Soviética se 
centra en la elaboración de procedimientos experimentales de 
evaluación de procesos básicos (memoria, percepción, atención...) y 
complejos (pensamiento, comprensión, abstracción...). La producción, 
tanto teórica como experimental, se incrementa de forma considerable. 
Se crean varios centros de investigación y/o docencia en psicología: el 
Instituto Estatal de Psicología de Moscú, la Cátedra de Psicología del 
Instituto Pedagógico Estatal (Leningrado), un Departamento de 
Psicología en el Instituto Béjteriev de Investigación Cerebral, y otros en 
Georgia y Ucrania. Fruto de ello, cabe resaltar los trabajos de Blonskii 
(sobre la memoria), Teplov (sobre las facultades o aptitudes), Kravkov 
(sobre psicofisiología), etc. Por otra parte, se potenció la evaluación 
neuropsicológica, como quedó patente en los numerosos y excelentes 
trabajos de Luria. 
 
Tal como había sucedido con la primera guerra mundial, la segunda 
guerra mundial también tiene como consecuencia un gran incremento en 
la construcción y aplicación de tests. Para la selección del personal 
militar, en Estados Unidos se desarrolló el Army general classification test 
(que incluía subpruebas de lectura, vocabulario, razonamiento 
aritmético, cálculo aritmético y relaciones espaciales), una prueba de 
aplicación colectiva —por razones obvias— y que fue aplicada a más de 
nueve millones de personas durante la guerra. Además, se elaboraron 
otras pruebas más específicas para la selección de oficiales y de 
cuerpos técnicos del Ejército. Mientras tanto, el ejército británico había 
optado por la utilización de pruebas de inteligencia general (que 
evaluaban el factor g) con contenidos no verbales. Dos de las pruebas que 
se emplearon están vigentes en la actualidad: las Matrices progresivas de 
Raven y el Test de los dominós de Anstey. En definitiva, podría decirse 
que la segunda guerra mundial supuso la aplicación de tests más 
numerosa que se ha hecho hastala actualidad. Se estima que en 1944, 
en los países aliados, se pasaron unos sesenta millones de tests a unos 
veinte millones de personas (Pelechano, 1988). 
 
Al comienzo de los años cuarenta, Hathaway y Mckinley presentaron el 
Minnesota multiphasic personality inventory (MMPI), construido 
según el modelo psicométrico, y que constituye una de las mayores 
aportaciones en el ámbito de la evaluación de la personalidad y de la 
evaluación clínica (Goldstein y Hersen, 1990b). El auge que tuvo esta 
prueba fue enorme, y todavía en la actualidad continúa siendo uno de 
los instrumentos más utilizados en la práctica clínica (Lubin y cols., 1984; 
Keller, Butcher y Slutske, 1990). Para elaborar las escalas que se 
incluyen en el MMPI se seleccionaron aquellos ítems que maximizaban 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 14 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
las diferencias entre los sujetos con clara sintomatología psicopatológica 
y sujetos "normales". 
 
A modo de resumen, se puede apuntar que esta etapa coincidente con las 
guerras mundiales supone un desarrollo de la evaluación de la 
personalidad, al mismo tiempo que se sigue desarrollando la evaluación 
de la inteligencia a través de escalas individuales como las de Terman y 
las de Wechsler y el refinamiento de la evaluación colectiva gracias a las 
técnicas factoriales. En este período surge también, tal como se 
comentó, la polémica entre la evaluación proyectíva y la psícométrica 
que llevará a incongruencias, que se siguen manteniendo todavía en la 
actualidad, tales como el empleo simultáneo del MMPI, el Rorschach y 
las escalas de Wechsler. 
Período de crisis de la evaluación psicológica 
 
Al finalizar la segunda guerra mundial, en Europa comienza un período 
de reconstrucción a todos los niveles, pero con una preferencia en los 
sectores económico y laboral. En este contexto, la psicología queda 
relegada a un segundo plano en espera de una mejor situación 
económica, produciéndose así un incremento en la emigración —que 
había comenzado antes de la guerra— de importantes psicólogos 
europeos a Estados Unidos (Titchener, Münsterberg, Levin...). Sin duda, 
ésta fue una causa adicional que contribuyó a un mayor desarrollo de la 
psicología en Estados Unidos a partir de la posguerra. Estados Unidos al 
final de la guerra se encuentra con el problema de la integración de los 
soldados a la vida civil. La "desarrollada" evaluación psicológica 
especializada en selección de grandes masas ya no tenía tanta utilidad. 
Ahora era necesaria una psicología orientada a la evaluación individual y 
a la rehabilitación. Por otra parte, la polémica, en un principio 
académica, sobre genetistas y ambientalistas pasa a ser un tema de 
debate social. A esto se unía una crítica, cada vez mayor, hacia el uso 
indiscriminado de todo tipo de tests, tal como ilustra Cronbach (1972, p. 
36): 
 
un psicólogo que hubiese inventado un test se limitaba a imprimir 
copias para su uso general y a través, generalmente, de una 
empresa que vendía aparatos a los laboratorios de psicología. 
Cuando la demanda de tests creció después de la primera 
guerra mundial, algunas firmas se especializaron en la 
publicación de tests, incluyendo las especializadas en tests 
escolares... Cada institución, universidad, empresa, o cualquier 
otra, planificaba y financiaba su propio programa. Cada cual 
adaptaba un test según su propia elección. Y en este sentido, 
reinaba una absoluta libertad. 
 
La utilización de tests llega a ser tan frecuente que el propio Cronbach 
se sorprende de que, sólo treinta meses después de haberse aplicado el 
primer test colectivo para población escolar, éste se había administrado a 
más de cuatro millones de niños en Estados Unidos. Por su parte, 
Holtzman (1971) estima que en los colegios estadounidenses se aplican 
anualmente más de 250 millones de tests. 
 
La psicología soviética durante estos años no sólo se había consolidado, 
sino que además había afinado sus críticas hacia los tests. Algunas de 
estas críticas se resumen en los siguientes puntos (Rubinstein, 1981): 
 
a. Si dos personas resuelven o no un mismo test, el significado 
psicológico de este hecho no es único, puesto que un mismo resultado 
puede ser motivado por procesos psíquicos diferentes. Por tanto, el que 
un test haya sido resuelto o no, no determina la naturaleza interna del 
acto psíquico correspondiente. 
b. Según el método de los tests, la evaluación de la personalidad se 
deriva tan sólo de la evaluación estadística de los datos externos que se 
han obtenido por el individuo en respuesta a determinadas cuestiones. 
Por tanto, este método sólo se basa en un enfoque mecánico, que parte 
de la conducta y se orienta hacia la personalidad. Se intenta establecer la 
evaluación de la personalidad que se va desarrollando sólo con una 
prueba, sin tener en cuenta el desarrollo del individuo y la influencia de 
la educación. 
c. El error se acentúa si se quiere establecer un pronóstico, 
partiendo para ello del supuesto de que el nivel que se ha calculado por 
medio de dicho test en un determinado grado de desarrollo caracterizará 
también en el futuro a la persona evaluada. Según esto, se admite una 
trascendente predeterminación de toda ulterior evolución de un ser 
humano bajo las condiciones que se han dado y, consciente o 
inconscientemente, se niega la posibilidad de transformación del hombre: 
del adulto por la interacción social y del niño por medio de la educación. 
d. Cuando a dos personas de distinto desarrollo y en condiciones 
diferentes se les formula el mismo test estándar y, según sus respectivas 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 15 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
soluciones, quieren obtenerse conclusiones sobre su inteligencia, se 
comete evidentemente un error, pues no se tiene en cuenta que los 
resultados dependen de las condiciones de evolución o desarrollo. Dos 
estudiantes o dos trabajadores pueden resolver los tests de diferente 
manera, porque uno de los estudiantes está menos preparado y uno de 
los trabajadores menos versado que los otros. Pero por medio de la 
enseñanza los unos pueden superar a los otros. 
e. El hecho de que determinados tests puedan ser resueltos por el 
75% de los niños de un intervalo de edad y de un determinado ambiente 
escolar no es razón para considerarlo como criterio mediante el cual se 
pueda establecer la inteligencia o el desarrollo intelectual de los niños 
que fueron educados en condiciones muy distintas. Postular tal 
conclusión equivaldría a no considerar que los resultados del test 
dependen de las condiciones de evolución del ser humano concreto. 
f Otro inconveniente es el hecho de que se emplean escalas 
estandarizadas y se intenta clasificar a los individuos por medio de 
pruebas en las cuales no se tienen en cuenta las diferencias individuales. 
g. También debe resaltarse el contenido casuista y a menudo 
provocador de estas pruebas, las cuales, por lo general, no consideran la 
preparación específica del sujeto en la evaluación. Al formular problemas 
que no están ligados con la enseñanza se cree, equivocadamente, poder 
obtener conclusiones sobre la capacidad de aprendizaje del sujeto. 
 
Todos estos factores contribuyeron a una crisis que Maloney y Ward 
(1976) describieron como un período de exacerbado pragmatismo 
empirista y con tendencia a las fórmulas y recetarios de evaluación a 
modo de "libros de cocina". Al igual que Cronbach (1972), estos 
autores también hablan del abuso y uso indiscriminadoque se ha hecho 
de los tests, así como de su mala interpretación y/o desconocimiento del 
significado de los mismos. Silva (1982) describe esta situación como 
una «crisis externa», de cara a la sociedad, pero, además, este autor 
habla de una «crisis interna», centrada en las garantías científicas y 
aspectos psicométricos. La eficacia predictiva de los instrumentos 
psicométricos queda en entredicho en una revisión de Ghiselli en 1955; 
por su parte, Edwards en 1957 habla de la influencia de la deseabilidad 
social en los cuestionarios de personalidad. Durante este período las 
críticas iban dirigidas tanto a las pruebas psicométricas como a las 
técnicas proyectivas y al diagnóstico psiquiátrico. Así, los tests de 
inteligencia eran acusados de tener escasa utilidad de cara a la 
intervención psicológica, algunas de las escalas del MMPI como las 
de depresión y esquizofrenia estaban contaminadas por otras categorías 
diagnósticas, etc. Tanto el Rorschach como el TAT fueron objeto de 
múltiples estudios con el fin de analizar su objetividad y los diferentes 
tipos de fiabilidad y validez, los cuales en general mostraron resultados 
negativos. Por su parte, el diagnóstico psiquiátrico fue fuertemente 
criticado por la falta de fiabilidad y validez, y por sustentarse en el mo-
delo médico de enfermedad, considerando la conducta anormal como 
un síntoma de enfermedad y etiquetando a la persona según un sistema 
nosológíco. Las críticas llegaron incluso a la efectividad de la 
psicoterapia, surgiendo así una nueva área de la evaluación 
psicológica, la evaluación de las intervenciones. Un buen ejemplo de 
ello es la publicación en 1952 de The effects of psychoterapy: An 
evaluation por parte de Eysenck. 
 
Sin embargo, toda crisis tiene sus aspectos innovadores y positivos; así, 
en este contexto aparecen numerosas publicaciones, consideradas 
clásicas actualmente, referentes a aspectos psicométricos. En 1950 
Gulliksen publica The theory of mental test con el fin de sistematizar los 
procedimientos de validación de los tests; en 1955 aparece el trabajo 
de Cronbach y Meehl Construct validity in psychological tests; y en 1958 
se publica la primera edición de Psychological testing de Anastasi. El 
esfuerzo por un acercamiento más individualizado a la evaluación 
psicológica hace que surjan durante la década de los años cincuenta 
diferentes pruebas vigentes todavía en la actualidad: la Prueba de 
clasificación Q de Stephenson, el Diferencial semántico de Osgood y las 
Técnicas de rejilla de Kelly (Silva, 1982). Asimismo, esta década va a 
suponer también el desarrollo de la evaluación factorial de la 
personalidad. En Gran Bretaña, Eysenck comienza a elaborar y 
desarrollar sus cuestionarios de factores básicos de personalidad; 
mientras, en Estados Unidos, Cattell publica su cuestionario de dieciséis 
factores. Otro hito importante en esta época es la publicación por parte 
de Meehl en 1954 del libro Clinical versus statistical prediction. A 
theoretical analysis anda review of the evidence, en donde se critican 
abiertamente las técnicas proyectivas, en especial su baja objetividad, 
su poca fiabilidad test-retest y su baja validez predictiva, 
presentándose como alternativa científica el MMPI; además, como 
manifiesta Pelechano (1988), la falta de una teoría en la que 
sustentarse lleva a identificar estas técnicas con las teorías 
psicoanalíticas. Sin embargo, estas críticas no influyeron en absoluto en 
su empleo; así, Sundberg (1961) comunica que entre los tests más 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 16 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
utilizados por psicólogos clínicos en el año 1959 se encontraba en primer 
lugar el Rorschach y en segundo el TAT. Holtzman relata su experiencia 
cuando fue contratado por las Fuerzas Aéreas de Estados Unidos, con la 
finalidad de comprobar la eficacia del test de Rorschach en la selección 
de pilotos: 
 
 
…no se trataba exactamente de la puesta a prueba de la 
utilidad del Rorschach en la evaluación clínica de los 
pacientes, o cualquiera que sufra un trastorno emocional o 
mental. Era más bien un intento por comprobar algo que 
muchos de los defensores del Rorschach proclamaban, en 
aquel tiempo, que era capaz de hacer. Durante e 
inmediatamente después de la segunda guerra mundial 
algunos de los pioneros del Rorschach, como Klopfer entre 
otros, dijeron que podían utilizar el test para predecir el éxito 
en las Fuerzas Aéreas. Y así se utilizaba, por ejemplo, para 
decidir entre dos candidatos a piloto de guerra [...]. El 
experimento era la adecuada puesta a prueba de esas 
particulares exageraciones. El Rorschach había sido 
propuesto para la selección de pilotos; para comprobar su 
eficacia fui contratado por las Fuerzas Aéreas a tiempo 
completo. En el estudio colaboraron 20 clínicos, expertos en 
Rorschach, muy conocidos, repartidos por todo Estados 
Unidos. Se les proporcionaron protocolos seleccionados al 
azar, pidiéndoles que diferenciaran los candidatos que habían 
tenido éxito de aquellos que no. No fueron capaces de 
hacerlo. Este estudio tuvo una gran importancia en su 
momento porque supuso la caída del Rorschach en los 
círculos académicos [...]. Lo que me resultó más sorprendente 
es que ninguno de los clínicos, a pesar de sus declaraciones, 
fuera capaz de superar el mero azar [...] y eso es muy pobre 
[Holtzman, 1989, pp. 108-109]. 
 
Es importante resaltar que Holtzman fue uno de los primeros en realizar 
estudios sobre la fiabilidad y validez del Rorschach y que cuando le 
contrataron para evaluar la eficacia de este test se encontraba en pleno 
auge la polémica iniciada por Meehl sobre predicción estadística frente a 
predicción clínica, siendo Holtzman, en aquel momento, un defensor de 
esta última. En 1988, la Society of Personality Assessment le concedió el 
galardón Distinguished Contribution Award por sus importantes 
contribuciones a la evaluación de la personalidad. 
 
En un esfuerzo por mejorar la calidad de los instrumentos de evaluación 
psicológica, la APA crea un comité dirigido por Cronbach encargado de 
elaborar el informe Technical recommendations for psychological tests 
and diagnostic aids 2 de 1954 en donde se plantea la necesidad de que 
los tests vayan acompañados de un manual con información acerca de 
la interpretación de los resultados, validez, fiabilidad, administración, etc. 
(Rogers, 1995). 
 
Sin embargo, todos estos esfuerzos son estériles y la crisis externa de la 
evaluación psicológica alcanza su punto culminante en el movimiento 
antitests que tuvo lugar en Estados Unidos en la década de los años 
cincuenta y, sobre todo, los sesenta. La polémica fue iniciada entre 
defensores de posturas genéticas y ambientalistas, utilizando ambos los 
resultados de los tests de inteligencia para defender sus posiciones. La 
realidad era que, a pesar de que los primeros psicómetras utilizaron los 
tests con la intención de que todas las personas tuviesen igualdad de 
oportunidades en función únicamente de su capacidad, estos 
procedimientos de evaluación terminaron favoreciendo a las clases 
dominantes y privilegiadas. Pronto esta discusión pasó de los círculos 
científicos a la vida ciudadana. Así, se producen hechos tan notables 
como la quema de protocolos en una escuela de Texas en 1959, la 
prohibición del uso de pruebas psicológicas en el estado de California y 
en las escuelas de Nueva York. Los tests de personalidad fueron blanco 
también de fuertes críticas; se manifiesta un descontento por la 
utilización de estos tests en la industria, e incluso se habla de invasión 
de la privacidad (Rogers, 1995). En opinión de Blanco (1986b), esta 
revuelta antitests fue fruto de cuatro factores diferentes: las limitaciones 
reales tanto técnicas (déficit conceptuales,metodológicos e 
instrumentales) como humanas (lagunas de conocimiento, fallos o 
errores), los abusos cometidos en una administración indiscriminada e 
inadecuada de pruebas, las reacciones defensivas de la sociedad ante 
unos instrumentos que pueden potencialmente violar su intimidad y, en 
último lugar, las críticas derivadas de una presentación inadecuada de 
los resultados del proceso diagnóstico; es decir, no es la técnica en sí 
misma, sino su inadecuado uso lo que puede acarrear riesgos. 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 17 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
LLAA EEVVAALLUUAACCIIÓÓNN CCOONNDDUUCCTTUUAALL 
 
Los inicios de la psicología conductual podrían situarse en las primeras 
aplicaciones de los principios del aprendizaje al estudio de la conducta, 
lo cual se remonta a los trabajos de Béchterev a finales del siglo XIX, 
primero en la ciudad de Kazán (donde fundó el primer laboratorio de 
psicología en Rusia) y luego en San Petersburgo donde crea otro 
laboratorio y desarrolla diversos equipos para registrar la sensibilidad 
cutánea, el dolor, la cinestesia, etc. Fue el fundador de la reflexología 
colectiva y del principio del estudio comparativo, el cual permitía 
evaluar la influencia de la relación entre sujetos sobre la respuesta de 
un sujeto, lo que constituye el primer intento serio y experimental del 
estudio del comportamiento humano (Lómov, 1985). Desde la 
perspectiva de la psicología soviética, Béjteriev es considerado como el 
creador de la orientación de la psicología de la conducta, no sólo en la 
psicología soviética, sino en toda la psicología (Rubinstein, 1981). Esta 
visión es compartida por Kazdin (1991) al plantear que los 
antecedentes de la evaluación y la modificación de conducta se 
encuentran en los trabajos de Béjteriev, Watson, Rayner, Jones, etc. 
Sin embargo, hay que matizar que en lo referente a la evaluación, tal 
como ha puesto de manifiesto McReynolds (1986), Watson no ve como 
incompatibles el modelo psicométrico y su punto de vista conductual. 
Ello se demuestra en una carta (fechada el 22 de mayo de 1917) que 
escribe Watson a Goddar (introductor de los tests de Binet en Estados 
Unidos) solicitándole una lista de tests psicológicos, con vistas a 
preparar un curso de psicología que tenía que impartir a estudiantes de 
medicina especializados en psiquiatría. Poco después dedica su libro 
Psychology from the standpoint of a behaviorist (1919) a Cattell y a 
Meyer, donde además incluye cinco páginas sobre tests. Además, en 
otro libro publicado en 1928 (Psychological care of infant and child) 
describe varios tests. El origen de la evaluación conductual puede 
situarse, por un lado, en la aplicación de los principios del aprendizaje 
a la modificación del comportamiento humano anormal y, por otro, en el 
intento de suplir los déficit de la evaluación psicológica de la época al 
hacer frente a la conducta anormal (Fernández-Ballesteros, 1994). 
Así, en investigaciones clásicas, como la de Watson y Rayner con el 
pequeño Albert en la década de los años veinte o la de los Mowrer con 
sujetos enuréticos en la de los treinta, se realizan evaluaciones de la 
conducta. 
 
Sin embargo, será a mediados del siglo XX cuando se produce un hito 
histórico en el desarrollo de la psicología y que posteriormente afectará a 
la evaluación psicológica. Tres autores sientan las bases de la 
modificación de conducta: Skinner (Estados Unidos) publica en 1953 
Ciencia y conducta humana (que daría lugar a la modificación de conducta 
basada en el modelo operante), Wolpe (Sudáfrica) publica en 1958 
Psicoterapia por inhibición recíproca (con base en el condicionamiento 
clásico y donde ya se describen técnicas como la desensibilización 
sistemática y el entrenamiento asertivo) y Eysenck (Gran Bretaña) 
publica en 1960 Terapia de conducta y neurosis, donde se describe la 
neurosis como una conducta inadaptada cuya adquisición y eliminación 
pueden explicarse en términos del condicionamiento clásico (véase 
Franks, 1991). Así, en estos textos se encuentran ya esbozos de la 
evaluación conductual; por ejemplo, Wolpe da una gran importancia a la 
entrevista como instrumento para determinar los estímulos que evocan las 
reacciones de temor. Skinner, por su parte, formula un concepto 
fundamental dentro de la evaluación conductual: el análisis funcional, el 
cual enfatiza la conducta manifiesta y los eventos ambientales que la 
controlan. Skinner radicalizó la perspectiva de Watson, comenzando a 
desarrollar estudios experimentales sobre la conducta operante para lo 
cual propone el análisis experimental de la conducta (búsqueda de las 
relaciones funcionales que prevalecen entre aspectos medibles de la 
conducta y las diferentes circunstancias y hechos de la vida de un 
organismo), que se convertirá en el punto de partida de la evaluación 
conductual. Además del trabajo experimental, Skinner resaltó las reper-
cusiones que tendría sobre la clínica. En los años siguientes se produce 
un gran desarrollo, tanto a nivel conceptual como instrumental, 
consolidándose así la psicología conductual que se convierte en el 
movimiento más importante dentro de la psicología clínica en las últimas 
décadas. 
 
En definitiva, la evaluación conductual surge como una necesidad ante 
la aplicación de los principios del aprendizaje al tratamiento de la 
conducta anormal e incluso ante la inutilidad que se empezaba a 
manifestar desde algunos círculos de los tests psicométricos, proyectivos 
y de los sistemas clasificatorios vigentes (Fernández-Ballesteros, 1994). 
De esta misma opinión son Hersen y Bellack (1976), quienes consideran 
que la evaluación conductual surge como respuesta a una serie de 
factores tales como los problemas de fiabilidad y validez que presentan 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 18 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
los diagnósticos psiquiátricos a través del DSM-I y el DSM-II, la relación 
indirecta entre la evaluación realizada por medio de tests tradicionales 
(como por ejemplo, los proyectivos) y la planificación y puesta en 
práctica del tratamiento, la gran aceptación de la terapia de conducta 
entre los psicólogos clínicos y el desarrollo de la evaluación en general, 
haciendo posible registros de conducta más precisos. Nelson (1983) 
otorga la "paternidad" de la evaluación conductual a la percepción de la 
debilidad de las técnicas de evaluación tradicional y a las innovaciones 
en la evaluación de los primeros terapeutas de conducta. Este nuevo 
modelo de evaluación se caracterizará por los siguientes principios: 
énfasis en aspectos observables; la conducta es fruto del aprendizaje, 
dependiendo de una serie de hechos controlables; la evaluación y el 
tratamiento están estrechamente interrelacionados, implicando todo ello 
una evaluación de carácter idiográfico (Matud, 1993). 
 
Dentro de este nuevo enfoque, Kanfer y Saslow (1965) publican el 
artículo «Behavioral analysis», dando lugar al nacimiento "oficial" de la 
evaluación conductual, aunque según Goldfried y Linehan (1977) la idea 
(no el término) aparece por primera vez en un texto de Johnson en el 
año 1946, donde se trata sobre el tipo de evaluación que debe hacer el 
psiquiatra, diciendo que éste debe obtener información acerca de lo que 
hace y en qué situaciones lo hace. La aportación de este trabajo es la 
admisión de variables subjetivas (eventos internos y variables 
personales u organísmicas) dentro del análisis funcional propuesto por 
Skinner, quedando abierta la posibilidad del empleo de autoinformes,aunque con cierta cautela. 
 
Poco después, Cautela (1968) y Goldfried y Pomeranz (1968) utilizan 
por primera vez el término behavioral assessment; esta nueva forma de 
evaluación aparece posteriormente con tres nombres: evaluación 
conductual, análisis funcional de la conducta y análisis conductual, que 
son considerados como sinónimos por la mayoría de los autores (Silva 
y Martorell, 1991). Por otra parte, Goldstein y Hersen (1990b) 
entienden que el desarrollo de la evaluación conductual está, en cierto 
modo, relacionado con la innovación en los instrumentos de registro o 
evaluación de la conducta, lo cual se puede comprobar en los primeros 
números de las revistas Journal of Applied Behavior Analysis, Behaviour 
Research and Therapy, Journal of Behavior Therapy and Experimental 
Psychiatry y Behavior Modification, donde aparece una gran cantidad de 
artículos sobre nuevos métodos e instrumentos de registro conductual. 
Un apoyo importante a esta incipiente evaluación conductual es la 
publicación de Personality and assessment por parte de Mischel en 1968. 
En esta obra se vierte una fuerte crítica sobre la evaluación psicológica 
"tradicional", proponiéndose la evaluación conductual como alternativa 
que hará énfasis sobre la especificidad, lo idiográfico, etc. El 
situacionismo constituyó una dura crítica a la evaluación tradicional de 
la personalidad (teoría de los rasgos y teoría psicodinámica). Su 
crítica se centra en la validez, fiabilidad y en la falta de utilidad que 
aportan los instrumentos de evaluación de la personalidad, resaltando 
la inadecuación de los rasgos para predecir la conducta. La teoría de 
los rasgos era criticada por el supuesto de que la personalidad se 
encuentra constituida por predisposiciones estables y duraderas que 
ejercen efectos generalizados sobre la conducta. De igual forma, critica 
la teoría psicodinámica por su énfasis en las entidades internas y en la 
estabilidad temporal y transituacional. Para explicar la conducta 
humana, Mischel asume una concepción interaccionista en la que se 
tienen en cuenta variables orgánicas, ambientales y de la propia 
conducta. Sin embargo, su mayor aportación podría considerarse en el 
giro que supone buscar la explicación de la variabilidad de la conducta, 
en vez de tratar de hacerlo en función de la estabilidad y consistencia, 
tal como se venía haciendo. Su obra ha servido para impulsar los 
estudios de la evaluación de situaciones, contextos y ambientes. 
Paralelamente, Peterson (1968) publicaba The clinical study of social 
behavior, donde se planteaba que dentro del ámbito clínico era 
necesario la construcción de situaciones que proporcionaran muestras 
representativas de las conductas a predecir; además, este autor 
recomienda la no utilización de los instrumentos de la evaluación 
tradicional para inferir las características de la personalidad. Asimismo, 
cabe destacar el trabajo de Lang (1968) sobre el triple sistema de 
respuesta y el de Goldfried y Kent (1972) sobre las diferencias y 
semejanzas entre la evaluación psicométrica y la evaluación 
conductual. 
 
Sin embargo, un hecho llamativo es el retraso en el desarrollo que tuvo 
la evaluación conductual con respecto a la modificación de conducta. 
Así, se comprueba que en las publicaciones de Eysenck y Rachman 
(1965), Meyer y Chesser (1970) y Wolpe (1969) no se hacen 
indicaciones acerca del análisis conductual. Sin embargo, ello no debe 
ser entendido como una falta de interés por la evaluación en los nuevos 
psicólogos conductuales, puesto que ya Staats y Staats (1963) se 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 19 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
planteaban la necesidad de incluir métodos conductuales de evaluación. 
Dos años después, Ullmann y Krasner (1965) en la introducción de su 
libro mantienen que hay un lugar para la evaluación psicológica en la 
modificación de conducta, indicando que la evaluación está íntimamente 
relacionada con el tratamiento. Se podrían plantear dos razones 
explicativas del relativo retraso de la evaluación conductual con 
respecto a la terapia de conducta. En primer lugar, no conviene olvidar 
que el nuevo enfoque nace claramente orientado al tratamiento. Por 
tanto, desde esta perspectiva, parece lógico que primero se desarrollen 
las técnicas de intervención y a la zaga la evaluación; en otras palabras, 
la evaluación conductual surge cuando las técnicas de intervención 
conductual se ponen en práctica, donde se demuestra que la evaluación 
tradicional no da una información adecuada sobre la conducta del 
paciente, por lo que tiene sentido que su desarrollo sea posterior. En 
segundo lugar, los primeros psicólogos conductuales se encontraron 
con una evaluación psicológica muy desarrollada y consolidada, por lo 
menos en lo que se refiere a la evaluación de corte psicométrico. Es 
importante considerar que la consolidación de la terapia de conducta 
coincide con la superación de la crisis que supuso la revuelta antitests. 
Como consecuencia de la crisis, los procedimientos para la elaboración 
de los tests se habían perfeccionado. Además, se produce una 
centralización y unificación en la construcción y distribución de tests 
motivada por algunas leyes que prescriben qué tipo de tests deben 
utilizarse y fundamentalmente por el desarrollo de la "industria de los 
tests". La edición de tests se había convertido en un negocio, como 
afirma Cronbach (1972); ya no era suficiente con publicar un test que 
elaboraba un profesor en sus ratos de ocio, sino que era necesario 
contar con un equipo de profesionales cualificados y que contasen con 
una red de colaboradores por todo el país. Además, debían 
demostrarse sus ventajas y garantías científicas en congresos y dis-
poner de unos buenos canales de distribución. Se había creado una 
competitividad por conseguir el "test más eficaz". Todo ello sirvió, sin 
duda, para seleccionar los tests que llegaban a aplicarse, con la 
consiguiente mejora de la imagen, a lo que también contribuía una 
tecnología más avanzada, tanto en los sistemas de corrección 
automática, como en el tipo de presentación de resultados. Por tanto, 
los psicólogos conductuales no sólo tenían que elaborar un nuevo 
sistema de evaluación, sino que, además, había que demostrar que los 
tests, un sistema tecnológicamente muy avanzado y con grandes 
garantías científicas, no servían para los propósitos del enfoque 
conductual. Evidentemente, esto suponía un período de reflexión antes 
de comenzar a elaborar un nuevo sistema de evaluación. Recuérdese, 
por ejemplo, que el propio Wolpe (uno de los pilares de la terapia de 
conducta) en su libro de 1958 recomendaba la utilización de inventarios 
de personalidad. Visto desde esta perspectiva, incluso nos atreveríamos 
a decir que la evaluación conductual ha tenido un desarrollo 
relativamente rápido, sobre todo si se tiene en cuenta que la 
consolidación de la terapia de conducta se produce a partir de 
mediados de la década de los años sesenta y que en la siguiente 
década tiene lugar una gran expansión de la evaluación conductual. 
 
A partir de la mitad de la década de los años setenta se produce la 
consolidación de la evaluación conductual como consecuencia de la 
multitud de publicaciones que sobre el tema van saliendo a la luz; entre 
los manuales más destacados se podrían citar Behavioral assessment. A 
practical handbook de Hersen y Bellack (1976), Behavior therapy 
assessment: Diagnosis, design and evaluation de Mash y Terdal (1976), 
Handbook of behavioral assessment de Ciminero, Calhoun y Adams 
(1977), Behavioral assessment. New directions in clinical psychology de 
Cone y Hawkins (1977), Behavior modification: Handbook of assessment, 
intervention and evaluation de Gambrill (1977), Principies ofbehavioral 
assessment de Haynes (1978), A practical guide to behavioral 
assessment de Keefe, Kopel y Gordon (1978) y Behavioral assessment: 
Recent advances in methods, concepts and aplications de Haynes y Wilson 
(1979). A estos manuales, ya clásicos, hay que añadir la aparición en 
1979 de las revistas BehavioralAssessment yJournalof Behavioral 
Assessment 3. El número de publicaciones sobre este enfoque llegó a 
ser tan elevado que el único análisis posible es el realizado a través de 
estudios bibliométricos, como el de Prieto, Tortosa y Silva (1984), 
quienes hacen un análisis cuantitativo de las publicaciones sobre 
evaluación conductual entre los años 1971-1982 a través de la base de 
datos Social sciences citation index, concluyendo que se ha producido 
un incremento considerable en los artículos publicados a lo largo de 
estos años, que estos artículos no aparecían exclusivamente en 
revistas especializadas (por ejemplo, encontraron que la revista que 
más trabajos publicó sobre esta temática fue Psychological Reports) y 
que el autor más productivo en el área de la evaluación conductual fue 
Alan E. Kazdin. 
 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 20 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
A esta fase de consolidación de la evaluación conductual producida 
durante la década de los años setenta, a la cual Nelson (1983) califica 
como "luna de miel", sucede un período de "desencanto", tal como es 
calificado por Fernández-Ballesteros (1994), en el cual la evaluación 
conductual entra en una crisis en la que todavía parece estar inmersa. 
Por otra parte, durante todo este período de auge del modelo conduc-
tual, la evaluación de corte psicométrico continúa dando lugar a 
publicaciones importantes entre las que destaca un manual de 
evaluación psicológica por parte de Cronbach en 1972 en donde se 
sistematiza la teoría de la generalizabilidad y la obra de Wiggins (1973) 
Personality and prediction: Principies of personality assessment. 
 
La situación de la evaluación psicológica desde la década de los años 
ochenta hasta la actualidad será abordada en el siguiente apartado. 
LLAA EEVVAALLUUAACCIIÓÓNN PPSSIICCOOLLÓÓGGIICCAA EENN LLAA AACCTTUUAALLIIDDAADD 
 
En este apartado se describirá la situación de la evaluación psicológica 
desde la década de los años ochenta hasta la actualidad. Para ello se 
hará un breve repaso de los acontecimientos más importantes ocurridos 
en los últimos años, así como algunas reflexiones sobre las cuestiones 
de especial relevancia que caracterizan este período, como puede ser la 
crisis que experimenta la evaluación conductual, la apertura de la 
evaluación psicológica a otras áreas, la introducción de la informática en 
la evaluación o la teoría de respuesta al ítem, entre otras. 
 
La característica que puede definir la evaluación psicológica de los 
últimos años tal vez sea, como comenta Matud (1993), la reelaboración y 
ampliación de los modelos y procedimientos de evaluación, 
manifestándose de una forma clara una postura más tolerante e 
integradora entre las diferentes aproximaciones, incluso entre la 
evaluación psicométrica y la evaluación conductual. 
Crisis de la evaluación conductual 
 
La década de los años ochenta se caracteriza por una serie de cambios 
dentro de la evaluación conductual, y por un período de reflexión dentro 
de la evaluación psicológica. Hayes y Follete (1993) y Fernández-
Ballesteros (1994) señalan algunos hechos que constituyen un reflejo de 
esta crisis; en primer lugar, dada la relevancia que tomó el DSM-III 
(1980) y DSM-III-R (1987) los evaluadores conductuales empiezan a 
familiarizarse y a utilizar etiquetas diagnósticas, por lo que se intenta una 
aproximación entre evaluación conductual y diagnóstico psiquiátrico 
(Haynes y O'Brien, 1988; Hersen, 1988); en segundo lugar, Kendall y 
Hollon (1981) publican Assessment strategies for cognitive-behavioral 
intervention que va a suponer una ruptura con la propia evaluación 
conductual; y, por último, se produce un debilitamiento del análisis 
funcional y una pérdida de vigencia de los planteamientos que oponen la 
evaluación conductual a otros modelos de evaluación psicológica 4. 
Como ejemplo clarificador de esta situación están las palabras de 
Bellack y Hersen (1988, p. 613): «[...] Si empleamos entrevistas 
estandarizadas con el propósito de alcanzar un diagnóstico con base en 
el DSM-III, generamos escalas clínicas sobre la severidad de síntomas, 
administramos inventarios de autoinforme y evaluamos estilos 
cognitivos, podemos preguntarnos “¿es todavía conductual la evaluación 
conductual?”. 
 
Esta crisis de asunciones teóricas de la evaluación conductual se pone 
de manifiesto en un análisis de los artículos publicados entre 1980 y 
1987 en Behavioral Assessment y en el Journal of (Psychopathology and) 
Behavioral Assessment realizado por Fernández-Ballesteros (1988) 
[citado en Fernández-Ballesteros (1994)]. En BehavioralAssessment 
únicamente un 15% de los trabajos trataba sobre temas conceptuales y 
solamente un 0,40% hacía referencia al análisis funcional de la conducta; 
en la segunda revista los datos tampoco son nada alentadores, con un 
6,50% de artículos conceptuales y un 0,50% referido al análisis 
funcional de la conducta. El mayor porcentaje de trabajos alude a 
aspectos metodológicos. A partir de estos datos, Fernández-Ballesteros 
(1994) concluye que los evaluadores conductuales no han dedicado 
mucho tiempo a reflexionar sobre aspectos conceptuales. En otro 
estudio realizado por Haynes y O'Brien (1990) en el que se analiza una 
serie de revistas conductuales (Behavior Modification, Behaviour 
Research and Therapy, Behavior Therapy y Journal of Applied Behavior 
Analysis) se concluye que únicamente un 20% de las intervenciones 
descritas estaba basado en el análisis funcional. En definitiva, parece 
que el análisis funcional de la conducta no ha sido el elemento 
fundamental de la evaluación conductual. 
 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 21 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
La crisis de la evaluación conductual afecta también a aspectos 
metodológicos. Así, el empleo por parte de los evaluadores conductuales 
de técnicas conductuales (por ejemplo, la observación) de una forma 
exclusiva y el rechazo de los tests tradicionales no terminó nunca de 
hacerse realidad. En el estudio de Fernández-Ballesteros (1988) [citado 
en Fernández-Ballesteros (1994)] se informa que sólo un 14,20% de los 
trabajos de Behavioral Assessment y un 10,30% de los del Journal of 
(Psychopathology and) Behavioral Assessment en el período 1980-1987 
están dedicados a la observación y un 18,40% y un 21%, 
respectivamente, se centraban en técnicas psicométricas. 
Según Matud (1993), esta desilusión metodológica se fundamenta en 
tres pilares importantes: la imperfección de las técnicas actuales de 
evaluación conductual, las cuales no muestran un acuerdo entre las 
diferentes medidas de la misma conducta, la impracticabilidad de muchas 
de ellas, habiendo sido utilizadas (excepto la entrevista) en menos de la 
mitad de los casos tratados por terapeutas de conducta, y la ausencia 
de avances en la tipificación de las técnicas, proliferando técnicas no 
estandarizadas. Este último hecho ha originado una de las discusiones 
más intensas de los últimos años entre quienes consideran necesaria la 
incorporación de criterios psicométricos a la evaluación conductual y 
quienes los rechazan. Así, por ejemplo, Nelson (1983) se opone a esta 
incorporación argumentando por un lado dificultadesprácticas, ya que 
el número de técnicas necesario para cubrir los diferentes sistemas de 
respuesta, los diferentes métodos de evaluación y las posibles 
situaciones de evaluación es casi infinito, y por otro dificultades teóricas 
existiendo tres diferencias insalvables entre el modelo psicométrico y el 
conductual: los supuestos de consistencia-estabilidad de la conducta, 
los modelos de causalidad de la conducta (estructural intrasujeto frente 
a funcional ambiente-sujeto) y el nivel de análisis (individual frente a 
grupal). Otros autores, tal vez más realistas, plantean una 
complementariedad de ambos enfoques. Así, Bellack y Hersen (1988) 
afirman que la aproximación nomotética de rasgo podría ser 
conveniente en las fases iniciales de la evaluación con el fin de 
categorizar al paciente y realizar una descripción general de la 
disfunción y la situación vital, mientras que en una segunda fase de 
evaluación cuando es necesario realizar un análisis funcional y 
establecer medidas objetivas de conductas específicas estarían 
justificadas las técnicas conductuales. 
 
En resumen, parece que los evaluadores conductuales han propuesto 
unos principios básicos y han practicado otros. A pesar de los 
presupuestos iniciales, la evaluación conductual utiliza escasamente el 
análisis funcional, utiliza técnicas basadas en diseños intersujetos 
implicando planteamientos nomotéticos y está empleando conceptos 
intrapsíquicos (Fernández-Ballesteros, 1994); sin embargo, a nuestro 
entender, esto no es más que una manifestación de la evolución a la cual 
está sometido cualquier concepto (Sierra, 1996). 
 
Ahora bien, a pesar de la crisis que experimenta la evaluación 
conductual en su seno, ésta goza de un ámbito propio y específico, y 
sigue manteniéndose en diferentes publicaciones; así, Cone (1993) 
informa que desde el período 1980-1982 a 1990-1992 se produce un 
incremento del 15,80% de trabajos publicados sobre evaluación 
conductual, así como un aumento del número de revistas en donde se 
publica este tipo de artículos. Sin embargo, no debemos olvidarnos, tal 
como plantea Fernández-Ballesteros (1993), que la salida de esta crisis 
pasa por la mejora de las garantías científicas de las medidas 
conductuales. 
Otros aspectos de actualidad 
 
Junto al gran desarrollo de la evaluación conductual, la psicología en 
general se fue abriendo a otros campos. En estos últimos años, la 
Organización Mundial de la Salud (OMS) ha recomendado, en reiteradas 
ocasiones, la necesidad de "invertir en salud", considerando además que 
la psicología es importante en más de la mitad de los objetivos planteados 
para mejorar la salud de la población. De estas recomendaciones parece 
haberse hecho eco la actual psicología clínica. En opinión de Richelle 
(1991), la psicología clínica ha experimentado un proceso de cambio que 
puede observarse a tres niveles. Primero, se ha dado un cambio de 
enfoque, pasando del interés por el sujeto "psicológicamente enfermo o 
anormal" al interés por el sujeto normal que se encuentra con problemas 
psicológicos que, en cierta medida, son consecuencia de las 
complejidades de la vida moderna; segundo, se produce una di-
versificación en su campo de acción, abarcando los aspectos psicológicos 
de otros tipos de enfermedad, además de la mental; y, tercero, se presta 
gran atención a la prevención de la enfermedad. Por otra parte, la 
inclusión de la psicología en los servicios sociales ha dado lugar al 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 22 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
nacimiento de la psicología comunitaria, abordándose así una gran 
diversidad de problemas desde un punto de vista social o de grupo 
(Holtzman, 1989). Todo ello contribuye, sin duda, a una extensión de la 
evaluación psicológica a estos nuevos campos. 
 
Todo ello, lleva a que la evaluación psicológica abra sus dominios a 
otras áreas: evaluación neuropsicológica (véase Benton, 1994), 
evaluación en tráfico y seguridad vial, psicología del trabajo y de las 
organizaciones (véase Fernández-Ríos, 1993; Rodríguez, 1993), 
psicología jurídica (véase Garrido, 1991), psicología del deporte (véase 
Cruz, 1995, y Cruz y Capdevilla en este mismo manual), etc. Asimismo, 
se produce un desarrollo importante de la psicología ambiental, lo que 
lleva emparejado un interés por la evaluación ambiental, surgiendo 
publicaciones como Environmental problems/behavioral solutions de 
Cone y Hayes (1980) y Pol (1994). Surge una necesidad de evaluar los 
contextos (settings) conductuales, la percepción de los mismos, su 
influencia en la conducta normal y patológica y la evaluación de los cam-
bios ambientales sobre la salud mental (Manid, 1993). En los últimos 
años se ha desarrollado un gran interés por la evaluación de 
intervenciones y programas (Sechrest y Figueredo, 1993; Fernández-
Ballesteros, 1995; Hernández, 1996). Incluso en áreas tradicionales como 
la evaluación de la inteligencia se produce una expansión de los 
objetivos planteados; así, por medio de los tests de inteligencia no nos 
limitamos a la obtención de un cociente intelectual, sino que evaluamos 
procesos cognitivos en pacientes con daño cerebral o esquizofrénicos 
(Goldstein y Hersen, 1990b). En definitiva, la actual evaluación 
psicológica no se puede identificar con la mera aplicación de tests 
psicológicos o la perspectiva clásica del psicodiagnóstico; hoy, la 
evaluación psicológica es un elemento fundamental de la intervención e 
investigación psicológica (Almeida y Ribeiro, 1994). 
 
En cuanto a la evaluación tradicional, no sólo no ha desaparecido sino 
que se ha seguido desarrollando; así, siguen apareciendo manuales 
importantes tales como New horizont in testing de Weiss (1983), 
Psychological testing (6a ed.) de Anastasi (1988), Psychological testing. 
Principies and applications (2a ed.) de Murphy y Davidshofer (1991) o 
The psychological testing enterprise. An introduction de Rogers (1995). 
Kaplan y Saccuzzo (1993) indican que en la evaluación psicológica 
actual se ha producido una proliferación de nuevos tests, muchos de 
ellos basados en modelos, teorías o conceptos claramente diferentes a 
los de los tests tradicionales; estos tests no tradicionales están basados 
en teorías del aprendizaje, en la psicología social o experimental. Este 
hecho respondería, en primer lugar, a un incremento de los aspectos 
científicos de la psicología en el campo de la evaluación psicológica y, 
en segundo lugar, al esfuerzo realizado por integrar los tests en otros 
aspectos de la psicología aplicada (por ejemplo, el tratamiento). 
Además, se ha producido un incremento de la tecnología, una mejora de 
la objetividad de los tests, y una alta preocupación por los aspectos éticos 
implicados en la evaluación (especialmente el abuso de los tests) puesta 
de manifiesto en 1988 por el Joint Committee on Testing Practices y 
respaldada por la American Association for Counseling and 
Development, la American Educational Research Association, la 
American Psychological Association, la American Speech-Language-
Hearing-Association y el National Council on Measurement in Education. 
Otro aspecto relevante citado por Kaplan y Saccuzzo (1993) es que en la 
actualidad el "público" en general tiene un mayor conocimiento de los 
tests; hoy existe una mayor demanda de servicios psicológicos, 
incluyendo la evaluación, lo cual, a su vez, repercute en la mejora de la 
calidad de los tests. En un análisis realizado de 65 practicum de 
psicodiagnóstico en psicología en Estados Unidos, Craig y Horowitz 
(1990) muestran una perspectiva del empleo de tests durante estos 
años; así, estos autores concluyen que los tests proyectivos, las escalas 
de Wechsler y el MMPI siguen gozando de gran popularidad entre los 
evaluadores psicológicos,hay un incremento en el empleo de tests 
neuropsicológicos, se usan los mismos tests para los adolescences que 
para los adultos y, por último, tests como el Millon clinical multiaxial 
inventory (MCMI) o el Millon adolescent personality inventory (MAPI) son 
poco usados en la actualidad pero es muy recomendado su aprendizaje, 
posiblemente porque los directores de los practicum creen que serán 
instrumentos importantes en un futuro próximo. 
 
En la última década también se ha producido un incremento en el 
interés por el diagnóstico psicopatológico; hay que destacar la 
publicación por parte de la Asociación Psiquiátrica Americana de tres 
ediciones del Diagnostic and statistical manual of mental disorders (DSM-
III en 1980, DSM-III-R en 1987 y DSM-IV en 1994). Las críticas a la 
falta de fiabilidad y validez de las anteriores clasificaciones son 
superadas en parte con la inclusión de criterios descriptivos ateóricos en 
cada una de las categorías diagnósticas y la presentación de un sistema 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 23 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
de evaluación multiaxial de cara a planificar el tratamiento y predecir la 
evolución del trastorno. 
 
Todos estos hechos conducen a un progresivo acercamiento de las 
diferentes opciones de evaluación; es decir, se ha producido una 
concepción de la evaluación psicológica «entendida en un sentido 
amplio, que abarca desde la descripción del comportamiento hasta la 
valoración de programas de intervención» (Fernández-Ballesteros y 
Silva, 1985, p. 3). 
 
La gran cantidad de acontecimientos que afectan a la evaluación 
psicológica en estos últimos años hace que la valoración de la situación 
actual se convierta en una tarea sumamente ardua, lo cual, en realidad, 
es un indicador del alto grado de desarrollo que se ha alcanzado. 
Quizás nada mejor para ilustrar el estado actual que referirnos a dos 
trabajos sobre este tema. El primero es un estudio bibliométrico realizado 
por Carbonell, Silva y Carpintero (1988) sobre las publicaciones 
relativas a la evaluación psicológica. El material analizado incluía los 
manuales de Anastasi (1982), Groffman y Michel (1982/1983), 
Fernández-Ballesteros (1983), Cronbach (1984), Golstein y Hersen 
(1984) y los cinco primeros volúmenes (1968-1981) de Advances in 
psychological assessment compilados por McReynolds. Los resultados 
más relevantes podrían resumirse en los siguientes puntos: 
 
a. Los autores más citados, en general, y que por tanto podrían 
considerarse como los más influyentes fueron en orden decreciente: 
Cattell, Cronbach, Eysenck, Reitan, Exner, Guilford, Golden, Jackson, 
McReynolds, Anastasi, Gough, Hersen, Mischel, etcétera. 
b. Mediante un análisis factorial de correspondencias se determinó 
la relación entre autores y temas. Así, se obtuvieron cuatro factores 
bipolares que mostraban los autores más citados junto con los temas 
más tratados. En el primer factor aparece evaluación neuropsicológica 
(inteligencia y memoria) con Reitan, Golden, Benton, Venables, 
Wechsler, etc., frente a Exner/Rorschach (y otras técnicas proyectivas) 
con Exner, Swartz, Bandura, Holtzman, etc. En el segundo factor 
aparecen determinantes situacionales con Barker, Moos, Haynes, 
Patterson, etc., frente a determinantes individuales con Fleishman, 
Galton, Binet, Terman, etc. En el tercer factor aparece evaluación 
ambiental con Moos, Barker, etc., frente a evaluación conductual con 
Haynes, Nelson, Cone, Bellack, Kazdin, etc. El resto de los factores 
presentan bastantes dificultades de interpretación, aunque en uno de 
ellos aparecía una dicotomía bastante clara: evaluación de la inteligencia 
frente a evaluación de la personalidad. 
 
En un análisis más reciente, Sierra (1996) informa que los quince autores 
de evaluación psicológica con más citas recibidas en el período 1993-
1995 son Beck, Spitzer, Wechsler, Bandura, Piaget, Eysenck, 
Cronbach, Spielberger, Achenbach, Endicott, Rosenthal, Kazdin, 
Campbell, Cattel y Zuckerman. En este mismo estudio, analizando los 
contenidos del IV Congreso de Evaluación Psicológica (1994) y el 23nd 
International Congress of Applied Psychology (1994), se pone de 
manifiesto que las áreas más relevantes de la evaluación psicológica son 
la clínica y salud, personalidad, psicología del trabajo y de las 
organizaciones, psicología educativa, evaluación de programas, 
seguridad vial, psicología jurídica, psicología del deporte y psicología 
ambiental. 
En otro estudio realizado por Carbonell, Carpintero y Silva (1988) se 
solicitó información, por medio de una encuesta acerca de la «situación 
actual y perspectivas futuras de la evaluación psicológica (o 
psicodiagnóstico en su sentido más amplio)», a más de cien 
profesionales seleccionados de los más representativos de la evaluación 
psicológica a nivel internacional. El primer resultado, que llama la 
atención de los autores, es que la mayoría de los especialistas 
encuestados evita describir de forma estructurada la situación actual, lo 
cual es interpretado por Carbonell y cols. (1988) como una muestra del 
grado de especialización alcanzado, con la consiguiente dificultad que 
supone dar una visión global y estructurada de la actual evaluación 
psicológica. Los resultados relacionados con aspectos conceptuales 
ponen de manifiesto: 
 
a. Una necesidad de fundamentación teórica de la evaluación 
psicológica en su conjunto, incidiéndose además en que hay que 
eliminar la idea de que evaluación psicológica es sinónimo de 
aplicación de tests, y no dejarse llevar por la especialización 
tecnológica que no esté contextualizada en un modelo teórico. 
b. Que especialistas con diversos enfoques plantean la 
necesidad de una integración de las diversas técnicas e instrumentos, 
proponiendo como ejemplo a imitar la evaluación neuropsicológica. Sin 
embargo, algunos representantes del modelo conductual se 
manifiestan reacios a una necesidad de integración. 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 24 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
c. Que las variables biológicas adquieren relevancia. 
d. Que crece el interés por la evaluación de la personalidad. 
e. Adquiere importancia la visión evolutiva de la evaluación. 
 
En relación a las aplicaciones de la evaluación psicológica las 
conclusiones más importantes son: 
 
a. Una expansión de la evaluación a nuevos ámbitos (evaluación 
de ambientes y organizaciones). 
b. Un énfasis en la relación entre evaluación y tratamiento, 
coincidiendo los autores en señalar que la evaluación debe ser 
un medio que permita seleccionar las alternativas de 
intervención, resaltando la especificidad del diagnóstico y los 
estudios de caso único. 
c. Se recupera la confianza en los tests. 
d. Se espera una próxima incorporación de los microordenadores 
a la práctica habitual. 
e. Las repercusiones sociales de la evaluación y las garantías 
éticas deben estar siempre presentes. 
 
Carbonell y cols. (1988) concluyen diciendo que el estado actual de la 
evaluación psicológica es positivo, fundamentalmente si se opina en 
función de la visión de los psicólogos que se identifican con modelos 
tradicionales. Sin embargo, quedan aún algunos problemas importantes 
por resolver, tales como las diferencias conceptuales entre distintos 
enfoques y el peligro de volver a la figura del psicólogo evaluador 
como un experto en aplicar tests. Un dato sorprendente, y a la vez 
ilustrativo, de la dificultad que implica describir la situación actual de la 
evaluación psicológica es el hecho de que autores comoCronbach o 
Guilford se manifestasen incapaces de contestar de forma precisa a la 
cuestión planteada. 
 
Recientemente, Piotrowski y Zalewski (1993) realizaron un análisis de 
los programas de doctorado en psicología clínica acreditados por la APA, 
llegando a una serie de conclusiones que también puede reflejar la 
situación actual de la evaluación psicológica. En este informe se 
concluye que: 
 
a. La evaluación psicológica es el área más importante en la 
formación de doctorado del psicólogo clínico; la evaluación de la 
inteligencia, de la personalidad y de la conducta son apartados 
imprescindibles en un currículo clínico. 
b. En esta formación se combinan técnicas psicométricas (MMPI-
2, 16PF...) con técnicas proyectivas (Rorschach, TAT...) y 
técnicas conductuales (observación, autorregistro...). 
c. Hay un auge de la evaluación por ordenador, referida tanto a la 
administración de tests como a su interpretación. 
 
La incorporación de los ordenadores a la evaluación psicológica puede 
considerarse actualmente ya una realidad; así, tal como plantean Kaplan 
y Saccuzzo (1993), el empleo de ordenadores va más allá de la 
corrección o la transformación de puntuaciones directas en típicas o 
centiles, llegando a la administración, corrección e interpretación de las 
puntuaciones. En un estudio realizado por Spielberger y Piotrowski 
(1990) entre los miembros de la Sociedad de Evaluación de la 
Personalidad se concluye que éstos consideran la evaluación 
computarizada como útil, aunque se debe mejorar la interpretación 
informatizada de los tests. Según Kaplan y Saccuzzo (1993), la 
aplicación de la informática a la evaluación psicológica puede hacerse a 
tres niveles: 
a. Procedimientos psicofísicos y de detección de señal, que 
consisten en presentar una señal al sujeto, el cual debe informar 
si la ha visto o no. De esta forma se puede evaluar la velocidad 
y/o la eficiencia del procesamiento de información, capacidad 
que está relacionada con las puntuaciones obtenidas en tests 
psicométricos de inteligencia. 
b. Informatización de tests clásicos. Muchos cuestionarios clásicos 
(MMPI, EPI, 16PF, Kuder...) disponen de una versión computarizada, 
mediante la cual el sujeto puede responder delante de la pantalla del 
ordenador. Una gran ventaja que presenta esta versión frente a la de 
lápiz y papel es que el evaluador puede disponer de la corrección e, 
incluso, de la interpretación al momento. Pero, además, esta aplicación 
informatizada puede llegar a aumentar el grado de confiabilidad y 
atractivo para el sujeto, además de disponer de una mayor versatilidad 
en la presentación de estímulos. La corrección de pruebas psicológicas y 
la obtención de una puntuación es tal vez la faceta más conocida de la 
aplicación de la informática a la evaluación psicológica, y algo habitual 
ya entre los evaluadores, por lo que el aspecto más actual es la 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 25 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
interpretación de resultados. Así, The Psychological Corporation en 
Estados Unidos y Técnicos Españoles Asociados (TEA) en España 
disponen de servicios a los que se puede acceder para obtener informes 
a partir de los resultados de diferentes pruebas (WATS, WISC, DAT, 
MMPI, Escalas de Beck, Rorschach...). Un ejemplo de estos informes se 
recoge en Keller y cols. (1990), quienes muestran un informe exhaustivo 
de un sujeto realizado por un programa informático a partir de las 
puntuaciones del MMPI-2; además, el informe se acompaña de un perfil 
gráfico de las escalas, así como de un listado de los ítems críticos de 
cada una de ellas. 
c. Informatización de la evaluación conductual. En este apartado las 
posibilidades de la informática son múltiples: almacenamiento de datos 
de autoinforme, codificación de observaciones, registro directo de 
conductas, análisis de datos, etcétera. 
 
Otro apartado importante de la aplicación de la informática a la 
evaluación psicológica es el referente a las entrevistas estructuradas. 
Así, algunas entrevistas como Present state examination (PSE) (Wing, 
1980) o Diagnostic interview schedule (DIS) (Robins y cols.,1981) 
presentan una versión informatizada que formula los diagnósticos. Sin 
embargo, en el momento en que la entrevista se transforma en un 
programa informático deja de cumplir los requisitos necesarios para ser 
catalogada como tal y se convierte en un autoinforme. Un problema 
importante que nos encontramos ante estos avances tecnológicos es la 
responsabilidad ética de las conclusiones de un programa informático; 
¿es el psicólogo el que realiza estas conclusiones o es el "frío" 
ordenador? De hecho, la APA ya ha recomendado que el informe 
informático debe acompañarse de un informe por parte del profesional 
(American Psychological Association, 1986). 
 
Un hecho de especial relevancia en la actual evaluación psicológica es 
el desarrollo de la teoría de la respuesta a los ítems (TRI), que se puede 
considerar una alternativa psicométrica a la teoría clásica de los tests. 
Frente a los tests clásicos (que hacen depender la evaluación del 
instrumento) y su corrección normativa (la puntuación del sujeto 
depende del grupo normativo), la TRI propone una medida invariable en 
relación a estos dos factores. La influencia de este cambio de concepción 
de los tests sobre la evaluación psicológica se concreta en los "tests a 
medida" (taylored tests). Según Muñiz (1990, p. 139) «[...] son unos tests 
que aun midiendo la misma variable no son idénticos para todos los 
sujetos, varían en función del nivel de competencia al que vayan 
destinados a medir». A partir de un banco de ítems, un programa infor-
mático administra un grupo de ellos que se irán seleccionando a medida 
que se van evaluando las respuestas. Esto evitaría que los sujetos 
contestaran a ítems demasiado fáciles o difíciles, lo cual incrementaría la 
motivación y reduciría la fatiga (Muñiz, 1990; Renom, 1993). Sin 
embargo, esta teoría se encuentra con el problema de que requiere un 
requisito de unidimensionalidad, algo que sólo cumplen los tests de eva-
luación de conocimientos específicos (Muñiz y Cuesta, 1993), por lo 
que su campo de aplicación está limitado hasta el momento a la 
evaluación del rendimiento académico. Esto hace que se requieran 
importantes avances en la metodología de la TRI para poder ser 
aplicada a contenidos multidimensionales. 
 
Por último, para finalizar la descripción de la situación actual de la 
evaluación psicológica se comentarán algunas de las reuniones 
científicas internacionales más importantes sobre esta disciplina 
celebradas en los últimos años, y que nos pueden 
servir para clarificar la situación de la disciplina en la actualidad. En 
Europa, un hecho relevante que supone un marco de referencia para la 
evaluación psicológica del viejo continente es la transformación en junio 
de 1990 de la Sociedad Española de Evaluación Psicológica en la 
European Association of Psychological Assessment, cuyo órgano 
oficial de comunicación va a ser el European Journal of Psychological 
Assessment (la publicación predecesora fue Evaluación 
Psicológica/Psychological Assessment). Esta sociedad ha organizado 
hasta la fecha cuatro congresos: Barcelona (1991), Gronigen (1993), 
Trier (1995) y Lisboa (1997). 
 
FFUUTTUURROO DDEE LLAA EEVVAALLUUAACCIIÓÓNN PPSSIICCOOLLÓÓGGIICCAA 
 
Algunos de los aspectos comentados anteriormente nos permiten 
predecir en cierta medida el rumbo que tomará la evaluación 
psicológica en los próximos años. Sin embargo, queremos hacer 
algunas reflexiones (o predicciones) acerca de las futuras tendencias de 
esta disciplina. En líneas generales, nos atrevemos a decir que el futuro 
de la evaluación psicológica es prometedor. Para ello, nos basamos,tal 
como consideran Kaplan y Saccuzzo (1993), en el importante papel 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 26 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
que ha jugado esta disciplina en el reconocimiento de la psicología. Si 
observamos el gran desarrollo alcanzado por la psicología (psicología 
conductual, psicofisiología, psicología de las organizaciones, psicología 
comunitaria, etc.), no podemos ocultar el gran papel que está 
desempeñando y tiene que desempeñar la evaluación psicológica en un 
futuro. Por otro lado, la proliferación de nuevos tests y la actualización 
de los tradicionales auguran un buen futuro para la evaluación 
psicométrica. La reciente aparición en el campo de la evaluación de la 
inteligencia del Wechsler adult intelligence scale (WAIS-R), del Wechsler 
intelligence scale for children-3th ed. (WISC-III) y del Wechsler preschool 
and Primary Scale of Intelligence-Revised (WPPSI-R), y del MMPI-2 en 
el campo de la evaluación de la personalidad auguran a estos instrumen-
tos un largo (y óptimo) futuro. En cuanto a la evaluación de la 
inteligencia, Matarazzo (1992) comenta que en los próximos años se 
continuarán utilizando los tests colectivos y las escalas individuales, 
pero que dada la importancia que están adquiriendo las minorías en 
Estados Unidos (hecho que se podría extrapolar a cualquier país) 
deberemos empezar a considerar la posibilidad de aplicar los 
instrumentos de evaluación teniendo en cuenta el contexto familiar y 
cultural del sujeto, con lo cual, tal vez, extinguiríamos algunas de las 
injusticias sociales de los tests tradicionales. Por otra parte, en la 
evaluación de la inteligencia se están desarrollando técnicas basadas en 
teorías innovadoras (por ejemplo, Carroll, Hunt o Sternberg) con las 
que se podrán estudiar desde los procesos mentales de primer orden 
hasta las habilidades cognitivas complejas como el razonamiento, la 
comprensión o la inteligencia. Otro hecho que está actualmente en sus 
inicios, pero que sin duda alcanzará gran importancia en los próximos 
años, es la evaluación de la inteligencia mediante indicadores biológicos. 
Por ejemplo, la correlación encontrada entre potenciales evocados e 
inteligencia puede hacer de ellos una alternativa a la evaluación 
tradicional de la inteligencia. Otra línea de investigación iniciada es la 
relación entre niveles de glucosa e inteligencia. No sería de extrañar, 
tal como plantea Matarazzo (1992), que en las próximas décadas se 
integrasen en un único modelo los planteamientos teóricos de Carroll, 
Hunt o Sternberg con sustratos biológicos del funcionamiento cognitivo. 
 
En un afán por mejorar la calidad de los tests, así como las habilidades 
de las personas que los aplican, se han formado dentro del marco de la 
Unión Europea diferentes comisiones de trabajo cuyas conclusiones se 
tratarán de poner en práctica en los próximos años; estos trabajos van 
dirigidos en tres direcciones (Muñiz, 1995). En primer lugar, el Colegio 
Oficial de Psicólogos español ha creado una comisión que intentará 
elaborar unas normas que tendrán que cumplir los tests con el fin de 
poseer un criterio con el que contrastar si un test posee los requisitos 
técnicos exigibles para su uso; en este contexto el Colegio de Psicólogos 
alemán ha planteado recientemente la posibilidad de que los tests fuesen 
considerados por el Parlamento Europeo como productos sanitarios, con 
lo que ello implica a nivel de uso y de control de calidad. Por otro lado, el 
Colegio Oficial de Psicólogos español está integrado en una comisión 
liderada por la International Tests Commission (ITC) que está a punto 
de finalizar la elaboración de unas directrices técnicas para la correcta 
adaptación de un test de una lengua/cultura a otra; un primer avance con 
veintidós directrices agrupadas en cuatro apartados (contexto, desarrollo 
de instrumentos y adaptación, administración e interpretación de las 
puntuaciones) fue publicado recientemente (Hambleton, 1994). Por 
último, en el futuro alguien (probablemente los colegios de psicólogos) 
deberán acreditar a las personas para utilizar ciertos tipos de tests, lo 
cual implicará el establecimiento de unos curricula o conocimientos 
exigibles. De hecho, en un reciente trabajo de Moreland y cols. (1995) se 
establecen doce competencias mínimas que deben cumplir aquellas 
personas que trabajen con tests, que van desde evitar errores al 
establecer las puntuaciones y registrar los datos hasta no asumir que 
una norma o baremo para una determinada situación o grupo de sujetos 
puede aplicarse automáticamente a otra situación o grupo de sujetos 
distintos, pasando por abstenerse de entrenar a los sujetos en los ítems 
de los tests o no hacer fotocopias de materiales originales. En Inglaterra 
ya se empieza a realizar una acreditación de especialistas en tests 
(Bartran, 1996). 
 
Un buen ejemplo del desarrollo de la evaluación psicológica en los 
próximos años es, en palabras de Matarazzo (1992), la mejora de la 
evaluación neuropsicológica. Ante la situación que probablemente 
tengamos que afrontar (una población envejecida, un incremento de la 
enfermedad de Alzheimer y casos de lesiones neuronales) tendrán que 
desarrollarse baterías o tests que evalúen la eficacia para captar 
información por diferentes modalidades sensoriales, la capacidad de 
atención, concentración y de procesamiento de información y la 
habilidad para ejecutar operaciones verbales o motoras requeridas ante la 
presentación de un ítem. Por lo que respecta a la evaluación de la 
personalidad, Matarazzo (1992) pronostica el desarrollo de tests para el 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 27 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 
 
 
 
 
diagnóstico de psicopatologías específicas como consecuencia del per-
feccionamiento de la tecnología de elaboración de tests. Por otro lado, 
nuevas generaciones de cuestionarios de personalidad como el NEO 
basado en las cinco dimensiones básicas (Costa y McCrae, 1988) se 
irán afianzando. 
 
Pero sin duda ninguna, uno de los campos de evaluación más 
prometedores en el futuro será la psicología de la salud. Tareas como la 
evaluación ecopsicológica del sujeto (Fernández del Valle, 1996) para 
determinar factores de riesgo y realizar cambios ambientales serán 
fundamentales en los próximos años. La tercera edad será un área de 
gran importancia en donde la evaluación psicológica tendrá un papel 
relevante. Temas como los trastornos gastrointestinales, el dolor 
crónico, el asma, los trastornos de la menstruación, la miopía, la artritis 
reumatoide, programas de salud, calidad de vida, etc. demandarán al 
evaluador psicológico (véase Buela-Casal, Caballo y Sierra, 1996). 
 
Quisiéramos terminar con las predicciones sobre el futuro de la 
evaluación psicológica realizadas por algunos autores relevantes de 
esta disciplina. En opinión de R. Ardila (comunicación personal, 14 de 
septiembre de 1995), la evaluación psicológica probablemente va a 
continuar abarcando nuevas áreas de la conducta humana, utilizando 
técnicas estadísticas más elaboradas, lo cual no excluirá el empleo de 
técnicas cualitativas. Por su parte, L. Almeida (comunicación personal, 
24 de septiembre de 1995) considera que en el futuro se realizará un 
mayor esfuerzo por integrar conceptos antagónicos hasta el momento, 
como rasgoconducta o E-R y cogniciones; según este autor, en los 
próximos años seremos testigos de grandes desarrollos en la 
evaluación psicofisiológica y en la computarización de la evaluación 
psicológica. Para A. E. Kazdin (comunicaciónpersonal, 17 de agosto de 
1995) el "modelo estático" de evaluación en el que una persona es 
evaluada mediante un test para predecir su ejecución dará paso a un 
"modelo dinámico" en el que primará la identificación de influencias 
bidireccionales entre constructos, de procesos de relaciones entre 
individuos y de las personas con sus ambientes. Por su parte, L. E. 
Beutler (comunicación personal, 15 de agosto de 1995) augura una 
mayor relación entre investigación y práctica dentro de la evaluación 
psicológica, especialmente en la planificación de tratamientos, y que 
todos aquellos procedimientos que tengan dificultad para validarse 
terminarán desapareciendo de la práctica convencional. Por último, en 
opinión de S. N. Haynes (comunicación personal, 23 de septiembre de 
1995) el futuro de la evaluación psicológica se puede resumir en los 
siguientes apartados: 
 
a. Se producirá un incremento en el empleo de los 
instrumentos de evaluación validados previamente (Haynes, 
Bogan e Ignacio, en prensa). 
b. Se seguirá incrementando el uso concurrente de 
diferentes métodos de evaluación (cuestionarios de autoinforme, 
registros psicofisiológicos, observación, autorregistros...). 
c. La evaluación psicológica seguirá integrando medidas 
de componentes situacionales con medidas tradicionales como 
los rasgos de personalidad, produciéndose un incremento de la 
aceptación de modelos de interacción persona x situación. 
d. Los juicios clínicos seguirán cobrando gran importancia. 
e. Teniendo en cuenta que la conducta es dinámica y 
cambia a lo largo del tiempo (Haynes, Blaine y Meyer, 1995), se 
enfatizará una metodología de evaluación basada en medidas de 
series temporales. Así, métodos como las correlaciones test-
retest, medidas pre y postratamiento, etc. ayudarán a evaluar 
estas características dinámicas de las variables. 
f Se producirán avances importantes en el desarrollo de 
instrumentos de evaluación psicológica: registros de vídeo y audio, 
sistemas de computarización de datos de observación, registros 
ambulatorios de variables psicofisiológicas, etc. (Tryon, 1996). 
 
 
 
MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 28 
 
 
 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL