Percepción Facial

¿Qué procesos intervienen en la percepción de una cara? ¿Percibir una cara es lo mismo que percibir un objeto cualquiera? ¿Por qué los testigos usualmente recurren a rótulos generales o únicamente describen los rasgos más sobresalientes cuando se les pide que describan a una persona? Los estudios en Psicología de la Percepción pueden aportarnos algunas respuestas a estas preguntas.

Específicamente para la percepción de caras, Bruce y Young (1986) propusieron un modelo general que abarca desde el instante en que se ve un rostro familiar hasta su reconocimiento y la evocación de su nombre. La primera fase consistiría en la codificación estructural de las características faciales que permitirá la construcción de una representación visual. Para ello, el sujeto realizaría un análisis simultáneo y en paralelo de diferentes tipos de información facial: a) de la apariencia facial o patrón facial que implica la identificación del estímulo visual como perteneciente a la categoría de las caras; b) de las características particulares del rostro y su distribución espacial particular mono-orientada que permitirán reconocer semejanzas o diferencias entre rostros; c) de las expresiones faciales; d) del lenguaje facial: movimientos orolinguofaciales, lectura labiofacial.

Figura 1. Modelo de reconocimiento de caras de Bruce y Young (1986)

La segunda fase implica el reconocimiento facial, a partir de la representación generada, mediante su comparación con las huellas de memoria de caras previamente aprendidas y almacenadas. En el caso de que se encuentre una huella de memoria facial de configuración similar a la representación se produce un sentimiento de familiaridad y se activa el acceso a su reconocimiento. Esta tarea es realizada por las unidades de reconocimiento facial que serían un almacén de las huellas de memoria de caras previamente conocidas y que establecen una conexión entre la representación y la memoria semántica o nodos de identidad personal.

El siguiente paso, sería la activación de la memoria semántica relativa a las personas. El sentimiento de familiaridad producido por el reconocimiento del rostro sólo nos asegura que la cara que vemos ha sido previamente conocida. Por ello, es necesaria la activación del nodo de identidad personal para acceder a las memorias semánticas relativas a la persona que vemos (profesión, lugar y época en que la conocimos, dónde vive, etc).

Una vez generada la representación facial, despertado el sentimiento de familiaridad, hecho el reconocimiento facial y activada la memoria semántica sólo queda acceder al nombre. Para ello se requiere la activación del sistema léxico. A la activación de la representación verbal se puede acceder a partir de la representación mnésica visual (el rostro) o de cualquiera de las representaciones semánticas del nodo de identidad personal. Finalmente, el acto de reconocimiento queda completado por la realización articulatoria del nombre seleccionado.

Así pues, el proceso de percibir una cara, esto es, de interpretar las sensaciones procedentes del estímulo complejo que es una cara, es probablemente uno de los más complicados de entre todas las capacidades perceptivas. En primer lugar porque las caras no solo están compuestas de diferentes rasgos que guardan una configuración concreta, sino que además son dinámicas. El dinamismo de una cara procede de su evolución a lo largo del tiempo, con la edad, y de cada expresión emocional a corto plazo. La cara es una de las estructuras anatómicas que más músculos posee y los elementos que componen una cara (pelo, frente, cejas, ojos, nariz, boca, mentón...) pueden adoptar formas y disposiciones diferentes. Por otro lado, todas las caras (o casi) están compuestas por los mismos rasgos y en disposiciones similares, de modo que la diferencia entre una cara y otra es cuestión solo de matiz, pudiendo encontrarse una variabilidad inmensa que va desde caras muy diferentes a otras bastante semejantes. Así pues podemos hablar de una variabilidad intrasujeto, relativa a la dinamicidad de la cara de una misma persona, y una variabilidad intersujetos, procedente de las diferencias entre unas personas y otras. Sin embargo, podríamos ser capaces de identificar a una persona de sesenta años en una fotografía tomada cuando tenía treinta años o incluso diez. La apariencia de esa persona es muy diferente en cada edad, pero conserva una identidad que somos capaces de reconocer. Igualmente somos capaces de reconocer a esa persona aun cuando adopte distintas expresiones faciales.

Esta variabilidad de las caras las confiere una cualidad que las distingue de cualquier otro estímulo, de cualquier otro objeto. Así, las teorías que tratan de explicar qué procesos cognitivos intervienen en la percepción de un objeto no parecen ser suficientes para explicar la percepción de una cara. Para explicar cómo se perciben los objetos, Treisman (1986, 1993) propuso la Teoría de Integración de Características en la que la percepción de un objeto se basaría en la percepción de las primitivas o unidades básicas del objeto en cuestión en una primera fase preatencional, para después integrar esos componentes y dotarles de significado comparándoles con los prototipos de objetos que conocemos (un camión), para por último identificarlos como objetos singulares (el camión de mi vecino).

Las primitivas o unidades básicas serían los componentes más simples del objeto y se percibirían de forma automática. Líneas rectas, curvas, orientaciones, etc. serían esas primitivas para las que sabemos existen estructuras neuronales específicas. Aunque también se ha demostrado que existen estructuras neuronales específicas para el procesamiento de formas complejas en el cortex inferotemporal (Tanaka, 1993). Incluso se han encontrado neuronas que responden específicamente a información facial (Gross, 1992, 1994; Rolls, 1992; Rolls y Tovee, 1995; Wachsmuth, Oram y Perrett, 1994). Estudios con resonancia magnética funcional (RMf) han localizado tres áreas implicadas en el procesamiento de caras: el área facial fusiforme, el área facial occipital y el surco temporal superior (Clark, Keil, Maisog, Courtney, Ungerleider y Haxby, 1996; Kanwisher, McDermott y Chun, 1997; Puce, Allison, Asgari, Gore y McCarthy, 1996; Rossion, Caldara, Seghier, Schuller, Lazeyras y Mayer, 2003). Una lesión en estas áreas provocaría un déficit en el procesamiento de caras que se denomina prosopagnosia, del que hablaremos más adelante.

Figura 2. Resonancia magnética funcional (RMf) que muestra la localización de las áreas cerebrales implicadas en la percepción facial (Rossion y cols., 2003).

Biederman (1987) desarrolló una propuesta parecida a la de Treisman (1986) salvo que las formas básicas sería volumétricas o tridimensionales, a las que denominó geones. Cilindros, conos, pirámides, etc. serían los componentes básicos de esta propuesta. Según Biederman la percepción de los objetos comenzaría con el reconocimiento de sus componentes (geones). Los geones se caracterizarían por ser identificables desde diferentes perspectivas debido a que contendrían propiedades invariantes para el sistema visual y por lo tanto serían discriminables unos geones de otros desde distintos puntos de vista. Además, estableció su resistencia al ruido visual; esto es, aún estando parcialmente enmascarados seríamos capaces de reconocerlos.

De acuerdo con estas propuestas, la pregunta clave sería si la cara como un todo podría considerarse un elemento básico susceptible de facilitación en su procesamiento por estructuras neurológicas específicas o si los elementos básicos son los rasgos que componen la cara. Algunos datos podrían apuntar en la dirección de que el elemento básico podría ser la cara como un todo: la existencia de neuronas específicas para el procesamiento de información facial y el hecho de que podamos reconocer una configuración muy básica de cara como tal.

Procesamiento holístico o por rasgos

Podríamos considerar dos posibles estrategias diferentes al codificar una cara: a) rasgo a rasgo, de acuerdo con un esquema previo (Penry, 1971); o b) de forma global u holística y no procesando sus rasgos específicos por separado (Kuehn, 1974).

Figura 3. Algunos rasgos faciales por separado.

Las principales teorías sobre el procesamiento de caras proponen que éstas no se percibirían como una colección de rasgos individuales, sino como un todo integrado, donde los distintos rasgos se relacionan entre ellos, creando la impresión particular de una persona. Algunos datos parecen avalar esta teoría. Homa, Haver y Schwartz (1976) mostraron que el procesamiento de una cara se ve facilitado en comparación con el procesamiento de un objeto. Aunque, Tanaka y Farah (1993) encontraron que esta facilitación solo se producía en el procesamiento de caras con estructura normal frente a caras con rasgos descolocados. En la misma dirección, Moscovitch, Winocur y Behrman (1997) hallaron que cuando se presentaba una fotografía fragmentada a personas cuya percepción de caras era débil no podían identificar que era una cara. Así, parecen ser actividades distintas el procesamiento de los rasgos faciales y la identificación de una persona (Benton y Allen, 1972). Los estudios de casos clínicos de pacientes aquejados de prosopagnosia mostrarían la disociación entre los dos tipos de procesamiento.

Figura 4. Las caras se percibirían de forma holística.

Heering, Houthuys y Rossion (2007) también encontraron que el procesamiento de las caras se veía facilitado en comparación con el procesamiento de un objeto, efecto que desaparecía cuando se presentaban caras mal alineadas (ver figura). Además, establecieron que la capacidad para percibir las caras de un modo holístico se desarrolla con la edad, y parece ya consolidada a la temprana edad de 6 años. Estudios con niños diagnosticados de autismo (López, Donnelly, Hadwin y Leekam, 2004) muestran que su déficit en la integración de información les podría impedir la percepción holística, y una muestra de ello es que no les afectan variables como la descomposición de las caras en rasgos, su desalineación o inversión respecto a la posición normal.

Figura 5. Ejemplo de estímulos de caras bien alineadas y mal alineadas del experimento de (Heering, Houthuys y Rossion, 2007).

Figura 6. Puntuaciones medias en sujetos de diferentes edades al procesar caras mal alineadas (adaptado de Heering, Houthuys y Rossion, 2007).

En la misma dirección apuntaron los datos obtenidos en una investigación que realizamos en la Universidad Complutense de Madrid (Arévalo, Barrio, Blanco y Manzanero, 2007) donde se evaluaba la identificación holística o por rasgos al procesar una cara. En la condición holística se presentaron 10 secuencias de 6 caras cada una, para a continuación mostrar una cara para discriminar si estaba presente en la secuencia anterior. En la condición por rasgos se presentó una cara y seguidamente 6 ejemplos de cada rasgo para identificar el correspondiente a la imagen previa. Los resultados mostraron que el reconocimiento holístico incrementa la probabilidad de aciertos en comparación con el reconocimiento por rasgos (89% vs. 66%), aunque no difieren en la probabilidad de falsas alarmas (8% vs. 6%). Los resultados más llamativos fueron que el reconocimiento holístico facilitaba la discriminabilidad respecto al reconocimiento por rasgos (d’=4.83 vs. d’=2.26), al tiempo que favorecía respuestas más conservadoras (los sujetos tienden al NO) mientras que en el reconocimiento por rasgos los sujetos tienden a respuestas más liberales (ß=33.65 vs. ß=0.44).

Figura 7. Porcentaje de aciertos para las condiciones por rasgos y holístico (Arévalo, Barrio, Blanco y Manzanero, 2007).

Figura 8. Puntuaciones de discriminabilidad (d’) para las condiciones por rasgos y holístico (Arévalo, Barrio, Blanco y Manzanero, 2007).

Figura 9. Puntuaciones del criterio de respuesta (β) para las condiciones por rasgos y holístico (Arévalo, Barrio, Blanco y Manzanero, 2007).

Por otro lado, pedir a un testigo que describa a una persona implícitamente supone que detalle sus rasgos faciales, tarea que sería posible si en la codificación se hubiera seguido la estrategia a). Sin embargo, sabemos que la capacidad para describir una cara es bastante escasa. Las investigaciones que se han realizado para estudiar si las caras se procesan considerando sus rasgos físicos (por ejemplo, Woodhead, Baddeley y Simmonds, 1983) concluyen que no parece que inducir a los sujetos a analizar las caras en sus características constituyentes sea una manera efectiva para mejorar el reconocimiento de caras.

No obstante, algunos autores (por ejemplo, Bruce, 1988) proponen que lo más útil para identificar a una persona podría ser un método sintético que implicaría un análisis del conjunto de la cara como un todo y de los rasgos relevantes de la misma. En esta dirección, diferentes investigadores proponían que la percepción de caras se realizaría mediante un procesamiento en paralelo, de forma que todos los rasgos se percibirían simultáneamente (Bradshaw y Wallace, 1971). El reconocimiento posterior se realizaría mediante rasgos faciales y holísticamente (Mathews, 1978). Si el proceso fuera como en el caso de la percepción de objetos, siguiendo las propuestas de Treisman (1986) o Biederman (1987) este procesamiento dual se daría en fases diferentes. En primer lugar se procesarían los rasgos y en una segunda fase la cara como un todo.

Por otro lado, diversas investigaciones han encontrado que no todos los rasgos de una cara se procesan de igual forma. Luria y Strauss (1978) encontraron que la nariz, los ojos y la boca atraen la mayor parte de nuestra atención. Mientras que Manzanero y López (2009) encuentran que la boca y los ojos se reconocen mejor que la nariz. Por su parte, Laughery, Alexander y Lane (1979) afirman que pocas personas dan importancia a las orejas en su descripción.

Figura 10. Intente reconocer los rasgos de la cara de la figura 4 sin volver atrás.

Procesamiento conceptual

Pero es más, el procesamiento de una cara es muy distinto al procesamiento de un objeto cualquiera y parece que se realiza de una forma mucho más conceptual. Patterson y Baddeley (1977) diseñaron un experimento donde los sujetos utilizaban a) una estrategia de análisis de características para cada una de las caras presentadas (narices grandes o pequeñas...), o b) evaluaban cada cara en términos de dimensiones semánticas de personalidad (agradable o desagradable...). Los resultados mostraron que los sujetos que habían categorizado las caras en términos de características de personalidad discriminaban más efectivamente las caras que los que las habían categorizado en términos físicos. Sin embargo, no parece que sea efectivo para mejorar el reconocimiento enfatizar una estrategia conceptual. En este sentido, Baddeley y Woodhead (1983) no encontraron diferencias cuando a los sujetos se les proporcionaban datos biográficos de las personas a identificar en comparación con proporcionar sólo su nombre, por lo que concluyen que dar una descripción detallada y rica de la personalidad de la persona no parece tener efecto sobre el posterior reconocimiento.

Por otro lado, algunos datos (Sporer, 1989) indican que los sujetos que intentaban visualizar las caras sobre la base de sus descripciones verbales, y podían utilizar sus propias notas sobre las caras como un reconocido indicio de recuperación, realizaban peor la prueba de reconocimiento que los sujetos que simplemente intentaban visualizarlas antes de la prueba de reconocimiento. Estos resultados apuntarían una ventaja del procesamiento visual de caras sobre el verbal, que podría ser debido a la carencia de descripciones verbales distintivas utilizadas por los sujetos. Este argumento se ve apoyado por los protocolos de los sujetos en la fase de codificación que contenían descripciones verbales generales no distintivas (“pelo largo”, “parece un sacerdote”, “parece viejo”, etc.). Aunque, en otras investigaciones (Lyle y Johnson, 2004; Manzanero, López y Contreras, en revisión) se ha encontrado que describir la cara de la persona objetivo reduce las falsas alarmas (más adelante nos centraremos en el efecto de la descripción previa sobre el reconocimiento posterior).

Figura 11. Diferentes rasgos faciales utilizados en las investigaciones sobre el procesamiento por rasgos obtenidos del programa FACES para la construcción de retratos robot. En el ejercicio anterior la respuesta correcta para todos los rasgos es la a).

Percepción de caras y frecuencia espacial

Desde un punto de vista visual una cara no sería más que un patrón determinado de distintas intensidades de luz. De este modo, podríamos analizar una cara por la diferente orientación, frecuencia y amplitud de sus componentes. La capacidad de distinguir los rasgos de las personas a distinta distancia y con distintos grados de iluminación estará en función de la frecuencia y el contraste de los rasgos, y la sensibilidad que el testigo tenga para la combinación de ambas dimensiones en lo que se denomina como la función de sensibilidad al contraste (FSC). Cuanto más grande sea la distancia a la que se presenta la persona a identificar mayor será la frecuencia espacial, cuanta menos iluminación menor será el contraste; por lo tanto, el incremento de la distancia y el decremento de la iluminación disminuyen la posibilidad de percibir algunos rasgos faciales.

Por otro lado, el sistema visual humano está preparado para procesar frecuencias bajas, medias y altas por diferentes canales (Campbell y Robson, 1968; Graham y Nachmias, 1971; Wilson y Bergen, 1979). Como se puede observar en la figura, las frecuencias bajas permitirían percibir la configuración global de una cara, mientras que los detalles permanecerían desdibujados. Las frecuencias altas permitirían distinguir el detalle de los rasgos. Algunos experimentos han tratado de evaluar qué frecuencias permitirían identificar una cara, aplicando filtros para las frecuencias altas o las bajas, de modo que se pudiera aportar algo más de información sobre si efectivamente las caras se procesan de forma holística o por rasgos. Si fuera correcta la teoría del procesamiento holístico, las caras de frecuencias bajas se distinguirían mejor que las caras en frecuencias altas. Harmon (1973) encontró que efectivamente las imágenes de caras degradadas mediante la eliminación de las frecuencias altas se reconocían sin demasiado problema, por lo que las frecuencias altas solo aportarían información redundante.

Figura 12. Función de sensibilidad al contraste, donde se han representado distintos canales para el procesamiento de cuatro rangos de frecuencia. Las imágenes muestran qué frecuencias analiza cada canal y su repercusión en la percepción facial. La suma de todas ellas daría lugar a la percepción del estímulo original.

¿Habría entonces algunas frecuencias que actuarían a modo de ruido dificultando la identificación de una cara? Harmon y Julesz (1973) encontraron que cuando a las caras sometidas a un filtro de paso bajo de banda se les añadía frecuencias cercanas en el espectro se interfería en su reconocimiento más que cuando se añadían frecuencias más lejanas y por lo tanto más altas. Estos resultados llevaron a Harmon y Julesz a proponer la existencia de una frecuencia crítica para la identificación de caras. Según Tieger y Ganz (1979) las frecuencias espaciales intermedias serían la clave. Utilizando imágenes de caras de 10 ciclos por grado de ángulo visual, las máscaras de enrejados sinusoidales de 2.2 ciclos interferían más que enrejados de mayor y menor frecuencia.

Figura 13. La imagen de arriba se ha manipulado con un filtro de frecuencias de paso bajo (izquierda), de paso de banda (central) y de paso alto (derecha).

No obstante, han surgido algunas opiniones en contra de estos resultados. Según Riley y Costall (1980) no habría un rango de frecuencias crítico para la identificación de caras dado que cualquier ancho de banda debería establecerse no en ciclos por grado de ángulo visual, sino en ciclos por cara. Sergent (1986) argumentaba que además los resultados de los trabajos sobre la frecuencia espacial dependían del tipo de tarea que se pidiera a los sujetos, lo que le llevó a concluir que el papel de la información procedente de una cara será relevante en función de la tarea que se solicite a los sujetos. En este sentido, podemos hipotetizar que probablemente una estrategia holística sería adecuada para la identificación de una cara, sin embargo, una estrategia basada en procesar los rasgos podría ser adecuada para una descripción física de la misma y el uso de técnicas de generación de retratos-robot. Así podría indicarlo el hecho de que una reciente investigación realizada con policías y civiles (Manzanero, Grandes y Jódar, 2009) mostrara que los primeros son mejores que los segundos al describir, pero tan malos como estos al identificar, lo que indica una disociación entre los dos tipos de tareas.

_____________________________________________

Manzanero, A.L. (2010): Procesos cognitivos en el reconocimiento de caras. En A.L. Manzanero, Memoria de Testigos (pág. 131-146). Madrid: Ed. Pirámide.