Emociones en el habla: incongruencia prosodia–semántica en adolescentes autistas en contextos escolares inclusivos *

Emotions in Speech: Prosody–Semantics Incongruence in Autistic Adolescents in Inclusive School Contexts

Vannia Olivares-Morales

Emociones en el habla: incongruencia prosodia–semántica en adolescentes autistas en contextos escolares inclusivos *

Universitas Psychologica, vol. 24, 2025

Pontificia Universidad Javeriana

Vannia Olivares-Morales a

Pontificia Universidad Católica de Valparaíso, Chile


Recibido: 01 septiembre 2025

Aceptado: 09 diciembre 2025

Resumen: Este estudio examinó el reconocimiento de emociones en el habla en adolescentes autistas escolarizados en entornos inclusivos, comparando su desempeño con el de un grupo neurotípico. Participaron veinte adolescentes chilenos de 12 a 15 años (10 autistas Nivel 1 y 10 controles), quienes completaron una tarea auditiva compuesta por 196 estímulos con variaciones congruentes e incongruentes entre la prosodia y la semántica emocional. Se analizaron precisión y tiempos de respuesta mediante pruebas no paramétricas y tamaños de efecto. Los resultados mostraron que ambos grupos presentaron niveles comparables de reconocimiento emocional, sin diferencias significativas en las condiciones global, congruente o incongruente. Sin embargo, en ambos grupos se observó un efecto robusto de interferencia ante la incongruencia prosódico–semántica, reflejado en una disminución marcada de la precisión, sin costos en los tiempos de respuesta. Solo una combinación incongruente —prosodia neutra con semántica alegre— evidenció diferencias entre grupos, con un desempeño superior en el grupo autista. Estos hallazgos sugieren que, en contextos educativos inclusivos, los adolescentes autistas de nivel 1 pueden desarrollar patrones de reconocimiento emocional comparables a los de sus pares neurotípicos, incluso frente a señales afectivas conflictivas. Se discuten implicancias para el desarrollo socioemocional y para la comprensión de los mecanismos de integración prosódico-semántica en el autismo.

Palabras clave:trastornos del espectro autista, desregulación emocional, reconocimiento de emociones, congruencia prosódico-semántica, procesamiento lingüístico..

Abstract: This study examined emotion recognition in speech among autistic adolescents enrolled in inclusive educational settings, comparing their performance with that of neurotypical peers. Twenty Chilean adolescents aged 12 to 15 years (10 autistic, Level 1; 10 neurotypical controls) completed an auditory task consisting of 196 stimuli that varied in prosodic–semantic congruence. Accuracy and response times were analyzed using non-parametric tests and effect-size estimates. Results showed that both groups achieved comparable levels of emotion recognition, with no significant differences in overall performance or in the congruent and incongruent conditions. However, a robust interference effect emerged in both groups when processing prosodic–semantic incongruence, reflected in a marked reduction in accuracy without accompanying increases in response times. Only one incongruent combination—neutral prosody paired with happy semantics—yielded between-group differences, with autistic adolescents outperforming their neurotypical peers. These findings suggest that autistic adolescents with Level 1 support needs, when educated in inclusive contexts, may develop emotion-recognition profiles comparable to those of neurotypical adolescents, even in the presence of conflicting affective cues. Implications for socio-emotional development and for understanding prosodic–semantic integration mechanisms in autism are discussed.

Keywords: autism spectrum disorder, emotional dysregulation, emotion recognition, prosody–semantics congruence, linguistic processing.

La interpretación de las señales emocionales transmitidas a través del habla constituye un componente esencial de la comunicación humana, especialmente durante la adolescencia, etapa caracterizada por un aumento en la complejidad socioemocional y lingüística. En este contexto, la prosodia emocional funciona como un canal crítico para la transmisión de estados afectivos que, al interactuar con el contenido semántico del mensaje, conforma un sistema multimodal de reconocimiento emocional (Kotz & Paulmann, 2007; Lin et al., 2020; Pell et al., 2011). Esta integración multimodal es particularmente relevante en el estudio del autismo, dado que esta condición se asocia a variaciones en la sensibilidad a pistas implícitas, la modulación afectiva y el procesamiento de información emocional en el lenguaje (Grossman et al., 2010; Lartseva et al., 2015; McCann & Peppé, 2003; Zhang et al., 2021). La literatura sobre reconocimiento emocional en el autismo ha documentado un desempeño heterogéneo, lo que sugiere que las diferencias observadas en esta población no responden a un déficit único, sino a variaciones moduladas por factores clínicos, lingüísticos y contextuales (Atherton et al., 2022; Mazefsky & White, 2014). Desde esta perspectiva, comprender cómo adolescentes autistas integran información prosódica y semántica resulta fundamental para examinar los mecanismos emocionales implicados en esta variabilidad.

En este caso, la incongruencia prosódico–semántica constituye un escenario experimental especialmente adecuado para examinar estas dinámicas si se considera que la discrepancia entre la información transmitida por la entonación y el contenido verbal introduce un conflicto interno que exige una mayor integración multimodal y activa mecanismos de control del conflicto emocional (Mitchell, 2006; Paulmann & Pell, 2010). Estudios previos han demostrado que este tipo de conflicto afecta el reconocimiento emocional tanto en personas autistas como neurotípicas (Chen et al., 2024; Lin et al., 2020; Pell et al., 2011), aunque la magnitud del efecto puede variar en función de características clínicas, lingüísticas o contextuales, incluyendo la experiencia comunicativa y el desarrollo sociocognitivo (Lartseva et al., 2015; Liu et al., 2021; Zuluaga-Arroyave et al., 2022).

En Chile, el análisis del reconocimiento emocional en población autista adolescente es aún limitado, especialmente en contextos educativos inclusivos, pese a la relevancia que tienen las interacciones escolares en el desarrollo socioemocional y comunicativo (Ávila-Rincón et al., 2024; Labbé-Atenas et al., 2019). Frente a esta necesidad, el objetivo de este estudio fue analizar el reconocimiento de emociones en el habla en adolescentes autistas escolarizados en educación regular, examinando tanto el desempeño global como los efectos específicos de la incongruencia prosodia–semántica. Para ello, se comparó el rendimiento de adolescentes autistas de nivel 1 con el de un grupo control neurotípico mediante un paradigma de alta densidad de ensayos que permite una evaluación precisa y robusta del procesamiento emocional.

Procesamiento emocional en autismo

La evidencia empírica sobre procesamiento emocional en autismo revela patrones altamente heterogéneos: algunas investigaciones describen dificultades en la identificación de emociones en la voz, el rostro o el discurso (Grossman et al., 2010; McCann & Peppé, 2003), mientras que otros estudios muestran un rendimiento comparable al de adolescentes neurotípicos con perfiles adaptativos altos y experiencias comunicativas consistentes (Atherton et al., 2022). Esta variabilidad ha impulsado perspectivas teóricas que enfatizan el carácter multimodal del reconocimiento emocional y la interacción entre factores lingüísticos, cognitivos y contextuales que influyen en la interpretación de señales afectivas (Grossman et al., 2010; Pronina et al., 2021).

Desde un enfoque lingüístico-cognitivo, la prosodia emocional se considera un canal crítico en la percepción afectiva, pues influye tempranamente en la interpretación del mensaje incluso antes del análisis semántico (Paulmann & Pell, 2010; Pell et al., 2011). Esta jerarquía temporal adquiere especial relevancia en el autismo, donde diferencias en la sensibilidad a señales paralingüísticas pueden modificar la integración entre prosodia y semántica durante la comunicación (Lartseva et al., 2015). Desde esta perspectiva, las variaciones observadas en el procesamiento emocional no reflejan un déficit único o estable, sino distintos modos de integrar información multimodal, modulados por factores cognitivos, estrategias adaptativas y características del contexto comunicativo y sociocultural (Liu et al., 2021; Zuluaga-Arroyave et al., 2022).

Mecanismos cognitivos de integración emocional en el autismo

La comunicación emocional en el habla implica la integración simultánea de información prosódica y semántica, un proceso que requiere coordinar distintos niveles lingüísticos y afectivos (Paulmann & Pell, 2010). Desde esta perspectiva, la coherencia entre estos canales facilita la interpretación emocional, mientras que su divergencia introduce un conflicto interno que demanda recursos adicionales de procesamiento (Lin et al., 2020; Pell et al., 2011). Este tipo de discrepancias activa mecanismos de monitoreo y control que permiten resolver la competencia entre señales afectivas contradictorias, fenómeno ampliamente descrito en estudios sobre prosodia emocional y procesamiento del lenguaje (Paulmann & Pell, 2010; Paulmann et al., 2013).

En consonancia con esta evidencia conductual, Mitchell (2006) mostró que los enunciados emocionalmente incongruentes generan una activación aumentada en regiones frontales —incluido el giro frontal inferior— vinculadas al monitoreo del conflicto y a la integración de señales afectivas. Más que situar este fenómeno exclusivamente en términos neurocognitivos, estos hallazgos permiten comprender que la incongruencia prosódico-semántica introduce una demanda adicional para organizar información afectiva dispersa en el habla. En contextos naturales de interacción —como los entornos educativos inclusivos— este tipo de señales puede ser procesado mediante estrategias comunicativas que se desarrollan a partir de la participación sostenida en intercambios sociales, proceso descrito en investigaciones sobre desempeño prosódico y pragmático en personas autistas con experiencias comunicativas ricas y consistentes (Atherton et al., 2022; Grossman et al., 2010; Paul et al., 2009). Estas interacciones favorecen interpretaciones emocionales más estables incluso ante estímulos ambiguos.

Aunque diversas investigaciones sugieren que variaciones en la flexibilidad cognitiva, el control inhibitorio y la integración multimodal pueden influir en la resolución de conflictos afectivo-lingüísticos en el autismo (Lartseva et al., 2015; Zuluaga-Arroyave et al., 2022), estos mecanismos forman parte de un espectro amplio de procesos que intervienen en la interpretación emocional del habla. En este marco, la incongruencia prosódico-semántica constituye un escenario específico dentro de ese espectro, ya que introduce un tipo puntual de competencia entre señales afectivas que permite observar cómo se integran y se ponderan distintos canales emocionales del lenguaje.

Congruencia e incongruencia prosódico-semántica

Como se desarrolló previamente, la prosodia emocional desempeña un papel decisivo en la interpretación afectiva del habla (Pronina et al., 2021). En este contexto, la relación entre prosodia y contenido semántico permite distinguir entre enunciados congruentes, cuando ambos niveles transmiten la misma emoción, e incongruentes, cuando prosodia y semántica comunican señales afectivas divergentes (ver Tabla 1). Esta distinción resulta fundamental para comprender cómo los oyentes integran información emocional distribuida en múltiples canales.

Tabla 1
Identificación de estímulos según congruencia

Identificación de estímulos según
congruencia

Nota. Las emociones corresponden a la codificación categorial de cada estímulo auditivo. El ejemplo muestra un enunciado tomado del corpus original utilizado para la construcción de la tarea.


La congruencia entre prosodia y semántica facilita la integración afectiva del mensaje, ya que ambas señales refuerzan una misma categoría emocional, lo que suele generar respuestas más rápidas y precisas en tareas de reconocimiento emocional (Pell et al., 2011). En contraste, la incongruencia introduce un conflicto interno que obliga al oyente a resolver la competencia entre señales divergentes, activando procesos adicionales de monitoreo y control afectivo (Mitchell, 2006; Paulmann & Pell, 2010).

En términos de procesamiento emocional, los enunciados incongruentes presentan un mayor potencial disruptivo, debido a que exigen integrar información conflictiva distribuida en múltiples canales. Diversos estudios han mostrado que este tipo de estímulos incrementa la carga cognitiva y puede modular la respuesta emocional del oyente, afectando tanto la precisión como la estabilidad de la interpretación afectiva (Kotz & Paulmann, 2007; Lin et al., 2020; Paulmann et al., 2013). Estas propiedades hacen que la incongruencia prosódico-semántica constituya un recurso experimental especialmente útil para examinar los mecanismos de integración emocional en el autismo

Desregulación emocional y su relación con la incongruencia prosodia-semántica

Dado que la incongruencia prosódico-semántica introduce un tipo específico de conflicto afectivo-lingüístico, su procesamiento se relaciona estrechamente con los mecanismos que participan en la regulación emocional. La hipótesis de la desregulación emocional plantea que ciertas dificultades afectivas observadas en el autismo no derivan exclusivamente de un déficit en la identificación de emociones, sino de una modulación atípica de la respuesta emocional ante estímulos sociales complejos (Mazefsky & White, 2014). Este modelo sitúa la desregulación en la interacción entre las demandas del contexto y los recursos cognitivos vinculados al control inhibitorio, la flexibilidad cognitiva y la integración sensorial, funciones que pueden presentar variaciones en personas autistas (Zuluaga-Arroyave et al., 2022).

En este marco, la incongruencia prosódico-semántica constituye un disparador experimental especialmente útil para estudiar la regulación emocional, ya que obliga al oyente a integrar señales afectivas contradictorias y activa mecanismos de monitoreo del conflicto emocional (Mitchell, 2006). Este tipo de estímulos incrementa la carga cognitiva y puede revelar diferencias en la forma en que las personas autistas ponderan la información distribuida en distintos canales afectivo-lingüísticos (Chen et al., 2024; Lartseva et al., 2015). Considerando estos antecedentes, evaluar la precisión y rapidez con que adolescentes autistas responden a enunciados congruentes e incongruentes permite explorar de manera indirecta los mecanismos cognitivo–emocionales implicados en la regulación ante señales lingüísticas emocionalmente conflictivas. Esta aproximación resulta especialmente relevante en contextos educativos inclusivos, donde las experiencias comunicativas cotidianas pueden contribuir al desarrollo de estrategias adaptativas de integración emocional.

Método

Este estudio empleó un diseño mixto, cuasiexperimental de grupos no equivalentes (TEA vs. control) y con medidas repetidas intra-sujeto sobre la congruencia prosodia–semántica, con el fin de examinar el reconocimiento verbal de emociones en adolescentes autistas. El objetivo general de este estudio fue analizar cómo estos procesan señales verbales emocionales, mediante una tarea que manipula la congruencia entre la prosodia y el contenido semántico. Para ello, se diseñó una tarea auditiva que manipulaba la congruencia entre prosodia y semántica, permitiendo evaluar el reconocimiento emocional comparativo entre adolescentes autistas y un grupo control neurotípico.

Con base en la literatura previa sobre desregulación emocional y procesamiento multimodal en el TEA (Mazefsky & White, 2014; Pell et al., 2011), se planteó la siguiente hipótesis general: se espera que el grupo TEA presente un reconocimiento emocional comparable al grupo control en condiciones congruentes, pero que en situaciones incongruentes muestre un patrón diferencial reflejado en variaciones de precisión y tiempos de reacción.

En coherencia con el objetivo planteado, se registraron dos medidas centrales: la precisión en el reconocimiento emocional y el tiempo de respuesta. La recolección se efectuó mediante la plataforma Gorilla.sc (Anwyl-Irvine et al., 2020), que permite implementar tareas conductuales con alta precisión temporal en entornos en línea. Este sistema facilitó un control experimental adecuado y garantizó la recolección remota de datos en condiciones de restricción presencial, manteniendo la estandarización del procedimiento para todos los participantes.

Participantes

La muestra se conformó a partir de dos grupos naturales y preexistentes: un grupo de adolescentes diagnosticados con Trastorno del Espectro Autista (TEA) de nivel 1 y un grupo control sin necesidades educativas especiales. Debido a que estas condiciones no pueden ser asignadas aleatoriamente, el estudio se enmarca en un diseño cuasiexperimental de grupos no equivalentes (Shadish et al., 2002).

Para asegurar comparabilidad entre los grupos, se establecieron criterios de inclusión que garantizaran cierto grado de homogeneidad dentro de cada uno. En el grupo TEA, estos criterios incluyeron un diagnóstico nivel 1 confirmado por profesionales del Programa de Integración Escolar (PIE), la ausencia de dificultades lingüísticas reportadas y la escolarización en establecimientos regulares equivalentes a los del grupo control. Asimismo, se buscó que ambos grupos provinieran de contextos educativos similares, a fin de reducir posibles efectos asociados a diferencias institucionales o curriculares. Finalmente, las condiciones experimentales fueron estandarizadas para todos los participantes, controlando el orden de presentación de los estímulos, las instrucciones, el tipo de dispositivo utilizado y las características acústicas del entorno de aplicación, con el objetivo de minimizar la variabilidad externa y favorecer la validez interna del estudio.

Se evaluó la adecuación del tamaño muestral mediante un análisis de potencia a priori realizado con G*Power, basado en un modelo equivalente de medidas repetidas (Faul, et al., 2007). Con parámetros convencionales (α = 0.05, 1 – β = 0.80 y dos niveles intra-sujeto), el análisis indicó que una muestra total de 20 participantes era suficiente en un diseño como el empleado, donde cada individuo aporta 196 observaciones. Esta estructura de alta densidad de ensayos incrementa la fiabilidad de las estimaciones dentro de sujeto y se alinea con prácticas habituales en investigaciones experimentales con poblaciones clínicas (Paulmann et al., 2013; Pell et al., 2011).

La muestra final estuvo compuesta por 20 adolescentes chilenos escolarizados en educación regular, de entre 12 y 15 años, distribuidos en dos grupos naturales no equivalentes: 10 adolescentes diagnosticados con autismo nivel 1 y 10 adolescentes neurotípicos que conformaron el grupo control. Todos eran hablantes nativos de español y presentaban visión y audición normales o corregidas. El reclutamiento se realizó mediante muestreo por conveniencia en establecimientos municipales de la Región de Valparaíso que contaban con PIE, manteniendo condiciones educativas comparables entre los grupos. El orden de presentación de los estímulos fue aleatorizado de manera uniforme para todos los participantes.

Las características descriptivas de la muestra se presentan en la Tabla 2. En el grupo TEA, todos los adolescentes habían sido evaluados por profesionales del PIE y contaban con un diagnóstico nivel 1 según criterios DSM-5 (American Psychiatric Association, 2013), lo que implica un requerimiento de apoyo externo reducido y ausencia de dificultades lingüísticas reportadas. Se registró la presencia de ansiedad en seis participantes, cuatro de los cuales recibían medicación ansiolítica estable; esta variabilidad clínica refleja patrones naturalistas en población adolescente autista escolarizada en contextos inclusivos. Por su parte, el grupo control estuvo compuesto por estudiantes del mismo tipo de establecimientos, sin necesidades educativas especiales ni intervención PIE previa.

Tabla 2
Datos descriptivos de los participantes
Datos descriptivos de los
participantes

Nota. Edad reportada en años. TEA = Trastorno del Espectro Autista; NT = neurotípicos. Los participantes del grupo autista fueron clasificados por profesionales del Programa de Integración Escolar dentro del Nivel 1 según criterios DSM-5.


Construcción de la tarea

La tarea de reconocimiento emocional se implementó como un paradigma auditivo compuesto por ensayos individuales en los que los participantes debían identificar la emoción expresada en el habla. Cada ensayo comenzaba con una pantalla de fijación de 2.5 segundos, seguida por la reproducción de un estímulo auditivo. Al finalizar la reproducción, el participante seleccionaba la emoción percibida entre cuatro alternativas (“alegre”, “triste”, “enojada” o “neutra”). Se registraron la precisión y el tiempo de respuesta, con un límite máximo de 15 segundos, y una pantalla neutra marcaba el inicio del siguiente ensayo. El orden de presentación fue aleatorizado para todos los participantes. La duración total aproximada de la tarea fue de 30 minutos, consistente con protocolos aplicados en población adolescente autista (Solomon et al., 2021).

Para establecer la respuesta correcta, se definió como categoría objetivo la emoción expresada en la prosodia del estímulo. Este criterio se basó en evidencia experimental que indica que, en casos de conflicto entre canales, la prosodia suele guiar la interpretación afectiva (Lin et al., 2020; Pell et al., 2011). La tarea también permitió obtener indicadores conductuales asociados a la carga regulatoria. Siguiendo la literatura previa, la incongruencia prosódico-semántica se consideró un disparador de conflicto afectivo-lingüístico, cuya manifestación se infiere a partir de reducciones en la precisión o aumentos en la variabilidad de las respuestas frente a enunciados incongruentes (Chen et al., 2024; Kotz & Paulmann, 2011; Mitchell, 2006; Paulmann & Kotz, 2008; Pell et al., 2011).

Selección de los estímulos

Los estímulos auditivos utilizados en la tarea provienen del corpus UST–PUCV de prosodia emocional 2018–2019, previamente validado para estudios experimentales de procesamiento afectivo en el habla. El corpus incluye 1546 enunciados distribuidos en cuatro categorías emocionales: alegría, tristeza, enojo y neutralidad, seleccionadas en coherencia con propuestas que respaldan su reconocimiento consistente a nivel intercultural (Jack et al., 2014).

Para el presente estudio, se llevó a cabo una revisión lingüística con el fin de asegurar adecuación para adolescentes de 12 a 15 años. Se excluyeron enunciados que contenían vocabulario inapropiado o poco frecuente para esta población, manteniéndose únicamente aquellos con alta probabilidad de comprensión. Tras la depuración, se seleccionaron 15 estímulos por cada combinación prosódico-semántica, además de la categoría neutra, alcanzando un total de 196 estímulos (Tabla 2). Todos los archivos fueron etiquetados de acuerdo con la nomenclatura del corpus (por ejemplo: Alegre_Enojado_05), lo que permitió organizar de manera controlada las condiciones de congruencia e incongruencia.

Durante el proceso de verificación acústica se identificó una limitación técnica en la categoría de enojo: varios estímulos presentaban fallas de volumen o claridad articulatoria. Debido a que estas deficiencias comprometían la consistencia del material experimental, dichos enunciados fueron descartados, lo que explica las combinaciones vacías en la Tabla 3.

Tabla 3
Combinatoria de estímulos para la tarea de reconocimiento de emociones

Combinatoria de estímulos para la
tarea de reconocimiento de emociones

Nota. Los valores indican número de enunciados por combinación prosódico-semántica. Las celdas vacías de la categoría “Enojado” corresponden a estímulos excluidos por problemas técnicos en la grabación de la prosodia emocional de enojo.


En conjunto, la validación previa del corpus, los criterios lingüísticos empleados en la selección y la distribución equilibrada de estímulos aseguran la calidad del conjunto final utilizado en la tarea experimental.

Resultados

A continuación, se presentan los resultados obtenidos a partir de las medidas de precisión y tiempo de respuesta en la tarea de reconocimiento emocional. Los análisis se organizaron en función de los objetivos planteados, considerando las diferencias entre condiciones de congruencia prosodia-semántica y los efectos del grupo (TEA vs. control). Se aplicaron pruebas no paramétricas debido a la naturaleza de la distribución de los datos y se reportan tanto los efectos significativos como los no significativos.

Reconocimiento de emociones

Los resultados globales se presentan en la Figura 1. La precisión global fue de 56.53 % (SE = 3.78) en el grupo autista y de 54.03 % (SE = 4.84) en el grupo control. La comparación mediante la prueba U de Mann–Whitney no mostró diferencias significativas entre los grupos (U = 39.5, p = 0.45). El tamaño de efecto estimado mediante r = Z/√N fue pequeño (r = 0.17), con intervalos de confianza amplios que incluyen el cero.

Rendimiento global en la tarea de
reconocimiento de emociones en el habla. Panel A: porcentaje de aciertos; Panel
B: tiempo de respuesta en milisegundos.
Figura 1.
Rendimiento global en la tarea de reconocimiento de emociones en el habla. Panel A: porcentaje de aciertos; Panel B: tiempo de respuesta en milisegundos.

Nota. Las barras de error representan ±1 SE. n = 10 por grupo ns = diferencias no significativas (p > 0.05).



Los tiempos de respuesta fueron de M = 3.845 ms (SE = 293) en el grupo autista y de M = 3.698 ms (SE = 396) en el grupo control. La prueba de Mann–Whitney no mostró diferencias significativas en ninguna condición (congruente: U = 64, p = 0.306, r = 0.23; incongruente: U = 40.50, p = 0.496, r = 0.15).

Comparación entre grupo TEA y control

Los resultados se presentan en la Figura 2. En la condición prosodia–semántica congruente, el grupo autista obtuvo un porcentaje de aciertos promedio de 80.17 % (SE = 4.12), mientras que el grupo control alcanzó 85.67 % (SE = 4.35). En la condición incongruente, los porcentajes de acierto fueron 46.10 % (SE = 6.22) para el grupo autista y 40.07 % (SE = 7.30) para el grupo control. La prueba de Mann–Whitney no mostró diferencias significativas en ninguno de los dos casos (congruente: U = 64, p = 0.306; incongruente: U= 40.50, p = 0.496). Los tamaños de efecto fueron pequeños (r = 0.23 y r = 0.15), con intervalos de confianza amplios que incluyen el cero.

Rendimiento por condición en tarea de reconocimiento de
emociones en el habla. El panel A y B muestran el porcentaje de aciertos en las
condiciones congruencia e incongruencia semántica-prosódica en ambos grupos
respectivamente. El panel C y D muestran el tiempo de respuesta (en
milisegundos) en las condiciones congruencia e incongruencia
semántica-prosódica en ambos grupos respectivamente.
Figura 2.
Rendimiento por condición en tarea de reconocimiento de emociones en el habla. El panel A y B muestran el porcentaje de aciertos en las condiciones congruencia e incongruencia semántica-prosódica en ambos grupos respectivamente. El panel C y D muestran el tiempo de respuesta (en milisegundos) en las condiciones congruencia e incongruencia semántica-prosódica en ambos grupos respectivamente.

Nota. ** = p < 0.01; ns = diferencias no significativas (p > 0.05).



En cuanto a los tiempos de respuesta, el grupo autista obtuvo un promedio de 3817.27 ms (SE = 268.97) en la condición congruente, mientras que el grupo control obtuvo 3561.81 ms (SE = 311.87). En la condición incongruente, los promedios fueron 3857.91 ms (SE = 311.57) y 3758.92 ms (SE = 439.10), respectivamente. La prueba U de Mann–Whitney tampoco mostró diferencias en los tiempos de respuesta (congruente: U = 37.50, p = 0.364, r = 0.20; incongruente: U = 44.50, p = 0.705, r = 0.09).

Comparación entre congruencia e incongruencia por grupo

Los resultados se presentan en la Figura 3. En el grupo TEA, la precisión fue significativamente mayor en la condición congruente que en la incongruente (W = 51, p = 0.01, r = 0.74). Un resultado similar se observó en el grupo control, donde la diferencia también fue significativa (W = 55, p = 0.004, r = 0.91).

Rendimiento entre condiciones en
cada grupo. El panel A y B muestran el porcentaje de aciertos en las
condiciones congruencia e incongruencia semántica-prosódica para el grupo TEA y
Control respectivamente. El panel C y D muestran el tiempo de respuesta (en
milisegundos) en las condiciones congruencia e incongruencia
semántica-prosódica para el grupo TEA y Control respectivamente.
Figura 3.
Rendimiento entre condiciones en cada grupo. El panel A y B muestran el porcentaje de aciertos en las condiciones congruencia e incongruencia semántica-prosódica para el grupo TEA y Control respectivamente. El panel C y D muestran el tiempo de respuesta (en milisegundos) en las condiciones congruencia e incongruencia semántica-prosódica para el grupo TEA y Control respectivamente.

Nota. ** = p < 0.01; ns = diferencias no significativas (p > 0.05).



En cuanto a los tiempos de reacción, no se observaron diferencias significativas entre condiciones en ninguno de los grupos (TEA: W = 30, p = 0.77, r = 0.09; control: W = 35, p = 0.43, r = 0.25).

Análisis por pares incongruentes

Los resultados se muestran en la Figura 4. El análisis por combinaciones específicas en la condición de incongruencia prosódico-semántica reveló que la combinación semántica alegre / prosodia neutra presentó una diferencia significativa entre grupos. El grupo TEA obtuvo un porcentaje de aciertos de 52.60 % (SE = 8.57), mientras que el grupo control alcanzó 29.30 % (SE = 7.00). La prueba U de Mann–Whitney confirmó esta diferencia (U = 23.00, p = 0.04, r = 0.46).

Rendimiento ante combinación semántica alegre/prosodia
neutra. (A) Porcentaje de aciertos en ambos grupos. (B) Tiempo de respuesta (en
milisegundos) en ambos grupos. Las barras de error representan el error
estándar de la media.
Figura 4.
Rendimiento ante combinación semántica alegre/prosodia neutra. (A) Porcentaje de aciertos en ambos grupos. (B) Tiempo de respuesta (en milisegundos) en ambos grupos. Las barras de error representan el error estándar de la media.

Nota. * = p < 0.05; ns = diferencias no significativas (p > 0.05).



En contraste, en las demás combinaciones de pares incongruentes no se observaron diferencias significativas en precisión (todos los p > 0.316) ni en tiempos de respuesta (todos los p > 0.273), con tamaños de efecto pequeños.

Discusión

Los resultados del presente estudio indican que adolescentes autistas de nivel 1 y sus pares neurotípicos mostraron un rendimiento comparable en el reconocimiento de emociones en el habla, tanto de manera global como en condiciones congruentes e incongruentes. Las diferencias entre grupos fueron pequeñas y no alcanzaron significación estadística, lo que sugiere que, bajo este paradigma, ambos grupos podrían emplear estrategias similares para procesar claves emocionales auditivas. En esta línea, este patrón converge con investigaciones que reportan un desempeño comparable en tareas de reconocimiento emocional cuando los participantes autistas presentan un adecuado funcionamiento adaptativo y se desenvuelven en contextos comunicativos estructurados y estables (Atherton et al., 2022; Grossman et al., 2010).

En este estudio, la carga regulatoria asociada a la integración de señales emocionales se evaluó de manera indirecta a partir del desempeño comportamental ante estímulos incongruentes, siguiendo las propuestas de Mazefsky y White (2014) y Mitchell (2006). Aunque no se aplicaron medidas clínicas directas de desregulación emocional, la literatura vincula las señales afectivas contradictorias con un aumento de las demandas reguladoras, manifestado en descensos de precisión o estabilidad de la respuesta (Kotz & Paulmann, 2011; Paulmann & Kotz, 2008). En este caso, la incongruencia prosodia–semántica generó un efecto de interferencia en ambos grupos, pero este incremento en la carga regulatoria no diferenció significativamente el rendimiento de los adolescentes autistas y neurotípicos. Este resultado se alinea con evidencia que sugiere que la participación prolongada en entornos educativos inclusivos puede favorecer el desarrollo de estrategias adaptativas de interpretación emocional, especialmente en jóvenes sin dificultades lingüísticas asociadas (Atherton et al., 2022).

La variabilidad clínica naturalista del grupo autista —incluida la presencia de ansiedad y el uso de medicación estable en algunos participantes— tampoco se asoció a diferencias sistemáticas en el rendimiento. Esta heterogeneidad refleja las características habituales de los perfiles autistas de nivel 1 escolarizados en programas regulares y aporta valor ecológico al estudio. No obstante, es importante reconocer que estos resultados podrían no generalizar a poblaciones que requieren mayores niveles de apoyo o que presentan perfiles clínicos más complejos. Por último, aunque la exclusión técnica de los estímulos con prosodia de enojo redujo la completitud emocional del set, el patrón de ausencia de diferencias entre grupos en las restantes categorías sugiere que los resultados no dependen de una emoción particular. Más bien, apuntan a la forma en que ambos grupos abordan la inconsistencia prosodia–semántica del estímulo auditivo.

En torno a la combinación incongruente semántica alegre / prosodia neutra, fue la única que mostró diferencias significativas entre grupos, con un mayor porcentaje de aciertos en adolescentes autistas. Aunque el tamaño del efecto fue moderado, este patrón es coherente con investigaciones que indican que, cuando la prosodia carece de marcadores acústicos distintivos, el canal semántico puede adquirir un rol dominante en la integración afectiva del mensaje (Lin et al., 2020; Pell et al., 2011). En este sentido, la neutralidad prosódica podría haber reducido la saliencia emocional del canal paralingüístico, favoreciendo que el contenido semántico guiara la categorización emocional de manera más consistente en parte del grupo autista.

Este patrón específico —un mejor desempeño del grupo autista cuando la prosodia era neutra y la semántica expresaba alegría— sugiere que, en ausencia de señales prosódicas distintivas, el procesamiento emocional podría estar guiado por recursos alternativos. Desde una perspectiva contextual, los modelos centrados en la experiencia comunicativa cotidiana destacan el papel del entorno social en la modulación del procesamiento emocional (Schirmer & Kotz, 2006). Los adolescentes autistas incluidos en este estudio participan regularmente en interacciones verbales dentro de entornos educativos inclusivos, lo que podría favorecer estrategias basadas en claves semánticas cuando la prosodia no aporta información discriminativa. Este enfoque compensatorio, caracterizado por el uso preferencial de señales explícitas y estables del lenguaje (Lartseva et al., 2015; Paulmann et al., 2013), podría contribuir a explicar el patrón observado.

Sin embargo, la especificidad de este efecto y su ausencia en las demás combinaciones incongruentes indican que no constituye un patrón generalizado. Es posible que las prosodias neutras generen un conflicto afectivo–lingüístico menos robusto, reduciendo la sensibilidad para detectar diferencias sistemáticas entre grupos. Futuros estudios deberían examinar esta combinación utilizando estímulos con mayor variabilidad prosódica, modalidades multimodales o diseños longitudinales que permitan evaluar la estabilidad temporal de este hallazgo.

Conclusión y proyecciones

Los hallazgos de este estudio evidencian que adolescentes autistas de nivel 1, escolarizados en contextos inclusivos, presentan un desempeño global comparable al de sus pares neurotípicos en el reconocimiento emocional del habla. Tanto en condiciones congruentes como incongruentes, las diferencias entre grupos fueron pequeñas y no significativas, lo que sugiere que, dentro de entornos educativos regulares y estructurados, las habilidades de identificación emocional auditiva pueden mantenerse preservadas en esta población. Este resultado dialoga con investigaciones que cuestionan la idea de un déficit generalizado en el reconocimiento emocional en el autismo, proponiendo en cambio modelos más matizados en los que las dificultades se vinculan a variaciones en la regulación emocional frente a señales contradictorias o ambiguas (Mazefsky & White, 2014; Mazefsky et al., 2013; Mitchell, 2006).

En coherencia con esta perspectiva, la incongruencia prosodia–semántica utilizada en este paradigma permitió aproximarse indirectamente a las demandas regulatorias de la tarea. En ambos grupos, este conflicto generó un descenso significativo en la precisión, aunque sin afectar los tiempos de respuesta. El hecho de que esta interferencia afecte de manera similar a adolescentes autistas y neurotípicos sugiere que, cuando las condiciones de estimulación son claras y cuando los participantes cuentan con experiencias comunicativas continuas en entornos escolarizados, la interpretación del discurso afectivo puede apoyarse en estrategias adaptativas que facilitan la integración emocional. En el caso del grupo autista, esta posibilidad cobra relevancia considerando que todos los participantes estaban escolarizados en aulas regulares, recibían apoyo a través del PIE y no presentaban dificultades lingüísticas asociadas. La literatura ha señalado que la escolarización inclusiva favorece la exposición diaria a intercambios verbales y emocionales diversificados, lo que contribuye al desarrollo de competencias sociales y lingüísticas que pueden amortiguar diferencias típicamente observadas en contextos experimentales más restrictivos (Atherton et al., 2022; Schirmer & Kotz, 2006).

Un hallazgo particularmente interesante fue la diferencia significativa observada en la combinación incongruente semántica alegre / prosodia neutra, donde el grupo autista obtuvo un porcentaje de acierto mayor. Este patrón, aunque específico y de efecto moderado, coincide con estudios que documentan una tendencia en parte de la población autista a basarse preferentemente en claves lingüísticas explícitas cuando la información prosódica es ambigua o poco saliente (Lartseva et al., 2015; Lin et al., 2020; Pell et al., 2011). La prosodia neutra, al carecer de marcadores acústicos distintivos, reduce su peso informativo en la interpretación afectiva; bajo estas condiciones, el canal semántico puede adquirir un rol dominante. En contextos educativos inclusivos, donde la instrucción docente suele enfatizar la claridad verbal y la explicitación del contenido, esta preferencia por claves semánticas podría verse fortalecida y traducirse en un desempeño más consistente ante señales afectivamente ambivalentes.

En términos metodológicos, este estudio aporta un paradigma replicable que combina estimulación auditiva controlada, alto número de ensayos por participante y un enfoque de análisis adecuado para muestras pequeñas pero densas en observaciones. Esta aproximación permitió observar con precisión los efectos intra-sujeto asociados a la incongruencia, los cuales fueron robustos incluso en ausencia de diferencias entre grupos. No obstante, el trabajo presenta limitaciones que deben considerarse. La muestra reducida y no probabilística restringe la generalización de los resultados a poblaciones con perfiles clínicos más complejos o con niveles de apoyo superiores. Asimismo, la desregulación emocional fue inferida de manera indirecta a partir del desempeño comportamental, por lo que futuras investigaciones deberían incorporar medidas psicométricas o fisiológicas que permitan capturar con mayor profundidad las variaciones individuales en regulación afectiva. También debe mencionarse la exclusión técnica de los estímulos asociados a la emoción “enojo”, cuya presencia habría permitido un análisis emocional más completo dado su rol central en la literatura sobre procesamiento afectivo (Barrett, 2017; Scherer & Moors, 2019).

Pese a estas limitaciones, los resultados ofrecen implicancias relevantes para el ámbito educativo. El hecho de que adolescentes autistas logren un reconocimiento emocional efectivo en contextos estructurados sugiere que es posible diseñar prácticas pedagógicas que integren la emocionalidad de manera explícita y accesible. La prosodia docente, la clarificación verbal de estados emocionales y la organización clara del discurso emergen como herramientas potenciales para favorecer la participación y comprensión emocional de estudiantes neurodivergentes. Desde esta perspectiva, avanzar hacia políticas educativas que reconozcan la diversidad en el procesamiento lingüístico-emocional y promuevan la accesibilidad comunicativa constituye un paso significativo hacia una educación realmente inclusiva.

Declaraciones éticas

Este estudio fue aprobado por el Comité de Ética de la Pontificia Universidad Católica de Valparaíso mediante resolución N.º BIOEPUCV-H 934-2025, cumpliendo con los lineamientos establecidos en la Declaración de Helsinki (World Medical Association, 2013) y con las normativas nacionales e internacionales vigentes para la investigación con seres humanos.

Dado que los participantes eran adolescentes menores de edad, se aplicó un protocolo de consentimiento informado en dos fases: en primer lugar, se obtuvo el consentimiento escrito por parte de los tutores legales; posteriormente, se solicitó el asentimiento voluntario de cada participante, con una explicación clara y accesible sobre los objetivos del estudio, su carácter voluntario y las condiciones de confidencialidad. Se garantizó en todo momento el anonimato de los datos, el resguardo de la información sensible y el derecho a desistir de la participación sin consecuencia alguna. No se aplicaron intervenciones clínicas ni se expuso a los participantes a riesgos físicos o psicológicos.

COI/Financiamiento

Este trabajo fue apoyado por la Agencia Nacional de Investigación y Desarrollo ANID, Doctorado Nacional N°7226/2022 y MILENIO ICS2019_024.

Referencias

American Psychiatric Association, DSM-5 Task Force. (2013). Diagnostic and statistical manual of mental disorders: DSM-5™ (5th ed.). American Psychiatric Publishing. https://doi.org/10.1176/appi.books.9780890425596

Anwyl-Irvine, A. L., Massonnié, J., Flitton, A., Kirkham, N., & Evershed, J. K. (2020). Gorilla in our midst: An online behavioral experiment builder. Behavior Research Methods, 52(1), 388–407. https://doi.org/10.3758/s13428-019-01237-x

Atherton, G., Edisbury, E., Piovesan, A., & Cross, L. (2022). Autism through the ages: A mixed methods approach to understanding how age and age of diagnosis affect quality of life. Journal of Autism and Developmental Disorders, 52(8), 3639–3654. https://doi.org/10.1007/s10803-021-05235-x

Ávila-Rincón, C., Benitez-Murillo, J., & Rodríguez-Portillo, S. (2024). Estructura interna y validez del Reading the Mind in the Eyes Test versión niños en una muestra colombiana de estudiantes de secundaria. Revista Colombiana de Psiquiatría, 53(3), 229–237. https://doi.org/10.1016/j.rcp.2022.07.002

Barrett, L. F. (2017). The theory of constructed emotion: An active inference account of interoception and categorization. Social Cognitive and Affective Neuroscience, 12(1), 1–23. https://doi.org/10.1093/scan/nsw154

Chen, Q. -X., Chen, Q., Zhai, K., Chen, H.-T., Wu, Y.-L., Liu, J.-M., & Jin, Y. (2024). Inefficient and unique processing of social–emotional interference in school-aged children with high-functioning autism spectrum disorder. Frontiers in Psychiatry, 15, 1412533. https://doi.org/10.3389/fpsyt.2024.1412533

Faul, F., Erdfelder, E., Lang, A.-G., & Buchner, A. (2007). GPower 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods, 39(2), 175–191. https://doi.org/10.3758/BF03193146

Grossman, R. B., Bemis, R. H., Skwerer, D. P., & Tager-Flusberg, H. (2010). Lexical and affective prosody in children with high-functioning autism. Journal of Speech, Language, and Hearing Research, 53(3), 778–793. https://doi.org/10.1044/1092-4388(2009/08-0127)

Jack, R. E., Garrod, O. G. B., & Schyns, P. G. (2014). Dynamic facial expressions of emotion transmit an evolving hierarchy of signals over time. Current Biology, 24(2), 187–192. https://doi.org/10.1016/j.cub.2013.11.064

Kotz, S. A., & Paulmann, S. (2007). When emotional prosody and semantics dance cheek to cheek: ERP evidence. Brain Research, 1151(1), 107–118. https://doi.org/10.1016/j.brainres.2007.03.015

Labbé-Atenas, T., Ciampi-Díaz, E., Venegas-Bustos, J., Uribe San-Martín, R. U., & Cárcamo-Rodríguez, C. (2019). Cognición social: Conceptos y bases neurales. Revista Chilena de Neuro-Psiquiatría, 57(4), 365–376. https://doi.org/10.4067/S0717-92272019000400365

Lartseva, A., Dijkstra, T., & Buitelaar, J. K. (2015). Emotional language processing in autism spectrum disorders: A systematic review. Frontiers in Human Neuroscience, 8, 991. https://doi.org/10.3389/fnhum.2014.00991

Lin, Y., Ding, H., & Zhang, Y. (2020). Prosody dominates over semantics in emotion word processing: Evidence from cross-channel and cross-modal Stroop effects. Journal of Speech, Language, and Hearing Research, 63(3), 896–912. https://doi.org/10.1044/2020_JSLHR-19-00258

Liu, P., Rigoulot, S., Jiang, X., Zhang, S., & Pell, M. D. (2021). Unattended emotional prosody affects visual processing of facial expressions in Mandarin-speaking Chinese: A comparison with English-speaking Canadians. Journal of Cross-Cultural Psychology, 52(3), 275–294. https://doi.org/10.1177/0022022121990897

Mazefsky, C. A., Herrington, J., Siegel, M., Scarpa, A., Maddox, B. B., Scahill, L., & White, S. W. (2013). The role of emotion regulation in autism spectrum disorder. Journal of the American Academy of Child & Adolescent Psychiatry, 52(7), 679–688. https://doi.org/10.1016/j.jaac.2013.05.006

Mazefsky, C. A., & White, S. W. (2014). Emotion regulation: Concepts & practice in autism spectrum disorder. Child and Adolescent Psychiatric Clinics of North America, 23(1), 15–24. https://doi.org/10.1016/j.chc.2013.07.002

McCann, J., & Peppé, S. (2003). Prosody in autism spectrum disorders: A critical review. International Journal of Language & Communication Disorders, 38(4), 325–350. https://doi.org/10.1080/1368282031000154204

Mitchell, R. L. C. (2006). How does the brain mediate interpretation of incongruent auditory emotions? The neural response to prosody in the presence of conflicting lexico-semantic cues. European Journal of Neuroscience, 24(12), 3611–3618. https://doi.org/10.1111/j.1460-9568.2006.05231.x

Paulmann, S., & Kotz, S. A. (2008). Early emotional prosody perception based on different speaker voices. NeuroReport, 19(2), 209–213. DOI: 10.1097/WNR.0b013e3282f454db

Paulmann, S. & Pell, M. D. (2010). Contextual influences of emotional speech prosody on face processing: How much is enough?. Cognitive, Affective, & Behavioral Neuroscience 10(2), 230–242. https://doi.org/10.3758/CABN.10.2.230

Paulmann, S., Bleichner, M., & Kotz, S. A. (2013). Valence, arousal, and task effects in emotional prosody processing. Frontiers in Psychology, 4, 345. https://doi.org/10.3389/fpsyg.2013.00345

Pell, M. D., Jaywant, A., Monetta, L., & Kotz, S. A. (2011). Emotional speech processing: Disentangling the effects of prosody and semantic cues. Cognition and Emotion, 25(5), 834–853. https://doi.org/10.1080/02699931.2010.516915

Pronina, M., Hübscher, I., Vilà-Giménez, I., & Prieto, P. (2021). Bridging the gap between prosody and pragmatics: The acquisition of pragmatic prosody in the preschool years and its relation with Theory of Mind. Frontiers in Psychology, 12, 662124. https://doi.org/10.3389/fpsyg.2021.662124

Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Houghton Mifflin.

Scherer, K. R., & Moors, A. (2019). The emotion process: Event appraisal and component differentiation. Annual Review of Psychology, 70, 719–745. https://doi.org/10.1146/annurev-psych-122216-011854

Schirmer, A., & Kotz, S. A. (2006). Beyond the right hemisphere: Brain mechanisms mediating vocal emotional processing. Trends in Cognitive Sciences, 10(1), 24–30. DOI: 10.1016/j.tics.2005.11.009

Solomon, M., Gordon, A., Iosif, A.-M., Geddert, R., Krug, M. K., Mundy, P., & Hessl, D. (2021). Using the NIH Toolbox to assess cognition in adolescents and young adults with autism spectrum disorders. Autism Research, 14(3), 500–511. https://doi.org/10.1002/aur.2399

World Medical Association. (2013). World Medical Association Declaration of Helsinki: Ethical principles for medical research involving human subjects. JAMA, 310(20), 2191–2194. https://doi.org/10.1001/jama.2013.281053

Zhang, M., Xu, S., Chen, Y., Lin, Y., Ding, H., & Zhang, Y. (2021). Recognition of affective prosody in autism spectrum conditions: A systematic review and meta-analysis. Autism, 26(4), 798–813. https://doi.org/10.1177/1362361321995725

Zuluaga-Arroyave, T., Zuluaga, J. B., & Cuartas, J. (2022). Cognición social y funcionamiento ejecutivo en los trastornos del espectro autista: ¿Qué hace la diferencia? Interdisciplinaria, 39(2), 181–198. https://doi.org/10.16888/interd.2022.39.2.12

Notas

* Artículo de investigación

Notas de autor

a Autor de correspondencia. Correo electrónico: vannia.olivares.m@mail.pucv.cl

Información adicional

Para citar este artículo: Olivares-Morales, V. (2025). Reconocimiento de emociones en el habla en adolescentes autistas: efectos de la incongruencia prosodia–semántica en contextos escolares inclusivos. Universitas Psychologica, 24, 1–14. https://doi.org/10.11144/Javeriana.upsy24.reha

Contexto
Descargar
Todas