Soutenance de thèse de Virginia AGLIERI

Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Neurosciences
établissement
Aix-Marseille Université
Mots Clés
iRMF,perception de la voix,différences individuelles,reconnaissance de la personne,
Keywords
fMRI,voice perception,individual differences,person recognition,
Titre de thèse
Variabilité comportementale et neuronale interindividuelle dans les processus de perception de la voix
Behavioral and neural inter-individual variability in voice perception processes
Date
Mercredi 18 Avril 2018 à 14:00
Adresse
27 Boulevard Jean Moulin
Salle de thèse 2
Jury
Directeur de these Pascal BELIN Aix-Marseille Université
Rapporteur Milene BONTE Maastricht University
Rapporteur Narly GOLESTANI Université de Genève
Examinateur Daniele SCHON Aix-Marseille Université

Résumé de la thèse

Chez l'homme, la voix facilite les interactions sociales par la transmission d’informations sur l'identité de la personne, ses émotions ou sa personnalité. En particulier, l'identité du locuteur peut être automatiquement extraite même lorsque le message et l'état émotionnel varient, ce qui suggère des mécanismes cognitifs et cérébraux partiellement dissociables pour ces processus. Cependant, la reconnaissance d'une voix familière ou la discrimination entre deux locuteurs sont, pour certains sujets, non seulement non-automatiques, mais même impossibles. Ce déficit, lorsqu'il se manifeste dès la naissance, est appelé phonagnosie du développement et constitue la contrepartie auditive de la prosopagnosie (déficit de reconnaissance des visages). Dans le domaine visuel, il a été proposé que les sujets affectés par la prosopagnosie du développement représentent des cas extrêmes dans la distribution des capacités de reconnaissance de visages. A l’inverse, des "super-reconnaisseurs" des visages se situaient à l’opposé de cette distribution. Comme la distribution des capacités de reconnaissance de la voix dans la population générale était encore inconnue, le premier objectif de cette thèse a été d'en étudier les différences individuelles au moyen d'un court test - le Glasgow Voice Memory Test (GVMT). Les résultats obtenus ont reflété une large variabilité interindividuelle dans les capacités de reconnaissance des voix: parmi une cohorte de 1120 sujets, il y avait à la fois des sujets avec des performances significativement en dessus de la moyenne (potentiels phonagnosiques) et des "super-reconnaisseurs" des voix. Cette variabilité individuelle comportementale semblerait se refléter au niveau cérébral, comme révélés par l'imagerie par résonance magnétique fonctionnelle (IRMf) : en fait, il a été montré précédemment qu'il existait une variabilité interindividuelle considérable dans le signal BOLD (blood-oxygen level dependent) lié à la voix dans les zones temporales de la voix (TVAs). Ces régions sont situées sur le bord supérieur des sulcus/gyrus temporal supérieur (STS/STG) et montrent une activation préférentielle pour les sons vocaux plutôt que non vocaux. Le deuxième objectif de ce travail fut de mieux caractériser le lien entre les mécanismes comportementaux et neuronaux sous-tendant la variabilité interindividuelle dans les processus de reconnaissance des voix. Pour cela, nous avons examiné comment la perception de la voix modulait la connectivité fonctionnelle entre les TVAs, constituant le "noyau" du réseau de perception de la voix, et les régions frontales également sensibles aux voix, constituant une extension de ce réseau.. Les résultats ont montré qu'il y avait une connectivité fonctionnelle positive dans l'ensemble du réseau et que la connectivité fonctionnelle fronto-temporelle et fronto-frontale droite augmentait avec les scores obtenus lors du GVMT. Pour compléter ce travail, nous avons réalisé une autre étude IRMf en utilisant des analyses multivariées, afin de clarifier les corrélats neuronaux de la reconnaissance du locuteur mais aussi le lien entre sensibilité cérébrale à la voix et capacités de reconnaissance du locuteur. Pour cela, des sujets ayant des capacités de reconnaissance vocale hétérogènes ont été soumis à la fois à une tâche d'identification du locuteur et à une tâche d'écoute passive de sons vocaux et non vocaux. Les résultats ont confirmé que l’identification du locuteur s’effectuait via un réseau étendu de régions, incluant les TVAs mais aussi des régions frontales. De plus, nous avons observé que le score de classification voix/non-voix dans le STS droit permettait de prédire les capacités d'identification des locuteurs. Dans l'ensemble, ces résultats suggèrent que les capacités de reconnaissance vocale varient considérablement d'un individu à l'autre et que cette variabilité pourrait être le reflet de profils d’activité cérébrale différents au sein du réseau de la perception de la voix.

Thesis resume

In humans, voice facilitates social interactions by conveying information about the person's identity, his/her emotions and personality. In particular, speaker’s identity can be automatically extracted even when language content and emotional state vary, highlighting partly dissociable cognitive and cerebral mechanisms underlying these processes. However, recognizing a familiar voice or discriminating between two different speakers, are, for some subjects, not only non-automatic but even impossible; such impairment, when present from birth, is referred to as developmental phonagnosia and it constitutes the auditory counterpart of prosopagnosia (deficit in recognizing faces). In the field of face perception, it has been proposed that subjects affected by developmental prosopagnosia can be viewed as extreme cases in the broad distribution of face recognition abilities. On the opposite side of the distribution, faces “super-recognizers” can be observed. Since the distribution of voice recognition abilities in the general population was still unknown, the first aim of this thesis was to investigate individual differences in voice recognition abilities by means of a short voice recognition test – the Glasgow Voice Memory Test (GVMT). The results obtained at this test reflected a considerable inter-individual variability in voice recognition abilities: among a cohort of 1120 subjects, there were both subjects with extremely poor performance (potential phonagnosics) as well as voice “super-recognizers”. Furthermore, a subject previously declared as affected by developmental phonagnosia performed significantly below average for voice recognition while receiving an average score for environmental sounds recognition, validating the GVMT as a preliminary assessment of voice recognition abilities. Individual differences in voice recognition abilities could have their cerebral correlates, as revealed by functional magnetic resonance imaging (fMRI): in fact, it has been previously observed that there exists a considerable inter-individual variability in voice-elicited blood-oxygen-level dependent activity in temporal voice areas (TVAs), regions in the upper bank of the superior temporal sulcus/gyrus (STS/STG) that show preferentially activation for vocal than non-vocal sounds. The second aim of this work was then to better characterize the link between the behavioral and neural mechanisms underlying inter-individual variability in voice recognition processes. In doing so, we looked at how voice perception modulates functional connectivity between TVAs located along the STS, constituting the “core” of the voice perception network, and frontal regions that also showed sensitivity to vocal stimuli and considered to belong to the extended portion of the voice perception network. The results showed that there was positive functional connectivity within the whole network and that right fronto-temporal and fronto-frontal functional connectivity increased with voice recognition scores obtained at the voice recognition test previously validated. To complete this work, another fMRI study was carried out; here, multivariate analyses were employed to better clarify the cerebral correlates of speaker recognition as well as the link between cerebral voice sensitivity and speaker recognition abilities. In doing so, subjects with heterogeneous voice recognition abilities underwent both a speaker identification task and a task requiring passive listening of vocal and non-vocal sounds. The results confirmed that speaker classification was done in an extended network of regions, including TVAs but also frontal regions.Moreover, we observed that voice/non-voice classification accuracy in right STS could predict speaker identification abilities. All together, these results suggest that voice recognition abilities considerably vary across subjects and that this variability can be mirrored by different neural profiles within the voice perception network.