Exploiter ou explorer ? Les circuits neuronaux de l’apprentissage en milieu incertain
- Authors
- Publication Date
- Sep 22, 2023
- Source
- HAL-Descartes
- Keywords
- Language
- French
- License
- Unknown
- External links
Abstract
La capacité à prendre une décision adaptée dans un environnement incertain mobilise plusieurs processus cognitifs essentiels dont la capacité à constamment arbitrer entre l’exploitation de ses connaissances, par le choix d’options familières permettant d’assurer un gain et l’exploration de nouvelles alternatives qui pourraient être plus favorables. Mon travail de recherche s’est concentré sur le développement d’une épreuve comportementale originale chez le rat qui permet d’étudier ce trait saillant de la cognition humaine et qui s’inspire largement d’épreuves réalisées chez l’humain. Lors de cette épreuve de bandit à trois bras, plusieurs options sont disponibles et sont associées à des conséquences plus ou moins bénéfiques. L’option la plus favorable est variable au cours du temps, ce qui contraint les animaux à alterner entre exploitation et exploration de l’environnement. Nous avons utilisé ce paradigme pour clarifier les interactions fonctionnelles dans un circuit thalamocortical constitué par les projections entre le cortex orbitofrontal (OFC) et le thalamus médiodorsal (MD). En effet, les interactions thalamocorticales apparaissent comme critiques pour de nombreux processus intégratifs qui concernent aussi bien la perception des stimuli environnementaux que les fonctions cognitives et cet élément de réflexion a fait l’objet d’un article de synthèse. Dans un premier temps, après apprentissage initial de l’épreuve, nous avons réalisé des lésions excitotoxiques de l’OFC et du MD et observé que la lésion de l’une ou l’autre de ces structures altère spécifiquement la performance des animaux durant la phase exploratoire. Nous avons ensuite employé une stratégie de déconnexion fonctionnelle basée sur une approche pharmacogénétique innovante qui repose sur de nouveaux outils viraux pour inhiber transitoirement et spécifiquement les neurones de l’OFC qui font l’objet d’une connexion directe avec le MD. Cette manipulation sélective produit également un déficit dans l’épreuve de bandit à trois bras. De ce fait, ces observations démontrent l’implication du circuit thalamocortical reliant l’OFC et le MD au sein du dilemme exploitation-exploration et suggèrent un rôle complémentaire de ces deux régions. Pour mieux appréhender leur rôle respectif, nous avons cherché à comprendre la dynamique d’activation de ce circuit thalamocortical lorsque le rat doit concilier des phases d’exploitation et d’exploration au cours d’une séance d’apprentissage. Pour ce faire, nous avons utilisé une technique d’imagerie calcique chez l’animal se comportant pour collecter l’activité de populations de neurones simultanément dans l’OFC et dans le MD. Les premiers résultats indiquent une activité de population neuronale différente dans l’OFC et dans le MD, démontrant la complémentarité des régions corticales et thalamiques dans les processus cognitifs de haut niveau. L’activité dans l’OFC semble corrélée avec le futur choix que va faire l’animal et signale lorsque ce choix est récompensé. A l’inverse, l’activité dans le MD semble signaler de façon différée lorsque ce choix n’a pas été récompensé. En conclusion, l’ensemble de ce travail indique que le circuit OFC-MD jour un rôle essentiel dans la prise de décision en milieu incertain. De façon remarquable, ces données obtenues chez le rongeur sont semblables à des travaux antérieurs menés chez le primate humain et non-humain, ce qui en souligne la valeur translationnelle. Comprendre les bases neurales de la prise de décision adaptative représente un enjeu majeur pour les neurosciences contemporaines et le rôle de la connectivité fonctionnelle thalamocorticale semble important pour mieux appréhender un grand nombre de pathologies mentales.