Les fluctuations de la dopamine dans des sous-régions distinctes du cerveau prédisent des récompenses sur diverses échelles de temps

Les fluctuations de la dopamine dans des sous-régions distinctes du cerveau prédisent des récompenses sur diverses échelles de temps

Accueil » Psychologie » Troubles mentaux » Adulte » Les fluctuations de la dopamine dans des sous-régions distinctes du cerveau prédisent des récompenses sur diverses échelles de temps

Des études antérieures en neurosciences suggèrent que les augmentations transitoires de la dopamine cérébrale sont des signaux essentiels pour en savoir plus sur la récompense et la motivation pour obtenir davantage de récompenses. Des chercheurs de l'Université de Californie à San Francisco ont mené une étude explorant les augmentations transitoires de la dopamine dans des sous-régions spécifiques du striatum, une partie du cerveau connue pour soutenir l'apprentissage et la prise de décision basés sur la récompense.

Leurs conclusions, publiées dans Neurosciences naturellessuggèrent que les fluctuations transitoires de la dopamine dans trois parties différentes du striatum reflètent les prédictions de récompense sur différents horizons temporels (c'est-à-dire respectivement une fraction de seconde, des dizaines de secondes et des centaines de secondes plus tard).

“Une impulsion de dopamine peut indiquer que nous nous sommes retrouvés dans une meilleure situation que celle à laquelle nous nous attendions, et nos estimations antérieures de récompense doivent donc être mises à jour”, a déclaré Josh Berke, auteur principal de l'article, à Medical Xpress. “Cette théorie de 'l'erreur de prédiction de récompense' a été très influente, en partie parce qu'elle relie les modèles d'activité cérébrale à certains calculs dans l'apprentissage automatique, mais plusieurs aspects de cette théorie sont, au mieux, incomplets.”

L'étude récente de Berke et de ses collaborateurs visait à aborder deux aspects problématiques de cette théorie de « l'erreur de prédiction des récompenses ». Le premier d'entre eux est la définition peu claire du terme « prédiction de récompense », qui ne précise pas quand une récompense est attendue (par exemple, dans un délai d'une seconde, d'une minute, d'une heure, etc.).

“Un deuxième problème est que l'on pensait à l'origine que les signaux de dopamine étaient diffusés uniformément dans tout le cerveau antérieur, mais des études plus récentes ont découvert différents signaux de dopamine à différents endroits du cerveau”, a déclaré Berke. “Alors, cela indique-t-il que nous avons besoin de nombreuses théories différentes pour expliquer ces différents signaux dopaminergiques ?”

Pour faire la lumière sur les aspects peu clairs de la théorie des erreurs de prédiction des récompenses, Berke et ses collègues ont mené des expériences sur des rats à l'aide d'un capteur moléculaire récemment développé. Ce capteur utilise une protéine génétiquement modifiée qui modifie sa fluorescence lorsqu'elle est liée à la dopamine.

“Nous avons déployé ce capteur dans trois zones différentes du striatum du rat, la zone du cerveau qui reçoit le plus fort apport de dopamine”, a expliqué Berke. “Ces différentes zones font partie de circuits en boucle distincts à grande échelle dans le cerveau, qui traitent différents types d'informations.”

Les chercheurs ont examiné les fluctuations de la dopamine, mises en évidence par leur capteur moléculaire, alors que les rats effectuaient diverses tâches comportementales. Les rats ont reçu des récompenses à des rythmes variables et ont entendu des signaux indiquant des récompenses à venir avec différents délais et probabilités.

Fait intéressant, ils ont constaté que les fluctuations de la dopamine dans chacune des trois sous-régions striatales qu’ils ont examinées reflétaient différentes échelles de temps pour les attentes de récompenses des rats.

“Dans un domaine, le plus concerné par le contrôle moteur, la dopamine fluctue fréquemment, et la réponse à un signal prédictif de récompense n'est forte que si elle prédit la délivrance d'une récompense en une fraction de seconde”, a déclaré Berke. “Une deuxième zone striatale semble se soucier des récompenses en quelques dizaines de secondes, et une troisième en centaines de secondes. Nous pensons qu'il pourrait y avoir un gradient continu d'échelles de temps de prédiction des récompenses, impliquant des circuits parallèles dans le cerveau.”

Les différentes échelles de temps et les sous-régions striatales associées dévoilées par Berke et ses collègues pourraient expliquer les observations expérimentales déroutantes précédemment rapportées enregistrant différents signaux de dopamine, le tout avec un seul cadre théorique. En outre, l’existence de différentes échelles de temps de prédiction des récompenses pourrait être à l’origine de certains comportements complexes et apparemment incohérents observés chez les animaux.

“Par exemple, lorsque nous chantons une chanson, il y a très peu de temps entre le mouvement de nos cordes vocales et l'audition du résultat agréable (ou non)”, a déclaré Berke. “Cette rétroaction doit être rapide pour un apprentissage efficace. Cependant, parfois nous faisons des choix et ne connaissons pas les résultats avant un temps considérable. Nous avons besoin de mécanismes cérébraux pour surmonter cet écart de temps, afin de déterminer si le choix a été le bon.”

Les nouvelles connaissances recueillies par cette équipe de chercheurs pourraient aider à mieux comprendre le lien entre les transitoires de dopamine dans les sous-régions striatales et l’apprentissage basé sur la récompense. En outre, ils pourraient mettre en lumière certains des processus qui sous-tendent la prise de décision.

“Souvent, nous prenons des résolutions sur la manière d'agir à long terme (par exemple, perdre du poids), mais lorsque nous sommes confrontés à un choix immédiat, nous n'agissons pas en conséquence”, a expliqué Berke.

“Cette inadéquation a longtemps été étudiée et a été considérée comme” irrationnelle “. Cependant, il est possible que ce soit une conséquence inévitable du fait que plusieurs sous-systèmes de décision fonctionnent en parallèle, chacun étant concerné par une durée différente du futur. À mesure que les résultats potentiels se rapprochent. avec le temps, davantage de sous-systèmes s'impliquent et poussent à obtenir des résultats à court terme.

Cette étude pourrait bientôt éclairer le développement de nouveaux modèles théoriques expliquant la prédiction des récompenses à différentes échelles de temps. Pendant ce temps, Berke et ses collaborateurs prévoient de s'appuyer sur leurs découvertes pour mener d'autres expériences sur les signaux dopaminergiques et leur interaction avec d'autres circuits neuronaux.

“Nous étudions actuellement comment ces signaux dopaminergiques interagissent avec d'autres composants de circuits, dans le cadre du développement d'une compréhension plus riche du fonctionnement de ces circuits et de la manière dont ils se détériorent dans des troubles tels que la dépendance, la maladie de Parkinson et le syndrome de Tourette. Nous avons également un programme actif étudiant la manière dont nous imaginons les possibilités futures et ajustons notre comportement en conséquence.

★★★★★

A lire également