Une réponse unique des adolescents pour récompenser les erreurs de prédiction (2010)

Nat Neurosci. 2010 Jun; 13 (6): 669-71. Epub 2010 mai 16.

 

Identifier

Département de psychologie, Université de Californie à Los Angeles, Los Angeles, Californie, États-Unis. [email protected]

Abstract

Des travaux antérieurs ont montré que des adolescents peuvent être hypersensibles aux récompenses, mais on ignore quel aspect de la récompenser le traitement en est responsable. Nous avons séparé la valeur de décision et prédiction signaux d'erreur et a constaté que neurale prédiction Les signaux d'erreur dans le striatum ont atteint leur maximum à l'adolescence, tandis que les signaux de décision neuronale ont varié en fonction de la modélisation de la valeur. Ceci suggère que dopaminergic élevé prédiction la réactivité aux erreurs contribue à adolescent récompenser cherchant.

L'adolescence est une période unique du développement psychologique, caractérisée par une augmentation des choix et des actions à risque par rapport aux enfants et aux adultes. Ceci peut refléter le développement fonctionnel relativement précoce des systèmes d’affection et de récompense limbiques par rapport au cortex préfrontal.1, de sorte que les adolescents ont tendance à prendre de mauvaises décisions et à faire des choix risqués plus souvent que les enfants (qui ne sont pas encore totalement sensibles aux récompenses) et les adultes (sensibles aux récompenses, mais qui ont la capacité d'exercer un contrôle sur les besoins motivés par les récompenses).

Selon les théories de décision comportementale, les choix sont déterminés par la valeur attribuée à chaque choix potentiel (valeur de décision).2. La valeur de décision est calculée par un système situé dans le cortex préfrontal médial qui sert de voie commune pour la représentation des valeurs.3,4. Cependant, afin de se comporter de manière adaptative dans un monde en mutation ou bruyant, ces valeurs doivent être mises à jour en fonction de l'expérience. Les signaux d'erreur de prédiction de récompense reflètent la différence entre la valeur attendue d'une action et le résultat réel de l'action5et sont codés par activité phasique dans le système dopaminergique mésolimbique6. En IRMf, elles sont généralement observées dans le striatum ventral, reflétant le rendement dopaminergique (par exemple, 7). La nature des signaux d'erreur de prédiction chez les enfants et les adolescents est inconnue. Les adolescents peuvent avoir une réponse striatale hypersensible à récompenser8, bien que cette conclusion soit quelque peu incohérente9,10. Nous avons examiné si l'adolescence est associée à des changements uniques dans les signaux de valeur de décision ou d'erreur de prédiction, en utilisant un paradigme d'apprentissage probabiliste11 (Fig. 1; voir Méthodes supplémentaires en ligne). Nous avons estimé les signaux d'erreur de valeur de décision et de prédiction sur chaque essai au cours de l'apprentissage, à l'aide d'un modèle d'apprentissage simple.5. À l'aide d'analyses IRMf paramétriques, nous avons identifié les régions du cerveau dont la réponse était modulée conformément à ces signaux et avons examiné comment cette réponse évoluait avec l'âge, de l'enfance à l'âge adulte. Nous avons examiné à la fois les effets linéaires (qui reflètent les tendances générales de la maturation ou du développement) et les effets quadratiques (qui reflètent les effets spécifiques aux adolescents) avec l'âge. Ce travail représente le premier examen de ces sous-composants de la prise de décision à travers le développement.

Figure 1

Conception expérimentale. Les participants sains 45 (enfants 18 âgés de 8 – 12, adolescents 16 âgés de 14 – 19 et 11 âgés de 25 – 30) ont effectué une tâche d'apprentissage probabiliste lors de l'acquisition IRMf. Le consentement éclairé écrit a été obtenu. Participants ...

Sur le plan comportemental, tous les participants sont devenus plus précis et plus rapides avec l’entraînement à des stimuli prévisibles, mais pas à des stimuli aléatoires (interaction F (5,210) = 9.85, P<0.0001 pour la précision et F (5,210) = 6.60, P<0.0001 pour les temps de réponse; Tableau supplémentaire 1 et Fig. 1 en ligne). De manière cruciale, il existait une interaction récompense x âge pour les temps de réponse (F (2,42) = 5.03, P = 0.01). Les tests post-hoc ont montré que les adolescents étaient le seul groupe d’âge à répondre significativement plus rapidement aux stimuli associés à de grandes récompenses par rapport aux petites récompenses (t (15) = 3.24, P = 0.006; pour les enfants t (17) = −0.32, P = 0.75 et pour adultes t (10) = 1.90, P = 0.09).

Nous avons modélisé les données IRMf pour permettre une estimation séparée des réponses neuronales au stimulus et à la rétroaction (Méthodes supplémentaires et Fig. 2 en ligne; Voir les stimuli et recevoir un retour d’information sur les réponses concerne l’ensemble du cerveau, voir Figures supplémentaires 3 – 4 et les tables 2 – 3 en ligne). Nous avons examiné comment les corrélations neuronales avec les signaux de décision basés sur un modèle (valeur de décision et erreur de prédiction) étaient liées à l'âge.

Figure 2

Résultats IRM. (a) Régions présentant des corrélations avec l'âge lors de la correction au niveau du cerveau entier à z> 2.3, P<0.05. Les régions striatale et angulaire du gyrus étaient négativement corrélées avec l'âge2; parce que l'âge moyen2 a été soustrait de ...

Nous avons analysé les tendances quadratiques de l'erreur de prédiction positive au retour et identifié deux régions dans lesquelles les adolescents présentaient une réponse hypersensible par rapport aux autres groupes d'âge - le striatum et le gyrus angulaire. Une zone du cortex préfrontal médial a montré un effet linéaire négatif de l’âge sur la valeur de décision du stimulus, de sorte que les participants plus jeunes avaient un signal de valeur de décision plus fort dans cette région par rapport aux participants plus âgés; cette région a été fortement associée à la valeur de stimulus axée sur les objectifs dans des travaux antérieurs chez les adultes (Fig. 2a)12. Ainsi, alors que la réponse aux réactions positives imprévisibles atteignait son point culminant à l’adolescence, la sensibilité à la valeur du stimulus diminuait linéairement avec l’âge (pour les tracés compris entre l’âge et chacune des régions d’intérêt [ROI] susmentionnées, voir Fig. Supplémentaire 5 en ligne).

Étant donné que la valeur de décision se développe grâce à l'apprentissage par erreur dans le modèle, il était surprenant que la valeur de décision montre une trajectoire liée à l'âge différente de l'erreur de prédiction. Cependant, en raison de la structure de la tâche, il est possible que le choix ait été motivé par d'autres facteurs au-delà de l'apprentissage par renforcement (par exemple, la mémoire explicite). Pour clarifier les résultats, nous avons utilisé un deuxième modèle qui a calculé la valeur de décision de manière plus intégrative comme la proportion d'essais précédents sur lesquels la réponse optimale a été choisie pour chaque stimulus (Lin, Adolphs & Rangel, non publié; Méthodes supplémentaires en ligne). Nous avons analysé les valeurs d'erreur de prédiction de ce modèle et constaté qu'elles correspondaient aux résultats de nos analyses initiales. Elles montraient des régions du striatum et du cortex pariétal, ainsi que des régions préfrontales latérales ventrales, où la réponse neuronale à l'erreur de prédiction atteignait son maximum à l'adolescence. L'analyse de la valeur de décision de ce modèle a montré à la fois des relations linéaires et non linéaires entre l'âge et l'activité neurale dans un certain nombre de régions, y compris le cortex pariétal latéral et le striatum (Fig. Supplémentaire 6 et tableau 5 en ligne). Des analyses ROI exploratoires (non indépendantes) ont montré que la réponse neuronale à la valeur de décision dans ce modèle semblait augmenter entre l'enfance et l'adolescence, puis asymptotée entre l'adolescence et l'âge adulte (Fig. Supplémentaire 7 en ligne). Ces résultats ont démontré que la réponse d'erreur de prédiction d'erreur maximale à l'adolescence était robuste vis-à-vis de différents modèles, alors que les changements dans les signaux de valeur de décision liés à l'âge étaient sensibles à la spécification du modèle.

Sur la base de travaux antérieurs montrant que le striatum ventral est systématiquement sensible aux retours positifs inattendus, comme le montrent les signaux d’erreur de prédiction de récompense basés sur un modèle (par exemple,7), nous avons examiné la localisation des réponses liées aux erreurs de prédiction pour chaque groupe d’âge séparément au sein d’un ROI anatomique indépendant comprenant le caudé bilatéral, le putamen et le noyau accumbens en utilisant le modèle d’apprentissage par renforcement original (Fig. 2b). Les régions striatales significativement liées à une erreur de prédiction positive ne se chevauchent pas pour les adolescents et les adultes. Alors que les adultes de cette étude avaient une activité dans la région striatale ventrale régulièrement observée dans les études examinant l’erreur de prédiction chez l’adulte, les adolescents avaient une activité dans une région plus dorsale. Les enfants n'avaient aucune activité dans le striatum liée à une erreur de prédiction positive.

Nos résultats étendent les découvertes précédentes d'augmentation de l'activité neuronale liée à la récompense durant l'adolescence8 en démontrant que cette constatation est propre à l’erreur de prédiction par rapport aux signaux d’évaluation. Les différences de développement dans la réponse d'erreur de prédiction reflètent probablement les différences de signalisation phasique de la dopamine13. Si cela est correct, cela fournit une explication directe du comportement risqué de recherche de récompense souvent observé chez les adolescents. L'augmentation des comportements à risque à l'adolescence pourrait en théorie refléter une sensibilité réduite aux conséquences négatives potentielles ou une sensibilité accrue aux conséquences positives potentielles. Nous estimons que nos données concordent avec ces dernières: en d’autres termes, un nombre accru de signaux d’erreur de prédiction (reflétant supposément des signaux de dopamine phasiques plus importants) reflète un plus grand impact de résultats positifs.14, qui est proposé pour accroître la motivation à obtenir des résultats positifs (et donc une plus grande prise de risque). Ainsi, une réponse erronée à une erreur de prédiction dopaminergique chez les adolescents pourrait entraîner une augmentation de la recherche de récompense, en particulier lorsqu'elle est associée à un système de contrôle cognitif immature.1.

Les présents résultats peuvent expliquer pourquoi des études antérieures ont produit des effets incohérents de l'âge sur le traitement des récompenses. Premièrement, toutes les études ne comparaient pas les adolescents aux enfants et aux adultes, ce qui signifie que la possibilité de relations non linéaires avec l’âge ne pouvait pas être notée. De plus, la définition du terme «adolescent» n’a pas été uniforme dans toutes les études. Deuxièmement, il est important de noter que la tâche d'apprentissage probabiliste utilisée ici n'était pas une tâche de prise de décision risquée en soi, elle est donc différente des autres tâches utilisées dans la littérature sur les récompenses et la prise de risque. Troisièmement, nos résultats suggèrent qu'une bonne compréhension des changements développementaux dans le traitement des récompenses nécessite l'utilisation d'approches basées sur un modèle ainsi que la décomposition des composants de chaque essai (stimulus, choix et rétroaction).

On se rend de plus en plus compte que l’adolescence est une période unique du développement psychologique et que le comportement risqué de recherche de récompenses qui se produit pendant cette période peut entraîner une morbidité et une mortalité importantes, notamment la mort accidentelle et l’apparition d’une toxicomanie. Par conséquent, comprendre le fondement neuronal de la prise de décision chez les adolescents est un défi crucial. Le présent travail suggère que la recherche de signaux d'erreur de prédiction améliorés pourrait contribuer à la recherche d'une récompense, ce qui constitue une nouvelle cible pour les études futures de cette période de développement importante.

Matériel complémentaire

Remerciements

Cette recherche a été financée par l'Institut national de la santé mentale (5R24 MH072697), l'Institut national de la toxicomanie (5F31 DA024534), la Fondation McDonnell et la Fondation Della Martin.

Notes

Contributions d'auteur Le JRC a participé à la conception des expériences, à l’acquisition et à l’analyse de données et à la rédaction du manuscrit. RFA, RMB et SYB ont conçu les expériences. FWS a contribué à l'acquisition de données. BJK et RAP ont conçu les expériences et aidé à la rédaction du manuscrit.

 

Intérêts concurrents Les auteurs déclarent qu'ils n'ont aucun intérêt financier en concurrence.

Bibliographie

1. Casey BJ, Getz S, Galvan A. Dev Rev. 2008;28: 62-77. [Article gratuit PMC] [PubMed]
2. Kahneman D, Tversky A. Econometrica. 1979;47: 263-91.
3. Chib VS, Rangel A, S Shimojo, JP O'Doherty. J Neurosci. 2009;29: 12315-20. [PubMed]
4. Tom SM, Fox CR, Trepel C, Poldrack RA. Science. 2007;315: 515-8. [PubMed]
5. Rescorla RA, Wagner AR. Dans: Conditionnement classique II: recherches et théories actuelles. Black A, Prokasy WF, éditeurs. Appleton Century Crofts; New York, NY: 1972. pp. 64 – 99.
6. Schultz W, Dayan P, PR de Montague. Science. 1997;275: 1593-9. [PubMed]
7. Pagnoni G, CF Zink, PR Montague, GS Berns. Nat Neurosci. 2002;5: 97-8. [PubMed]
8. Galvan A et al. J Neurosci. 2006;26: 6885-92. [PubMed]
9. Bjork JM, et al. J Neurosci. 2004;24: 1793-802. [PubMed]
10. May JC et al. Biol Psychiatry. 2004;55: 359-66. [PubMed]
11. Knowlton BJ, Mangels JA, Squire LR. Science. 1996;273: 1399-402. [PubMed]
12. Hare TA, J O'Doherty, cameraman CF, W Schultz, Rangel A. J Neurosci. 2008;28: 5623-30. [PubMed]
13. D'Ardenne K, SM McClure, Nystrom LE, Cohen JD. Science. 2008;319: 1264-7. [PubMed]
14. Berridge KC, Robinson TE. Brain Res Rev 1998;28: 309-69. [PubMed]