Un développement plus précoce des accumbens par rapport au cortex orbitofrontal pourrait sous-tendre le comportement de prise de risque chez les adolescents (2006)

J Neurosci. 2006 Jun 21;26(25):6885-92.
 

Identifier

Institut Sackler pour la psychobiologie du développement, Weill Medical College de l'Université Cornell, New York, New York 10021, États-Unis. [email protected]

Abstract

L'adolescence a été caractérisée par des comportements à risque qui peuvent conduire à des issues fatales. Cette étude a examiné le développement neurobiologique des systèmes neuronaux impliqués dans les comportements de recherche de récompense. Trente-sept participants (âgés de 7 à 29 ans) ont été scannés à l'aide de l'imagerie par résonance magnétique fonctionnelle liée à l'événement et d'un paradigme qui manipulait de manière paramétrique les valeurs de récompense. Les résultats montrent une activité accumbens exagérée, par rapport à l'activité préfrontale chez les adolescents, par rapport aux enfants et aux adultes, qui semble être motivée par des cycles de développement différents pour ces régions. L'activité Accumbens chez les adolescents ressemblait à celle des adultes à la fois en termes d'activité et de sensibilité aux valeurs de récompense, bien que l'ampleur de l'activité ait été exagérée. En revanche, l'ampleur de l'activité du cortex frontal orbitaire chez les adolescents ressemblait davantage à celle des enfants que des adultes, avec moins de schémas d'activité focaux. Ces résultats suggèrent que les systèmes sous-corticaux en cours de maturation deviennent activés de manière disproportionnée par rapport aux systèmes de contrôle descendant qui mûrissent plus tard, ce qui oriente l'action de l'adolescent vers des gains immédiats plutôt qu'à long terme.

Introduction

La toxicomanie commence souvent pendant la période de prise de risque accrue de l’adolescence (Silveri et al., 2004) On sait peu de choses sur les facteurs neurobiologiques pouvant prédisposer les adolescents à une augmentation des comportements à risque. Chez les adultes, les régions mésolimbiques ont été impliquées dans la récompense (Knutson et al., 2001; Elliott et al., 2003; McClure et al., 2004), prise de risque (Kuhnen et Knutson, 2005), et la dépendance (Hyman et Malenka, 2001; Volkow et al., 2004), mais on en sait moins sur le développement de ces systèmes. Le but de cette étude était de vérifier l'hypothèse selon laquelle l'adolescence est une période de développement caractérisée par une réactivité accrue à la récompense par rapport à l'enfance et à l'âge adulte. Plus précisément, nous avons examiné si des différences dans le développement des régions sous-corticales [par exemple, le noyau accumbens (NAcc)] par rapport aux régions préfrontales [par exemple, le cortex frontal orbital (OFC)] pouvaient caractériser cette période de développement afin d'expliquer l'augmentation du comportement à risque .

L'adolescence se caractérise par la poursuite du développement structurel et fonctionnel des circuits frontostriataux impliqués dans la régulation comportementale. Les rats péri-adolescents présentent une augmentation de la transmission de la dopamine liée au rendement dans le striatum (Laviola et al., 1999), et chez les primates non humains, l'innervation dopaminergique est accrue dans le cortex préfrontal (PFC) (Rosenberg et Lewis, 1994, 1995) Des études d'imagerie humaine montrent des changements dans la région frontostriatale (Giedd et al., 1999; Sowell et al., 1999; Casey et al., 2005) qui semblent parallèlement à un contrôle cognitif accru (Casey et al., 1997; Rubia et al., 2000; Luna et al., 2001; Luna et Sweeney, 2004; Steinberg, 2004) Ces changements semblent montrer que l'activation des régions préfrontales passe d'un recrutement diffus à un recrutement plus focal au fil du temps (Casey et al., 1997; Bunge et al., 2002; Moses et al., 2002; Durston et al., 2006) Les études de neuroimagerie ne permettent pas de caractériser de manière définitive le mécanisme de tels changements développementaux (élagage synaptique, myélinisation, par exemple). Cependant, ces changements de volume et de structure peuvent refléter le raffinement et le réglage précis des projections réciproques de ces régions du cerveau au cours de la maturation. Cette interprétation n’est donc que spéculative.

Récemment, des études de neuroimagerie ont commencé à examiner le traitement lié à la récompense chez des adolescents et ont montré que l'activation du NAcc était similaire à celle observée chez l'adulte (Bjork et al., 2004; May et al., 2004; Ernst et al., 2005) Cependant, les résultats ont été mitigés quant à la différence d'activité entre les adolescents et les adultes. Ces études ont principalement porté sur la région des Accumbens plutôt que sur l’OFC dans l’examen des changements. En outre, peu d'attention a été accordée à la caractérisation du développement des CNS et des CFO depuis l'enfance jusqu'à l'âge adulte. Le suivi de ce développement fournit des contraintes supplémentaires sur la question de savoir si les changements signalés à l'adolescence sont spécifiques à cette période de développement ou reflètent les changements linéaires de maturation.

Ici, nous avons utilisé l'imagerie par résonance magnétique fonctionnelle (IRMf) pour examiner les réponses comportementales et neurales afin de récompenser les manipulations de valeur tout au long du développement. Nous nous sommes concentrés sur le NAcc et l’OFC selon les rapports antérieurs chez animal (Hikosaka et Watanabe, 2000; Pecina et al., 2003), imagerie (O'Doherty et al., 2001; Zald et al., 2004), et la dépendance (Hyman et Malenka, 2001) des études les impliquant dans un apprentissage lié à la récompense. Basé sur des modèles de rongeurs (Laviola et al., 1999; Lance, 2000) et travaux d'imagerie antérieurs (Ernst et al., 2005), nous avons émis l’hypothèse que, par rapport aux enfants et aux adultes, les adolescents montreraient une réponse d’accumbens exagérée suggérant des activations focales raffinées dans les accumbens au cours de cette période, ainsi que des activations moins matures dans les régions de PFC descendantes.

Matériels et méthodes

Participants

Seize enfants (sept femmes; âgés de 7 – 11, d'âge moyen de 9.8), adolescents de 13 (six femmes; âgés de 13 – 17, d'âge moyen de 16) et d'adultes en bonne santé de type 12 (six femmes de 23 – 29, avec l’âge moyen des années 25) a participé à l’expérience IRMf. Une analyse statistique distincte des données relatives aux adultes a déjà été rapportée (Galvan et al., 2005). Trois enfants et un adolescent ont été exclus de l'analyse en raison d'un mouvement excessif (> 2 mm). Le mouvement était> 0.5 voxels (1.56 mm) dans n'importe quelle direction pour deux sujets (un enfant et un adulte) inclus dans l'analyse. L'élimination de ces sujets de l'analyse n'a pas changé les résultats et les différents groupes d'âge ne différaient pas significativement dans le mouvement dans le plan (adultes: x = 0.48, y = 0.76, z = 0.49; adolescents: x = 0.26, y = 0.58, z = 0.45; les enfants: x = 0.18, y = 0.76, z = 0.36). Les sujets n'avaient aucun antécédent de trouble neurologique ou psychiatrique et ont chacun donné leur consentement éclairé (consentement des parents et assentiment des enfants pour adolescents et enfants) à un protocole approuvé par le comité d'examen institutionnel du Weill Cornell Medical College de l'Université Cornell. Avant l'expérience, l'expérience sur des adolescents et des enfants avait été simulée dans un faux scanner, dans lequel ils étaient exposés aux sons qu'ils entendraient au cours de l'expérience.

Tâche expérimentale.

Les participants ont été testés à l’aide d’une version adaptée d’une tâche à deux choix à réponse retardée précédemment utilisée chez les primates non humains (Cromwell et Schultz, 2003) et décrit précédemment (Galvan et al., 2005) dans une étude IRMf événementielle (Fig. 1) Dans cette tâche, trois indices (contrebalancés) étaient associés à une valeur de récompense distincte. Les sujets ont été priés d'appuyer sur leur index ou leur majeur pour indiquer le côté sur lequel un signal est apparu à l'invite, et de répondre aussi rapidement que possible sans commettre d'erreur.

 

Figure 1.

Paradigme comportemental. Panneau de gauche, Trois signaux ont été associés à une valeur de récompense distincte (contrebalancée par tous les sujets) qui est restée constante tout au long de l'expérience. Panneau de droite, Le paradigme consistait en une réplique, une réponse et une récompense qui étaient temporairement séparées dans le temps avec ITI de 12. La durée totale des essais était de 20.

Les paramètres de stimulus étaient les suivants. Une des trois images de bande dessinée de pirate a été présentée dans un ordre pseudo-aléatoire à gauche ou à droite d'une fixation centrée pour 1000 ms (Fig. 1) Après un délai de 2000 ms, on a présenté aux sujets une invite de réponse consistant en deux coffres au trésor situés des deux côtés de la fixation (2000 ms) et en leur demandant d’appuyer sur un bouton de leur index droit si le pirate se trouvait du côté gauche de la fixation ou leur majeur droit si le pirate était du côté droit de la fixation. Après un autre délai 2000 ms, le retour de récompense d'une petite, moyenne ou grande quantité de pièces était présenté au centre de l'écran (1000 ms). Chaque pirate était associé à un montant de récompense distinct. Il y avait un intervalle entre les essais (ITI) de 12 avant le début du prochain essai. La durée totale des essais était de 20. Les sujets n'étaient pas récompensés s'ils ne répondaient pas ou s'ils commettaient une erreur. dans les deux cas, ils ont reçu un message d'erreur au moment où ils recevraient normalement un retour d'informations sur les récompenses.

Les participants avaient la garantie de participer à l’étude à un montant de 50 $ US et on leur avait dit qu’ils pouvaient gagner jusqu’à concurrence de $ 25 supplémentaires, en fonction des performances (indexées par temps de réaction et précision) sur la tâche. Bien que les montants des récompenses diffèrent nettement les uns des autres, la valeur exacte de chaque récompense n’a pas été révélée au sujet, car lors des études pilotes, les sujets ont déclaré compter l’argent après chaque essai et nous voulions éviter cette distraction possible. Les stimuli ont été présentés avec le système d'imagerie fonctionnelle intégré (PST, Pittsburgh, PA) utilisant un écran vidéo à affichage à cristaux liquides dans l'alésage du scanner à résonance magnétique (MR) et un dispositif de collecte de réponse à fibre optique.

L’expérience consistait en cinq séries d’essais 18 (six essais de récompense de petite, moyenne et grande récompense), d’une durée de 6 min et de 8 chacune. Chaque essai comportait six essais de chaque valeur de récompense présentés dans un ordre aléatoire. À la fin de chaque série, les sujets étaient informés du montant qu'ils avaient gagné pendant cette période. La somme d'argent gagnée était la même pour tous les sujets et tous recevaient un programme de renforcement continu (récompensé sur 100% des essais). Avant de commencer l'expérience, on montrait aux sujets l'argent qu'ils pouvaient réellement gagner pour assurer leur motivation. Ils ont reçu des instructions détaillées comprenant une familiarisation avec les stimuli utilisés. Par exemple, on a montré aux sujets les trois signaux et les trois montants de récompense qu’ils verraient pendant l’expérience. On ne leur a pas dit en quoi les indices étaient liés aux récompenses. Nous avons explicitement souligné qu'il y avait trois montants de récompense, l'un petit, l'autre moyen et l'autre grand. Ces quantités sont visuellement évidentes dans l'expérience car le nombre de pièces dans les stimuli augmente avec la récompense. Un seul sujet pouvait articuler l'association entre des stimuli spécifiques et des montants de récompense, lorsqu'on l'interrogeait explicitement sur cette association lors du débriefing du sujet à la fin de l'expérience.

Acquisition d'image.

L'imagerie a été réalisée à l'aide d'un scanner IRM 3T General Electric (Milwaukee, WI) utilisant une bobine de tête en quadrature. Les balayages fonctionnels ont été acquis à l’aide d’une séquence d’entrée et de sortie en spirale (Glover et Thomason, 2004) Les paramètres comprennent les éléments suivants: temps de répétition (TR), 2000 ms; temps d'écho (TE), 30 ms; Matrice 64 × 64; Tranches coronales 29 5 mm; 3.125 × 3.125 en résolution dans le plan; flip, 90 ° pour les répétitions 184, y compris quatre acquisitions abandonnées au début de chaque exécution. Des balayages anatomiques pondérés dans le plan T1 ont été recueillis (TR, 500; TE, min; 256 × 256; champ de vision, 200 mm; 5 mm, épaisseur de coupe) aux mêmes emplacements que les images fonctionnelles, en plus d'une image tridimensionnelle. ensemble de données d'acquisition à haute résolution avec rappel de gradient gâté dans des images en régime permanent (TR, 25; TE, 5; Épaisseur de coupe 1.5, mm; Coupes 124)

L'analyse d'image.

Le progiciel Brainvoyager QX (Brain Innovations, Maastricht, Pays-Bas) a été utilisé pour effectuer une analyse à effets aléatoires des données d'imagerie. Avant l'analyse, les procédures de prétraitement suivantes ont été effectuées sur les images brutes: correction de mouvement tridimensionnelle pour détecter et corriger les petits mouvements de la tête par alignement spatial de tous les volumes sur le premier volume par transformation du corps rigide, correction du temps de balayage en tranches (avec interpolation sincère) ), suppression de la tendance linéaire, filtrage temporel passe-haut pour supprimer les dérives non linéaires de trois cycles ou moins par cycle temporel et lissage des données spatiales à l'aide d'un noyau gaussien avec une largeur totale 4 mm à mi-hauteur. Les mouvements de rotation et de translation estimés n'ont jamais dépassé 2 mm pour les sujets inclus dans cette analyse. Les données fonctionnelles ont été enregistrées dans le volume anatomique par alignement des points correspondants et ajustements manuels pour obtenir un ajustement optimal par inspection visuelle. Elles ont ensuite été transformées en espace de Talairach. Les voxels fonctionnels ont été interpolés à partir de la taille des voxels d’acquisition de 48.83 mm3 à une résolution de 1 mm3 lors de la transformation de Talairach. Le NAcc et l’OFC ont été définis par les coordonnées de Talairach en liaison avec l’atlas du cerveau de Duvernoy (Talairach et Tournoux, 1988; Duvernoy, 1999).

L’analyse initiale du modèle linéaire général (GLM) omnibus a inclus tous les sujets et toutes les étapes de l’essai (par rapport au niveau de référence avant le procès) afin de déterminer les régions sensibles à la récompense (NAcc et OFC). Pour s'assurer que des analyses statistiques ont été effectuées sur les mêmes régions pour chaque groupe d'âge, des analyses GLM distinctes ont été effectuées. Chaque groupe a montré une activation dans le NAcc et l'OFC basé sur un contraste récompense / base. La localisation de ces régions a ensuite été confirmée pour chaque groupe séparément par les coordonnées de Talairach en liaison avec la référence à l’atlas du cerveau de Duvernoy (Talairach et Tournoux, 1988; Duvernoy, 1999) comme décrit ci-dessus. Des travaux méthodologiques antérieurs ont montré que l’enregistrement stéréotaxique et l’évolution dans le temps de la réponse hémodynamique à travers les âges testés dans la présente étude ne sont pas dissemblables (Burgund et al., 2002; Kang et al., 2003). Analyse ultérieure et post hoc des contrastes ont été effectués sur les régions identifiées avec ce GLM initial omnibus pour tous les groupes ensemble, puis séparément pour chaque groupe. Enfin, une analyse de la conjonction a été réalisée pour identifier les voxels qui étaient couramment activés dans les trois groupes, dans le NAcc et l’OFC (Fig. 1, disponible à l’adresse suivante). www.jneurosci.org as matériel supplémentaire). Les régions d’intérêt identifiées dans l’analyse de la conjonction se recoupaient avec celles identifiées avec le GLM omnibus initial, et post hoc les tests ont confirmé des effets similaires à ceux obtenus avec les analyses ci-dessus.

Dans l'analyse du groupe entier, l'omnibus GLM comprenait toutes les analyses de l'essai (opérations 5 × sujets 37 = 185 z- cours du temps fonctionnel normalisé) et a été réalisée avec l’ampleur de la récompense comme prédicteur principal. Les prédicteurs ont été obtenus par convolution d’une réponse idéale en wagon couvert (supposant une valeur de 1 pour le volume de présentation de la tâche et un volume de 0 pour les points temporels restants) avec un modèle linéaire de la réponse hémodynamique (Boynton et al., 1996) et utilisé pour construire la matrice de conception de chaque cours de l'expérience. Seuls les essais corrects ont été inclus et des prédicteurs distincts ont été créés pour les essais d'erreur. Le nombre total d'essais corrects pour chaque groupe était le suivant: 1130 pour enfants (n = 13), 1061 pour les adolescents (n = 12) et 1067 pour les adultes (n = 12). Le nombre moins important d'essais sur des enfants a été corrigé en incluant un sujet supplémentaire sur l'enfant.

Post hoc Des analyses de contraste ont ensuite été effectuées sur la base de t des tests sur les poids β des prédicteurs afin d'identifier une région d'intérêt dans le NAcc et l'OFC. Les contrastes ont été réalisés avec une analyse à effets aléatoires. La série chronologique et le pourcentage de modifications du signal de résonance magnétique, pour chaque point de données de l'essai entier (18) par rapport aux 2 de la fixation précédant le début de l'essai (la durée totale de l'essai était 20), ont été calculés à l'aide de la moyenne d'événements sur des voxels significativement actifs. obtenu à partir des analyses de contraste. Le calcul du nombre de voxels recrutés dans chaque région par groupe d'âge était basé sur les analyses GLM effectuées sur chaque groupe décrit ci-dessus.

Les corrections pour les comparaisons multiples ont été basées sur des simulations de Monte Carlo, qui ont été exécutées à l’aide du programme AlphaSim au sein de AFNI (Cox, 1996), afin de déterminer les seuils de contiguïté appropriés pour obtenir un niveau α corrigé de p <0.01 (Forman et al., 1995) basé sur un volume de recherche de 450 mm3 pour le NAcc. Un niveau α corrigé de p <0.05 dans l'OFC était basé sur un volume de recherche de ∼25,400 XNUMX mm3 (Forman et al., 1995). L’activation OFC n’a pas survécu au seuil plus strict de p <0.01 entre les groupes.a

Résultats

Résultats d'imagerie

L’analyse GLM omnibus des données d’imagerie a permis d’identifier le NAcc [right (x = 6, y = 5, z = −2) et left (x = −8, y = 6, z = −2)] et droite OFC (x = 46, y = 31, z = 1) représenté dans Figure 2, A et C, avec la valeur de récompense comme prédicteur principal, pour tous les sujets et toutes les séquences de l’expérimentation pour l’ensemble de l’essai (18), par rapport à l’intervalle entre deux essais précédant le début de l’essai suivant (par exemple, le contraste entre la récompense et la ligne de base). Dans ces régions, l’effet principal de la valeur de la récompense (F(2,72) = 8.424; p = 0.001) (Fig. 2B) dans le NAcc, mais pas dans le BCE (F(2,72) = 1.3; p = 0.44) (Fig. 2D). Post hoc t Les tests sur l’effet principal de la récompense pour le NAcc ont confirmé des différences significatives entre les grands et les petits (t(36) = 4.35; p <0.001), grande et moyenne (t(36) = 2.01; p <0.05), et moyen et petit (t(36) = 2.09; p <0.04) récompenses, avec une plus grande activation pour de plus grandes récompenses.

 

Figure 2.

Localisation du noyau accumbens (A) et le cortex frontal orbital (C) activation pour récompenser. Il y avait un effet principal de la valeur de récompense dans le noyau accumbens (B) [droite (x = 6, y = 5, z = −2) et left (x = −8, y = 6, z = −2)] mais pas dans le cortex frontal de l’orbite latérale droite (x = 46, y = 31, z = 1) (D). Les barres d'erreur indiquent SEM. Les astérisques désignent des différences significatives entre petites et moyennes, moyennes et grandes entreprises, et petites et grandes entreprises.

Différences de développement quant à l'ampleur et à l'ampleur de l'activité à récompenser

Dans la mesure où cette étude portait principalement sur l’influence de la récompense sur le recrutement neuronal au cours du développement, nous avons examiné les différences de développement quant à l’ampleur et à l’ampleur de l’accumbens et de l’activité de l’OFC pour les essais cliniques, avec une récompense maximale. L’intensité de l’activité a été calculée sous forme de pourcentage de variation du signal de résonance magnétique moyenne sur les premiers 18 de l’essai par rapport à l’intervalle de fixation entre deux essais précédant immédiatement l’essai (2), moyenne sur l’ensemble de l’expérience (essais 90 = 900 scans). Ce calcul a été effectué pour chaque groupe. L’étendue de l’activité a été calculée comme le volume d’activité (nombre de voxels) d’une série à l’autre, par groupe, en utilisant le même contraste.

Magnitude d'activité.

Dans l’accumbens et l’OFC, il existait des différences de développement significatives dans le pourcentage de changement du signal du récepteur IRM (F(2,22) = 6.47, p <0.01; F(2,22) = 5.02, p = 0.01, respectivement) (Fig. 3A,B). Dans les accumbens, les adolescents ont montré le plus grand changement de signal. Post hoc Les tests ont confirmé des différences significatives entre les adolescents et les enfants (t(11) = 4.2; p = 0.03) et entre adolescents et adultes (t(11) = 5.5; p = 0.01) en magnitude de l’activité d’accumbens. Dans l'OFC, post hoc Les tests ont confirmé des différences significatives entre les enfants et les adolescents (t(11) = 4.9; p = 0.01) et les enfants et les adultes (t(11) = 3.99; p = 0.01). Ainsi, les adolescents ont montré une activité accrue dans les accumbens et cette tendance différait de celle observée dans les OFC et chez les enfants et les adultes.

 

Figure 3.

Magnitude et étendue des efforts et de l’activité de l’OFC à récompenser. A, Les adolescents ont montré un pourcentage de variation exagéré du signal de l'IRM générant une grande récompense par rapport aux enfants et aux adultes des adultes. BDans l’OFC, les enfants présentaient le plus grand pourcentage de variation du signal IRM par rapport aux adolescents et aux adultes. C, Les enfants présentaient le plus grand volume d'activité chez les accumbens par rapport aux adolescents et aux adultes. D, Les enfants et les adolescents ont présenté un volume d’activité plus important dans le CFO que chez les adultes. Les barres d'erreur indiquent SEM. Les astérisques indiquent des différences d’activation significatives entre les enfants et les adolescents et les adolescents et les adultes A; plus grande activation chez les enfants que chez les adolescents et les adultes B; volume d'activité plus élevé chez les enfants que chez les adolescents et les adultes C; et un plus grand volume d'activité chez les enfants par rapport aux adolescents et aux adolescents par rapport aux adultes de D.

Étendue de l'activité.

Des différences significatives de développement ont été observées dans l’ampleur de l’activité chez les accumbens (F(2,22) = 4.7; p <0.02) et OFC (F(2,22) = 5.01; p = 0.01). Post hoc Les tests ont confirmé le plus grand volume d'activité chez les enfants (accoxens 503 ± 43 interpolés) par rapport aux adolescents (voxels 389 ± 71 interpolés) (t(22) = 4.2; p <0.05) et adultes (311 ± 84 voxels interpolés) (t(22) = 3.4; p <0.05) (Fig. 3C) Les adolescents et les adultes ne différaient pas (t(22) = 0.87; p = 0.31). Pour l’OFC, enfants (voxels interpolés 864 ± 165) (t(22) = 7.1; p = 0.01) et les adolescents (671 ± 54) (t(22) = 5.8; p = 0.01) présentait la plus grande activité par rapport aux adultes (361 ± 45 voxels) (Fig. 3D), mais il n'y avait pas de différence significative entre les enfants et les adolescents (t(22) = 1.8; p = 0.07). Ce schéma d’activité reflète le développement prolongé de l’OFC par rapport au NAcc (Fig. 4, graphique).

 

Figure 4.

Mesure de l’activité normalisée pour le noyau accumbens et le CFO de tous les sujets, ajustée en fonction de l’ampleur moyenne de l’activité (x - moyenne / moyenne) pour chaque région.

Différences de développement dans le traitement temporel de la valeur de récompense

Pour examiner les modifications différentielles du recrutement neuronal au cours de l'expérience, nous avons examiné le principal effet du temps (essais précoces, moyens et tardifs) et des interactions avec celui-ci sur le changement du signal IRM dans le NAcc ou l'OFC. L’effet du temps n’a été observé que dans l’interaction du temps par groupe par récompense chez les accumbens (F(8,136) = 3.08; p = 0.003) et de manière moins robuste dans l’OFC (F(8,136) = 2.71; p = 0.02). Cette interaction était principalement motivée par les modifications survenues au cours des derniers essais de l'expérience (pour les modifications en fonction des essais précoces, intermédiaires et tardifs, voir la figure supplémentaire, Fig. 2, disponible à l'adresse suivante: www.jneurosci.org as matériel supplémentaire). Chiffres 5 et 6 décrivent l'évolution temporelle du changement du signal IRM en fonction de valeurs de récompense faibles, moyennes et élevées pour les essais tardifs par groupe pour chaque région. Ces séries chronologiques montrent un changement exagéré de l'activité d'accumens chez les adolescents par rapport aux enfants ou aux adultes pour les essais de récompense petits et grands qui ont lieu 5 – 6 après la réponse et au point où les trois groupes d'âge montrent un changement de signal MR. Ce modèle est illustré graphiquement dans Figure 7 pour plus de clarté (pour le changement d'activité de l'OFC à ce moment-ci pour les trois groupes d'âge, voir supplément Fig. 3, disponible à www.jneurosci.org as matériel supplémentaire).

 

Figure 5.

Les changements temporels dans le noyau accumbens en fonction de petites, moyennes et grandes valeurs de récompense pour les essais tardifs de l'expérience pour chaque groupe d'âge. Les barres grises correspondent au (x) point (s) ∼5 – 6 s après la réponse. Les barres d'erreur indiquent SEM. Les astérisques désignent les différences d'activation entre les groupes.

 

Figure 6.

Changements temporels dans le cortex orbitofrontal en fonction de valeurs de récompense petites, moyennes et grandes pour les essais tardifs de l'expérience pour chaque groupe d'âge. Les barres grises correspondent au (x) point (s) ∼5 – 6 s après la réponse. Les barres d'erreur indiquent SEM. Les astérisques désignent les différences d'activation entre les groupes.

 

Figure 7.

Variation en pourcentage du signal de résonance magnétique 5 – 6 s après la réponse par rapport au niveau de référence avant le procès pour chaque groupe d'âge, ce qui montre un changement exagéré de l'activité des accumbens chez les adolescents par rapport aux enfants ou aux adultes pour les essais de récompense de grande et de petite taille. Les barres d'erreur indiquent SEM. Les astérisques désignent les différences d'activation entre les groupes.

Résultats comportementaux

Les effets du temps sur la tâche et la valeur de récompense ont été testés avec une ANOVA 5 (séries) × 3 (récompense petite, moyenne et grande) × 3 (groupe) pour les variables dépendantes du temps de réaction moyen pour des essais corrects et une précision moyenne. Les principaux effets de la valeur de la récompense (F(2,72) = 9.51; p = 0.001) et groupe (F(2,220) = 4.37; p = 0.02) et des interactions significatives de récompense par le temps (F(8,288) = 4.176; p <0.001) et grouper par récompense par heure (F(16,272) = 3.01; p = 0.01) pour le temps de réaction moyen. Le principal effet de la récompense a montré que, chez tous les sujets, les temps de réaction moyens étaient plus rapides que la récompense la plus grande (moyenne, 515.47; SD, 178.75; t(36) = 3.8; p <0.001) par rapport à moyenne (moyenne, 556.89; SD, 180.53) ou petite récompense (moyenne, 552.39; SD, 180.35). L'interaction significative de la récompense par le temps était principalement motivée par l'interaction tripartite du groupe par la récompense par le temps. Les adultes différaient dans le temps de réaction moyen aux trois valeurs de récompense à la fin de l'expérience (Fig. 8) Les adolescents étaient nettement plus rapides avec les récompenses importantes par rapport aux récompenses moyennes et petites, sans différence entre les récompenses moyennes et petites. Les enfants n'ont montré aucune différence significative dans le temps de réaction moyen aux récompenses petites, moyennes ou grandes. Il n'y avait pas de corrélation significative entre le temps de réaction moyen ou l'exactitude et l'activité d'accumbens ou orbitofrontal.

 

Figure 8.

Résultats comportementaux. Le temps de réaction moyen en fonction de valeurs de récompense faibles, moyennes et élevées est indiqué pour les essais expérimentaux précoces, moyens et tardifs de chaque groupe d'âge. Les barres d'erreur indiquent SEM. Les astérisques dénotent un temps de réaction plus lent pour des gains faibles et moyens par rapport à un gain faible chez les adolescents et un temps de réaction plus lent pour des gains faibles par rapport à moyen et moyen par rapport à élevé chez les adultes.

Il n’ya pas eu d’effet significatif de la récompense (F(2,72) = 0.26; p = 0.40), groupe (F(2,220) = 0.73; p = 0.80), ou le temps (F(4,476) = 0.57; p = 0.44) ou interactions pour la précision moyenne. Tous les sujets avaient une grande précision dans les valeurs de récompense (enfants: petits, 96%; moyens, 98%; grands 96%; adolescents: petits, 98%; moyens, 99%; grands, 99% et adultes: petits, 98%; moyen, 99%; grand, 99%).

a lieu

Cette étude a examiné les réponses comportementales et neurales pour récompenser les manipulations de la valeur tout au long du développement. Nos résultats corroborent notre hypothèse selon laquelle les adolescents diffèrent des enfants et des adultes lors du recrutement dans les centres NACC et OFC, régions précédemment impliquées dans le traitement des récompenses (Knutson et al., 2001) et la dépendance (Volkow et al., 2004) Nos résultats sont compatibles avec le rongeur (Laviola et al., 2003) et l’imagerie de développement antérieure (Ernst et al., 2005) l’étude de l’activité accrue d’accumbens à l’adolescence. Ces résultats suggèrent que des trajectoires de développement différentes pour ces régions peuvent être liées aux comportements impulsifs et à risque accrus observés au cours de cette période de développement.

Changements développementaux dans la structure et la fonction

L’activité accrue d’accumbens s’accompagnait d’une structure d’activités plus raffinée chez les adolescents par rapport aux enfants, mais semblable à celle des adultes. En revanche, les adolescents ont montré un recrutement plus diffus de CFO plus semblable aux enfants que les adultes. Nous interprétons ces données comme suggérant que le développement du NAcc pourrait précéder celui de l'OFC pendant l'adolescence. Le développement prolongé des régions préfrontales, avec une transition du recrutement diffus au recrutement focal, est compatible avec le traitement neuroanatomique basé sur l'IRM (Sowell et al., 1999; 2003; Gogtay et al., 2004) et des études IRMf (Casey et al., 1997, 2002; Brown et al., 2005, Durston et al., 2006) du développement préfrontal (Casey et al., 2005).

Changements développementaux du volume d’activité dans les régions fronto-triatales (Sowell et al., 1999) sont intéressants à la lumière des processus de développement connus (p. ex., arborisation dendritique, élagage synaptique, myélinisation) intervenant au cours de cette période. Cependant, ni l'IRMf ni l'IRM ne fournissent un niveau d'analyse permettant de caractériser définitivement le mécanisme de tels changements. Les mesures de volume ont été utilisées en partie pour limiter l'interprétation des différences de magnitude, mais nous ne pouvons que supposer que nos changements de volume et de magnitude d'activité du NAcc et de l'OFC reflètent un réglage précis de ce circuit avec l'expérience et le développement.

Le recrutement différentiel des régions fronto-triatales a été rapporté dans plusieurs études IRMf développementales (Casey et al., 2002; Monk et al., 2003; Thomas et al., 2004). Généralement, ces résultats ont été interprétés en termes de régions préfrontales immatures plutôt qu’un déséquilibre entre les régions préfrontales et sous-corticales. Il a été démontré que les régions préfrontales guidaient les actions appropriées dans différents contextes (Miller et Cohen, 2001) une activité préfrontale immature pourrait entraver l’estimation appropriée des résultats futurs et des choix risqués, et pourrait donc avoir moins d’influence sur l’évaluation de la récompense que les accumbens. Cette tendance est cohérente avec les recherches précédentes montrant une activité sous-corticale élevée par rapport à l'activité corticale lorsque les décisions sont biaisées par des gains immédiats sur le long terme (McClure et al., 2004). De plus, il a été démontré que l’activité d’accumbens était en corrélation positive avec les comportements de prise de risque ultérieurs (Kuhnen et Knutson, 2005).

Apprentissage lié à la récompense tout au long du développement

L'un des objectifs de cette étude était de caractériser l'apprentissage par récompense au travers du développement. Les adultes ont montré une distinction comportementale entre les trois signaux, avec les réponses les plus rapides au signal de grande récompense. Les adolescents ont présenté des réponses moins discrètes et les enfants, peu ou pas d'apprentissage. L'apprentissage plus lent au cours du développement est parallèle aux résultats d'imagerie du développement prolongé de l'OFC qui peuvent entraver l'apprentissage associatif entre les événements prédictifs et les résultats de récompense. Cette interprétation est supportée par animal (Hikosaka et Watanabe, 2000; Chudasama et Robbins, 2003; Cetin et al., 2004; Hosokawa et al., 2005) et l'imagerie humaine (Elliott et al., 2000; O'Doherty et al., 2003; McClure et al., 2004; Cox et al., 2005; Galvan et al., 2005) des études montrant le rôle du CFO dans l’apprentissage et la représentation des liens entre les événements prédictifs (stimuli et réponses) et les résultats obtenus en optimisant les comportements de choix.

Jusqu'à présent, peu d'études d'imagerie de la récompense ont pu montrer des différences de comportement en fonction du résultat de la récompense (Haruno et al., 2004; Delgado et al., 2005; Galvan et al., 2005). Ici, nos données suggèrent que les réponses neuronales liées à la récompense influencent le rendement comportemental. Une variabilité comportementale minimale aurait pu empêcher les auteurs précédents de déterminer si différentes conditions de récompense biaisaient la production comportementale. Une des raisons pour lesquelles nous avons pu distinguer les différences de comportement pourrait être parce que notre paradigme a été conçu pour optimiser les réponses comportementales et l'apprentissage en utilisant un calendrier de renforcement continu (Dickinson et Mackintosh, 1978; Gottlieb, 2004, 2005). Les études animales montrent un apprentissage plus rapide avec des calendriers de renforcement continus par rapport à intermittents (Gottlieb, 2004) qui pourrait expliquer les réponses plus rapides aux essais de récompense volumineux parmi les sujets et le schéma de comportement distinct pour chaque valeur de récompense chez les adultes lors des essais tardifs.

Les récompenses sont relatives pour différents contextes et âges

La préférence de récompense varie en fonction du contexte de récompense (Tversky et Kahneman, 1981; Tremblay et Schultz, 1999). Les données de notre étude appuient la notion selon laquelle la préférence relative en matière de récompense est exagérée à l’adolescence: les adolescents ont montré une réaction accrue d’Accumbens à la grande récompense et une diminution de l’activité à la petite récompense par rapport aux autres récompenses et aux autres âges. Les adolescents signalent une plus grande intensité de sentiments positifs et une intensité de signal BOLD plus positive que les adultes lorsque les conditions de victoire sont gagnantes (Ernst et al., 2005). Les adolescents ont peut-être perçu la petite récompense comme une omission de récompense, similaire à l’absence d’un événement attendu à un moment donné, qui avait déjà montré une diminution de l’activité striatale (Davidson et al., 2004). Cette constatation correspond à un ralentissement du temps de réaction des essais précoces aux essais tardifs pour les récompenses plus modestes, fournissant une preuve supplémentaire que cette condition peut avoir été perçue comme plus négative pour les adolescents. Ensemble, ces résultats impliquent que la perception de la récompense pourrait être influencée par les changements dans les systèmes neuronaux pendant l'adolescence (Irwin, 1993).

Les changements de développement peuvent être parallèles aux changements avec l'apprentissage

Récemment, Pasupathy et Miller (2005) ont montré que, chez les singes, les zones striatales détectaient d’abord des contingences de récompenses, ce qui semblait ensuite biaiser les régions préfrontales pour les inciter à agir. D’autres travaux ont montré que le BCE semble impliqué dans la mise en relation des réponses avec les résultats (Elliott et al., 2000; Galvan et al., 2005). Cependant, cet effet peut dépendre de la maturité des systèmes préfrontaux et des connexions réciproques entre les régions frontostriatales (Haber, 2003) qui associent des actions à des résultats, car les enfants et les adolescents n’ont pas montré un apprentissage, tel qu’indiqué par le temps de réaction moyen, à la différence des adultes. Reste à savoir si les enfants ne pourraient pas apprendre à faire la distinction entre les différentes valeurs de récompense ou s'ils étaient tout aussi satisfaits d'une petite récompense qu'une grande récompense.

Les résultats de moins sensibilité dans la réponse comportementale que dans la réponse neurale chez les sujets plus jeunes peuvent être compatibles avec des études d’apprentissage antérieures montrant que les changements neuraux précèdent les changements comportementaux (Tremblay et al., 1998). Les adolescents étaient significativement plus rapides à des essais de récompense plus importants à la fin de l'expérience par rapport aux autres valeurs de récompense, mais les accumbens ont montré des modèles d'activité distincts pour chaque valeur de récompense similaires aux adultes. Si cette explication était vraie, nous pourrions nous attendre avec un entraînement supplémentaire que les performances comportementales des adolescents seraient finalement parallèles à l'activité accumbens. De même, on s'attendrait à ce que des modèles similaires apparaissent chez les enfants, mais avec une formation plus poussée.

Contrastes entre les résultats actuels et précédents

Bien que la réponse accumbens exagérée chez les adolescents reproduise celle de May et al. (2004) et Ernst et al. (2005), Bjork et al. (2004) ont constaté une diminution de l’activité d’accumbens par rapport aux adultes au cours d’un contraste versus gain. Alors que Bjork et al. (2004) ont signalé une modification du signal de l'IRM pendant toute l'expérience; nous avons examiné les modifications de l'IRM tout au long de l'expérience, ainsi que pendant les essais précoces et tardifs. Les essais ultérieurs ont montré une activation plus importante chez l'adolescent que chez l'adulte.

Une seconde différence dans l’étude actuelle par rapport à la littérature existante (O'Doherty et al., 2001, Elliott et al., 2003, Galvan et al., 2005), était l’absence d’un effet principal de la valeur de la récompense dans l’OFC parmi les sujets. En examinant cet effet principal, nous avons regroupé l’activité OFC à travers les groupes d’âge et au cours de l’expérience. D’autres études sur les avantages du BCE n’incluent pas les populations en développement qui présentent des patrons d’activité diffus et plus variables dans cette région (Casey et al., 1997). L'inclusion de populations en développement a donc accru la variabilité du recrutement de cette région, avec des modèles d'activité moins cohérents. De plus, nos données ont montré que, lors d'essais ultérieurs de l'expérience, l'activité de l'OFC différait pour les récompenses les plus grandes par rapport aux récompenses plus petites, mais montrait une cartographie moins précise de la valeur de récompense par rapport au NAcc, qui montrait des profils d'activité distincts pour chaque valeur de récompense à travers l'âge. groupes, cohérents avec nos travaux précédents (Galvan et al., 2005) et celle des autres (Elliott et al., 2003).

Implications

Nos résultats suggèrent qu'il y a des changements de maturation prolongés dans les systèmes de contrôle descendants par rapport aux régions sous-corticales impliquées dans les comportements d'appétit. Ces trajectoires développementales différentes peuvent contribuer à des choix sous-optimaux chez les adolescents, davantage guidés par des systèmes appétitifs que par des systèmes de contrôle (Lance, 2000). Comprendre le développement de la connectivité structurelle et fonctionnelle des circuits mésolimbiques liés aux récompenses pourrait en outre informer le terrain sur les bases neurobiologiques de la dépendance accrue à la recherche de récompenses et à l'adolescence.

Un cadre neuronal similaire à celui que nous proposons ici a été suggéré pour expliquer la dépendance. En conséquence, le PFC est «détourné» par un système sous-cortical impulsif, qui pourrait le rendre incapable de moduler de manière appropriée les décisions dans le contexte de conséquences futures (Bechara, 2005). Nos résultats sont cohérents avec cette hypothèse mais interviennent au cours du développement typique. Ainsi, les contributions disproportionnées des systèmes sous-corticaux par rapport aux systèmes de réglementation préfrontale peuvent être à la base d’un mauvais processus décisionnel qui prédispose les adolescents à la consommation de drogue et, en fin de compte, à la dépendance.

Notes

    • Reçu Janvier 5, 2006.
    • Révision reçue Mai 15, 2006.
    • Acceptée Mai 25, 2006.
  • a La taille des grappes de 6 et 10 pour Accumbens et OFC, respectivement, a été déterminée par ces simulations. La taille des grappes de 8 et 10 dans les données relatives aux adolescents et aux enfants, respectivement, a survécu à des seuils plus stricts (p <0.002 et p <0.001, respectivement). Dans l'OFC, des tailles de grappes de 14 et 18 chez les adolescents et les enfants, respectivement, ont survécu à des seuils plus stricts (p <0.004 et p <0.001, respectivement).

  • Ce travail a été financé en partie par les subventions R01 DA18879 et R21 DA15882 de l'Institut national des toxicomanies, la subvention P50 MH62196 de l'Institut national de la santé mentale (BJC) et la bourse T32 EY07138 de la National Eye Institute. Nous remercions chaleureusement tous les participants et leurs familles d'avoir participé à cette étude, ainsi que trois relecteurs anonymes.

  • La correspondance doit être adressée à Adriana Galvan ou à BJ Casey, avenue 1300 York, Box 140, New York, NY 10021. Email: [email protected] or [email protected]

Bibliographie

Articles citant cet article