Publié sous forme finale modifiée en tant que:
Neurosci Biobehav Rev. 2011 Apr; 35 (5): 1219 – 1236.
Publié en ligne 2010 Dec 24. est ce que je: 10.1016 / j.neubiorev.2010.12.012
PMCID: PMC3395003
NIHMSID: NIHMS261816
Xun Liu,1,2 Jacqueline Hairston,2 Madeleine Schrier,2 et Jin Fan2,3,4
La version finale modifiée de cet article par l'éditeur est disponible à l'adresse Neurosci Biobehav Rev
Voir d'autres articles dans PMC qui citer l'article publié.
Abstract
Pour mieux comprendre les circuits de récompense dans le cerveau humain, nous avons effectué une estimation de la probabilité d'activation (ALE) et des méta-analyses paramétriques à base de voxels (PVM) sur des études de neuroimagerie 142 portant sur l'activation du cerveau lors de tâches liées à la récompense chez des adultes en bonne santé. Nous avons observé plusieurs zones centrales du cerveau qui ont participé à la prise de décision liée aux récompenses, notamment le noyau accumbens (NAcc), le cortex caudé, le putamen, le thalamus, le cortex orbitofrontal (OFC), l’insula antérieure bilatérale, l’ACC (antérieur) et le postérieur (PCC). , ainsi que des régions de contrôle cognitif dans le lobule pariétal inférieur et le cortex préfrontal (PFC). Le CNSM était généralement activé par des récompenses positives et négatives au cours des différentes étapes du traitement des récompenses (anticipation, résultat et évaluation, par exemple). De plus, l'OFC et le CCP médiaux ont répondu préférentiellement aux récompenses positives, tandis que les CAC, l'insula antérieure bilatérale et les PFC latéraux ont répondu sélectivement aux récompenses négatives. L'anticipation des récompenses a activé le CAC, l'insula antérieure bilatérale et le tronc cérébral, tandis que les résultats de la récompense ont activé de manière plus significative le NAcc, l'OFC médial et l'amygdale. Les théories neurobiologiques de la prise de décision liée aux récompenses doivent donc tenir compte des représentations distribuées et interdépendantes de l’évaluation des récompenses et de la valence.
1. Introduction
Les gens font face chaque jour à d'innombrables occasions de prendre des décisions liées aux récompenses. Notre bien-être physique, mental et socio-économique dépend essentiellement des conséquences des choix que nous faisons. Il est donc crucial de comprendre ce qui sous-tend le fonctionnement normal de la prise de décision liée aux récompenses. L'étude du fonctionnement normal de la prise de décision liée aux récompenses nous aide également à mieux comprendre les divers troubles du comportement et de la mentalité qui surviennent lorsque cette fonction est perturbée, tels que la dépression (Drevets, 2001), abus de substance (Bechara, 2005; Garavan et Stout, 2005; Volkow et al., 2003) et des troubles de l’alimentation (Kringelbach et al.2003; Volkow et Wise, 2005).
La recherche en neuro-imagerie fonctionnelle sur la récompense est devenue un domaine en pleine croissance. Nous avons observé une forte augmentation de la recherche en neuroimagerie dans ce domaine, avec des dizaines d'articles pertinents parus dans la base de données PubMed chaque mois. D'une part, c'est excitant, car les résultats croissants sont primordiaux pour formaliser les mécanismes comportementaux et neuronaux de la prise de décision liée aux récompenses (Fellows, 2004; Trépel et al.2005). D'autre part, l'hétérogénéité des résultats, associée à des schémas opposés occasionnels, rend difficile l'obtention d'une image claire du circuit de récompense dans le cerveau humain. Le mélange de résultats est en partie dû à divers paradigmes expérimentaux développés par divers groupes de recherche qui visaient à aborder différents aspects de la prise de décision liée aux récompenses, tels que la distinction entre anticipation de récompense et résultat (Breiter et al.2001; Knutson et al., 2001b; McClure et al.2003; Rogers et al.2004), valorisation des avantages positifs et négatifs (Liu et al., 2007; Nieuwenhuis et al., 2005; O'Doherty et al., 2003a; O'Doherty et al., 2001; Ullsperger et von Cramon, 2003) et l’évaluation du risque (Bach et al., 2009; d'Acremont et Bossaerts, 2008; Hsu et al., 2009; Huettel, 2006).
Par conséquent, il est crucial de mettre en commun les études existantes et d’examiner les principaux réseaux de récompense dans le cerveau humain, à partir d’approches fondées sur les données et sur la théorie, afin de tester les points communs et la distinction entre différents aspects de la prise de décision liée aux récompenses. Pour atteindre cet objectif, nous avons utilisé et comparé deux méthodes de méta-analyse par coordonnées (CBMA) (Salimi-Khorshidi et al.2009), estimation de vraisemblance d'activation (ALE) (Laird et al., 2005; Turkeltaub et al., 2002) et la méta-analyse paramétrique à base de voxels (PVM) (Costafreda et al.2009), afin de révéler la concordance entre un grand nombre d’études de neuro-imagerie sur la prise de décision liée aux récompenses. Nous nous attendions à ce que le striatum ventral et le cortex orbitofrontal (OFC), deux zones de projection dopaminergiques majeures associées au traitement de la récompense, soient activés de manière constante.
En outre, d’un point de vue théorique, notre objectif était de déterminer s’il existait des distinctions dans les réseaux cérébraux responsables du traitement des informations de récompense positives et négatives, et impliquées de manière préférentielle à différentes étapes du traitement de la récompense, telles que l’anticipation de la récompense et les résultats. suivi et évaluation des décisions. La prise de décision implique le codage et la représentation des options alternatives et la comparaison des valeurs ou des utilitaires associés à ces options. Dans tous ces processus, la prise de décision est généralement associée à une valeur positive ou négative des résultats ou des réponses émotionnelles aux choix effectués. La valence de récompense positive fait référence aux états subjectifs positifs que nous rencontrons (par exemple, le bonheur ou la satisfaction) lorsque le résultat est positif (par exemple, gagner à la loterie) ou meilleur que prévu (par exemple, la perte de valeur inférieure à celle projetée). La valence de récompense négative fait référence aux sentiments négatifs que nous ressentons (par exemple, frustration ou regret) lorsque le résultat est négatif (par exemple, perdre un pari) ou pire que ce à quoi nous nous attendons (par exemple, la valeur du stock augmente plus bas que prévu). Bien que des études antérieures aient tenté de distinguer les réseaux de récompense sensibles au traitement d’informations positives ou négatives (Kringelbach, 2005; Liu et al.2007), ainsi que ceux impliqués dans l’anticipation ou le résultat des récompenses (Knutson et al.2003; Ramnani et al.2004), les résultats empiriques ont été mitigés. Nous avons cherché à extraire des modèles cohérents en regroupant un grand nombre d'études examinant ces distinctions.
2. Méthodes
2.1 Recherche documentaire et organisation
Identification de l'étude 2.1.1
Deux chercheurs indépendants ont effectué une recherche approfondie dans la littérature pour des études IRMf examinant la prise de décision basée sur la récompense chez l'homme. Les termes utilisés pour rechercher le service d’indexation de citations en ligne PUBMED (jusqu’en juin 2009) sont «IRMf», «récompense» et «décision» (par le premier chercheur), «tâche de prise de décision de récompense», «IRMf» et «humain». ”(Par le second chercheur). Ces résultats de recherche initiaux ont été fusionnés pour donner un total d'articles 182. Un autre article 90 a été identifié à partir d'une base de données de référence d'un troisième chercheur, accumulée jusqu'à juin 2009, en utilisant les critères de récompense «récompense» et «IRM». Nous avons également effectué une recherche dans la base de données BrainMap en utilisant Sleuth, avec «tâche de récompense» et «IRMf» comme termes de recherche, et avons trouvé des articles 59. Tous ces articles ont été regroupés dans une base de données et les entrées redondantes ont été éliminées. Nous avons ensuite appliqué plusieurs critères d'exclusion pour éliminer davantage les articles qui ne sont pas directement pertinents pour la présente étude. Ces critères sont: 1) des études empiriques non de première main (par exemple, des articles de synthèse); 2) n’ayant pas signalé de résultats dans un espace de coordonnées stéréotaxiques standard (Talairach ou l’Institut neurologique de Montréal, MNI); 3) d’études utilisant des tâches non liées à une décision ou à une prise de décision fondée sur la valeur; 4) d’analyses structurelles du cerveau (p. Ex. Morphométrie à base de voxel ou imagerie tenseur de diffusion); 5) uniquement sur la base d’une analyse par région d’intérêt (par exemple, utilisation de masques anatomiques ou de coordonnées d’autres études); 6) chez des populations particulières dont les fonctions cérébrales peuvent être différentes de celles d’adultes en bonne santé (enfants, adultes vieillissants ou toxicomanes, par exemple), bien que les coordonnées rapportées dans ces études pour le groupe d’adultes en bonne santé aient été incluses. La variabilité entre les méthodes avec lesquelles les sujets étaient priés de rendre compte de leurs décisions au cours des tâches (c.-à-d. Presse verbale et non verbale) a été acceptée. Cela a abouti à des articles 142 dans la base de données finale (listés dans le Appendice).
Au cours de la phase d'extraction des données, les études ont ensuite été regroupées selon différents schémas de normalisation spatiale en fonction des transformations de coordonnées implémentées dans la boîte à outils GingerALE (http://brainmap.org, Centre d’imagerie de recherche du Centre des sciences de la santé de l’Université du Texas, San Antonio, Texas): utilisation du langage FSL pour indiquer les coordonnées de l’INM, utilisation de SPM pour indiquer les coordonnées de l’INM, utilisation d’autres programmes pour la création de coordonnées de l’INM, utilisation de méthodes de Brett pour convertir les coordonnées de l’INM en Talairach espace, en utilisant un modèle natif Talairach. Les listes de coordonnées qui se trouvaient dans l'espace Talairach ont été converties dans l'espace MNI conformément à leurs schémas de normalisation d'origine. Pour la liste de Brett-Talairach, nous avons reconverti les coordonnées dans l’espace de l’INM en utilisant la transformation inverse de Brett (c.-à-d. Tal2mni) (Bord et al.2002). Pour la liste Talairach native, nous avons utilisé la transformation Talairach-MNI de BrainMap (c'est-à-dire, tal2icbm_other). Une liste maîtresse de toutes les études a été créée en combinant toutes les coordonnées dans l'espace INM en vue des méta-analyses ALE de GingerALE.
2.1.2 Catégorisation des expériences
Pour tester des hypothèses concernant les parcours de récompense communs et distincts qui sont recrutés par différents aspects de la prise de décision liée à la récompense, nous avons classé les coordonnées selon deux types de classification: la valence de la récompense et les étapes de décision. Nous avons adopté le terme «expériences» utilisé par la base de données BrainMap pour désigner des régresseurs individuels ou des contrastes généralement rapportés dans les études IRMf. Pour récompenser la valence, nous avons organisé les expériences en récompenses positives et négatives. Pour les étapes de décision, nous avons séparé les expériences en anticipation, résultat et évaluation de la récompense. Les coordonnées de la liste maîtresse correspondant à ces catégories ont été placées dans des sous-listes; ceux qui étaient difficiles à interpréter ou qui n'étaient pas clairement définis ont été omis. Ci-dessous, nous énumérons quelques exemples qui ont été classés dans chacune de ces catégories.
Les contrastes suivants ont été classés comme traitement des récompenses positives: ceux dans lesquels les sujets gagnaient de l’argent ou des points (Elliott et al.2000) (récompense en cours de succès); évité de perdre de l'argent ou des points (kim et al.2006) (comparaison directe entre éviter un résultat défavorable et recevoir une récompense); a remporté la plus grande des deux sommes d’argent ou de points (Knutson et al., 2001a) (grande ou petite récompense anticipée); perdu la plus petite des deux sommes d’argent ou de points (Sérieusement et al.2005) (no-win 0.50 $> no-win 4 $); reçu des mots ou des graphiques encourageants à l'écran (Zalla et al.2000) (augmentation pour “gagner”); goût sucré dans la bouche (O'Doherty et al.2002) (glucose> goût neutre); évalué positivement le choix (Liu et al.2007) (bien> faux), ou a reçu tout autre type de récompenses positives à la suite de la réussite de la tâche.
Les expériences classées pour des récompenses négatives incluent celles dans lesquelles les sujets ont perdu de l'argent ou des points (Elliott et al., 2000) (pénalité en cas d’échec); n'a pas gagné d'argent ni de points (Sérieusement et al.2005) (insatisfaction de non-gain); a remporté la plus petite des deux sommes d’argent ou de points (Knutson et al., 2001a) (Récompense 1 $ vs récompense 50); perdu la plus grande des deux sommes d’argent ou de points (Knutson et al., 2001a) (anticipation de punition importante ou petite); évalué négativement le choix (Liu et al.2007) (faux> bien); ou reçu toute autre récompense négative telle que l'administration d'un goût amer dans la bouche (O'Doherty et al.2002) (sel> goût neutre) ou des mots ou des images décourageants (Zalla et al.2000) (augmenter pour “perdre” et diminuer pour “gagner”).
L'anticipation des récompenses était définie comme la période au cours de laquelle le sujet réfléchissait aux options possibles avant de prendre une décision. Par exemple, placer un pari et s’attendre à gagner de l’argent sur ce pari serait qualifié d’anticipation (Cohen et Ranganath, 2005) (décision à risque élevé vs décision à faible risque). Le résultat / la distribution de la récompense a été classé comme étant la période au cours de laquelle le sujet a reçu un retour sur l’option choisie, tel qu’un écran avec les mots «gagner x $» ou «perdre x $» (Bjork et al.2004) (gain vs résultat sans gain). Lorsque le retour d'informations influençait la décision et le comportement du sujet lors d'un essai ultérieur ou était utilisé comme signal d'apprentissage, le contraste était classé dans l'évaluation de la récompense. Par exemple, une décision risquée qui est récompensée lors de l'essai initial peut amener un sujet à prendre un autre risque, peut-être plus important, lors du prochain essai (Cohen et Ranganath, 2005) (récompenses à faible risque suivies de décisions à haut risque ou à faible risque). L’aversion pour les pertes, la tendance des personnes à préférer fortement éviter les pertes à acquérir des gains, est un autre exemple d’évaluation (Tom et al.2007) (relation entre lambda et aversion pour perte neurale).
Estimation de vraisemblance d'activation (ALE) 2.2
L'algorithme de l'ALE est basé sur (Eickhoff et al.2009). ALE modélise les foyers d'activation comme des distributions gaussiennes 3D centrées sur les coordonnées rapportées, puis calcule le chevauchement de ces distributions à travers différentes expériences (ALE traite chaque contraste dans une étude comme une expérience distincte). L'incertitude spatiale associée aux foyers d'activation est estimée par rapport au nombre de sujets dans chaque étude (c'est-à-dire qu'un échantillon plus grand produit des modèles d'activation et une localisation plus fiables; par conséquent, les coordonnées sont convoluées avec un noyau gaussien plus serré). La convergence des modèles d'activation entre les expériences est calculée en prenant l'union des cartes d'activation modélisées ci-dessus. Une distribution nulle qui représente les scores ALE générés par un chevauchement spatial aléatoire entre les études est estimée par la procédure de permutation. Enfin, la carte ALE calculée à partir des coordonnées d'activation réelles est testée par rapport aux scores ALE de la distribution nulle, produisant une carte statistique représentant les valeurs p des scores ALE. Les valeurs p non paramétriques sont ensuite transformées en scores z et seuillées à un niveau de cluster corrigé p <0.05.
Six analyses ALE différentes ont été réalisées avec GingerALE 2.0 (Eickhoff et al.2009), une pour l’analyse principale de toutes les études et une pour chacune des cinq sous-listes, caractérisant l’activation du cerveau par des récompenses positives ou négatives, ainsi que des anticipations, des résultats et des évaluations. Deux analyses ALE de soustraction ont été effectuées avec GingerALE 1.2 (Turkeltaub et al.2002), l’un pour le contraste entre les récompenses positives et négatives, et l’autre pour le contraste entre l’anticipation et les résultats.
2.2.1 Analyse principale de toutes les études
Toutes les études 142 ont été incluses dans l'analyse principale, qui consistait en des foyers 5214 issus d'expériences 655 (contrastes). Nous avons utilisé l'algorithme implémenté dans GingerALE 2.0, qui modélise l'ALE en fonction de l'incertitude spatiale de chaque foyer en utilisant une estimation de la variabilité inter-sujet et inter-expérience. L'estimation a été contrainte par un masque de matière grise et a permis d'estimer la classification au-dessus des chances avec les expériences comme facteur à effets aléatoires, plutôt que d'utiliser une analyse à effets fixes sur les foyers (Eickhoff et al.2009). La carte ALE résultante a été seuillée en utilisant la méthode du taux de fausses découvertes (FDR) avec p <0.05 et une taille de cluster minimale de 60 voxels de 2 × 2 × 2 mm (pour un total de 480 mm3) pour se protéger contre les faux positifs de comparaisons multiples.
2.2.2 Analyses individuelles de sous-listes
Cinq autres analyses ALE ont également été réalisées sur la base des sous-listes qui classent différentes expériences en récompenses positives et négatives, ainsi qu'en anticipation de récompense, en délivrance de récompense (résultat) et en évaluation de choix. Pour l'analyse de la récompense positive, les foyers 2167 issus des expériences 283 ont été inclus. L'analyse de la récompense négative consistait en des foyers 935 issus des expériences 140. Les nombres de foyers inclus dans les analyses d’anticipation, de résultat et d’évaluation des choix étaient respectivement les foyers 1553 (expériences 185), 1977 (253) et 520 (97). Nous avons appliqué la même analyse et les mêmes approches de seuils que pour l'analyse principale ci-dessus.
Analyses de soustraction 2.2.3
Nous voulions également comparer les zones du cerveau qui étaient sélectivement ou préférentiellement activées par des récompenses positives par rapport à des récompenses négatives, et par l'anticipation de la récompense par rapport à la délivrance de récompenses. GingerALE 1.2 a été utilisé pour réaliser ces deux analyses. Les cartes ALE ont été lissées avec un noyau avec un FWHM de 10 mm. Un test de permutation de foyers distribués au hasard avec 10000 simulations a été effectué pour déterminer la signification statistique des cartes ALE. Pour corriger les comparaisons multiples, les cartes ALE résultantes ont été seuillées en utilisant la méthode FDR avec p <0.05 et une taille de cluster minimale de 60 voxels.
Méta-analyse basée sur voxel paramétrique (PVM) 2.3
Nous avons également analysé les mêmes listes de coordonnées en utilisant une autre approche de méta-analyse, PVM. Contrairement à l'analyse ALE, qui traite les différents contrastes au sein d'une étude comme des expériences distinctes, l'analyse PVM regroupe les pics de tous les contrastes au sein d'une étude et crée une carte de coordonnées unique pour l'étude spécifique (Costafreda et al.2009). Par conséquent, le facteur des effets aléatoires dans l'analyse PVM est le et le cannabis, par rapport aux individus expériences / contrastes dans l'analyse ALE. Cela réduit davantage le biais d'estimation causé par les études à contrastes multiples qui signalent des modèles d'activation similaires. Semblable à l’approche ALE, nous avons effectué six analyses PVM différentes à l’aide des algorithmes mis en œuvre dans le logiciel statistique R (http://www.R-project.org) d'une étude précédente (Costafreda et al.2009), une pour l’analyse principale de toutes les études et une pour chacune des cinq sous-listes caractérisant l’activation du cerveau par différents aspects du traitement des récompenses. Deux analyses PVM supplémentaires ont été effectuées en utilisant la même base de code afin de comparer les récompenses positives et négatives ainsi qu'entre l'anticipation des récompenses et les résultats.
2.3.1 Analyse principale de toutes les études
Les coordonnées MNI (5214) des mêmes 142 études utilisées dans l'analyse ALE ont été transformées en un tableau de texte, chaque étude étant identifiée par une étiquette d'identification d'étude unique. Les calculs sur la carte des pics ont été contraints dans un masque dans l'espace MNI. La carte des pics a d'abord été lissée avec un noyau uniforme (ρ = 10 mm) pour générer la carte récapitulative, qui représente le nombre d'études rapportant des pics d'activation se chevauchant dans un voisinage de 10 mm de rayon. Ensuite, une analyse PVM à effets aléatoires a été effectuée pour estimer la signification statistique associée à chaque voxel dans la carte récapitulative. Le nombre d'études dans la carte récapitulative a été converti en proportion d'études qui ont signalé une activation concordante. Nous avons utilisé le même seuil que celui utilisé dans l'analyse ALE pour identifier les grappes significatives pour la carte de proportion (en utilisant la méthode FDR avec p <0.05 et une taille de grappe minimale de 60 voxels).
2.3.2 Analyses individuelles de sous-listes
Cinq autres analyses PVM ont été effectuées sur les sous-listes pour les récompenses positives et négatives, ainsi que pour l'anticipation, les résultats et l'évaluation des récompenses. L'analyse de la récompense positive incluait les foyers 2167 des études 111, tandis que l'analyse de la récompense négative incluait les foyers 935 des études 67. Le nombre d’études incluses dans les analyses d’anticipation, de résultat et d’évaluation des choix était respectivement de foyers 1553 (études 65), 1977 (86) et 520 (39). Nous avons appliqué la même analyse et les mêmes approches de seuils que pour l'analyse principale ci-dessus.
Analyses comparatives 2.3.3
Nous avons également réalisé deux analyses PVM pour comparer les modèles d'activation entre les récompenses positives et négatives ainsi qu'entre l'anticipation et le résultat des récompenses. Deux cartes de pics (par exemple, une pour le positif et l'autre pour le négatif) ont d'abord été lissées avec un noyau uniforme (ρ = 10 mm) pour générer les cartes de synthèse, chacune représentant le nombre d'études avec un pic d'activation se chevauchant dans un voisinage de 10 mm rayon. Ces deux cartes récapitulatives ont été entrées dans un test de Fisher pour estimer le rapport de cotes et la valeur p de signification statistique pour chaque voxel contribuant dans le masque spatial de l'INM. Le test de Fisher n'étant pas spécifiquement développé pour l'analyse des données IRMf et empiriquement moins sensible que les autres méthodes, nous avons appliqué un seuil relativement clément pour l'analyse PVM de comparaison directe, en utilisant p <0.01 non corrigé et une taille de cluster minimale de 60 voxelsXiong et al.1995), pour corriger l’erreur de type I liée aux comparaisons multiples.
3. Résultats
Résultats 3.1 ALE
L’analyse globale des études sur 142 a montré une activation significative d’un grand groupe englobant le noyau bilatéral accumbens (NAcc), le pallidum, l’insula antérieure, le CGO latéral / médial, le cortex cingulaire antérieur (ACC), la région motrice supplémentaire (SMA), la cortex préfrontal (CPF), amygdale droite, hippocampe gauche, thalamus et tronc cérébral (Figure 1A) Les autres groupes plus petits comprenaient le gyrus frontal moyen droit et le gyrus frontal gauche moyen / inférieur, le lobule pariétal bilatéral inférieur / supérieur et le cortex cingulaire postérieur (PCC) (Tableau 1).
Les récompenses positives ont activé un sous-ensemble des réseaux mentionnés ci-dessus, comprenant le pallidum bilatéral, l’insula antérieure, le thalamus, le tronc cérébral, la CFO médiale, l’ACC, la SMA, la CCP et d’autres zones frontales et pariétales (Figure 1B et Tableau 2, regarde aussi Matériel supplémentaire - Figure S1A) Les récompenses négatives ont montré une activation dans le NAcc bilatéral, le caudé, le pallidum, l’insula antérieure, l’amygdale, le thalamus, le tronc cérébral, le CAC rostral, le PFC dorsomédial, le COF latéral droit,Figure 1B et Tableau 2, regarde aussi Matériel supplémentaire - Figure S1B) Contrairement aux activations positives et négatives, nous avons constaté que les récompenses positives activaient de manière significative les régions suivantes: NAcc bilatéral, insula antérieure, OFC médial, hippocampe, putamen gauche et thalamus (Figure 1D et Tableau 4) Aucun n'a montré plus d'activation par des récompenses négatives que positives.
Différents stades de traitement des récompenses partageaient des schémas d’activation cérébrale similaires dans les réseaux centraux susmentionnés, notamment le NAcc bilatéral, l’insula antérieure, le thalamus, le CIO médial, le CAC et le PFC dorsomédien (Figure 1C et Tableau 3, regarde aussi Matériaux supplémentaires - Figures S1C – E) L’anticipation de la récompense, comparée au résultat de la récompense, a révélé une plus grande activation de l’insula antérieure bilatérale, ACC, SMA, du lobule pariétal inférieur gauche et du gyrus frontal moyen (Figure 1E et Tableau 5) L’activation préférentielle des résultats incluait le cancer du sein de type bilatéral, caudé, thalamus et OFC bilatéral / latéral (Tableau 5).
Résultats 3.2 PVM
La principale analyse des études sur 142 a montré une activation significative du NAcc bilatéral, de l’insula antérieure, de l’OFC latéral / médial, de l’ACC, du CCP, du lobule pariétal inférieur et du gyrus frontal moyen (Figure 2A et Tableau 6).
Les récompenses positives activaient le NAcc bilatéral, le pallidum, le putamen, le thalamus, le CFO médial, le cortex cingulaire prégénuel, le SMA et le PCC (Figure 2B et Tableau 7, regarde aussi Matériel supplémentaire - Figure S2A) Une activation par récompenses négatives a été trouvée dans les inserts bilatéraux NACC et antérieur, pallidum, ACC, SMA et gyrus frontal moyen / inférieur (Figure 2B et Tableau 7, regarde aussi Matériel supplémentaire - Figure S2B) Le contraste direct entre les récompenses positives et négatives révélait une activation préférentielle par des récompenses positives dans le NAcc, le pallidum, l'OFC médial et le CCP, et une activation accrue par des récompenses négatives dans l'ACC et le gyrus frontal moyen / inférieur (Figure 2D et Tableau 9).
De même, différents stades de traitement des récompenses ont activé le NAcc et le CAC, alors qu'ils ont recruté de manière différenciée d'autres zones du cerveau telles que l'OFC médial, l'insula antérieure et l'amygdale (Figure 2C et Tableau 8, regarde aussi Matériel supplémentaire - Figure S2C – E) L’anticipation de la récompense, comparée au résultat de la récompense, a révélé une activation significative de l’insula antérieur bilatéral, du thalamus, du gyrus précentral et du lobule pariétal inférieur (Figure 2E et Tableau 10) Aucune zone du cerveau ne montre une plus grande activation par le résultat de la récompense par rapport à l'anticipation.
3.3 Comparaison des résultats ALE et PVM
L’étude actuelle a également montré que, bien que les méthodes ALE et PVM traitent les données basées sur les coordonnées différemment et adoptent des algorithmes d’estimation distincts, les résultats pour une liste unique de coordonnées de ces deux approches de méta-analyse sont très similaires et comparables (Figures 1A – C et 2A – C, Tableau 11, regarde aussi Figures S1 et S2 dans les matériaux supplémentaires) L'algorithme ALE amélioré implémenté dans GingerALE 2.0, intentionnellement, traite les expériences (ou les contrastes) comme le facteur des effets aléatoires, ce qui réduit considérablement le biais causé par les expériences rapportant plus de loci par rapport à celles ayant moins de loci. Cependant, différentes études incluent un nombre différent d'expériences / de contrastes. Par conséquent, les résultats de GingerALE 2.0 peuvent toujours être affectés par le biais qui pèse davantage vers les études rapportant plus de contrastes, potentiellement surestimant la concordance entre études. cependant, par choix, les utilisateurs peuvent combiner ensemble les coordonnées de différents contrastes afin que GingerALE 2.0 puisse traiter chaque étude comme une expérience unique. C’est ce que PVM met en œuvre, regroupant les coordonnées de tous les contrastes d’une étude sur une seule carte d’activation. Ainsi, toutes les études sont pondérées de manière égale pour estimer le chevauchement d’activation entre les études.
En revanche, la comparaison de deux listes de coordonnées différait de manière significative entre les approches ALE et PVM (Tableau 11), du fait de leurs différences de sensibilité à la convergence intra-étude et inter-études. Comme l'algorithme ALE amélioré n'a pas été implémenté pour l'analyse ALE soustractive, nous avons utilisé une version antérieure, GingerALE 1.2, qui traite les coordonnées en tant que facteur d'effet aléatoire et les expériences en tant que variable à effets fixes. Par conséquent, les différences dans le nombre de coordonnées et les expériences dans deux listes peuvent affecter les résultats de la soustraction. L'analyse ALE soustractive biaisée vers la liste avec plus d'expériences contre l'autre avec moins (Figure 1D / E). Les études de récompense positives (foyers 2167 issus des expériences 283) ont clairement prédominé les études négatives (foyers 935 issus des expériences 140). La différence entre l'anticipation des récompenses (foyers de 1553 issus des expériences 185) et le résultat (foyers de 1977 issus des expériences 253) était plus petite, mais aurait également pu causer un biais en faveur de la phase de résultats. En revanche, l’utilisation du test de Fisher pour estimer le rapport de cotes et attribuer les voxels de l’une des deux listes par PVM semblait moins sensible pour la détection de la différence d’activation entre les deux listes (Figure 2D / E).
4. Discussion
Nous prenons constamment des décisions dans notre vie quotidienne. Certaines décisions n'impliquent apparemment aucune valeur positive ou négative des résultats, alors que d'autres ont un impact significatif sur la valence des résultats et nos réactions émotionnelles face aux choix que nous faisons. Nous pouvons nous sentir heureux et satisfaits lorsque le résultat est positif ou lorsque nos attentes sont satisfaites, ou être frustrés lorsque le résultat est négatif ou inférieur à nos attentes. De plus, de nombreuses décisions doivent être prises sans connaissance préalable de leurs conséquences. Par conséquent, nous devons être en mesure de faire des prédictions sur la récompense future et d'évaluer la valeur de la récompense et le risque potentiel de l'obtenir ou d'être pénalisé. Cela nous oblige à évaluer notre choix en fonction de la présence d'erreurs de prédiction et à utiliser ces signaux pour guider notre apprentissage et nos comportements futurs. De nombreuses études de neuroimagerie ont examiné la prise de décision liée aux récompenses. Cependant, étant donné les processus psychologiques complexes et hétérogènes impliqués dans la prise de décision basée sur les valeurs, examiner les réseaux de neurones servant à la représentation et au traitement de l'information liée aux récompenses n'est pas une tâche facile. Nous avons observé une croissance rapide du nombre d’études empiriques dans le domaine de la neuroéconomie, mais jusqu’à présent, il était difficile de voir comment ces études avaient convergé de manière à délimiter clairement les circuits de récompense dans le cerveau humain. Dans la présente étude de méta-analyse, nous avons montré une concordance entre un grand nombre d’études et révélé les modèles communs et distincts d’activation du cerveau par différents aspects du traitement de la récompense. De manière axée sur les données, nous avons regroupé toutes les coordonnées de différents contrastes / expériences d’études 142 et avons observé un réseau de récompense principal, constitué des réseaux NAcc, OFC latéral / médial, ACC, insula antérieure, dorsomédial, les zones frontopariétales latérales. Une récente étude de méta-analyse axée sur l’évaluation des risques dans la prise de décision a révélé un circuit de récompense similaire (Mohr et al., 2010). En outre, d’un point de vue théorique, nous avons comparé les réseaux de neurones impliqués dans la valence positive et négative aux étapes d’anticipation et de résultat du traitement de la récompense, et avons élucidé les substrats neuronaux distincts sous-tendant l’évaluation liée à la valence, ainsi que leur implication préférentielle dans l’anticipation et le suivi. résultat.
Zones de récompense 4.1 Core: NAcc et OFC
Le NAcc et l'OFC ont longtemps été conçus comme les principaux acteurs du traitement des récompenses, car ils constituent les principales zones de projection de deux voies dopaminergiques distinctes, les voies mésolimbique et mésocorticale, respectivement. Cependant, on ignore comment les neurones dopaminergiques modulent de manière distincte l'activité dans ces zones limbique et corticale. Des études antérieures ont tenté de différencier les rôles de ces deux structures en termes d’étapes temporelles, associant le CNRC à l’anticipation des récompenses et reliant le OFC médian à l’obtention de la récompense (Knutson et al., 2001b; Knutson et al.2003; Ramnani et al.2004). Les résultats d’autres études remettaient en cause une telle distinction (Breiter et al., 2001; Delgado et al., 2005; Rogers et al., 2004). De nombreuses études ont également laissé entendre que le CNRC était chargé de détecter l’erreur de prédiction, un signal crucial pour l’apprentissage par incitation et l’association de récompenses (McClure et al., 2003; O'Doherty et al., 2003b; Pagnoni et al., 2002). Des études ont également révélé que le NAcc montrait une réponse biphasique, de sorte que son activité diminuerait et tomberait en dessous de la ligne de base en réponse à des erreurs de prédiction négatives (Knutson et al., 2001b; McClure et al.2003; O'Doherty et al., 2003b). Bien que l'OFC présente généralement des schémas d'activité similaires à ceux du NACC, des études antérieures de neuroimagerie chez l'homme ont suggéré que l'OFC sert à convertir une variété de stimuli en une devise commune en termes de valeur de récompense (Arana et al., 2003; Cox et al., 2005; Elliott et al., 2010; FitzGerald et al., 2009; Gottfried et al., 2003; Kringelbach et al., 2003; O'Doherty et al., 2001; Plassmann et al., 2007). Ces résultats sont similaires à ceux obtenus d’enregistrements sur une seule cellule et d’études sur des lésions chez des animaux (Schoenbaum et Roesch, 2005; Schoenbaum et al., 2009; Schoenbaum et al., 2003; Schultz et al., 2000; Tremblay et Schultz, 1999, 2000; Wallis, 2007).
Nos analyses globales ont montré que le NAcc et l’OFC répondaient au traitement général des récompenses (Figure 1A et Figure 2A). L’activation dans le NACC s’est largement chevauchée à travers différentes étapes, alors que l’OFC médian était plus à l’écoute pour récompenser la réception (Figure 1C / E et Figure 2C). Ces résultats ont mis en évidence le fait que le CNRS pourrait être chargé de suivre les signaux de récompense positifs et négatifs et de les utiliser pour moduler l'apprentissage de l'association de récompense, alors que le BCE surveille et évalue principalement les résultats de la récompense. Un complément d’investigation est nécessaire pour mieux différencier les rôles du NAcc et de l’OFC dans la prise de décision liée aux récompenses (Frank et Claus, 2006; Lièvre et al.2008).
Évaluation 4.2 liée à Valence
En plus de convertir différentes options de récompense en devise commune et de représenter leurs valeurs de récompense, des régions distinctes du cerveau dans le circuit de récompense peuvent coder séparément des valences de récompense positives et négatives. Les comparaisons directes entre les valences de récompense ont révélé que le CNO et le CFO médial étaient plus actifs en réponse aux récompenses positives que négatives (Figure 1B / D et Figure 2B / D). En revanche, le cortex insulaire antérieur était impliqué dans le traitement des informations de récompense négatives (Figure 1B et Figure 2B). Ces résultats ont confirmé la distinction entre latéral et latéral entre les récompenses positives et négatives (Kringelbach, 2005; Kringelbach et Rolls, 2004) et concordaient avec ce que nous avions observé dans notre étude précédente sur une tâche de récompense (Liu et al.2007). Les sous-régions du CAC ont uniquement réagi aux avantages positifs et négatifs. Les CAC prégénuels et rostraux, proches du CIO médial, ont été activés par des récompenses positives alors que les CAC caudaux ont répondu aux récompenses négatives (Figure 1B et Figure 2B). Les méta-analyses ALE et PVM ont également révélé que le PCC était toujours activé par des récompenses positives (Figure 1B et Figure 2B).
Fait intéressant, des réseaux séparés codant des valences positives et négatives sont similaires à la distinction entre deux réseaux anticorrélés, le réseau en mode par défaut et le réseau associé aux tâches (Fox et al., 2005; Raichle et al., 2001; Raichle et Snyder, 2007). Des méta-analyses récentes ont montré que le réseau en mode par défaut impliquait principalement les régions préfrontales médiales (y compris l'OFC médial) et le cortex postérieur médial (y compris le CCP et le précuneus), et que le réseau lié à la tâche englobait l'ACC, l'insula et le frontopariétal latéral. les régions (Laird et al., 2009; Toro et al., 2008). L'activation dans l'OFC et la CCP médiales par des récompenses positives reflétait le réseau en mode par défaut généralement observé pendant l'état de repos, alors qu'une activation dans le cortex préfrontal latéral, insulaire et insulaire, par des récompenses négatives, était parallèle au réseau associé à la tâche. Il a été constaté que cette organisation fonctionnelle intrinsèque du cerveau influençait la prise de décision basée sur les récompenses et les risques, ainsi que la prise en compte des différences individuelles entre les caractéristiques de prise de risque (Cox et al., 2010).
4.3 Anticipation versus résultat
L'actula antérieure bilatérale, ACC / SMA, le lobule pariétal inférieur et le tronc cérébral ont montré une activation plus consistante par anticipation par rapport à la phase finale (Figure 1C / E et Figure 2C / E). L'insula antérieure et l'ACC ont déjà été impliqués dans l'interoception, l'émotion et l'empathie (Craig, 2002, 2009; Gu et al., 2010; Phan et al., 2002) et l’évaluation des risques et des incertitudes (Critchley et al., 2001; Kuhnen et Knutson, 2005; Paulus et al., 2003), prêtant son rôle par anticipation. L’insula antérieure a été systématiquement impliquée dans le traitement du risque, en particulier dans l’anticipation des pertes, comme le révèle une méta-analyse récente (Mohr et al., 2010). Semblable au rôle de l’OFC, le lobule pariétal a été associé à la valorisation de différentes options (Sugrue et al.2005), représentation numérique (Cohen Kadosh et al.2005; Hubbard et al.2005), et intégration de l'information (Or et Shadlen, 2007; Yang et Shadlen, 2007). Par conséquent, il est essentiel que le lobule pariétal soit impliqué dans la phase d’anticipation du traitement de la récompense afin de planifier et de préparer une action éclairée (Andersen et Cui, 2009; Lau et al., 2004a; Lau et al., 2004b).
Par contre, le striatum ventral, la CFO médiane et l’amygdale ont montré une activation préférentielle lors de l’obtention de la récompense par rapport au stade d’anticipation (Figure 1C / E et Figure 2C). Ces tendances étaient cohérentes avec ce que nous avons découvert avec d’autres enquêteurs (Breiter et al., 2001; Delgado et al., 2005; Liu et al., 2007; Rogers et al., 2004), s’opposant à la dissociation fonctionnelle entre le striatum ventral et l’OFC médian en ce qui concerne leurs rôles respectifs dans l’anticipation et le résultat de la récompense (Knutson et al., 2001a; Knutson et al., 2001b; Knutson et al., 2003).
4.4 Une illustration schématique du traitement des récompenses
Sur la base des conclusions de réseaux communs et distincts impliqués dans divers aspects de la prise de décision en matière de récompense, nous avons proposé une illustration schématique résumant les représentations distribuées de la valeur et de la valence dans le traitement de la récompense (Figure 3). Nous groupons provisoirement différentes régions du cerveau en fonction de leurs rôles dans différents processus, bien que chaque région puisse remplir de multiples fonctions et interagir avec d'autres zones du cerveau d'une manière beaucoup plus complexe. Lorsqu'ils sont confrontés à des choix alternatifs, chacun présentant des caractéristiques distinctives telles que la magnitude et la probabilité, ces propriétés doivent être converties en informations comparables, basées sur la valeur, une "devise commune". Nous comparons non seulement les valeurs de ces choix alternatifs, mais également les valeurs factuelles et projetées ainsi que les valeurs fictives associées au choix non choisi (par exemple, le signal d'erreur de prédiction). Le striatum ventral et le CFO médial ont été impliqués dans cette représentation fondée sur les valeurs. Le lobule pariétal inférieur s'est également révélé impliqué dans la représentation et la comparaison d'informations numériques. En outre, la prise de décision fondée sur la valeur conduit inévitablement à une évaluation des choix, en fonction de la valence des résultats et des réponses émotionnelles associées. Alors que le striatum ventral et le CFO médial sont également impliqués dans la détection de la valence de récompense positive, les CFO latéraux, l'insula antérieure, l'ACC et l'amygdale sont principalement impliqués dans le traitement de la valence de récompense négative, probablement liée à leurs rôles évaluatifs dans les réponses émotionnelles négatives. En raison de l’effet négatif généralement associé au risque, l’insula antérieure et l’ACC sont également impliqués dans l’anticipation de la récompense des décisions risquées, en particulier dans le cas de réponses non désireuses d’incertitude dans l’anticipation de la perte. Enfin, les régions frontopariétales servent à intégrer et à agir sur ces signaux afin de prendre des décisions optimales (par exemple, commutation gagnant-séjour-perte).
Mises en garde 4.5
Quelques mises en garde méthodologiques doivent être notées. Le premier est lié au biais dans la communication des résultats dans différentes études. Certaines études sont purement basées sur le retour sur investissement, qui ont été exclues de la présente étude. Pourtant, d’autres ont choisi ou mis davantage l’accent sur Un préalable régions en signalant plus de coordonnées ou de contrastes liés à ces régions. Ils pourraient biaiser les résultats vers la confirmation des «points chauds». Deuxièmement, nous voulons mettre en garde à propos de la distinction conceptuelle des différents aspects du traitement des récompenses. Nous avons classé divers contrastes en différentes catégories d’intérêts théoriques. Cependant, dans les décisions de la vie réelle ou dans de nombreuses tâches expérimentales, ces aspects ne sont pas nécessairement clairs. Par exemple, l'évaluation du choix précédent et du résultat de la récompense peut se confondre avec l'anticipation de la récompense et la prise de décision à venir. Il n'y a pas de frontière claire entre les différentes étapes du traitement des récompenses, ce qui laisse notre classification actuelle ouverte à la discussion. Néanmoins, cette approche fondée sur des hypothèses est grandement nécessaire (Caspers et al., 2010; Mohr et al., 2010; Richlan et al., 2009), qui complète la nature de la méta-analyse basée sur les données. De nombreux facteurs liés à la prise de décision en matière de récompense, tels que l’évaluation des risques et les types de récompense (primaire ou secondaire, monétaire ou social), nécessitent des méta-analyses supplémentaires.
Points saillants de la recherche
- Nous avons effectué deux séries de méta-analyses basées sur les coordonnées sur les études de récompense de la radiographie par IRM-142.
- Le circuit de récompense de base comprenait le noyau accumbens, les régions insula, orbitofrontal, cingulate et frontoparietal.
- Le noyau accumbens a été activé par des récompenses positives et négatives à travers différentes étapes du traitement des récompenses.
- D'autres régions ont montré des réactions préférentielles à l'égard de récompenses positives ou négatives, ou lors d'anticipations ou de résultats.
Matériel complémentaire
01
02
03
Remerciements
Cette étude est financée par le projet des centaines de talents de l'Académie chinoise des sciences, le prix NARSAD pour jeunes chercheurs (XL) et le NIH Grant R21MH083164 (JF). Les auteurs souhaitent remercier l'équipe de développement de BrainMap et Sergi G. Costafreda pour avoir fourni d'excellents outils pour cette étude.
Appendice
Liste des articles inclus dans les méta-analyses de la présente étude.
Notes
Contributions de l'auteur: XL a conçu et supervisé l'ensemble de l'étude. JH et MS ont apporté une contribution équivalente à cette étude en effectuant une recherche documentaire, une extraction de données et une organisation. JF a participé à la discussion et à la préparation du manuscrit.
Avis de non-responsabilité de l'éditeur: Ceci est un fichier PDF d’un manuscrit non édité qui a été accepté pour publication. En tant que service à nos clients, nous fournissons cette première version du manuscrit. Le manuscrit subira une révision, une composition et une révision de la preuve résultante avant sa publication dans sa forme définitive. Veuillez noter que des erreurs pouvant affecter le contenu peuvent être découvertes au cours du processus de production, de même que tous les dénis de responsabilité qui s'appliquent à la revue.
Bibliographie