Interaction contextuelle entre le traitement de la nouveauté et des récompenses dans le système mésolimbique (2012)

  • Hum Brain Mapp. 2012 Jun; 33 (6): 1309 – 1324.
  • Publié en ligne 2011 Apr 21. doi:  10.1002 / hbm.21288

Nico Bunzeck,*,1 Christian F Doeller,2,3,4 Ray J Dolan,5 et Emrah Duzel2,6

Cet article a été cité par autres articles dans PMC.

Allez à:

Abstract

La mémoire à long terme dépendante du lobe temporal médian (MTL) pour de nouveaux événements est modulée par un circuit qui répond également à la récompense et inclut le striatum ventral, le mésencéphale dopaminergique et le cortex orbitofrontal médial (mOFC). Ce réseau de neurones commun peut refléter un lien fonctionnel entre nouveauté et récompense, la nouveauté motivant l'exploration dans la recherche de récompenses; un lien également appelé «bonus d'exploration» de la nouveauté. Nous avons utilisé l'IRMf dans un paradigme de codage de scène pour étudier l'interaction entre la nouveauté et la récompense, en mettant l'accent sur les signaux neuronaux s'apparentant à un bonus d'exploration. Comme prévu, la mémoire à long terme liée aux récompenses pour les scènes (après les heures 24) était fortement corrélée à l’activité de MTL, du striatum ventral et de la substantia nigra / zone tegmentale ventrale (SN / VTA). De plus, l'hippocampe a montré un effet principal de nouveauté, le striatum a montré un effet principal de récompense et le mOFC a signalé à la fois la nouveauté et la récompense.. Une interaction entre nouveauté et récompense s'apparentant à un bonus d'exploration a été constatée dans l'hippocampe. Ces données suggèrent que les signaux de nouveauté MTL sont interprétés en termes de leurs propriétés de prédiction de récompense dans le mOFC, ce qui biaise les réponses de récompense striatales. Le striatum associé au SN / VTA régule ensuite la formation de la mémoire à long terme dépendante du MTL et les signaux de bonus d'exploration contextuelle dans l'hippocampe.

Mots clés: nouveauté, récompense, système mésolimbique, mémoire, hippocampe, substantia nigra / zone tegmentale ventrale, striatum ventral, mOFC, bonus d'exploration

INTRODUCTION

La nouveauté est un signal d'apprentissage d'une grande motivation qui attire l'attention, favorise l'encodage de la mémoire et modifie les comportements orientés vers les objectifs [Knight,1996; Lisman et Grace, 2005; Mesulam, 1998; Sokolov, 1963]. Des preuves récentes d'études sur des primates humains et non humains suggèrent que les aspects motivationnels de la nouveauté sont en partie liés à ses propriétés partagées avec récompense [Bunzeck et Duzel, 2006; Kakade et Dayan, 2002; Mesulam, 1998]. Cette suggestion découle d'observations selon lesquelles, dans des études sur des animaux, la substantia nigra / région tegmentale ventrale (SN / VTA) du tronc cérébral est activée par des stimuli qui prédisent les avantages ainsi que des stimuli nouveaux [Ljungberg, et al. 1992]; pour un examen, voir [Lisman et Grace, 2005]. De même, le SN / VTA humain est activé à la fois par récompense [Knutson et Cooper, 2005] et la nouveauté [Bunzeck et Duzel, 2006; Bunzeck et al. 2007; Wittmann et al. 2005] ainsi que par des signaux prédisant leur apparition [Knutson et Cooper, 2005; O'Doherty et coll. 2002; Wittmann et al. 2005, 2007]. La neurotransmetteur dopamine produite dans le SN / VTA régule profondément les aspects motivationnels du comportement [Berridge, 2007; Niv et al. 2007].

En outre, il existe des preuves convergentes selon lesquelles l’hippocampe, structure du lobe temporal médial (LML), essentielle à la formation de mémoires épisodiques à long terme pour des événements inédits, est également impliquée dans diverses formes d’apprentissage par récompense [Devenport, et al.1981; Holscher et al. 2003; Ploghaus et al. 2000; Purves et al. 1995; Rolls et Xiang, 2005; Salomon et al. 1986; Tabuchi et al. 2000; Weiner, 2003; Wirth et al. 2009]. Par exemple, l’hippocampe de rongeur montre une activité accrue dans les bras de labyrinthe avec appâts mais non sans appétit [Holscher, et al. 2003]; chez les primates non humains, il participe à des associations de récompense de lieu d'apprentissage [Rolls et Xiang, 2005]; L’activité hippocampique suit les règles d’apprentissage des erreurs de prédiction pour les stimuli aversifs chez l’homme [Ploghaus, et al. 2000]; et récompense augmente la synchronisation entre les neurones de l'hippocampe et du noyau accumbens [Tabuchi, et al. 2000].

Un point commun entre les effets de récompense et de nouveauté peut être réconcilié théoriquement en suggérant que la nouveauté incite à explorer un environnement propice à la récolte de récompenses [Kakade et Dayan,2002]. Selon cette suggestion, une propriété de motivation clé de la nouveauté est son potentiel de prédiction des récompenses, tandis que les stimuli familiers, s'ils sont répétés en l'absence de récompense, perdent progressivement ce potentiel. L’hypothèse relative au bonus d’exploration fait deux types de prédictions: la première concerne la puissance avec laquelle le statut de nouveauté ou de familiarité peut prédire une récompense et la seconde concerne les effets contextuellement éloignés de cette contingence sur d’autres stimuli. Selon la première prévision, être un nouveau stimulus devrait être un facteur de prédiction plus puissant de la récompense que d'être un stimulus familier [par exemple, Wittmann, et al. 2008]. En d’autres termes, lorsque de nouveaux stimuli prédisent une récompense, l’espérance de récompense devrait être plus grande que lorsque des stimuli connus prédisent des récompenses. La deuxième prédiction (plus indirecte) est que l’effet de la nouveauté qui améliore la motivation sur le comportement exploratoire devrait avoir un effet contextuel sur la signification motivationnelle d’autres stimuli présents dans le même contexte. Compatible avec cette suggestion, Bunzeck et Duzel [ 2006] ont montré que dans un contexte dans lequel de nouveaux stimuli sont présents, les stimuli familiers montrent moins de suppression de la répétition dans les structures de MTL. Ceci suggère que même en l'absence de récompense explicite, dans un contexte dans lequel de nouveaux stimuli sont présents, la motivation pour explorer également les stimuli familiers dans ce contexte est plus forte [Bunzeck et Duzel, 1991]. 2006]. Cependant, à ce jour, ces prédictions concernant la relation entre nouveauté et récompense n’ont pas été testées directement. En termes expérimentaux, cela nécessite de manipuler la propriété de nouveauté qui prédit la récompense, de telle sorte que les récompenses dans un contexte donné sont prédites soit par nouveauté, soit par familiarité. Ici, nous avons utilisé cette approche expérimentale pour étudier l’interaction fonctionnelle entre la nouveauté et la récompense dans une étude IRMf.

Comprendre l'interaction fonctionnelle entre la nouveauté et la récompense a de profondes implications pour comprendre comment la plasticité à long terme des nouveaux stimuli est régulée. Un grand nombre de preuves physiologiques montrent que la dopamine provenant du SN / VTA régule non seulement les aspects motivationnels du comportement, mais qu’elle est essentielle pour améliorer et stabiliser la plasticité de l’hippocampe [Frey et Morris, 1997].1998; Li et al. 2003] et consolidation de la mémoire dépendante de l'hippocampe [O'Carroll, et al. 2006]. Selon le modèle dit de boucle hippocampe-VTA [Lisman and Grace, 2005] les signaux de nouveauté sont générés dans l'hippocampe et sont acheminés vers le SN / VTA par le noyau accumbens et le pallidum ventral [Lisman et Grace, 2005]. Bien que le modèle insiste sur la nouveauté en tant que signal cognitif clé pour moduler la dopamine à partir du SN / VTA, il soulève également la question de savoir comment les facteurs motivationnels régulent l'impact de la nouveauté sur l'activité de l'hippocampe et du SN / VTA. Le but de cette étude est d’aborder cette question du point de vue des propriétés partagées entre la nouveauté et la récompense et leur interaction fonctionnelle.

Si la nouveauté agit comme un signal qui incite l'exploration à récolter des récompenses [Bunzeck et Duzel,2006; Kakade et Dayan, 2002; Wittmann et al. 2008] certaines parties de la boucle SN-VTA / hippocampe ne devraient montrer une réponse préférentielle à la nouveauté que dans un contexte où être nouveau prédit des récompenses, mais pas dans un contexte où être familier prédit une récompense. Dans le même temps, l'amélioration de l'exploration lorsque le fait d'être nouveau est récompensé devrait stimuler les réponses de l'hippocampe aux stimuli familiers présentés dans le même contexte, même si ceux-ci ne prédiraient pas les avantages. En revanche, dans un contexte dans lequel être familier mais non novateur prédit des récompenses, il devrait y avoir une motivation contextuelle moins importante à explorer et, par conséquent, l'activité de l'hippocampe devrait être faible, tant pour le stimulus roman que familier dans ce contexte. Par conséquent, l'hypothèse selon laquelle la nouveauté a une propriété intrinsèque de motiver un comportement exploratoire dans la recherche de récompenses conduit à la prédiction d'une interaction entre le statut de nouveauté et de récompense des stimuli. En conséquence, l’hippocampe répondrait fortement aux stimuli nouveaux et familiers lorsqu’il était nouveau prédit une récompense et faiblement aux stimuli nouveaux et familiers lorsqu’il était familier prédit une récompense.

L’autre possibilité est que la nouveauté et le statut de récompense de l’information soient indépendants. Selon cette possibilité, il ne devrait y avoir aucune interaction fonctionnelle entre la nouveauté et la récompense. En d’autres termes, certaines parties de la boucle hippocampe-SN / VTA n’exprimeraient qu’un effet principal de nouveauté ou de récompense, mais pas d’interaction entre les deux.

Pris ensemble, la manipulation de la contingence entre la nouveauté et les récompenses peut aider à comprendre les mécanismes clés qui induisent les réponses à la nouveauté au sein du système mésolimbique. À cette fin, nous avons développé un paradigme selon lequel le fait de recevoir une récompense monétaire dépendait du statut de nouveauté des images de scènes [Bunzeck, et al.2009]. Ainsi, prendre les bonnes décisions en matière de préférence de récompense (voir Méthodes) n’était possible qu’après avoir correctement distingué des stimuli nouveaux et familiers. Il est important de noter que nous avons évalué la mémoire de reconnaissance un jour après le codage et avons ainsi pu identifier dans quelle mesure les composants de la boucle hippocampe-SN / VTA seraient en corrélation avec l'amélioration de la mémoire à long terme liée à la récompense pour des stimuli nouveaux et familiers.

Matériels et méthodes

Deux expériences ont été réalisées. Alors que la première expérience (Expérience 1) était une expérience comportementale, la deuxième expérience (Expérience 2) impliquait des mesures comportementales et une IRMf.

Sujets

À l'expérience 1, 17 adultes ont participé (13 femmes et 19 hommes; tranche d'âge de 33 à 23.1 ans; moyenne de 4.73, écart-type = 14 ans) et 2 adultes ont participé à l'expérience 19 (34 hommes et 22.4 femmes; tranche d'âge: 3.8 à XNUMX ans ; moyenne = XNUMX ans; ET = XNUMX ans). Tous les sujets étaient en bonne santé, droitiers et avaient une acuité normale ou corrigée à la normale. Aucun des participants n'a rapporté d'antécédents de troubles neurologiques, psychiatriques ou médicaux ou de problèmes médicaux actuels. Toutes les expériences ont été menées avec le consentement éclairé écrit de chaque sujet et conformément à l'autorisation éthique locale (University College London, Royaume-Uni).

Conception expérimentale et tâche

Dans les deux expériences, trois ensembles de (1) une phase de familiarisation suivie par (2) une tâche de jugement de préférence basée sur la mémoire de reconnaissance ont été effectués. Ici, de nouvelles images ont été utilisées pour chaque ensemble, ce qui a abouti à l’utilisation simultanée d’images 120 nouvelles et familières. Les procédures expérimentales étaient identiques pour les deux expériences sauf que l'expérience 120 était réalisée sur un écran d'ordinateur et que l'expérience 1 était réalisée à l'intérieur d'un scanner IRM. (2) Le deuxième jour, les mémoires de reconnaissance de toutes les images présentées ont été testées à l'aide de la procédure «Mémoriser / Savoir» (voir ci-dessous).

(1) Familiarisation: les sujets étaient initialement familiarisés avec un ensemble d'images 40 (images 20 indoor et 20 outdoor). Ici, chaque image a été présentée deux fois dans un ordre aléatoire pour les 1.5 avec un intervalle entre les intersections (ISI) de 3 et les sujets ont indiqué le statut intérieur / extérieur en utilisant leur index de la main droite et leur majeur. (2) Test de la mémoire de reconnaissance: par la suite, les sujets ont exécuté une tâche d’appréciation des préférences basée sur la mémoire de reconnaissance des minutes 9 (session). Cette partie (session) a été subdivisée en deux blocs contenant chacune des images 20 de la phase de familiarisation (appelées «images familières») et des images 20 précédemment non présentées (appelées «images nouvelles»; les sujets pouvaient faire une pause entre deux images 20). blocs). Dans un bloc donné, les nouvelles images sont utilisées comme CS + et les images familières comme CS - ou inversement (Fig..1). Les participants devaient donner à chaque image un jugement de «préférence» en appuyant sur un bouton à deux choix indiquant «Je préfère» ou «Je ne préfère pas» en fonction de l'éventualité entre le statut de nouveauté et la valeur de renforcement. Il est important de noter que les termes “préféré” et “non préféré” se réfèrent à la récompense qui prédit le statut de l'image (en fonction de la contingence contextuelle) plutôt que les propriétés esthétiques de l'image.

Figure 1 

Conception expérimentale.

La contingence a été randomisée et indiquée à l’écran avant chaque passage par «Nouveauté sera récompensée si elle est préférée» (auquel cas les images inédites ont servi de CS + et les images familières sous forme de CS-) ou «La familiarité sera récompensée si elle est préférée» (ici des images familières servaient de CS + et de nouvelles images comme CS−). Seules les réponses correctes «Je préfère» à la suite d’un CS + ont conduit à une victoire de £ 0.50 alors que les réponses «incorrectes» à la suite de CS− ont entraîné une perte de £ -0.10. Les réponses correctes «je ne préfère pas» à la suite de CS- et (incorrect) les réponses «je ne préfère pas» à la suite d'un CS + n'ont entraîné ni victoire ni perte. Les images ont été présentées dans un ordre aléatoire pour les 1 sur un fond gris, suivies par une croix de fixation blanche pour les 2 (ISI = 3). Pour s'assurer que les réponses de récompense neuronale étaient limitées aux images présentées (c'est-à-dire, anticipation de récompense plutôt que résultat), aucun retour d'information n'a été donné essai par essai. Au lieu de cela, les sujets ont été informés de leurs performances globales après chaque session (contenant des blocs 2 avec chaque éventualité). Avant l'expérience, les sujets avaient pour instruction de répondre aussi rapidement et correctement que possible et de ne verser que X% des gains.

Toutes les images ont été mises à l'échelle gris et normalisées à une valeur de gris moyenne de 127 et à un écart-type de 75. Aucune des scènes ne représente des êtres humains ou des parties d’êtres humains, y compris des visages au premier plan.

Séances de formation

Chaque sujet a effectué deux sessions de formation avant l'expérience. Semblable à l'expérience réelle, les deux phases de formation ont commencé par une phase de familiarisation, au cours de laquelle seulement 10 images ont été présentées deux fois dans un ordre aléatoire (durée = 1.5 s; ISI = 3 s) et les sujets ont indiqué leur statut intérieur / extérieur. Comme ce fut le cas pour l'expérience principale, la familiarisation a été suivie d'une tâche de jugement de préférence basée sur la mémoire comprenant des images familières et nouvelles. À des fins de formation, lors de la session de formation 1, une rétroaction a été donnée essai par essai après chaque réponse. Lors de la séance d'entraînement 2, le retour d'information sur les récompenses n'était pas affiché immédiatement après chaque stimulus / réponse. Après chaque session de formation, la récompense financière du sujet (maximum 1 £) a été rapportée au sujet. Dans l'expérience 2, les sujets ont également reçu une brève session de formation contenant 10 images familières et 10 nouvelles images par bloc de contingences de réponse.

Un jour plus tard, les sujets ont effectué un test de mémoire de reconnaissance incidente en suivant la procédure «souvenir / savoir» [Tulving,1985]. Ici, dans un ordre aléatoire, toutes les images 240 déjà vues (60 par condition) ont été présentées avec les nouvelles images de distracteur 60 au centre de l’écran d’un ordinateur. Tâche: le sujet a d’abord pris une décision «ancienne / nouvelle» pour chaque image présentée individuellement à l’aide de son index droit ou de son majeur. À la suite d'une «nouvelle» décision, les sujets ont été invités à indiquer s'ils étaient confiants («certainement nouveaux») ou incertains («deviner»), en utilisant à nouveau l'index et le majeur. Après une décision «ancienne», les sujets ont été invités à indiquer s'ils étaient capables de se souvenir de quelque chose de spécifique sur la scène à l'étude («souvenez-vous de la réponse»), ils ont juste senti qu'ils connaissaient bien la photo sans aucune expérience de mémoire (réponse «connue») ou étaient simplement en train de deviner que la photo était ancienne (réponse «devinez»). Le sujet disposait de 4 pour émettre chacun des deux jugements et il y avait une pause de 15 après chaque image 75.

Méthodes IRMf

Nous avons réalisé une IRMf sur un scanner à résonance magnétique Siemens Allegra 3-Tesla (Siemens, Erlangen, Allemagne) avec imagerie écho-planaire (EPI) en utilisant une bobine émetteur-récepteur en quadrature avec une conception basée sur le principe de «cage à oiseaux». Au cours de la session fonctionnelle, des images pondérées 48 T2 * (séquence EPI; couvrant toute la tête) ont été obtenues volume par contraste avec contraste dépendant du taux d’oxygénation du sang (taille BOLD) (taille de la matrice: 64 × 64; coupes axiales obliques 48 par volume orientées selon le même angle). −30 ° dans l'axe antéro-postérieur; résolution spatiale: 3 × 3 × 3 mm; TR = 3120 ms; TE = 30 ms; Z-shimming moment de gradient de pré-impulsion de PP = 0 mT / m * ms; phase positive la polarité de codage). Le protocole d'acquisition IRMf a été optimisé pour réduire les pertes de sensibilité BOLD induites par la sensibilité dans les régions frontales inférieures et les régions du lobe temporal [Deichmann, et al.2003; Weiskopf et al. 2006]. Pour chaque sujet, les données fonctionnelles ont été acquises au cours de trois sessions de numérisation contenant 180 volumes par session. Six volumes supplémentaires par session ont été acquis au début de chaque série pour permettre une magnétisation en régime permanent et ont ensuite été écartés d'une analyse ultérieure. Des images anatomiques du cerveau de chaque sujet ont été collectées en utilisant le FLASH 3D multi-écho pour cartographier la densité de protons, le T1 et le transfert de magnétisation (MT) à une résolution de 1 mm [Helms, et al. 2009; Weiskopf et Helms, 2008] et par séquences EPI (IR-EPI) préparées avec récupération par inversion pondérée T1 (taille de la matrice: 64 × 64; tranches 64; résolution spatiale: 3 × 3 × 3 mm). En outre, des cartes de terrain individuelles ont été enregistrées en utilisant une séquence FLASH à double écho (taille de la matrice = 64 × 64; coupes 64; résolution spatiale = 3 × 3 × 3 mm; écart court = 1 ms; longueur TE = 10 ms) ; TR = 12.46 ms) pour la correction de distorsion des images EPI acquises [Weiskopf, et al. 2006]. Utilisation de la «boîte à outils FieldMap» [Hutton, et al. 2002, 2004] les cartes de terrain ont été estimées à partir de la différence de phase entre les images acquises au TE court et au TE long.

Les données IRMf ont été prétraitées et analysées statistiquement à l'aide du progiciel SPM5 (Centre Wellcome Trust pour la neuroimagerie, University College London, Royaume-Uni) et de MATLAB 7 (The MathWorks, Inc., Natick, MA). Toutes les images fonctionnelles ont été corrigées pour les artefacts de mouvement par réalignement sur le premier volume; corrigé des distorsions sur la base de la carte de terrain [Hutton, et al.2002]; corrigé pour l'interaction du mouvement et de la distorsion à l'aide de la «boîte à outils Unwarp» [Andersson, et al. 2001; Hutton et al. 2004]; spatialement normalisé sur un gabarit SPM standard pondéré T1 [Ashburner et Friston, 1999] (on a veillé à ce que les régions du cerveau moyen alignées avec le modèle standard en particulier); ré-échantillonné à 2 × 2 × 2 mm; et lissé avec un noyau gaussien demi-maximum 4 mm de pleine largeur. Cette résolution spatiale à échelle précise, associée à un noyau de lissage relativement petit, permet de détecter de petites grappes d'activation, par exemple dans les régions du cerveau moyen et du MTL où des modèles d'activation différentiels (réponses de nouveauté et interactions entre nouveauté et récompense) ) pourrait être situé à proximité [Bunzeck, et al. 2010]. Les données de la série temporelle IRMf ont été filtrées par passe-haut (seuil = 128) et blanchies à l'aide d'un modèle AR (1). Pour chaque sujet, un modèle statistique lié à l'événement a été calculé en créant une «fonction de blocage» pour chaque événement (durée = 0), qui a été convolutionné avec la fonction de réponse hémodynamique canonique combinée à des dérivés de temps et de dispersion [Friston, et al. 1998]. Les conditions modélisées incluaient des réponses nouvelles, récompensées, non récompensées, familièrement récompensées, familières, non récompensées et incorrectes. Pour capturer les artefacts résiduels liés au mouvement, six covariables ont été incluses (les trois translation de corps rigide et les trois rotations résultant du réalignement) en tant que régresseurs sans intérêt. Les effets de conditions spécifiques à une région ont été testés en utilisant des contrastes linéaires pour chaque sujet et chaque condition (analyse de premier niveau). Les images de contraste résultantes ont été entrées dans une analyse à effets aléatoires de second niveau. Ici, les effets hémodynamiques de chaque condition ont été évalués à l'aide d'une analyse de variance 2 × 2 (ANOVA) avec les facteurs «récompense» (récompensant, non récompensant) et «nouveauté» (roman, familier). Ce modèle nous a permis de tester les principaux effets de la nouveauté, les principaux effets de la récompense et l’interaction entre les deux. Tous les contrastes ont été seuillés à P = 0.001 (non corrigé) sauf les analyses de régression (P = 0.005, non corrigé). Les deux seuils relativement libéraux ont été choisis en fonction de nos hypothèses anatomiques a priori précises au sein du système mésolimbique.

La localisation anatomique des activations significatives a été évaluée en référence à l'atlas stéréotaxique standard par superposition des cartes SPM sur l'un des deux modèles de groupe. Un gabarit de groupe pondéré en T1 et en pondération MT a été dérivé de la moyenne des images T1 ou MT normalisées de tous les sujets (résolution spatiale de 1 × 1 × 1 mm). Alors que le modèle T1 permet une localisation anatomique en dehors du mésencéphale sur les images MT, la région SN / VTA peut être distinguée des structures environnantes par une bande lumineuse tandis que le noyau rouge et le pédoncule cérébral adjacents apparaissent sombres [Bunzeck et Duzel,2006; Bunzeck et al. 2007; Eckert et al. 2004].

Notez que nous préférons utiliser le terme SN / VTA et considérons l'activité BOLD de l'ensemble du complexe SN / VTA pour plusieurs raisons [Duzel, et al.2009]. Contrairement aux premières formulations de la VTA en tant qu'entité anatomique, différentes voies de projection dopaminergiques sont dispersées et se chevauchent dans le complexe SN / VTA. En particulier, les neurones dopaminergiques qui se projettent dans les régions limbiques et régulent le comportement motivé par la récompense ne se limitent pas à la VTA, mais sont également distribués à travers le SN (pars compacta) [Gasbarri, et al. 1994, 1997; Ikemoto, 2007; Smith et Kieval, 2000]. Sur le plan fonctionnel, ceci est mis en parallèle avec le fait que chez les humains et les primates, le neurone DA dans le SN et le VTA répondent à la fois à la récompense et à la nouveauté [voir par exemple Ljungberg, et al. 1992 ou Tobler, et al., 2003 pour une description des sites d'enregistrement].

RÉSULTATS

Toutes les analyses (comportementales et IRMf) sont basées sur des essais avec des réponses de préférence correctes.

Experiment 1

Les sujets ont différencié les conditions dans les deux contextes avec une grande précision (Tableau I) et il n'y avait pas de différence statistiquement significative entre les conditions. Temps de réaction (Fig. 2A) ont révélé que les sujets répondaient le plus rapidement à la récompense familière prédisant les stimuli (tous Ps <0.007), mais il n'y avait aucune différence entre les trois autres conditions (roman-récompensé, roman-non-récompensé, familier-non-récompensé; tous P's> 0.05).

Figure 2 

Résultats comportementaux. (A) Temps de réaction. Dans les deux expériences, les RT étaient nettement plus rapides pour les images récompensées habituelles que pour toutes les autres conditions (toutes P <0.01) - comme indiqué par l'astérisque - mais il n'y avait pas d'autre différence ...
Tableau I 

Résultats comportementaux

Performance de la mémoire de reconnaissance - deuxième jour. L'analyse de la mémoire de reconnaissance était basée à la fois sur les occurrences (mémoriser les réponses, connaître les réponses après les images vues précédemment lors du codage) et sur les fausses alarmes ([FA]: mémoriser, connaître les distracteurs). Dans un premier temps, nous avons calculé la proportion de réponses mémorisées et connues pour les anciennes et les nouvelles images (taux de succès et taux FA) en divisant le nombre de résultats (et FA respectivement) par le nombre d'éléments par état. Deuxièmement, des taux de réussite corrigés ont été obtenus pour les réponses de rappel ([Rcorr], rappel du taux de réponse moins rappelez-vous du taux FA) et les réponses-réponses ([Kcorr], taux de réussite connu moins taux de connaître FA) (voir Tableau II). Dans une comparaison planifiée, nous avons évalué l'effet de la récompense sur la mémoire de reconnaissance globale (taux de correspondance corrigé = Rcorr + Kcorr) pour des images nouvelles et familières. Cela a révélé que la récompense avait considérablement amélioré la mémoire globale des images originales par rapport aux images originales non récompensées (P = 0.036), mais il n’ya pas eu d’amélioration de la mémoire globale récompensant les images familières (P > 0.5; Fig. 2). En outre, l'effet de renforcement de la récompense sur la mémoire de reconnaissance pour les nouvelles images était aussi fort pour le souvenir que pour la familiarité, comme le révélait l'analyse de variance (ANOVA; aucune interaction entre le type de récompense et le type de mémoire de reconnaissance [F(1,16) = 2.28, P > 0.15)].

Tableau II 

Mémoire de reconnaissance

Experiment 2

Comme dans l'expérience 1, les sujets ont différencié les conditions dans les deux contextes avec une grande précision et aucune différence significative entre les conditions (Tableau I). Comme dans l'expérience 1, le temps de réaction (Fig. 2A) ont montré que les réponses étaient significativement plus rapides pour les stimuli de récompense familiers (tous P's <0.001) mais il n'y avait aucune différence entre les trois autres conditions (roman-récompensé, roman-non-récompensé, familier-non-récompensé; tous P's> 0.05).

Performance de la mémoire de reconnaissance - deuxième jour. Contrairement à l'expérience 1, la mémoire de reconnaissance pour les nouvelles images récompensées n'a pas été améliorée de manière significative par rapport aux nouvelles images non récompensées (ni la mémoire de reconnaissance globale, ni Rcorr / Kcorr; P > 0.05, Tableau II). De plus, contrairement à Experiment 1, dans Experiment 2, le souvenir des images récompensées familières a été considérablement amélioré par rapport aux images familières non récompensées (P = 0.001, Tableau II) entraînant une amélioration de la mémoire globale (Rcorr + Kcorr) pour les images récompensées familières par rapport aux images non récompensées familières (il n'y avait pas de différence significative entre les taux de connaissance corrigés des images récompensées familières récompensées et non récompensées, P > 0.05). De plus, les données en Tableau II et Figure 2B montre que les performances globales de la mémoire étaient considérablement inférieures dans l’expérience 2 par rapport à l’expérience 1, qui était étayée par une ANOVA à effets mixtes.

Résultats de la mémoire IRM - test de mémoire de reconnaissance basé sur la récompense. Tout d'abord, nous avons analysé les données IRMf à l'aide d'une ANOVA 2 × 2 avec des facteurs «nouveauté» (roman, familier) et «récompense» (récompense, pas de récompense). Nous avons trouvé un effet principal de nouveauté dans le cortex orbitofrontal médial bilatéral et dans le LTM droit, y compris l'hippocampe et le cortex rhinal (Fig. 3; voir le tableau d’informations complémentaires S1 pour une liste complète des structures cérébrales activées). Un effet principal de la récompense a été observé dans les segments bilatéraux caudé, septum / fornix, striatum ventral (ncl. Accumbens), mOFC bilatéral et cortex préfrontal médial (mPFC) (Fig. 4; Tableau d'informations de support S1). Ces deux effets principaux ont été exclusivement masqués par les effets d’interactions (masquage exclusif, P = 0.05, non corrigé) pour identifier uniquement les régions qui ont exprimé des effets principaux en l'absence de toute interaction.

Figure 3 

Résultats IRMf Expérience 2. Un effet principal de la nouveauté a été observé dans l'hippocampe droit (A), le cortex rhinal (B) et l'OFC médial (C). Les cartes d'activation ont été superposées sur un modèle de groupe pondéré T1 (voir Méthodes). Les coordonnées sont indiquées dans l'espace MNI. ...
Figure 4 

Résultats IRMf Expérience 2. Un effet principal de la récompense a été observé dans le striatum, notamment ncl. accumbens (A) et caudé ncl. (C), septum / fornix (B), PFC médial (C) et CFO médial (D). Les cartes d'activation ont été superposées sur un modèle de groupe pondéré T1 ...

Pour tester nos deux prédictions concernant l'hypothèse de bonus d'exploration, nous avons effectué deux analyses supplémentaires. Premièrement, dans les régions du cerveau qui ont montré un effet principal de la récompense que nous avons analysé, lesquelles ont également montré une réponse plus forte des stimuli nouvellement récompensés que des stimuli récompensés (c.-à-d. La conjonction). Cette analyse n'a donné aucun résultat significatif suggérant qu'il n'y avait pas de régions du cerveau où être nouveau conduisait à une réponse de prédiction de récompense plus forte que celle connue. Deuxièmement, nous avons évalué l'interaction (contraste F) entre la nouveauté et la récompense. Une telle interaction a été exprimée dans plusieurs régions du cerveau, y compris l'hippocampe droit, le gyrus frontal inférieur et l'OFC droit (Tableau d'information à l'appui S1, Fig. 5). Plus précisément, l'hippocampe a montré le modèle d'interaction attendu avec des réponses plus élevées pour les stimuli présentés dans le contexte où la nouveauté est récompensée (contraste T). En d’autres termes, l’activité de l’hippocampe était plus élevée pour les nouveaux stimuli récompensés et les stimuli non récompensés (notez que ces deux stimuli étaient présentés dans le même contexte) que pour les nouveaux même contexte). La comparaison post-hoc planifiée a confirmé des différences statistiquement significatives entre nouveautés récompensées et nouveautés non récompensées (P <0.025) et familier récompensé vs familier non récompensé (P <0.01; Fig. 5).

Figure 5 

Résultats IRMf Expérience 2. Une interaction entre la nouveauté et la récompense a été observée au sein de l'hippocampe et de l'OFC. Au sein de l'hippocampe, les réponses aux objets familiers non récompensés ont été améliorées par rapport aux objets familiers récompensées si elles étaient présentées dans leur contexte. ...

Il convient de noter que le modèle d’activation de l’interaction entre nouveauté et récompense (36, −14, −16; Fig. 5) est adjacente mais non identique à l'activation d'un effet principal de nouveauté, qui se trouve également dans l'hippocampe droit (28, −14, −20; Fig. 3). Ce modèle d'activation différentiel correspond à nos hypothèses, les enregistrements de cellules chez l'animal et les études IRMf humaines. Par exemple, les recherches sur les animaux ont montré que différents neurones de l'hippocampe peuvent répondre à différentes caractéristiques (telles que la nouveauté ou la familiarité) au sein d'une même tâche [Brown et Xiang,1998]. En accord avec ces observations, nous avons montré chez l’homme que des activations hippocampiques spatialement distinctes peuvent refléter les propriétés différentielles du traitement de la nouveauté, des signaux de nouveauté absolus, des signaux de nouveauté à échelle adaptative et des erreurs de prédiction de nouveauté ([Bunzeck, et al. 2010], Informations de support Fig. S4). Johnson et al. (2008) ont signalé que des groupes d'activation très proches sur le plan spatial présentaient des réponses très différentes à la nouveauté: un groupe indiquait une différence catégorique entre les nouveaux et les anciens éléments, tandis que l'autre regroupait une diminution linéaire de la réponse en fonction de la familiarité accrue avec les stimuli. Cependant, pour exclure davantage la possibilité d'un résultat faussement positif, nous avons appliqué une correction de faible volume aux deux modèles d'activation en utilisant l'hippocampe antérieur droit comme volume. L'analyse a atteint une signification statistique (P ≤ 0.05; FWE corrigé).

Enfin, nous avons cherché à relier l’amélioration de la mémoire liée aux récompenses aux schémas régionaux d’activité du cerveau en utilisant des analyses de régression (toutes les analyses ont été réalisées à partir de données de l’expérience 2). Premièrement, le roman de contraste récompensé par rapport aux images non récompensées a été entré dans une analyse de régression simple de second niveau utilisant l'amélioration de la mémoire individuelle par récompense en tant que régresseur (Δ taux de réussite corrigé = taux de réussite corrigé [Rcorr + Fcorr] pour roman-récompensé - taux de réussite corrigé pour le roman non récompensé). Cette analyse était motivée par notre observation initiale d'amélioration de la mémoire globale (c.-à-d. Le souvenir et la familiarité) d'images originales par récompense (Experiment 1) et de résultats antérieurs similaires [Adcock, et al.2006; Krebs et al. 2009; Wittmann et al. 2005]. Ceci a révélé une corrélation positive significative entre les réponses hémodynamiques (HR) et l’amélioration de la mémoire de reconnaissance au sein du SN / VTA, du MTL antérieur droit (jonction de l’hippocampe / amygdale du cortex rhinal) et du striatum ventral droit (Fig. 6, Tableau d’informations complémentaires S1 pour toutes les régions activées). Dans une seconde analyse de régression, le même contraste pour les images familières (récompenses familières vs non récompenses connues) a été corrélé avec le taux de souvenir amélioré individuel (comportementalement, le taux de souvenir a été significativement amélioré pour les images récompensées familières par rapport aux images non récompensées, mais aucune amélioration de Fcorr). Étant donné que les RT pour les images récompensées familières étaient nettement plus rapides que pour les images familières non récompensées, la différence entre les deux pour chaque sujet était également entrée comme régresseur. Ici, nous ne nous sommes intéressés qu'aux régions présentant une corrélation positive significative entre les différences de ressources humaines (récompensé familier vs familier non récompensé) et un taux de souvenir accru (familier récompensé vs familier non récompensé), mais pas à celles présentant également une corrélation avec RT amélioration. Cette analyse a révélé des effets similaires à ceux de la première analyse de régression, à savoir une corrélation significative entre la FC et l’amélioration du taux de souvenir liée au rendement dans le striatum ventral (à gauche), l’hippocampe droit et le cortex rhinal gauche (Fig. 7, Supporting Information Table S1), mais pas de corrélation dans le SN / VTA. Une analyse post hoc statistiquement plus sensible du voxel SN / VTA [4, −18, −16] qui a montré une corrélation significative pour les nouvelles images n'a également révélé aucune corrélation entre les réponses hémodynamiques et le taux de rappel amélioré pour les images familières (r = −0.07, P = 0.811).

Figure 6 

Résultats IRMf Expérience 2 – analyse de régression. Une corrélation significative entre l’amélioration de la mémoire de reconnaissance pour les nouvelles images récompensées par rapport aux images non récompensées (taux de réussite corrigé Δ) et les différences de réponse hémodynamique entre les nouvelles images. ...
Figure 7 

Résultats IRMf Expérience 2 – analyse de régression. Une corrélation significative entre l’amélioration du taux de souvenir pour les images récompensées familières par rapport aux images non récompensées (taux de souvenir Δ) et les différences de réponse hémodynamique entre ...

DISCUSSION

Notre découverte qu’un groupe de voxels dans le LTM (comprenant l’hippocampe et le cortex rhinal) a montré un effet principal de la nouveauté mais pas un effet principal de la récompense (Fig. 3A, B), soutient l’idée que l’hippocampe et le cortex rhinal peuvent signaler une nouveauté indépendante de la valeur de récompense. Cette découverte s’accorde avec un large éventail d’études animales et humaines suggérant que l’hippocampe et le cortex rhinal sont sensibles à la nouveauté [Brown et Xiang,1998; Dolan et Fletcher, 1997; Chevalier, 1996; Lisman et Grace, 2005; Étrange, et al. 1999; Yamaguchi et al. 2004]. Cependant, une autre région de l'hippocampe a également montré l'interaction supposée de la nouveauté et de la récompense (Fig. 5) avec des réponses hémodynamiques considérablement améliorées à des images familières non récompensées si elles sont présentées dans un contexte où la nouveauté est récompensée.

Cette interaction de nouveauté et de récompense dans l'hippocampe fournit la preuve de notre deuxième prédiction d'un effet de contexte conformément au cadre des primes d'exploration (voir [Sutton et Barto,1981] pour une description formelle du bonus d'exploration dans le dilemme exploration-exploitation). Basé sur la notion que la nouveauté peut agir comme un bonus d’exploration contre récompense [Kakade et Dayan, 2002] nous avons prédit que, dans un contexte où la nouveauté est récompensée, l'exploration des stimuli familiers devrait également être renforcée (même s'ils ne sont pas récompensés). Compatibles avec cette possibilité, les stimuli familiers ont provoqué une activité hippocampique plus intense dans un contexte où la disponibilité de la récompense était signalée par son caractère nouveau par rapport à un contexte dans lequel la récompense était signalée par sa familiarité. Cette activation neuronale améliorée de manière contextuelle au sein de l'hippocampe lors de l'encodage ne s'est toutefois pas traduite directement en mémoire à long terme, c'est-à-dire en une meilleure mémoire pour les éléments familiers lorsqu'elle est présentée dans le contexte de nouveaux éléments prédictifs de récompense. La performance de reconnaissance dépendait plutôt de la récompense qui prédisait le statut d'un objet pour des stimuli nouveaux (Experiment 1) et familiers (Experiment 2) (voir ci-dessous). Cela suggère que, dans un contexte expérimental dans lequel la prédiction de la récompense et la nouveauté contextuelle peuvent influencer l'apprentissage, la prédiction de la récompense peut exercer l'influence de la dominance.

Une autre prédiction concernant le cadre de bonus d'exploration n'a pas été confirmée. Nous n'avons trouvé aucune région cérébrale présentant un effet principal de récompense et une activité significativement plus forte pour les images novatrices récompensées que les images récompensées habituelles. À première vue, cette conclusion négative semble contredire les études précédentes [Krebs, et al.2009; Wittmann et al. 2008]. Cependant, dans les deux cas, Krebs et al. [ 2009] et Wittmann et al. [ 2008] étude, une prédiction de récompense améliorée pour de nouveaux stimuli a été trouvée dans des conditions où le statut de nouveauté des stimuli était implicite et où les participants assistaient pour récompenser les imprévus. En fait, Krebs et al. ont signalé que cette amélioration était absente lorsque les participants se préoccupaient du statut de nouveauté des stimuli plutôt que de récompenser les imprévus (à noter toutefois que, dans Krebs et al., le statut de nouveauté en soi n'était pas prédictif de la récompense). Ainsi, contrairement à l’interaction contextuelle entre la nouveauté et la récompense (Fig. 5), cet aspect du bonus d’exploration peut être fortement dépendant de la tâche et ne doit se produire que lorsque les sujets peuvent assister aux récompenses sans avoir à évaluer la nouveauté. Il a été suggéré sur la base d’études sur des rongeurs que les intrants préfrontaux et hippocampiques se font concurrence pour le contrôle du noyau accumbens (une partie du striatum ventral) [Goto and Grace, 2008]. Il est plausible que l'attention portée à la nouveauté ou à la récompense liée à la tâche affecte une telle compétition.

Notes de mémoire de reconnaissance de Experiment 1 (Fig. 2) étaient bien compatibles avec le cadre de bonus d’exploration en montrant une amélioration comportementale liée à la récompense des performances de la mémoire à long terme pour des stimuli nouveaux mais pas pour des stimuli familiers. Cependant, les résultats comportementaux obtenus dans des conditions où l'encodage se produisait dans le scanner IRMf (Experiment 2) étaient différents en ce que la mémoire des stimuli familiers montrait une amélioration par récompense (pour des stimuli nouveaux, cette amélioration n'atteignait pas la signification). Une des raisons de cette divergence est peut-être que dans l'expérience 1, le contexte d'encodage et le contexte d'extraction du lendemain étaient identiques (les sujets ont été appris et ont été testés dans la même pièce), alors qu'ils étaient différents (les sujets encodés dans l'IRMf et l'IRMF). ont été testés dans une salle d’essai). Il est bien connu que les changements entre les contextes d’encodage et de récupération peuvent avoir une profonde influence sur les performances de la mémoire [Godden et Baddeley,1975]. Compatible avec cette possibilité, les performances de la mémoire étaient considérablement inférieures dans Experiment 2 par rapport à Experiment 1 (Fig. 2). De tels effets de contexte peuvent également avoir entraîné une divergence dans les modèles de comportement observés dans les expériences 1 et 2.

Le striatum ventral (Fig. 4A) et du cortex préfrontal médial (Fig. 4 C, D) a exprimé les principaux effets de la valeur de la récompense attendue. Dans notre tâche, la prévision des récompenses dépend de la discrimination explicite de la nouveauté et il est donc évident que les régions exprimant la valeur de la récompense attendue (striatum ventral, septum / fornix) nécessitent un accès à des informations sur la mémoire pour l'image présentée. Une origine probable de ces informations de mémoire déclarative est le MTL. En fait, l'hippocampe et le cortex rhinal, faisant partie du LTM, exprimaient non seulement l'effet principal de la nouveauté, mais ils sont également bien connus pour envoyer des efférents au striatum ventral et au cortex préfrontal médial (notez que la projection du cortex rhinal vers les NAcc proviennent principalement du cortex entorhinal [Friedman, et al.2002; Selden et al. 1998; Thierry et al. 2000]). Les mécanismes précis et les processus de calcul, cependant, qui peuvent être impliqués dans la traduction de la nouveauté en réponses de récompense, ne sont pas clairs. Cela implique peut-être le cortex préfrontal médian (y compris les parties orbitales) qui, conformément aux études précédentes [O'Doherty, et al. 2004; Ranganath et Rainer, 2003] –Exprimé l'activation liée à la nouveauté et à la récompense (Fig. 3C et 4C, D).

Les implications fonctionnelles de nos résultats concernant la représentation des réponses de nouveauté et de récompense dans l'hippocampe, le SN / VTA, le striatum ventral et le PFC médial sont résumées dans Figure8. Pour étayer ce modèle, nous avons calculé une corrélation entre l’activation de nos régions d’intérêt, en utilisant une analyse de corrélation de Spearman pour chaque sujet de la série temporelle déconvolutionnée, afin de fournir un coefficient de corrélation de groupe R et un P-valeur.

Figure 8 

Illustration schématique de la relation fonctionnelle entre l'hippocampe, Nucleus accumbens (NAcc), le cortex préfrontal médial (CPFm) et la substantia nigra / région tegmentale ventrale (SN / VTA). Pour soutenir ce modèle, nous avons calculé une corrélation entre ...

Comme la récompense dépendait de la nouveauté et que la seule région qui représentait les deux types de signaux était le mPFC, cette région sera probablement la source de la signalisation de récompense basée sur la nouveauté (R = 0.09; P <0.001). L'hippocampe, en revanche, est très probablement la source du signal de nouveauté pour le mPFC (R = 0.11; P <0.001). Ceci est plausible étant donné qu'il existe des projections directes de l'hippocampe vers le mPFC [Ferino, et al.1987; Rosene et Van Hoesen, 1977]. Il est également plausible que le signal de récompense mPFC soit ensuite transmis au NAcc (R = 0.09; P <0.001) et le SN / VTA (R = 0.03; P = 0.08). Il convient de noter que le signal SN / VTA n’est corrélé qu’avec le mPFC sensible à la nouveauté (R = 0.03; P = 0.08), mais pas le CPF sensible à la récompense (R = 0.007; P > 0.6). Cela suggère que les entrées mOFC vers le SN / VTA pourraient provenir plus fortement de ces régions mPFC associées au traitement de nouveauté plutôt que de traitement de récompense. Notre observation selon laquelle le mPFC répond à la nouveauté et est en corrélation avec le signal SN / VTA est également compatible avec la suggestion [Lisman et Grace, 2005] que le PFC est une source de signal de nouveauté dans les circuits dopaminergiques. Le rôle du NAcc dans la signalisation de nouveauté reste toutefois incertain [Duzel et al. 2009]. En d’autres termes, bien que nous n’ayons pas observé de signaux de nouveauté au sein du NAcc, il existait une forte corrélation entre les signaux des régions mOFC sensibles au NAcc et sensibles à la nouveauté (R = 0.09; P <0.001), NAcc et régions de l'hippocampe sensibles à la nouveauté (R = 0.15; P <0.001), et les NAcc et SN / VTA (R = 0.19; P <0.001). Enfin, il convient de noter que les flèches de notre modèle indiquent une directionnalité supposée sur la base de projections connues plutôt que d'une causalité estimée quantitativement.

L’amélioration liée à la récompense de la mémoire de reconnaissance a été corrélée avec l’activation du striatum ventral, du SN / VTA et du MTL (Fig. 6) Un aspect important de l’apprentissage et de la plasticité de l’hippocampe est une exigence de la DA dans l’expression de la LTP en phase tardive (potentialisation à long terme), mais pas de la LTP en phase précoce [Frey and Morris,1998; Frey et al. 1990; Huang et Kandel 1995; Geai 2003; Morris 2006]. Cela soutient l'idée que l'AD est nécessaire pour la consolidation de la mémoire à long terme, ce qui est soutenu par des données comportementales récentes chez les rongeurs [O'Carroll, et al. 2006]. Nos données sont compatibles avec cette vue en montrant une corrélation entre l'amélioration de la mémoire à long terme grâce à une récompense un jour après le codage et l'activation dans les régions dopaminergiques putatives et l'hippocampe. En particulier, nous constatons une corrélation entre les éléments nouveaux récompensés et non récompensés dans SN / VTA, le striatum ventral et l'hippocampe, ainsi qu'une corrélation entre les éléments récompensés familiers et non récompensés dans le striatum et l'hippocampe ventral. Étant donné que le striatum ventral est une structure de sortie principale du cerveau moyen dopaminergique (SN / VTA) [Fields, et al. 2007] nos résultats suggèrent que la capacité à observer une amélioration de la mémoire à long terme liée à la récompense par le biais du SN-VTA / VTA de l'hippocampe ne se limite pas à de nouveaux stimuli, mais s'applique également à des stimuli familiers. En fait, il est probable que le degré de familiarité parmi la classe de stimuli familiers (au cours du codage) a été assez variable et que les stimuli dont le codage a le plus profité de la récompense étaient les moins familiers (relativement les plus novateurs). Par conséquent, il est raisonnable de supposer que les corrélations pour les nouvelles classes de stimulus et les classes de stimulus familières étaient dictées par les mêmes mécanismes.

Nous avons également observé un effet principal de récompense sur le septum / fornix (Fig. 4B), une région susceptible de contenir des neurones cholinergiques se projetant dans les structures temporales médianes. Fait intéressant, des études chez l'animal ont montré que, tout comme les neurones DA, les neurones cholinergiques (dans le cerveau antérieur basal) répondent à la nouveauté et s'habituent lorsque les stimuli deviennent familiers [Wilson and Rolls,1990b]. Cependant, dans les tâches dans lesquelles des stimuli familiers prédisent la récompense, l'activité des neurones basaux du cerveau antérieur reflète la prédiction de la récompense plutôt que le statut de nouveauté [Wilson and Rolls, 1990]. Nos découvertes (Fig. 4B) sont compatibles avec l'observation de Wilson et Rolls (1990) bien que nous ne puissions pas dire dans quelle mesure ces activations impliquent réellement des réponses de neurones cholinergiques.

Pris ensemble, nous reproduisons des observations récentes selon lesquelles l'activité du striatum ventral, du SN / VTA, de l'hippocampe et du cortex rhinal était corrélée à une amélioration de la mémoire liée à la récompense compatible avec la boucle hippocampe-SN / VTA. Fait important, nos résultats fournissent de nouvelles informations clés sur les propriétés fonctionnelles des composants de cette boucle. Dans une tâche dans laquelle le statut de nouveauté d'un élément prédit la récompense, l'hippocampe a exprimé de manière préférentielle le statut de nouveauté, tandis que l'activité striatum ventrale reflétait la valeur de la récompense indépendamment du statut de nouveauté. Le PFC médian (y compris les parties orbitales) était probablement le site où les signaux de nouveauté et de récompense étaient intégrés car il exprimait à la fois les effets de nouveauté et de récompense et était connu pour être connecté à l'hippocampe et au striatum ventral. Enfin, conformément à la théorie des bonus d’exploration [Kakade et Dayan,2002] nouvelle récompense prédictive de stimuli exerçant des effets renforçant contextuellement des éléments familiers (non enrichissants), exprimés sous forme de réponses neuronales améliorées au sein de l'hippocampe.

Remerciements

Nous remercions K. Herriot pour son soutien dans l’acquisition de données.

Des informations complémentaires sont disponibles dans la version en ligne de cet article.

Références

  • Adcock RA, Thangavel A, S Whitfield-Gabrieli, Knutson B, Gabrieli JD. Apprentissage motivé par une récompense: l'activation mésolimbique précède la formation de la mémoire. Neurone. 2006; 50: 507 – 517. [PubMed]
  • Andersson JL, Hutton C, Ashburner J, Turner R, Friston K. Modélisation des déformations géométriques dans les séries chronologiques EPI. Neuroimage. 2001; 13: 903 – 919. [PubMed]
  • Ashburner J, KJ Friston. Normalisation spatiale non linéaire à l'aide de fonctions de base. Hum Brain Mapp. 1999; 7: 254 – 266. [PubMed]
  • Berridge KC. Le débat sur le rôle de la dopamine dans la récompense: les arguments en faveur de la saillance des incitations. Psychopharmacology (Berl) 2007; 191: 391–431. [PubMed]
  • Brown MW, Xiang JZ. Mémoire de reconnaissance: substrats neuronaux du jugement de l'occurrence antérieure. Prog Neurobiol. 1998; 55: 149 – 189. [PubMed]
  • Bunzeck N, Duzel E. Codage absolu de la nouveauté du stimulus chez la substance humaine noire / VTA. Neurone. 2006; 51: 369 – 379. [PubMed]
  • Bunzeck N, H Schutze, S Stallforth, J Kaufmann, S Duzel, HJ Heinze, Duzel E. traitement de nouveauté mésolimbique chez les personnes âgées. Cereb Cortex. 2007; 17: 2940 – 2948. [PubMed]
  • Bunzeck N, Doeller CF, Fuentemilla L, Dolan RJ, Duzel E. La motivation des récompenses accélère l'apparition des signaux de nouveauté neurale chez l'homme en millisecondes 85. Curr Biol. 2009; 19: 1294 – 1300. [Article gratuit PMC] [PubMed]
  • Bunzeck N, Dayan P, Dolan RJ, Duzel E. Un mécanisme commun pour la mise à l'échelle adaptative de la récompense et de la nouveauté. Hum Brain Mapp. 2010; 31: 1380 – 1394. [Article gratuit PMC] [PubMed]
  • Deichmann R, Juge Gottfried, C Hutton et Turner R., EPI optimisé pour les études IRMf du cortex orbitofrontal. Neuroimage. 2003; 19 (2 Pt 1): 430 – 441. [PubMed]
  • Devenport LD, Juge Devenport, FA Holloway. Stéréotypie induite par la récompense: Modulation par l'hippocampe. Science. 1981; 212: 1288 – 1289. [PubMed]
  • Dolan RJ, PC Fletcher. Dissociation de la fonction préfrontale et de l'hippocampe dans le codage en mémoire épisodique. La nature. 1997; 388: 582 – 585. [PubMed]
  • Duzel E, Bunzeck N, Guitart-Masip M, Wittmann B, Schott BH, Tobler PN. Imagerie fonctionnelle du cerveau moyen dopaminergique humain. Tendances Neurosci. 2009; 32: 321 – 328. [PubMed]
  • Eckert T, Sailer M, Kaufmann J, Schrader C, Peschel T, Bodammer N, Heinze HJ, Schoenfeld MA. Différenciation de la maladie de Parkinson idiopathique, de l'atrophie multisystémique, de la paralysie supranucléaire progressive et des contrôles sains à l'aide de l'imagerie par transfert de magnétisation. Neuroimage. 2004; 21: 229-235. [PubMed]
  • Ferino F, Thierry AM, Glowinski J. Preuve anatomique et électrophysiologique d'une projection directe de la corne d'Ammon vers le cortex préfrontal médian chez le rat. Exp Brain Res. 1987; 65: 421–426. [PubMed]
  • Champs HL, GO Hjelmstad, EB Margolis, Nicola SM. Zone neuronale ventrale des neurones dans le comportement d'appétit appris et le renforcement positif. Annu Rev Neurosci. 2007; 30: 289 – 316. [PubMed]
  • Frey U, Morris RG. Marquage synaptique: implications pour le maintien tardif de la potentialisation à long terme de l'hippocampe. Tendances Neurosci. 1998; 21: 181 – 188. [PubMed]
  • Frey U, Schroeder H, Matthies H. Les antagonistes dopaminergiques empêchent le maintien à long terme de la PLT post-tétanique dans la région CA1 des tranches d'hippocampe de rat. Brain Res. 1990; 522: 69 – 75. [PubMed]
  • Friedman DP, Aggleton JP, Saunders RC. Comparaison des projections de l'hippocampe, de l'amygdale et du périrhinal avec le noyau accumbens: étude combinée du traçage antérograde et rétrograde dans le cerveau de macaque. J Comp Neurol. 2002; 450: 345 – 365. [PubMed]
  • Friston KJ, Fletcher P, Josephs O, Holmes A, Rugg MD, Turner R. IRMf événementiel: caractérisation des réponses différentielles. Neuroimage. 1998; 7: 30 – 40. [PubMed]
  • Gasbarri A, Packard MG, Campana E, Pacitti C. Traçage antérograde et rétrograde des projections de la région tegmentale ventrale à la formation de l'hippocampe chez le rat. Cerveau Res Bull. 1994; 33: 445 – 452. [PubMed]
  • Gasbarri A, Sulli A, Packard MG. Les projections mésencéphaliques dopaminergiques à la formation de l'hippocampe chez le rat. Prog Neuropsychopharmacol Biol Psychiatry. 1997; 21: 1 – 22. [PubMed]
  • Godden DR, Baddeley AD. Mémoire dépendant du contexte dans deux environnements naturels: terrestre et sous-marin. British Journal of Psychology. 1975; 66: 325 – 331.
  • Allez à Y, Grace AA. Traitement de l'information limbique et corticale dans le noyau accumbens. Tendances Neurosci. 2008; 31: 552 – 558. [Article gratuit PMC] [PubMed]
  • Helms G, Draganski B, R Frackowiak, Ashburner J, Weiskopf N. Amélioration de la segmentation des structures de la matière grise cérébrale profonde à l'aide de cartes de paramètres de transfert de magnétisation (MT). Neuroimage. 2009; 47: 194 – 198. [Article gratuit PMC] [PubMed]
  • Holscher C, Jacob W., Mallot HA. La récompense module l'activité neuronale dans l'hippocampe du rat. Behav Brain Res. 2003; 142: 181 – 191. [PubMed]
  • Huang YY, Kandel ER. Les agonistes des récepteurs D1 / D5 induisent une potentialisation tardive dépendante de la synthèse des protéines dans la région CA1 de l'hippocampe. Proc Natl Acad Sci US A. 1995; 92: 2446 – 2450. [Article gratuit PMC] [PubMed]
  • Hutton C, A Bork, O Josephs, R Deichmann, J Ashburner, Turner R. Correction de distorsion de l'image dans IRMf: Une évaluation quantitative. Neuroimage. 2002; 16: 217 – 240. [PubMed]
  • Hutton C, R Deichmann, R Turner, Andersson JL. 2004. Correction combinée de la distorsion géométrique et de son interaction avec le mouvement de la tête en IRMf; Actes de ISMRM 12, Kyoto, Japon.
  • Circuit de récompense de la dopamine Ikemoto S.: Deux systèmes de projection du cerveau moyen ventral au complexe noyau accumbens-olfactif. Brain Res Rev. 2007; 56: 27 – 78. [Article gratuit PMC] [PubMed]
  • Jay TM. La dopamine: un substrat potentiel pour la plasticité synaptique et les mécanismes de la mémoire. Prog Neurobiol. 2003; 69: 375 – 390. [PubMed]
  • Johnson JD, Muftuler LT, Rugg MD. Les répétitions multiples révèlent des modèles d'activité hippocampale distincts sur le plan fonctionnel et anatomique au cours de la mémoire de reconnaissance continue. Hippocampe 2008; 18: 975 – 980. [Article gratuit PMC] [PubMed]
  • Kakade S, Dayan P. Dopamine: Généralisation et bonus. Neural Netw. 2002; 15: 549 – 559. [PubMed]
  • Knight R. Contribution de la région de l'hippocampe humain à la détection des nouveautés. La nature. 1996; 383: 256 – 259. [PubMed]
  • Knutson B, Cooper JC. Imagerie par résonance magnétique fonctionnelle de la prévision de la récompense. Curr Opin Neurol. 2005; 18: 411 – 417. [PubMed]
  • Krebs RM, Schott BH, Schutze H, Duzel E. Le bonus à l'exploration de nouveauté et sa modulation attentionnelle. Neuropsychologia. 2009; 47: 2272 – 2281. [PubMed]
  • Li S, WK Cullen, R Anwyl, MJ Rowan. Facilitation dépendante de la dopamine de l'induction de la PLT dans CA1 de l'hippocampe par l'exposition à la nouveauté spatiale. Nat Neurosci. 2003; 6: 526 – 531. [PubMed]
  • Lisman JE, Grace AA. La boucle Hippocampal-VTA: contrôler l’entrée des informations dans la mémoire à long terme. Neurone. 2005; 46: 703 – 713. [PubMed]
  • Ljungberg T, Apicella P, Schultz W. Réponses de neurones dopaminergiques de singe lors de l'apprentissage de réactions comportementales. J Neurophysiol. 1992; 67: 145 – 163. [PubMed]
  • Mesulam MM. De la sensation à la cognition. Cerveau. 1998; 121 (Pt 6): 1013 – 1052. [PubMed]
  • Morris RG. Eléments d'une théorie neurobiologique de la fonction hippocampique: rôle de la plasticité synaptique, du marquage synaptique et des schémas. Eur J Neurosci. 2006; 23: 2829 – 2846. [PubMed]
  • Niv Y, ND ND, Joël D, Dayan P. Dopamine tonique: coûts d'opportunité et contrôle de la vigueur de la réponse. Psychopharmacologie (Berl) 2007; 191: 507 – 520. [PubMed]
  • O'Carroll CM, Martin SJ, Sandin J, Frenguelli B, Morris RG. Modulation dopaminergique de la persistance de la mémoire dépendante de l'hippocampe à un essai. Apprenez Mem. 2006; 13: 760–769. [Article gratuit PMC] [PubMed]
  • O'Doherty JP, Deichmann R, Critchley HD, Dolan RJ. Les réponses neuronales lors de l'anticipation d'une récompense gustative primaire. Neurone. 2002; 33: 815 – 826. [PubMed]
  • O'Doherty J, Dayan P, J Schultz, R Deichmann, K Friston, Dolan RJ. Rôles dissociables du striatum ventral et dorsal dans le conditionnement instrumental. Science. 2004; 304: 452 – 454. [PubMed]
  • Ploghaus A, Tracey I, Clare S, Gati JS, Rawlins JN, Matthews PM. En savoir plus sur la douleur: Le substrat neural de l'erreur de prédiction pour les événements aversifs. Proc Natl Acad Sci US A. 2000; 97: 9281 – 9286. [Article gratuit PMC] [PubMed]
  • Purves D, Bonardi C, Hall G. Amélioration de l'inhibition latente chez le rat présentant des lésions électrolytiques de l'hippocampe. Behav Neurosci. 1995; 109: 366 – 370. [PubMed]
  • Ranganath C, Rainer G. Mécanismes neuronaux de détection et de mémorisation d'événements nouveaux. Nat Rev Neurosci. 2003; 4: 193 – 202. [PubMed]
  • Rolls ET, Xiang JZ. Représentations spatiales de récompense et d'apprentissage dans l'hippocampe de primate. J Neurosci. 2005; 25: 6167 – 6174. [PubMed]
  • Rosene DL, Van Hoesen GW. Les efférents de l'hippocampe atteignent des zones étendues du cortex cérébral et de l'amygdale chez le singe rhésus. Science. 1977; 198: 315 – 317. [PubMed]
  • Selden NR, Gitelman DR, Salamon-Murayama N, TB de Parrish, Mesulam MM. Trajectoires des voies cholinergiques dans les hémisphères cérébraux du cerveau humain. Cerveau. 1998; 121 (Pt 12): 2249 – 2257. [PubMed]
  • Smith Y, JZ Kieval. Anatomie du système dopaminergique dans les noyaux gris centraux. Tendances Neurosci. 2000; 23 (Supplément 10): S28 – S33. [PubMed]
  • Sokolov EN. Fonctions nerveuses supérieures; le réflexe d'orientation. Annu Rev Physiol. 1963; 25: 545 – 580. [PubMed]
  • Solomon PR, Vander Schaaf ER, Thompson RF, Weisz DJ. Hippocampe et conditionnement des traces de la réponse membranaire nictitante classiquement conditionnée du lapin. Behav Neurosci. 1986; 100: 729–744. [PubMed]
  • Etrange BA, PC Fletcher, RN Henson, KJ Friston, RJ Dolan. Séparer les fonctions de l'hippocampe humain. Proc Natl Acad Sci US A. 1999; 96: 4034 – 4039. [Article gratuit PMC] [PubMed]
  • Sutton RS, Barto AG. Vers une théorie moderne des réseaux adaptatifs: attente et prédiction. Psychol Rev. 1981; 88: 135 – 170. [PubMed]
  • Tabuchi ET, AB Mulder, Wiener SI. Modulation de position et de comportement de la synchronisation des décharges neuronales de l'hippocampe et d'accumbens chez des rats en mouvement libre. Hippocampe 2000; 10: 717 – 728. [PubMed]
  • Thierry AM, Y Gioanni, E. Degenetais, voie du cortex préfrontal Hippocampo J. J.: Caractéristiques anatomiques et électrophysiologiques. Hippocampe 2000; 10: 411 – 419. [PubMed]
  • Tulving E. Mémoire et conscience. Psychologie canadienne. 1985; 26: 1 – 12.
  • Weiner I. Le modèle d'inhibition latente «à deux têtes» de la schizophrénie: modélisation des symptômes positifs et négatifs et de leur traitement. Psychopharmacologie (Berl) 2003; 169 (3 – 4): 257 – 297. [PubMed]
  • Weiskopf N, Helms G. Cartographie multi-paramètres du cerveau humain à la résolution 1mm en moins de 20 minutes. ISMRM 16, Toronto, Canada: 2008.
  • Weiskopf N, C Hutton, O Josephs, R. Deichmann. Paramètres EPI optimaux pour la réduction des pertes de sensibilité BOLD induites par la susceptibilité: Une analyse du cerveau entier à 3 T et 1.5 T. Neuroimage. 2006; 33: 493 – 504. [PubMed]
  • Wilson FA, Rolls ET. L'apprentissage et la mémoire se reflètent dans les réponses des neurones liés au renforcement dans le cerveau antérieur basal des primates. J Neurosci. 1990a; 10: 1254 – 1267. [PubMed]
  • Wilson FA, Rolls ET. Les réponses neuronales liées à la nouveauté et à la familiarité des stimuli visuels dans la substantia innominata, la bande diagonale de Broca et la région périventriculaire du cerveau antérieur basal des primates. Exp Brain Res. 1990b; 80: 104 – 120. [PubMed]
  • Wirth S, E Avsar, CC Chiu, Sharma V, AC Smith, AC Brown, Suzuki WA. Résultats de l'essai et signaux d'apprentissage associatif dans l'hippocampe du singe. Neurone. 2009; 61: 930 – 940. [Article gratuit PMC] [PubMed]
  • Wittmann BC, Schott BH, Guderian S, JU Frey, Heinze HJ, Duzel E. L'activation FMRI du cerveau moyen dopaminergique liée à la récompense est associée à une formation accrue de la mémoire à long terme dépendante de l'hippocampe. Neurone. 2005; 45: 459 – 467. [PubMed]
  • Wittmann BC, Bunzeck N, Dolan RJ, Duzel E. L'anticipation de la nouveauté recrute le système de récompense et l'hippocampe tout en favorisant le souvenir. Neuroimage. 2007; 38: 194 – 202. [Article gratuit PMC] [PubMed]
  • Wittmann BC, Daw ND, Seymour B, Dolan RJ. L'activité striatale est à la base du choix fondé sur la nouveauté chez l'homme. Neurone. 2008; 58: 967 – 973. [Article gratuit PMC] [PubMed]
  • Yamaguchi S, Hale LA, D'Esposito M, Knight RT. Habituation préfrontal-hippocampique rapide à de nouveaux événements. J Neurosci. 2004; 24: 5356-5363. [PubMed]