Sensitiwiteit van die kern sluit aan by oortredings in verwagting van beloning (2007)

Neuro Image. 2007 Jan 1;34(1):455-61. Epub 2006 17 Okt.

Spicer J, Galvan A, Hare TA, Voss H, Glover G, Casey B.

Bron

Die Sackler Institute for Developmental Psychobiology, Weill Cornell Medical College van Cornell University, 1300 York Avenue, Box 140, New York, NY 10021, VSA.

Abstract

Hierdie studie het ondersoek of ventrale frontostriatale streke differensieel kodeer vir verwagte en onverwagte beloningsuitkomste. Ons het die waarskynlikheid van beloning parametries gemanipuleer en die neurale reaksie op beloning en nie-beloning vir elke waarskynlikheidstoestand in die ventrale striatum en die orbitofrontale korteks (OFC) ondersoek. Deur laat proewe van die eksperiment het vakke stadiger gedragsreaksies getoon vir die toestand met die laagste waarskynlikheid van beloning, relatief tot die toestand met die hoogste waarskynlikheid van beloning. Op die neurale vlak het beide die nucleus accumbens (NAcc) en OFC groter aktivering getoon vir beloon in vergelyking met nie-beloonde proewe, maar die accumbens het die meeste sensitief gelyk vir oortredings in verwagte beloningsuitkomste. Hierdie data dui op afsonderlike rolle vir frontostriatale stroombane in beloningsvoorspelling en in reaksie op skendings in verwagtinge.

 

Inleiding

Die vorming van akkurate voorspellings en die opsporing van oortredings in verwagtinge oor komende lonende gebeure is 'n noodsaaklike komponent van doelgerigte gedrag. Nie-menslike primaat- en menslike beeldingstudies dui daarop dat dopamienryke frontostriatale streke betrokke is by die vorming van voorspellings oor toekomstige beloningsuitkomste en die optimering van gedrag dienooreenkomstig. Die neurale meganismes van beloningsverwante voorspellingsfout - 'n voorstelling van die verskil tussen die werklike en verwagte beloning (Schultz et al, 1997) – is bestudeer in nie-menslike primate in terme van verwagte en onverwagte belonings en/of weglatings van beloning (Hollerman et al, 1998, Leon en Shadlen, 1999; Tremblay en Schultz, 1999). Die huidige studie het 'n eenvoudige ruimtelike vertraging passing-tot-steekproef-taak gebruik, soortgelyk aan een wat voorheen met nie-menslike primate gebruik is (Fiorillo et al, 2003), wat die waarskynlikheid van beloningsuitkoms gemanipuleer het, om neurale reaksies op verwagte en onverwagte belonings te ondersoek.

Konvergerende bewyse impliseer die dopamienstelsel as krities vir voorspelling en beloningsverwerking (Olds en Milner, 1954; Montague et al, 2004, Schultz, 2002 Vir hersiening). Niemenslike primaatstudies het getoon dat dopamienneurone reageer op onverwagte primêre belonings en uiteindelik op die stimuli wat daardie belonings voorspel (Mirencowicz & Schultz, 1994, Tobler et al, 2005). Dopamienneurone in die ventrale tegmentale area (VTA) van die aap sal vuur in reaksie op 'n primêre beloning wat onvoorspel is (of voorspel met 'n lae waarskynlikheid) meer as op 'n beloning wat ten volle voorspel is (Fiorillo et al, 2003;Tobler et al, 2005). Omgekeerd word die aktiwiteit van dieselfde neurone onderdruk wanneer 'n verwagte beloning nie gelewer word relatief tot 'n verwagte weglating van beloning nie (Fiorillo et al, 2003; Tobler et al, 2005). Dus, dopamienneurone kodeer vir voorspellingsfout deur die verskil tussen die werklike en voorspelde uitkoms voor te stel (Schultz et al, 1997; Tobler et al, 2005), sodanig dat onverwagte aanbieding van beloning lei tot verhoogde aktiwiteit en onverwagte weglatings van beloning lei tot verminderde aktiwiteit.

Veranderinge in dopamienvuur in reaksie op veranderinge in beloningsuitkoms word gepaard met veranderinge in gedrag. Nie-menslike primaatstudies het bevind dat 'n aap sy afwagtende lek sal verhoog as 'n funksie van die waarskynlikheid waarmee 'n gekondisioneerde stimulus geassosieer word met daaropvolgende ongekondisioneerde stimulus (saplewering). As sodanig ontlok stimuli wat 'n hoë waarskynlikheid van daaropvolgende sapaflewering verteenwoordig meer afwagtende lek (Fiorillo et al., 2003).

Wedersydse anatomiese verbande bestaan ​​tussen streke wat verband hou met doelgerigte gedrag (bv. prefrontale korteks) en dié wat geassosieer word met meer outomatiese eetlusgedrag (bv. ventrale striatum) waar voorspellings bereken kan word (bv.Shultz et al., 1997; Haber et al., 2003). Hierdie streke is sterk geïnnerveer met dopamien deur projeksies vanaf middelbrein dopamien neurone en hierdie verbindings kan 'n funksionele neuroanatomiese stroombaan vorm wat optimalisering van gedrag ondersteun deur aksies te bevoordeel wat die grootste winste tot gevolg het.

Onlangs het menslike funksionele magnetiese resonansbeelding (fMRI) studies twee streke van hierdie stroombaan, die nucleus accumbens en orbitofrontale korteks, in die voorstelling van voorspellingsfout betrek. Daar is byvoorbeeld getoon dat onvoorspelbare volgordes van sap- en waterlewering verhoogde aktiwiteit in die NAcc veroorsaak relatief tot voorspelbare aflewering (Berns et al, 2001). Voorspellingsfout gebaseer op tydelike (McClure et al, 2003) en stimulus (O'Doherty et al, 2003 O'Doherty et al, 2004) oortredings aktiveer ook die ventrale striatum.

Die rol van die OFC in beloningsvoorspelling was minder duidelik. Terwyl sommige studies sensitiwiteit van die OFC gerapporteer het onder toestande van voorspellingsfout (Berns et al., 2001; O'Doherty et al., 2003; Ramnini et al., 2004; Dreher et al., 2005) ander het nie (McClure et al., 2003; O'Doherty et al., 2004; Delgado et al., 2005). Studies met minder klem op voorspellingsfout toon groter OFC-aktivering tot gunstig relatief tot ongunstige uitkomste (O'Doherty et al, 2001; Elliot et al, 2003; Galvan et al, 2005) in studies van beloningswaarde (Gottfried et al, 2003), en valensie (Cox et al, 2005; O'Doherty, 2000 O'Doherty, 2003 O'Doherty, 2004). onlangs het Kringelbach en Rolls (2004) die neurobeelding en neuropsigologiese literatuur geïntegreer om rekening te hou met verskillende funksies van die orbitofrontale korteks. Hulle stel 'n mediale-laterale onderskeid en 'n anterior-posterior onderskeid voor. Die mediale en laterale orbitofrontale korteks monitor onderskeidelik beloningswaarde en evaluasie van strafregter (bv. O'Doherty et al, 2001 ; Rolls et al, 2003). Daar word vermoed dat die anterior orbitofrontale korteks meer betrokke is by die voorstelling van abstrakte versterkers (O'Doherty et al, 2001) oor eenvoudiger wat met smaak verband hou (bv De Araujo et al, 2003) en pyn (bv Craig et al, 2000).

Hierdie ventrale frontostriatale streke het onlangs (Knutson et al, 2005) geassosieer met die voorstelling van verwagte waarde (die produk van verwagte waarskynlikheid en grootte van uitkoms) gedurende afwagting van beloningsuitkoms. Gegewe die elegante, maar komplekse ontwerp wat 18 leidrade ingesluit het wat talle kombinasies van grootte, waarskynlikheid en/of valensie verteenwoordig, het 'n gebrek aan statistiese krag die skrywers verhinder om breinaktivering wat verband hou met aansporing te ondersoek uitkomste. In die huidige studie het ons drie duidelike leidrade gebruik, wat elk geassosieer is met 33%, 66% of 100% beloning vir korrekte proewe. Die klem van hierdie studie was op beloning uitkoms eerder as om afwagting te beloon, ten einde sensitiwiteit op neurale vlak vir skendings in beloningsverwagtinge te ondersoek, eerder as om afwagting van beloning voor die uitkoms. Hierdie analise is van kritieke belang om die voorspelbaarheid van belonings te verstaan ​​as gevolg van die veranderinge in dopamienvuur wat plaasvind by beloningsuitkoms wanneer oortredings van voorspelde verwagtinge plaasvind (Fiorillo et al, 2003).Die a priori voorspellings oor die accumbens en die OFC-reaksie op verwagte en onverwagte geldelike beloning was gebaseer op vorige beeldwerk wat hierdie streke impliseer in beloningsverwerking (Knutson et al, 2001; 2005; O'Doherty et al, 2001; Galvan et al, 2005). Ons het 'n eenvoudige ruimtelike vertraagde passing gebruik om paradigma te monster soortgelyk aan dié wat gebruik word deur Fiorillo et al (2003) in elektrofisiologiese studies van dopamienneurone in niemenslike primate. Ons het veronderstel dat aktiwiteit in die ventrale striatum, veral die NAcc, sou toeneem wanneer 'n onverwagte beloning gelewer word en sou afneem wanneer 'n verwagte beloning nie gelewer is nie. Daar word van gedrag verwag om hierdie veranderinge te parallel met vinniger gemiddelde reaksietye op leidrade wat beloning die meeste voorspel, maar stadiger reaksietye met die leidraad wat beloning die minste voorspel. Verder het ons veronderstel dat die OFC sensitief sou wees vir beloningsuitkoms (beloning of nie), maar dat die accumbens die sensitiefste sou wees vir veranderinge in beloningvoorspellings. Hierdie hipoteses was gebaseer op verslae van vorige beeldstudies (Galvan et al 2005, in druk) en nie-menslike primaatwerk wat groter striatale betrokkenheid by beloningwaarskynlikheidsparameters toon, relatief tot die beloningsgeslote aktiwiteit van die OFC (Schultz, et al, 2000) en op die vaste eerder as wisselende hoeveelheid beloning oor die waarskynlikheidstoestande.

Metodes

Deelnemers

Twaalf regshandige gesonde volwassenes (7 vroulik), ouderdomme 19-27 (gemiddelde ouderdom 24 jaar), is by die fMRI-eksperiment ingesluit. Proefpersone het geen geskiedenis van neurologiese of psigiatriese siekte gehad nie en alle proefpersone is ingestem tot die studie wat deur die Institusionele Hersieningsraad goedgekeur is voor deelname.

Eksperimentele taak

Deelnemers is getoets met behulp van 'n gewysigde weergawe van 'n vertraagde reaksie tweekeuse-taak wat voorheen beskryf is (Galvan et al, 2005) in 'n gebeurtenis-verwante fMRI studie (Figuur 1). In hierdie taak is drie leidrade elk geassosieer met 'n duidelike waarskynlikheid (33%, 66% en 100%) om 'n vaste bedrag van beloning te verkry. Proefpersone is opdrag gegee om óf hul wys- óf middelvinger te druk om die kant aan te dui waarop 'n aanduiding verskyn wanneer hulle gevra word, en om so vinnig as moontlik te reageer sonder om foute te maak. Een van drie seerower spotprentbeelde is in ewekansige volgorde aan óf die linker- óf regterkant van 'n gesentreerde fiksasie vir 1000 msek aangebied (sien Figuur 1). Na 'n vertraging van 2000 2000 msek, is aan die proefpersone 'n reaksie-instruksie van twee skatkiste aan beide kante van die fiksasie (2000 msek) gegee en opdrag gegee om 'n knoppie met hul regterwysvinger te druk as die seerower aan die linkerkant van die fiksasie of hul regtermiddelvinger as die seerower aan die regterkant van die fiksasie was. Na nog 'n vertraging van 1000 msek, is óf beloningterugvoer (spotprentmunte) óf 'n leë skatkis in die middel van die skerm (12 msek) aangebied op grond van die beloningwaarskynlikheid van daardie proeftipe. Daar was 'n XNUMX sekondes tussenverhoor interval (ITI) voor die aanvang van die volgende proef.

Figuur 1  

Taak Ontwerp

Daar was drie beloningwaarskynlikheidstoestande: 'n 33%, 66% en 100% beloningwaarskynlikheid. In die 33%-toestand is proefpersone op 33% van die proewe beloon en geen beloning ('n leë skatkis) het op die ander 66% van die proewe in daardie toestand plaasgevind nie. In die 66%-toestand is proefpersone op 66% van proewe beloon en geen beloning het vir die ander 33% van proewe plaasgevind nie. In die 100% toestand is proefpersone beloon vir alle korrekte proewe.

Vakke is $50 gewaarborg vir deelname aan die studie en is meegedeel dat hulle tot $25 meer kan verdien, afhangend van prestasie (soos geïndekseer deur reaksietyd en akkuraatheid) op die taak. Stimuli is aangebied met die geïntegreerde funksionele beeldingstelsel (IFIS) (PST, Pittsburgh) met behulp van 'n LCD-videoskerm in die boring van die MR-skandeerder en 'n optiesevesel-reaksie-versamelingstoestel.

Die eksperiment het bestaan ​​uit vyf lopies van 18 proewe (6 elk van die 33%, 66% en 100% waarskynlikheid van beloningsproeftipes), wat 6 min en 8 s elk geduur het. Elke lopie het 6 proewe gehad van elke beloningwaarskynlikheid wat in ewekansige volgorde aangebied is. Aan die einde van elke lopie is vakke opgedateer oor hoeveel geld hulle tydens daardie lopie verdien het. Voor die aanvang van die eksperiment het proefpersone gedetailleerde instruksies ontvang wat vertroudheid ingesluit het met die stimuli wat aangewend is en 'n oefenlopie uitgevoer om taakbegrip te verseker. Hulle is meegedeel dat 'n verband tussen die leidrade en geldelike uitkomste bestaan, maar die presiese aard van daardie verhouding is nie geopenbaar nie.

Beeldvervaardiging

Beeldvorming is uitgevoer met behulp van 'n 3T General Electric MRI-skandeerder met behulp van 'n kwadratuurkopspoel. Funksionele skanderings is verkry met behulp van 'n spiraal in en uit volgorde (Glover & Thomason, 2004). Die parameters het 'n TR=2000, TE=30, 64 X 64 matriks, 29 5 mm koronale skywe, 3.125 X 3.125 mm in-vlak resolusie, flip 90°) vir 184 herhalings ingesluit, insluitend vier weggooi verkrygings aan die begin van elke hardloop. Anatomiese T1-geweegde in-vlak skanderings is versamel (TR=500, TE=min, 256 X 256, FOV=200 mm, 5 mm snydikte) op dieselfde plekke as die funksionele beelde bykomend tot 'n 3-D datastel van hoë resolusie SPGR beelde (TR=25, TE=5, 1.5 mm snydikte, 124 snye).

Beeldontleding

Die Brainvoyager QX (Brain Innovations, Maastricht, Nederland) sagtewarepakket is gebruik om 'n ewekansige effekte-analise van die beelddata uit te voer. Voor ontleding is die volgende voorverwerkingsprosedures op die rou beelde uitgevoer: 3D-bewegingskorreksie om klein kopbewegings op te spoor en te korrigeer deur ruimtelike belyning van alle volumes na die eerste volume deur rigiede liggaamstransformasie, snyskanderingtydkorreksie (met sink-interpolasie), lineêre neiging verwydering, hoë-deurlaat temporale filtering om nie-lineêre dryf van 3 of minder siklusse per tyd verloop te verwyder, en ruimtelike data gladmaking met behulp van 'n Gaussiese kern met 'n 4mm FWHM. Geskatte rotasie- en translasiebewegings het nooit 2 mm oorskry vir vakke wat in hierdie analise ingesluit is nie.

Funksionele data is mede-geregistreer tot die anatomiese volume deur die belyning van ooreenstemmende punte en handaanpassings om optimale passing te verkry deur visuele inspeksie en is dan omskep in Talairach-ruimte. Tydens Talairach-transformasie is funksionele voxels geïnterpoleer tot 'n resolusie van 1 mm3 vir belyning doeleindes, maar die statistiese drempels was gebaseer op die oorspronklike verkryging voxel grootte. Die nucleus accumbens en orbitale frontale korteks is gedefinieer deur 'n heelbrein voxelwise GLM met beloning as die primêre voorspeller (sien hieronder) en dan gelokaliseer deur Talairach koördinate in samewerking met verwysing na die Duvernoy breinatlas (Talairach & Tournoux, 1988; Duvernoy, 1991).

Statistiese ontledings van die beelddata is op die hele brein uitgevoer met behulp van 'n algemene lineêre model (GLM) wat bestaan ​​uit 60 (5 lopies X 12 vakke) z-genormaliseerde funksionele lopies. Die primêre voorspeller was beloning (beloning teenoor nie-beloning proewe) oor alle beloning waarskynlikhede by beloning uitkoms. Die voorspeller is verkry deur konvolusie van 'n ideale karreaksie (met 'n waarde 1 vir die volume van taakaanbieding en 'n volume van 0 vir oorblywende tydpunte) met 'n lineêre model van die hemodinamiese reaksie (Boynton et al, 1996) en gebruik om die ontwerpmatriks van elke tydverloop in die eksperiment te bou. Slegs korrekte proewe is ingesluit en afsonderlike voorspellers is geskep vir foutproewe. Post hoc kontras ontledings op die streke van belang is dan uitgevoer gebaseer op t-toetse op die beta gewigte van voorspellers. Monte Carlo-simulasies is uitgevoer met behulp van die AlphaSim-program binne AFNI (Cox, 1996) om toepaslike drempels te bepaal om 'n gekorrigeerde alfavlak van p<0.05 te bereik gebaseer op soekvolumes van ongeveer 25,400 3 mm450 en 3 mm20 vir die orbitale frontale korteks en nucleus accumbens, onderskeidelik. Persentasie veranderinge in die MR-sein relatief tot basislyn (interval onmiddellik voor die XNUMX sek proef) in die nucleus accumbens en orbitale frontale korteks is bereken deur gebruik te maak van gebeurtenisverwante gemiddeldes oor aansienlik aktiewe voxels verkry uit die kontrasontledings.

Die hele brein GLM is gebaseer op 50 beloning proewe per proefpersoon (n=12) vir 'n totaal van 600 proewe en 30 niebeloning proewe per proefpersoon (n=12) vir 'n totaal van 360 niebeloning proewe oor die hele eksperiment. Daaropvolgende kontraste oor die beloningwaarskynlikheidstoestande het bestaan ​​uit verskillende aantal belonings en geen beloningproewe nie. Vir die 100% beloning waarskynlikheid toestand was daar 6 beloning proewe per lopie (5) per vak (12) vir 'n totaal van 360 beloning proewe en geen nie-beloning proewe. Vir die 66% beloning waarskynlikheid toestand was daar 4 beloning proewe per lopie (5) per proefpersoon (12) vir 'n totaal van 240 beloning proewe en 120 nie-beloning proewe. Vir die 33% beloning waarskynlikheid toestand, was daar 2 beloning proewe per lopie (5) per vak (12) vir 'n totaal van 120 beloning proewe en 240 nie-beloning proewe.

Results

Gedragsdata

Die uitwerking van beloningwaarskynlikheid en tyd op taak is getoets met 'n 3 (33%, 66%, 100%) x 5 (lopies 1-5) herhaalde maatreëls analise van variansie (ANOVA) vir die afhanklike veranderlikes van gemiddelde reaksietyd (RT) ) en gemiddelde akkuraatheid.

Daar was geen hoofeffekte of interaksies van waarskynlikheid van beloning (F[2,22]=.12, p<.85) tyd op taak (F[4,44]=2.02, p<.14) of beloning waarskynlikheid X tyd op taak (F[8, 88]=1.02, p<.41) vir gemiddelde akkuraatheid. Dit was te verwagte aangesien deelnemers se akkuraatheid naby plafonvlakke bereik het vir alle waarskynlikhede van die eksperiment (33% toestand=97.2%; 66% toestand=97.5%; 100% toestand=97.7%).

Daar was 'n beduidende interaksie tussen waarskynlikheid van beloning en tyd op taak (F[8,88] = 3.5, p <.01) op gemiddelde RT, maar geen hoofeffekte van tyd op taak nie (F[4,44] = .611 , p < 0.59) of waarskynlikheid van beloning (F[2,22]= 2.84, p < 0.08). Post-hoc t-toetse van die beduidende interaksie het getoon dat daar 'n beduidende verskil was tussen die 33% en 100% beloning waarskynlikheidstoestande tydens laat proewe van die eksperiment (lopie 5) (t(11)=3.712, p<.003), met vinniger gemiddelde RT vir die 100% beloning waarskynlikheidstoestand (gemiddeld =498.30, sd=206.23) relatief tot die 33% toestand (gemiddeld=583.74, sd=270.23).

Die verskil in gemiddelde reaksietyd tussen die 100% en 33% toestande het tweevoudig toegeneem van vroeë tot laat proewe (sien Figuur 2a). Om leer verder te wys, het ons 'n omkering ingestel, wat die waarskynlikhede van beloning vir die 33%- en 100%-toestande aan die einde van die eksperiment verander het. 'n 2 (waarskynlikheid) X 2 (omkeer en nie-omkeer) ANOVA vir laat proewe het 'n beduidende interaksie getoon (F (1,11)=18.97, p=0.001), met 'n afname in RT tot die toestand wat die 33% was waarskynlikheid in die nie-omkering (gemiddeld=583.74, sd=270.24) en 100% in die ommekeer (gemiddeld=519.89,sd=180.46) (Figuur 2b).

Figuur 2  

Gedragsresultate (RT)

Imaging Results

'n GLM vir korrekte proewe met behulp van beloningwaarskynlikheid as die primêre voorspeller is gemodelleer op die punt waarin die proefpersoon terugvoer van beloning ontvang het of nie (dws uitkoms). Hierdie analise het die streke van die NAcc (x=9, y=6, z=−1 en x=−9, y=9, z=−1) en OFC (x=28, y=39, z =−) geïdentifiseer 6) (sien Figuur 3a, b). Post-hoc t-toetse tussen die beta-gewigte van die beloonde versus nie-beloonde proewe het groter aktivering in beide hierdie streke getoon om te beloon (NAcc: t(11)=3.48, p<0.01; OFC x=28, y=39, z =−6, t(11)=3.30, p<0.02)1.

Figuur 3  

Groter aktivering na beloonde versus nie-beloonde uitkomste in die a) nucleus accumbens (x=9,y=6,z=−1; x=−9, y=9, z=−1) en b) orbitale frontale korteks (x= 28,y=39, z=−6).

Daar was twee moontlike uitkomste (beloning of geen beloning) vir die twee intermitterende beloningskedules (33% en 66% waarskynlikheid) en slegs een uitkoms vir die deurlopende beloningskedule (100% beloning waarskynlikheid), wat as 'n vergelykingsvoorwaarde gebruik is. Terwyl daar 'n hoofeffek van beloning (beloning teenoor geen beloning proewe) in die OFC hierbo beskryf was, het OFC-aktiwiteit nie gewissel as 'n funksie van beloningwaarskynlikheid in die huidige studie nie [F(2,10)=0.84, p=0.46) . In teenstelling hiermee het die NAcc duidelike veranderinge in aktiwiteit tot uitkoms getoon as 'n funksie van die beloningwaarskynlikheidsmanipulasie [F(2,10)=9.32, p<0.005]. Spesifiek, NAcc-aktiwiteit het toegeneem om uitkomste te beloon, wanneer die beloning onverwags was (33% beloning waarskynlikheid toestand) relatief tot verwagte (100% basislyn toestand) [t(11)=2.54, p<.03 sien Figuur 4a]. Tweedens was daar verminderde NAcc-aktiwiteit tot geen beloning, wanneer 'n beloning verwag is en nie ontvang is nie (66% beloning waarskynlikheidstoestand) relatief tot beloning wat nie verwag of ontvang is nie (33% beloning waarskynlikheidstoestand; t(59)=2.08, p <.04; kyk Figuur 4b). Let daarop dat daar geen beduidende verskille in aktivering was tussen die 33% en 66% beloning waarskynlikheidstoestande [t(11)=.510, p=.62] of tussen die 66% en 100% beloningwaarskynlikheidstoestande [t(11)= 1.20, p=.26] in beloonde uitkomste. MR sein as 'n funksie van beloning uitkoms en waarskynlikheid word getoon in Figuur 4.

Figuur 4  

Persentasie MR sein verander as 'n funksie van beloning uitkoms en waarskynlikheid in die nucleus accumbens na a) beloonde en b) nie-beloonde uitkomste.

Bespreking

Hierdie studie het die uitwerking van oortredings in verwagte beloningsuitkomste op gedrag en neurale aktiwiteit in die accumbens en orbitale frontale korteks (OFC) ondersoek, wat voorheen getoon is betrokke te wees by die afwagting van beloningsuitkomste (McClure et al 2004; Knutson et al, 2005). Ons het getoon dat beide die nucleus accumbens en OFC gewerf is tydens beloonde proewe relatief tot nie-beloonde proewe, maar slegs die nucleus accumbens het sensitiwiteit getoon vir oortredings in die voorspelde beloningsuitkoms in hierdie studie. Groter sensitiwiteit van die accumbens vir beloningswaarde (bv. grootte) relatief tot die OFC is in vorige werk getoon (Galvan et al 2005), en saam dui hierdie bevindinge daarop dat hierdie streek betrokke kan wees by die berekening van beide grootte en waarskynlikheid van beloning. Die gebrek aan sensitiwiteit in die OFC vir hierdie manipulasies kan 'n meer absolute voorstelling van beloning of dubbelsinnigheid in uitkoms weerspieël (Hsu et al., 2005). Alternatiewelik, aangesien die MR-sein meer veranderlik in hierdie streek was, kan hierdie effekte in die huidige studie verswak gewees het.

In elektrofisiologiese studies in diere, is getoon dat dopamienneurone in die middelbrein (wat na die nucleus accumbens projekteer) min tot geen reaksie op voorspelde beloningsuitkomste (waarskynlikheid = 1.0), maar toon fasiese vuur wanneer beloning gelewer word met minder as 100 % waarskynlikheid, selfs na uitgebreide opleiding (Fiorillo et al, 2003). In die huidige studie het ons groter accumbens-aktiwiteit getoon om te beloon wanneer die beloning onverwags was (33% toestand) relatief tot wanneer dit verwag is (100% toestand) in ooreenstemming met hierdie bevindings. Verder, elektrofisiologiese studies van dopamienneurone in diere (bv. Fiorillo et al, 2003) het getoon dat vir proewe waarop beloning voorspel is, maar nie plaasgevind het nie, neuronale aktiwiteit afgeneem het. Die huidige studie het 'n soortgelyke patroon in die accumbens getoon, met 'n afname in aktiwiteit in hierdie streek in die nie-beloonde proewe vir die 66% beloning waarskynlikheid toestand relatief tot die 33% toestand.2

Dopamienneurone is op twee maniere betrokke by leer. Eerstens kodeer hulle gebeurlikhede tussen stimuli (of reaksie) en uitkomste deur middel van voorspellingsfoute seine wat oortredings in verwagtinge opspoor (Schultz et al, 1997; Mirencowicz en Schultz, 1998; Fiorillo et al, 2003). Die voorspellingsfout blyk dus 'n onderrigsein te verskaf wat ooreenstem met die leerbeginsels wat aanvanklik deur beskryf is Rescorla en Wagner (1972). Tweedens dien hulle om gedragsreaksies te verander (Schultz et al, 1997; McClure et al, 2004) sodanig dat aksies bevooroordeeld is na die leidrade wat die meeste voorspellend is. In die huidige studie wys ons dat deur laat proewe van die eksperiment, die mees optimale prestasie is vir die toestand met die hoogste waarskynlikheid van beloning (100% beloning waarskynlikheid) en die minste optimaal vir die laagste waarskynlikheid toestand (33% beloning waarskynlikheid). Hierdie gedragsbevinding stem ooreen met vorige waarskynlikheidswerk wat die minste optimale prestasie toon met die laagste waarskynlikheid van beloningsuitkoms, wat daarop dui dat beloningsgebeurlikhede oor tyd aangeleer is (Delgado et al, 2005). Om leer verder te wys, het ons 'n omkering ingestel, wat die waarskynlikhede van beloning vir die 33%- en 100%-toestande aan die einde van die eksperiment verander het. Hierdie manipulasie het gelei tot verswakking van verskille tussen hierdie toestande wat leereffekte verder bevestig.

’n Belangrike doelwit van beloningsverwante studies is om te bepaal hoe belonings gedrag en vooroordeel beïnvloed (bv Robbins en Everitt, 1996; Schultz, 2004) benewens die karakterisering van die onderliggende neurale prosessering. Talle faktore dra by tot hoe vinnig en robuust belonings gedrag beïnvloed, insluitend skedules van versterking (Skinner, 1958), beloningswaarde (Galvan et al, 2005), en beloon voorspelbaarheid (Fiorillo et al, 2003; Delgado et al, 2005). Verwagte waarde, wat die produk is van die omvang en waarskynlikheid van 'n beloning (Pascal, ongeveer 1600's), beïnvloed gedragskeuses (von Frisch, 1967; Montague et al, 1995; Montague en Berns, 2002). Deur 'n baie soortgelyke taak te gebruik waarin slegs die uitkoms (grootte in plaas van waarskynlikheid) verskil van die huidige studie, het ons getoon dat die nucleus accumbens sensitief was vir diskrete beloningswaardes (Galvan et al, 2005). Tesame met die getuienis wat hier en elders aangebied word (Tobler et al, 2005), stel ons voor dat die ventrale striatum waarskynlik bydra tot die berekening van verwagte beloningswaarde gegewe sy sensitiwiteit vir beide beloningwaarskynlikheid en -omvang.

Die rol van die orbitale frontale korteks in beloningsvoorspelling stem ooreen met funksionele onderafdelings van hierdie streek deur Kringelbach en Rolls (2004). Hulle stel voor dat meer anterior en mediale gedeeltes van OFC sensitief is vir abstrakte beloningsmanipulasies. Die OFC-aktivering in hierdie studie is in hierdie algemene plek waargeneem. Elektrofisiologiese studies impliseer die OFC in die kodering van subjektiewe waarde van 'n beloningstimulus (vir hersiening, O'Doherty, 2004). OFC-neurone brand byvoorbeeld na 'n spesifieke smaak wanneer 'n dier honger is, maar verminder hul vuurtempo sodra die dier versadig is en die beloningswaarde van die kos afgeneem het (Critchley en Rolls, 1996). As sodanig het ander voorgestel dat die OFC die sensitiefste is vir relatiewe belonings (Tremblay en Schultz, 1999) en beloningsvoorkeur (Schultz et al, 2000). Neurobeeldingstudies het 'n analoog patroon by mense getoon met 'n verskeidenheid stimuli, insluitend smaak (O'Doherty et al, 2001; Kringelbach et al, 2003), reuk (Anderson et al, 2003; Rolls et al, 2003), en geld (Elliot et al, 2003; Galvan et al, 2005), met elke aktivering wat wissel in die ligging van aktiwiteit van anterior tot posterior en van mediale tot laterale OFC. Die OFC is geïmpliseer in afwagting van beloning (O'Doherty et al 2002), maar slegs in soverre die voorspellende waarde van die respons aan die spesifieke gekoppel is waarde van die gepaardgaande beloning, eerder as in die waarskynlikheid dat daardie beloning sal plaasvind (O'Doherty, 2004 ). In die huidige studie het ons nie sensitiwiteit vir oortredings in beloningsvoorspelling in die OFC gesien nie. Knutson en kollegas (2005) het korrelasies tussen waarskynlikheidskattings en breinaktivering gerapporteer in afwagting van beloning in die mesiale prefrontale korteks (Knutson et al 2005), maar nie spesifiek in die orbitale frontale korteks nie. In kontras, Ramnani et al (2004 ) het OFC-sensitiwiteit vir positiewe voorspellingsfout in mediale orbitale frontale korteks gerapporteer met behulp van 'n passiewe kyktaak en Dreher et al. (2005) OFC-foutvoorspelling gerapporteer in 'n taak wat beide die waarskynlikheid en omvang van voorspellende leidrade gemanipuleer het, maar hierdie gebeurlikhede is geleer voor skandering. Dit is dus steeds houdbaar dat OFC voorspelde belonings kan bereken, maar miskien is hierdie berekeninge growwer (dws opgesom oor 'n reeks waarskynlikhede) of stadiger om te vorm relatief tot die presiese berekeninge wat blykbaar in die NAcc voorkom. Alternatiewelik kan hierdie streek meer sensitief wees om stimuli van onsekere en/of dubbelsinnige waarde op te spoor, soos voorgestel deur Hsu et al (2005), as om oortredings in beloningsvoorspelling op te spoor. Hsu et al (2005) toon dat die vlak van dubbelsinnigheid in keuses (onsekere keuses gemaak as gevolg van ontbrekende inligting) positief korreleer met aktivering in die OFC. Laastens kan die groter variasie in MR-sein in hierdie streek ons ​​vermoë om hierdie effekte ook op te spoor, verminder het.

Die fundamentele vraag van die huidige studie was hoe die accumbens en OFC differensiële kode beloningsuitkomste relatief tot onvoorspelde uitkomste voorspel het (dws oortredings in verwagtinge). Ons het die waarskynlikheid van beloning parametries gemanipuleer en die neurale reaksie op beloning- en niebeloningproewe vir elke waarskynlikheidsbeloningtoestand ondersoek. Ons data stem ooreen met vorige menslike beelding en nie-menslike elektrofisiologiese studies (Fiorillo et al, 2003; Schultz, 2002) en stel voor dat die accumbens en OFC sensitief is vir beloningsuitkoms (beloning of nie). Dit blyk egter dat aktiwiteit in hierdie streke, veral die accumbens, gemoduleer word deur voorspellings oor die waarskynlikheid van beloningsuitkomste wat met leer oor tyd gevorm word. Hierdie dinamiese patroon van aktivering kan wysigings in dopamienaktiwiteit binne of na hierdie streke voorstel, aangesien inligting oor voorspelde beloning aangeleer en opgedateer word.

voetnote

1Die NAcc [t(11)=3.2, p<0.04] en OFC [t(11)=3.5, p<0.02] het verhoogde aktiwiteit getoon in afwagting van beloning vir die intermitterende maar nie die deurlopende beloningstoestand nie

2Weglating van beloningsuitkoms in die 33% toestand het gelei tot 'n effense toename in NAcc aktiwiteit eerder as 'n verminderde een, soortgelyk aan dié waargeneem deur Knutson et al., 2001. Een moontlike interpretasie van hierdie resultaat is dat proefpersone intrinsiek gemotiveer of beloon is as hulle voorspel het dat geen beloning vir daardie verhoor sou kom nie, en niemand het nie. Alternatiewelik, aangesien beloningsuitkomste vir hierdie proewe die minste in getal oor die eksperiment was, kan die aktiwiteit voortgesette leer vir hierdie toestand weerspieël.

Disclaimer van die uitgewer: Hierdie is 'n PDF-lêer van 'n ongeredigeerde manuskrip wat aanvaar is vir publikasie. As 'n diens aan ons kliënte voorsien ons hierdie vroeë weergawe van die manuskrip. Die manuskrip sal kopieëring, tikwerk en hersiening van die gevolglike bewys ondergaan voordat dit in sy finale citable vorm gepubliseer word. Let asseblief daarop dat tydens die produksieproses foute ontdek kan word wat die inhoud kan beïnvloed, en alle wettige disklaimers wat van toepassing is op die tydskrif betrekking het.

Verwysings

  • Anderson A, Christoff K, Stappen I, Panitz D, Ghahremani D, Glover G, Gabrieli JD, Sobel N. Gedissocieerde neurale voorstellings van intensiteit en valensie in menslike reuk. Natuur Neurowetenskap. 2003;6: 196-202.
  • Berns GS, McClure SM, Pagnoni G, Montague PR. Voorspelbaarheid moduleer menslike breinrespons om te beloon. Blaar van Neurowetenskap. 2001;21: 2793-2798. [PubMed]
  • Boynton GM, Engel SA, Glover GH, Heeger DJ. Lineêre stelselanalise van funksionele magnetiese resonansiebeelding in menslike V1. Blaar van Neurowetenskap. 1996;16: 4207-4221. [PubMed]
  • Cox RW. AFNI: Sagteware vir analise en visualisering van funksionele magnetiese resonansie neuroimages. Berekeninge in Biomediese Navorsing. 1996;29: 162-173.
  • Cox SM, Andrade A, Johnsrude IS. Leer om van te hou: 'n Rol vir menslike orbitofrontale korteks in gekondisioneerde beloning. Blaar van Neurowetenskap. 2005;25: 2733-2740. [PubMed]
  • Craig AD, Chen K, Bandy D, Reiman EM. Termosensoriese aktivering van insulêre korteks. Natuur Neurowetenskap. 2000;3: 184-190.
  • Critchley HD, Rolls ET. Honger en versadiging verander die reaksies van reuk- en visuele neurone in die primaat-orbitofrontale korteks. Blaar van Neurofisiologie. 1996;75: 1673-1686. [PubMed]
  • De Araujo IET, Kringelbach ML, Rolls ET, McGlone F. Menslike kortikale reaksies op water in die mond, en die gevolge van dors. Blaar van Neurofisiologie. 2003;90: 1865-1876. [PubMed]
  • Delgado MR, Miller M, Inati S, Phelps EA. 'N fMRI-studie van beloningsverwante waarskynlikheidsleer. Neuro Image. 2005;24: 862-873. [PubMed]
  • Dreher JC, Kohn P, Berman KF. Neurale kodering van duidelike statistiese eienskappe van beloningsinligting by mense. Serebrale korteks. 2005 Epub voor druk.
  • Elliott R, Newman JL, Longe OA, Deakin JFW. Differensiële reaksiepatrone in die striatum en orbitofrontale korteks tot finansiële beloning by mense: 'n parametriese funksionele magnetiese resonansbeeldingstudie. Blaar van Neurowetenskap. 2003;23: 303-307. [PubMed]
  • Fiorillo CD, Tobler PN, Schultz W. Diskrete kodering van beloning waarskynlikheid en onsekerheid deur dopamien neurone. Wetenskap. 2003;299: 1898-1902. [PubMed]
  • Galvan A, Hare TA, Davidson M, Spicer J, Glover G, Casey BJ. Die rol van ventrale frontostriatale kringe in beloningsgebaseerde leer by mense. Die Journal of Neuroscience. 2005;25: 8650-8656. [PubMed]
  • Galvan A, Hare TA, Parra C, Penn J, Voss H, Glover G, Casey BJ. Vroeëre ontwikkeling van die accumbens relatief tot die orbitofrontale korteks kan risiko-neem gedrag by adolessente onderlê. Die Journal of Neuroscience. 2006;26: 6885-6892. [PubMed]
  • Gottfried JA, O'Doherty J, Dolan RJ. Enkodering van voorspellende beloningswaarde in menslike amigdala en orbitofrontale korteks. Wetenskap. 2003;301: 1104-1107. [PubMed]
  • Haber SN. Die primale basale ganglia: parallelle en integrerende netwerke. Tydskrif vir Chemiese Neuroanatomie. 2003;26: 317-330. [PubMed]
  • Hollerman J, Schultz W. Dopamienneurone rapporteer 'n fout in die tydelike voorspelling van beloning tydens leer. Natuur Neurowetenskap. 1998;1: 304-309.
  • Hsu M, Bhatt M, Adolphs R, Tranel D, Camerer CF. Neurale sisteme wat reageer op grade van onsekerheid in menslike besluitneming. Wetenskap. 2005;310: 1680-1683. [PubMed]
  • Knutson B, Adams CM, Fong GW, Hommer D. Die verwagting van toenemende monetêre beloning werf selektief kernkwartiere. Blaar van Neurowetenskap. 2001;21: 1-5.
  • Knutson B, Taylor J, Kaufman M, Peterson R, Glover G. Verspreide neurale voorstelling van verwagte waarde. Die Journal of Neuroscience. 2005;25: 4806-4812. [PubMed]
  • Kringelbach ML, O'Doherty J, Rolls ET, Andrews C. Aktivering van die menslike orbitofrontale korteks na 'n vloeibare voedselstimulus word gekorreleer met die subjektiewe aangenaamheid daarvan. Serebrale korteks. 2003;13: 1064-1071. [PubMed]
  • Kringelbach ML, Rolls ET. Die funksionele neuroanatomie van die menslike orbitofrontale korteks: bewyse van neurobeelding en neuropsigologie. Vordering in Neurobiologie. 2004;72: 341-372. [PubMed]
  • Leon MI, Shadlen MN. Effek van verwagte beloningsgrootte op die reaksie van neurone in die dorsolaterale prefrontale korteks van die makaak. Neuron. 1999;24: 415-425. [PubMed]
  • McClure SM, Berns GS, Montague PR. Temporale voorspellingsfoute in 'n passiewe leertaak aktiveer menslike striatum. Neuron. 2003;38: 339-346. [PubMed]
  • McClure SM, Laibson DI, Loewenstein G, Cohen JD. Afsonderlike neurale stelsels waardeer onmiddellike en vertraagde monetêre belonings. Wetenskap. 2004;306: 503-507. [PubMed]
  • Mirenowicz J, Schultz W. Belangrikheid van onvoorspelbaarheid vir beloningsreaksies in primaat-dopamienneurone. Blaar van Neurofisiologie. 1994;72: 1024-1027. [PubMed]
  • Montague PR, Berns GS. Neurale ekonomie en die biologiese substraten van waardering. Neuron. 2002;36: 265-284. [PubMed]
  • Montague PR, Hyman SE, Cohen JD. Rekenkundige rolle vir dopamien in gedragsbeheer. Die natuur. 2004;431: 379-387.
  • O'Doherty JP. Beloningsvoorstellings en beloningsverwante leer in die menslike brein: insigte van neuro-beelding. Huidige Advies in Neurobiologie. 2004;14: 769-776. [PubMed]
  • O'Doherty JP, Dayan P, Friston K, Critchley H, Dolan RJ. Temporele verskille modelle en beloningsverwante leer in die menslike brein. Neuron. 2003;38: 329-337. [PubMed]
  • O'Doherty JP, Deichmann R, Critchley HD, Dolan RJ. Neurale reaksies tydens afwagting van 'n primêre smaakbeloning. Neuron. 2002;33: 815-826. [PubMed]
  • O'Doherty J, Kringelbach M, Rolls ET, Hornak J, Andrews C. Abstrakte beloning en straf voorstellings in die menslike orbitofrontale korteks. Natuur Neurowetenskap. 2001;4: 95-102.
  • O'Doherty J, Rolls ET, Francis S, Bowtell R, McGlone F, Kobal G, Renner B, Ahne G. Sensories-spesifieke versadigingsverwante reukaktivering van die menslike orbitofrontale korteks. Neuroreport. 2000;11: 893-897. [PubMed]
  • Olds J, Milner P. Positiewe versterking geproduseer deur elektriese stimulasie van septal area en ander streke van rotbrein. Tydskrif vir Vergelykende Fisiologie en Sielkunde. 1954;47: 419-427.
  • Ramnani N, Elliott R, Athwal B, Passingham R. Voorspellingsfout vir gratis monetêre beloning in die menslike prefrontale korteks. Neuro Image. 2004;23: 777-786. [PubMed]
  • Rescorla R, Wagner A. In: Klassieke kondisionering 2: Huidige navorsing en teorie. Swart A, Prokasy W, redakteurs. Appleton Century-Crofts; New York: 1972. pp. 64–69.
  • Robbins TW, Everitt BJ. Neurogedragsmeganismes van beloning en motivering. Huidige opinies in Neurobiologie. 1996;6: 228-235.
  • Rolls E, Kringelbach M, DeAraujo I. Verskillende voorstellings van aangename en onaangename reuke in die menslike brein. Europese Tydskrif vir Neurowetenschappen. 2003;18: 695-703. [PubMed]
  • Schultz W, Dayan P, Montague PR. 'n Neurale substraat van voorspelling en beloning. Wetenskap. 1997;275: 1593-1599. [PubMed]
  • Schultz W, Tremblay L, Hollerman JR. Beloningsverwerking in primaat-orbitofrontale korteks en basale ganglia. Cereb Cortex. 2000;10: 272-284. [PubMed]
  • Schultz W. Word formele met dopamien en beloning. Neuron. 2002;36: 241-263. [PubMed]
  • Schultz W. Neurale kodering van basiese beloningsterme van diereleerteorie, spelteorie, mikro-ekonomie en gedragsekologie. Huidige Advies in Neurobiologie. 2004;14: 139-147. [PubMed]
  • Skinner BF. Diagramskedules van versterking. Tydskrif vir Eksperimentele Analise van Gedrag. 1958;1: 103-107.
  • Sutton RS, Barto AG. Versterkingsleer: 'n Inleiding. MIT Press; Cambridge, MA: 1998.
  • Schultz W, Tremblay L, Hollerman J. Beloning verwerking in primaat orbitofrontale korteks en basale ganglia. Serebrale korteks. 2000;10: 272-284. [PubMed]
  • Talairach J, Tournoux P. Ko-planêre stereotaksiese atlas van die menslike brein. Thieme; New York: 1988.
  • Tobler PN, Fiorillo CD, Schultz W. Aanpasbare kodering van beloningswaarde deur dopamienneurone. Wetenskap. 2005;307: 1642-1645. [PubMed]
  • Tremblay L, Schultz W. Relatiewe beloning voorkeur in primate orbitofrontale korteks. Die natuur. 1999;398: 704-708. [PubMed]
  • von Frisch K. Die Danstaal en Oriëntasie van Bye. Harvard University Press; Cambridge, Massachusetts: 1967.