En unik ungdomsrespons for å belønne prediksjonsfeil (2010)

Nat Neurosci. 2010 juni; 13 (6): 669-71. Epub 2010 mai 16.

 

kilde

Institutt for psykologi, Universitetet i California Los Angeles, Los Angeles, California, USA. [e-postbeskyttet]

Abstrakt

Tidligere arbeid har vist at menneskelige ungdommer kan være overfølsomme overfor belønninger, men det er ikke kjent hvilket aspekt av belønne behandling er ansvarlig for dette. Vi skiltes avgjørelsesverdien og prediksjon feilsignaler og fant det nevrale prediksjon Feilsignaler i striatumet toppet i ungdomsårene, mens signaler for neurale avgjørelsesverdier varierte avhengig av hvordan verdien var modellert. Dette antyder at økt dopaminerge prediksjon Feilresponsivitet bidrar til ungdom belønne søker.

Ungdom er en unik periode i psykologisk utvikling, preget av økte risikable valg og handlinger i forhold til barn og voksne. Dette kan gjenspeile den relativt tidlige funksjonelle utviklingen av limbiske affektive og belønningssystemer i forhold til prefrontal cortex1, slik at ungdom har en tendens til å ta fattige beslutninger og risikofylte valg oftere enn begge barn (som ennå ikke er fullt følsomme overfor belønninger) og voksne (som er følsomme overfor belønninger, men har evnen til å utøve kontroll over belønningsdrevne oppfordringer).

I henhold til atferdsmessige beslutningsteorier blir valgene drevet av verdien tilordnet hvert potensielt valg (beslutningsverdi)2. Beslutningsverdi beregnes av et system i den mediale prefrontale cortex som tjener som en felles vei for verdierrepresentasjon3,4. For å oppføre seg adaptivt i en forandring eller bråkete verden, må disse verdiene imidlertid oppdateres basert på erfaring. Belønningsforutsigelse feil signaler gjenspeiler forskjellen mellom forventet verdi av en handling og det faktiske resultatet av handlingen5, og er kodet av phasic aktivitet i mesolimbic dopamin-systemet6. I fMRI observeres de vanligvis i ventralstriatumet, som reflekterer dopaminerge utganger (f.eks. 7). Typen av prediksjonsfeilssignaler hos barn eller ungdom er ukjent. Ungdom kan ha en overfølsom striatal respons på belønning8, selv om dette funnet er noe inkonsekvent9,10. Vi undersøkte om ungdomsårene er knyttet til unike endringer i enten avgjørelsesverdien eller prediksjonsfeil signaler, ved hjelp av et probabilistisk læringsparadigme11 (Fig. 1; se Supplerende metoder på nett). Vi estimerte både beslutningsverdier og prediksjonsfeil signaler på hver prøve under læring ved hjelp av en enkel læringsmodell5. Ved å bruke parametriske fMRI-analyser, identifiserte vi hjernegrupper hvis respons ble modulert i henhold til disse signalene, og undersøkte hvordan dette svaret endret seg med alderen fra barndommen til voksenlivet. Vi undersøkte både lineære effekter (som gjenspeiler generelle modnesjons- eller utviklingsmessige trender) og kvadratiske effekter (som reflekterer ungdomsspesifikke effekter) med alderen. Dette arbeidet representerer den første undersøkelsen av disse delkomponentene i beslutningsprosesser på tvers av utviklingen.

Figur 1

Eksperimentelt design. 45-sunn deltakere (18-barn i alderen 8-12, 16 ungdommer i alderen 14-19 og 11 voksne i alderen 25-30) utførte en probabilistisk læringsoppgave under fMRI-oppkjøpet. Skriftlig informert samtykke ble oppnådd. deltakere ...

Behaviorally ble alle deltakerne mer nøyaktige og raskere med trening for forutsigbare stimuli, men ikke for tilfeldige stimuli (interaksjon F (5,210) = 9.85, P<0.0001 for nøyaktighet og F (5,210) = 6.60, P<0.0001 for responstid; Tilleggstabell 1 og Fig. 1 på nett). Hovedsakelig var det en belønning x aldersinteraksjon for responstider (F (2,42) = 5.03, P = 0.01). Post-hoc-tester viste at ungdom var den eneste aldersgruppen som reagerte betydelig raskere på stimuli forbundet med store fordeler sammenlignet med små belønninger (t (15) = 3.24, P = 0.006; for barn t (17) = -0.32, P = 0.75 og for voksne t (10) = 1.90, P = 0.09).

Vi modellerte fMRI-dataene for å tillate separat estimering av nevrale responsene til stimulus og tilbakemelding (Supplerende metoder og Fig. 2 på nett; for helhjernens hovedeffekter av å se stimuliene og motta tilbakemelding om svar, se Supplerende fig. 3-4 og Tabeller 2-3 på nett). Vi undersøkte hvordan nevrale korrelasjoner med modellbaserte beslutningssignaler (beslutningsverdi og prediksjonsfeil) var relatert til alder.

Figur 2

MR-resultater. (a) Regioner som viser sammenhenger med alder når de korrigeres på hele hjernenivået ved z> 2.3, P<0.05. De striatale og kantede gyrusregionene var negativt korrelert med alderen2; fordi gjennomsnittsalderen2 ble trukket fra ...

Vi analyserte kvadratiske trender i positiv prediksjonsfeil ved tilbakemelding og identifiserte to regioner hvor ungdommer viste en overfølsom respons sammenlignet med de andre aldersgruppene-striatum og vinkelgyrus. Et område i den mediale prefrontale cortex viste en negativ lineær effekt av alder på stimulusbeslutningsverdien, slik at yngre deltakere hadde et sterkere beslutningsverdisignal i denne regionen sammenlignet med eldre deltakere; denne regionen har vært sterkt forbundet med målrettet stimulansverdi i tidligere arbeid hos voksne (Fig. 2a)12. Således, mens respons på uforutsigbar positiv tilbakemelding toppet i ungdomsårene, økte følsomheten for stimulusverdien lineært med alderen (for plott mellom alder og hver av de ovennevnte regionene av interesse [ROIs], se Supplerende Fig. 5 på nett).

Gitt at beslutningsverdien utvikler seg gjennom feilstyrt læring i modellen, var det overraskende at beslutningsverdien viste en annen aldersrelatert bane enn prediksjonsfeil. På grunn av oppgavens struktur er det imidlertid mulig at valg ble drevet av andre faktorer utover forsterkningslæring (f.eks. Eksplisitt minne). For å klargjøre resultatene kjørte vi en andre modell som beregnet beslutningsverdien på en mer integrerende måte som andelen av tidligere studier der den optimale responsen ble valgt for hver stimulus (Lin, Adolphs & Rangel, upublisert; Supplerende metoder på nett). Vi analyserte prediksjonsfeilverdier fra denne modellen og fant at de speilte resultatene fra våre første analyser, viser regioner i striatum og parietal cortex, sammen med ventrale laterale prefrontale regioner, hvor nevrale respons på prediksjonsfeil toppet i ungdomsårene. Analyse av avgjørelsesverdi fra denne modellen viste både lineære og ikke-lineære forhold mellom alder og neural aktivitet i en rekke regioner, inkludert lateral parietal cortex og striatum (Supplerende Fig. 6 og Tabell 5 på nett). Forsøkende (ikke-uavhengige) avkastningsanalyser viste at den neurale responsen til avgjørelsesverdi i denne modellen syntes å øke mellom barndom og ungdom, men så asymptotert mellom ungdomsår og voksenliv (Supplerende Fig. 7 på nett). Disse resultatene viste at peak prediksjonsfeilresponsen i ungdomsårene var robust til forskjellige modeller, mens aldersrelaterte endringer i beslutningsverdisignaler var følsomme for modellspesifikasjon.

Basert på tidligere arbeid som viser at ventralstriatumet er konsekvent følsomt overfor uventet positiv tilbakemelding, som reflektert i modellbaserte belønningsforutsigelsesfeil signaler (f.eks.7), undersøkte vi lokaliseringen av prediksjonsfeilrelaterte svar for hver aldersgruppe separat i en uavhengig anatomisk avkastning, inkludert de bilaterale caudatene, putamen og nucleus accumbens ved hjelp av den opprinnelige forsterkningsinlæringsmodellen (Fig. 2b). Striatalregioner som er betydelig relatert til positiv prediksjonsfeil, overlapper ikke for ungdom og voksne. Mens voksne i denne studien hadde aktivitet i den ventrale striatal regionen konsekvent sett i studier som undersøkte prediksjonsfeil hos voksne, hadde ungdommer aktivitet i en mer dorsal region. Barn hadde ingen aktivitet i striatum relatert til positiv prediksjonsfeil.

Våre resultater utvider tidligere funn av økt belønningsrelatert nevrologisk aktivitet i ungdomsårene8 ved å demonstrere at dette funnet er spesifikt for prediksjonsfeil, sammenlignet med verdsettelsessignaler. Utviklingsforskjellene i prediksjonsfeilrespons reflekterer sannsynligvis forskjeller i fasisk dopamin-signalering13. Hvis det er riktig, gir dette en direkte forklaring på den risikable belønningsøkende oppførselen som ofte blir observert hos ungdom. Den økte risikable oppførselen i ungdomsårene kan i teorien gjenspeile enten nedsatt følsomhet overfor potensielle negative resultater eller økt følsomhet overfor potensielle positive resultater. Vi tror at våre data er konsistente med sistnevnte: det vil si økte prediksjonsfeil signaler (putatively reflekterer større phasic dopamin signaler) gjenspeiler større effekt av positive resultater14, som foreslås å resultere i økt motivasjon for å oppnå positive resultater (og dermed større risikoopptak). Dermed kan en overaktiv dopaminerge prediksjonsfeilrespons hos ungdom føre til økning i belønningsøkende, særlig når kombinert med et umodent kognitivt kontrollsystem1.

De nåværende funnene kan kaste lys på hvorfor tidligere studier har gitt inkonsekvente virkninger av alder på belønningsprosessering. For det første sammenlignet ikke alle studier ungdommer til både barn og voksne, noe som betyr at muligheten for ikke-lineære forhold til alder ikke kunne noteres. Videre har definisjonen av "ungdom" ikke vært konsistent i forhold til studier. For det andre er det viktig å merke seg at den probabilistiske læringsoppgaven som benyttes her ikke var en risikofylt beslutningstaking i seg selv, og dermed er forskjellig fra andre oppgaver brukt i belønning og risikovillig litteratur. For det tredje antyder resultatene at en riktig forståelse av utviklingsendringer i belønningsprosessering krever bruk av modellbaserte tilnærminger sammen med dekomponering av individuelle prøvekomponenter (stimulus, valg og tilbakemelding).

Det blir stadig mer innlysende at ungdomsår er en unik periode i psykologisk utvikling, og at den risikable, belønningsøkende atferden som oppstår i denne perioden kan føre til betydelig sykelighet og dødelighet, inkludert utilsiktet død og oppstart av narkotikamisbruk. Dermed er forståelsen av det neurale grunnlaget for ungdomsbeslutninger en kritisk utfordring. Nåværende arbeid antyder at en bidragsyter til ungdomsbelønningssøking kan være tilstedeværelse av forbedrede prediksjonsfeilssignaler, noe som gir et nytt mål for fremtidige studier av denne viktige utviklingsperioden.

Tilleggsmateriale

Erkjennelsene

Denne undersøkelsen ble støttet av National Institute of Mental Health (5R24 MH072697), Nasjonalt institutt for narkotikamisbruk (5F31 DA024534), McDonnell Foundation og Della Martin Foundation.

Fotnoter

Forfatterbidrag JRC bidro til å designe eksperimentene, gjennomføre datainnsamling og analyser, og skrev manuskriptet. RFA, RMB og SYB designet eksperimenter. FWS bidro til datainnsamling. BJK og RAP utformet forsøkene og bidro til å skrive manuskriptet.

 

Konkurrerende interesser Forfatterne erklærer at de ikke har konkurrerende økonomiske interesser.

Referanser

1. Casey BJ, Getz S, Galvan A. Dev Rev. 2008;28: 62-77. [PMC gratis artikkel] [PubMed]
2. Kahneman D, Tversky A. Econometrica. 1979;47: 263-91.
3. Chib VS, Rangel A, Shimojo S, O'Doherty JP. J Neurosci. 2009;29: 12315-20. [PubMed]
4. Tom SM, Fox CR, Trepel C, Poldrack RA. Science. 2007;315: 515-8. [PubMed]
5. Rescorla RA, Wagner AR. I: Klassisk kondisjon II: Aktuell forskning og teori. Black A, Prokasy WF, redaktører. Appleton Century Crofts; New York, NY: 1972. pp. 64-99.
6. Schultz W, Dayan P, Montague PR. Science. 1997;275: 1593-9. [PubMed]
7. Pagnoni G, Zink CF, Montague PR, Berns GS. Nat Neurosci. 2002;5: 97-8. [PubMed]
8. Galvan A, et al. J Neurosci. 2006;26: 6885-92. [PubMed]
9. Bjork JM, et al. J Neurosci. 2004;24: 1793-802. [PubMed]
10. May JC, et al. Biolpsykiatri. 2004;55: 359-66. [PubMed]
11. Knowlton BJ, Mangels JA, Squire LR. Science. 1996;273: 1399-402. [PubMed]
12. Hare TA, O'Doherty J, Camerer CF, Schultz W, Rangel A. J Neurosci. 2008;28: 5623-30. [PubMed]
13. D'Ardenne K, McClure SM, Nystrom LE, Cohen JD. Science. 2008;319: 1264-7. [PubMed]
14. Berridge KC, Robinson TE. Brain Res Rev. 1998;28: 309-69. [PubMed]