Unikátní odpověď dospívajících na odměňování chyb předpovědí (2010)

Nat Neurosci. 2010 Jun; 13 (6): 669-71. Epub 2010 May 16.

 

Zdroj

Katedra psychologie, Kalifornská univerzita v Los Angeles, Los Angeles, Kalifornie, USA. [chráněno e-mailem]

Abstraktní

Předchozí práce ukázala, že lidské adolescenty mohou být přecitlivělé na odměny, ale není známo, který aspekt odměna za to odpovídá zpracování. Oddělili jsme hodnotu rozhodnutí a předpověď chybové signály a zjistili, že neurální předpověď chybové signály ve striatu vrcholily v adolescenci, zatímco signály hodnot neurální hodnoty se lišily v závislosti na tom, jak byla hodnota modelována. To naznačuje, že zvýšené dopaminergní předpověď přispívá chyba reakce dospívající odměna hledající.

Dospívání je jedinečným obdobím psychologického vývoje, které se ve srovnání s dětmi a dospělými vyznačuje zvýšeným rizikovým výběrem a jednáním. To může odrážet relativně časný funkční vývoj limbických afektivních a odměňovacích systémů ve srovnání s prefrontální kůrou1, jako je to, že adolescenti mají sklon přijímat špatná rozhodnutí a riskantnější rozhodnutí častěji než děti (které ještě nejsou plně citlivé na odměny) a dospělé (které jsou citlivé na odměny, ale mají schopnost vykonávat kontrolu nad naléhavými potřebami).

Podle teorií rozhodování o chování jsou volby řízeny hodnotou přiřazenou každé potenciální volbě (hodnota rozhodnutí)2. Rozhodovací hodnotu vypočítává systém v mediální prefrontální kůře, který slouží jako společná cesta pro reprezentaci hodnot3,4. Abychom se však mohli chovat adaptivně v měnícím se nebo hlučném světě, musí být tyto hodnoty aktualizovány na základě zkušeností. Signály chyby predikce odměny odrážejí rozdíl mezi očekávanou hodnotou akce a skutečným výsledkem akce5a jsou kódovány fázovou aktivitou v mezolimbickém dopaminovém systému6. U fMRI jsou obvykle pozorovány ve ventrálním striatu, což odráží dopaminergní produkci (např. 7). Povaha signálů chyby predikce u dětí nebo adolescentů není známa. Dospívající mohou mít přecitlivělou striatální reakci na odměnu8, i když je toto zjištění poněkud nekonzistentní9,10. Zkoumali jsme, zda je adolescence spojena s jedinečnými změnami signálů hodnot rozhodování nebo predikčních chyb, pomocí pravděpodobnostního paradigmatu učení11 (Obr. 1; vidět Doplňkové metody online). Odhadli jsme jak hodnotu rozhodnutí, tak i signály predikce chyby v každé studii během učení pomocí jednoduchého modelu učení5. Pomocí parametrických analýz fMRI jsme identifikovali oblasti mozku, jejichž odpověď byla modulována v souladu s těmito signály, a zkoumali jsme, jak se tato odpověď mění s věkem od dětství do dospělosti. Zkoumali jsme jak lineární efekty (které odrážejí obecné maturační nebo vývojové trendy), tak kvadratické efekty (které odrážejí účinky specifické pro dospívající) s věkem. Tato práce představuje první zkoumání těchto dílčích složek rozhodování napříč vývojem.

Obrázek 1

Experimentální design. Zdraví účastníci 45 (18 děti ve věku 8 – 12, 16 adolescenti ve věku 14 – 19 a 11 dospělí ve věku 25 – 30) provedli během akvizice fMRI pravděpodobnostní učební úkol. Byl získán písemný informovaný souhlas. Účastníci ...

Behaviorálně byli všichni účastníci přesnější a rychlejší s tréninkem na předvídatelné podněty, ale ne na náhodné podněty (interakce F (5,210) = 9.85, P<0.0001 pro přesnost a F (5,210) = 6.60, P<0.0001 pro doby odezvy; Doplňková tabulka 1 a Obr. 1 online). Důležité je, že za dobu odezvy došlo k interakci odměna x věk (F (2,42) = 5.03, P = 0.01). Post-hoc testy ukázaly, že adolescenti byli jedinou věkovou skupinou, která reagovala podstatně rychleji na podněty spojené s velkými odměnami ve srovnání s malými odměnami (t (15) = 3.24, P = 0.006; pro děti t (17) = −0.32, P = 0.75 a pro dospělé t (10) = 1.90, P = 0.09).

Modelovali jsme data fMRI, abychom umožnili samostatný odhad nervových odpovědí na stimul a zpětnou vazbu (Doplňkové metody a Obr. 2 online; hlavní účinky sledování mozku a získávání zpětné vazby o reakcích na celý mozek viz Doplňkové obr. 3 – 4 a tabulky 2 – 3 online). Zkoumali jsme, jak neurální korelace s rozhodovacími signály založenými na modelu (hodnota rozhodnutí a chyba predikce) souvisejí s věkem.

Obrázek 2

Výsledky MRI. (a) Regiony vykazující korelace s věkem při korekci na úrovni celého mozku při z> 2.3, P<0.05. Striatální a úhlové gyrusové oblasti negativně korelovaly s věkem2; protože průměrný věk2 byl odečten ...

Analyzovali jsme kvadratické trendy v pozitivní predikční chybě při zpětné vazbě a identifikovali jsme dva regiony, ve kterých adolescenti vykazovali hypersenzitivní odpověď ve srovnání s ostatními věkovými skupinami - striatem a úhlovým gyrem. Oblast v mediální prefrontální kůře vykázala negativní lineární účinek věku na hodnotu rozhodnutí o podnětu, takže mladší účastníci měli v této oblasti silnější signál hodnoty rozhodnutí ve srovnání se staršími účastníky; tento region byl silně spojen s cílovou hodnotou stimulu v předchozí práci u dospělých (Obr. 2a)12. Zatímco odpověď na nepředvídatelnou pozitivní zpětnou vazbu vrcholila v adolescenci, citlivost na hodnotu stimulu lineárně klesala s věkem (pro grafy mezi věkem a každou z výše uvedených oblastí zájmu [ROI] viz Doplňkový obrázek 5 online).

Vzhledem k tomu, že hodnota rozhodnutí se vyvíjí pomocí učení založeného na chybách v modelu, bylo překvapivé, že hodnota rozhodnutí ukázala jinou trajektorii související s věkem než chyba predikce. Vzhledem ke struktuře úkolu je však možné, že výběr byl poháněn jinými faktory, které přesahují učení posílení (např. Explicitní paměť). Abychom objasnili výsledky, spustili jsme druhý model, který počítal rozhodovací hodnotu integrativnějším způsobem jako podíl předchozích pokusů, na kterých byla zvolena optimální odpověď pro každý stimul (Lin, Adolphs & Rangel, nepublikováno; Doplňkové metody online). Analyzovali jsme hodnoty chyb predikce z tohoto modelu a zjistili jsme, že odrážejí výsledky našich počátečních analýz, ukazující regiony ve striatu a parietální kůře, spolu s ventrálními laterálními prefrontálními oblastmi, kde nervová odpověď na chybu predikce vrcholila v adolescenci. Analýza hodnoty rozhodnutí z tohoto modelu ukázala jak lineární, tak nelineární vztahy mezi věkem a nervovou aktivitou v řadě regionů, včetně laterální parietální kůry a striata (Doplňkový obrázek 6 a tabulka 5 online). Průzkumné (nezávislé) ROI analýzy ukázaly, že nervová odpověď na rozhodovací hodnotu v tomto modelu se zdála mezi vzrůstem mezi dětstvím a dospíváním, ale poté asymptotována mezi dospíváním a dospělostí (Doplňkový obrázek 7 online). Tyto výsledky ukázaly, že maximální odpověď na chyby predikce v adolescenci byla robustní pro různé modely, zatímco změny související s věkem v signálech hodnot rozhodnutí byly citlivé na specifikaci modelu.

Na základě předchozí práce, která ukazuje, že ventrální striatum je trvale citlivé na neočekávanou pozitivní zpětnou vazbu, jak se odráží v chybových signálech predikce odměn založených na modelu (např.7) jsme zkoumali lokalizaci odpovědí souvisejících s predikční chybou pro každou věkovou skupinu samostatně v rámci nezávislé anatomické ROI včetně bilaterálního caudate, putamen a nucleus accumbens pomocí původního modelu učení zesílení (Obr. 2b). Striatální regiony významně spojené s chybou pozitivní predikce se u dospívajících i dospělých nepřekrývaly. Zatímco dospělí v této studii měli aktivitu ve ventrální striatální oblasti konzistentně vidět ve studiích zkoumajících chyby predikce u dospělých, adolescenti měli aktivitu v dorsální oblasti. Děti neměly ve striatu žádnou aktivitu související s chybou pozitivní predikce.

Naše výsledky rozšiřují předchozí nálezy zvýšené odměny související s neurální aktivitou během dospívání8 prokázáním, že toto zjištění je specifické pro chybu predikce ve srovnání se signály ohodnocení. Vývojové rozdíly v reakci na predikční chybu pravděpodobně odrážejí rozdíly ve fázové signalizaci dopaminu13. Pokud je to správné, poskytuje to přímé vysvětlení rizikového chování při hledání odměn, které je u dospívajících často pozorováno. Zvýšené rizikové chování v adolescenci by teoreticky mohlo odrážet buď sníženou citlivost na potenciální negativní výsledky nebo zvýšenou citlivost na potenciální pozitivní výsledky. Věříme, že naše data jsou v souladu s posledními: to znamená, že zvýšené signály predikčních chyb (údajně odrážející větší fázové dopaminové signály) odrážejí větší dopad pozitivních výsledků14, což má za následek zvýšenou motivaci k získání pozitivních výsledků (a tedy k většímu riskování). Reakce na nadměrně aktivní dopaminergní predikci u dospívajících by tedy mohla vést ke zvýšení hledání odměn, zejména ve spojení s nezralým kognitivním kontrolním systémem.1.

Současná zjištění mohou objasnit, proč předchozí studie přinesly nekonzistentní účinky věku na zpracování odměn. Zaprvé, ne všechny studie porovnávaly dospívající děti a dospělé, což znamená, že možnost nelineárních vztahů s věkem nemohla být zaznamenána. Dále, definice „dospívající“ nebyla v rámci studií konzistentní. Za druhé je důležité si uvědomit, že zde používaný pravděpodobnostní učební úkol nebyl sám o sobě riskantním rozhodovacím úkolem, takže se liší od ostatních úkolů používaných v literatuře o odměňování a riskování. Za třetí, naše výsledky naznačují, že správné porozumění vývojovým změnám ve zpracování odměn vyžaduje použití modelových přístupů spolu s rozkladem jednotlivých složek zkoušky (stimul, výběr a zpětná vazba).

Stále více si uvědomujeme, že dospívání je jedinečným obdobím v psychologickém vývoji a že rizikové chování při hledání odměn, ke kterému dochází během tohoto období, může vést k významné morbiditě a úmrtnosti, včetně náhodné smrti a nástupu drogové závislosti. Pochopení nervového základu rozhodování dospívajících je tedy kritickou výzvou. Tato práce naznačuje, že jedním z přispěvatelů k dospívání při hledání odměn může být přítomnost zesílených signálů chyb predikce, což poskytuje nový cíl pro budoucí studie tohoto důležitého období vývoje.

Doplňkový materiál

Poděkování

Tento výzkum podpořili Národní ústav duševního zdraví (5R24 MH072697), Národní institut zneužívání drog (5F31 DA024534), McDonnell Foundation a Della Martin Foundation.

Poznámky pod čarou

Autorské příspěvky JRC pomohl navrhnout experimenty, provedl sběr a analýzu dat a napsal rukopis. Experimenty navrhly RFA, RMB a SYB. FWS přispěl k získávání dat. BJK a RAP navrhly experimenty a pomohly napsat rukopis.

 

Konkurenční zájmy Autoři prohlašují, že nemají konkurenční finanční zájmy.

Reference

1. Casey BJ, Getz S, Galvan A. Dev Rev. 2008;28: 62-77. [PMC bezplatný článek] [PubMed]
2. Kahneman D, Tversky A. Econometrica. 1979;47: 263-91.
3. Chib VS, Rangel A, Shimojo S, O'Doherty JP. J Neurosci. 2009;29: 12315-20. [PubMed]
4. Tom SM, Fox CR, Trepel C, Poldrack RA. Science. 2007;315: 515-8. [PubMed]
5. Rescorla RA, Wagner AR. V: Klasická kondice II: Současný výzkum a teorie. Black A, Prokasy WF, editoři. Crown Appleton Century Crofts; New York, NY: 1972. str. 64 – 99.
6. Schultz W, Dayan P, Montague PR. Science. 1997;275: 1593-9. [PubMed]
7. Pagnoni G, Zink CF, Montague PR, Berns GS. Nat Neurosci. 2002;5: 97-8. [PubMed]
8. Galvan A, a kol. J Neurosci. 2006;26: 6885-92. [PubMed]
9. Bjork JM, a kol. J Neurosci. 2004;24: 1793-802. [PubMed]
10. May JC, a kol. Biol Psychiatry. 2004;55: 359-66. [PubMed]
11. Knowlton BJ, Mangels JA, Squire LR. Science. 1996;273: 1399-402. [PubMed]
12. Zajíc TA, O'Doherty J, Camerer CF, Schultz W, Rangel A. J Neurosci. 2008;28: 5623-30. [PubMed]
13. D'Ardenne K, McClure SM, Nystrom LE, Cohen JD. Science. 2008;319: 1264-7. [PubMed]
14. Berridge KC, Robinson TE. Brain Res Rev. 1998;28: 309-69. [PubMed]