Nat Neurosci. 2010 Jun; 13 (6): 669-71. Epub 2010 May 16.
Zdroj
Katedra psychologie, Kalifornská univerzita v Los Angeles, Los Angeles, Kalifornie, USA. [chráněno e-mailem]
Abstraktní
Předchozí práce ukázala, že lidské adolescenty mohou být přecitlivělé na odměny, ale není známo, který aspekt odměna za to odpovídá zpracování. Oddělili jsme hodnotu rozhodnutí a předpověď chybové signály a zjistili, že neurální předpověď chybové signály ve striatu vrcholily v adolescenci, zatímco signály hodnot neurální hodnoty se lišily v závislosti na tom, jak byla hodnota modelována. To naznačuje, že zvýšené dopaminergní předpověď přispívá chyba reakce dospívající odměna hledající.
Dospívání je jedinečným obdobím psychologického vývoje, které se ve srovnání s dětmi a dospělými vyznačuje zvýšeným rizikovým výběrem a jednáním. To může odrážet relativně časný funkční vývoj limbických afektivních a odměňovacích systémů ve srovnání s prefrontální kůrou1, jako je to, že adolescenti mají sklon přijímat špatná rozhodnutí a riskantnější rozhodnutí častěji než děti (které ještě nejsou plně citlivé na odměny) a dospělé (které jsou citlivé na odměny, ale mají schopnost vykonávat kontrolu nad naléhavými potřebami).
Podle teorií rozhodování o chování jsou volby řízeny hodnotou přiřazenou každé potenciální volbě (hodnota rozhodnutí)2. Rozhodovací hodnotu vypočítává systém v mediální prefrontální kůře, který slouží jako společná cesta pro reprezentaci hodnot3,4. Abychom se však mohli chovat adaptivně v měnícím se nebo hlučném světě, musí být tyto hodnoty aktualizovány na základě zkušeností. Signály chyby predikce odměny odrážejí rozdíl mezi očekávanou hodnotou akce a skutečným výsledkem akce5a jsou kódovány fázovou aktivitou v mezolimbickém dopaminovém systému6. U fMRI jsou obvykle pozorovány ve ventrálním striatu, což odráží dopaminergní produkci (např. 7). Povaha signálů chyby predikce u dětí nebo adolescentů není známa. Dospívající mohou mít přecitlivělou striatální reakci na odměnu8, i když je toto zjištění poněkud nekonzistentní9,10. Zkoumali jsme, zda je adolescence spojena s jedinečnými změnami signálů hodnot rozhodování nebo predikčních chyb, pomocí pravděpodobnostního paradigmatu učení11 (Obr. 1; vidět Doplňkové metody online). Odhadli jsme jak hodnotu rozhodnutí, tak i signály predikce chyby v každé studii během učení pomocí jednoduchého modelu učení5. Pomocí parametrických analýz fMRI jsme identifikovali oblasti mozku, jejichž odpověď byla modulována v souladu s těmito signály, a zkoumali jsme, jak se tato odpověď mění s věkem od dětství do dospělosti. Zkoumali jsme jak lineární efekty (které odrážejí obecné maturační nebo vývojové trendy), tak kvadratické efekty (které odrážejí účinky specifické pro dospívající) s věkem. Tato práce představuje první zkoumání těchto dílčích složek rozhodování napříč vývojem.
Behaviorálně byli všichni účastníci přesnější a rychlejší s tréninkem na předvídatelné podněty, ale ne na náhodné podněty (interakce F (5,210) = 9.85, P<0.0001 pro přesnost a F (5,210) = 6.60, P<0.0001 pro doby odezvy; Doplňková tabulka 1 a Obr. 1 online). Důležité je, že za dobu odezvy došlo k interakci odměna x věk (F (2,42) = 5.03, P = 0.01). Post-hoc testy ukázaly, že adolescenti byli jedinou věkovou skupinou, která reagovala podstatně rychleji na podněty spojené s velkými odměnami ve srovnání s malými odměnami (t (15) = 3.24, P = 0.006; pro děti t (17) = −0.32, P = 0.75 a pro dospělé t (10) = 1.90, P = 0.09).
Modelovali jsme data fMRI, abychom umožnili samostatný odhad nervových odpovědí na stimul a zpětnou vazbu (Doplňkové metody a Obr. 2 online; hlavní účinky sledování mozku a získávání zpětné vazby o reakcích na celý mozek viz Doplňkové obr. 3 – 4 a tabulky 2 – 3 online). Zkoumali jsme, jak neurální korelace s rozhodovacími signály založenými na modelu (hodnota rozhodnutí a chyba predikce) souvisejí s věkem.
Analyzovali jsme kvadratické trendy v pozitivní predikční chybě při zpětné vazbě a identifikovali jsme dva regiony, ve kterých adolescenti vykazovali hypersenzitivní odpověď ve srovnání s ostatními věkovými skupinami - striatem a úhlovým gyrem. Oblast v mediální prefrontální kůře vykázala negativní lineární účinek věku na hodnotu rozhodnutí o podnětu, takže mladší účastníci měli v této oblasti silnější signál hodnoty rozhodnutí ve srovnání se staršími účastníky; tento region byl silně spojen s cílovou hodnotou stimulu v předchozí práci u dospělých (Obr. 2a)12. Zatímco odpověď na nepředvídatelnou pozitivní zpětnou vazbu vrcholila v adolescenci, citlivost na hodnotu stimulu lineárně klesala s věkem (pro grafy mezi věkem a každou z výše uvedených oblastí zájmu [ROI] viz Doplňkový obrázek 5 online).
Vzhledem k tomu, že hodnota rozhodnutí se vyvíjí pomocí učení založeného na chybách v modelu, bylo překvapivé, že hodnota rozhodnutí ukázala jinou trajektorii související s věkem než chyba predikce. Vzhledem ke struktuře úkolu je však možné, že výběr byl poháněn jinými faktory, které přesahují učení posílení (např. Explicitní paměť). Abychom objasnili výsledky, spustili jsme druhý model, který počítal rozhodovací hodnotu integrativnějším způsobem jako podíl předchozích pokusů, na kterých byla zvolena optimální odpověď pro každý stimul (Lin, Adolphs & Rangel, nepublikováno; Doplňkové metody online). Analyzovali jsme hodnoty chyb predikce z tohoto modelu a zjistili jsme, že odrážejí výsledky našich počátečních analýz, ukazující regiony ve striatu a parietální kůře, spolu s ventrálními laterálními prefrontálními oblastmi, kde nervová odpověď na chybu predikce vrcholila v adolescenci. Analýza hodnoty rozhodnutí z tohoto modelu ukázala jak lineární, tak nelineární vztahy mezi věkem a nervovou aktivitou v řadě regionů, včetně laterální parietální kůry a striata (Doplňkový obrázek 6 a tabulka 5 online). Průzkumné (nezávislé) ROI analýzy ukázaly, že nervová odpověď na rozhodovací hodnotu v tomto modelu se zdála mezi vzrůstem mezi dětstvím a dospíváním, ale poté asymptotována mezi dospíváním a dospělostí (Doplňkový obrázek 7 online). Tyto výsledky ukázaly, že maximální odpověď na chyby predikce v adolescenci byla robustní pro různé modely, zatímco změny související s věkem v signálech hodnot rozhodnutí byly citlivé na specifikaci modelu.
Na základě předchozí práce, která ukazuje, že ventrální striatum je trvale citlivé na neočekávanou pozitivní zpětnou vazbu, jak se odráží v chybových signálech predikce odměn založených na modelu (např.7) jsme zkoumali lokalizaci odpovědí souvisejících s predikční chybou pro každou věkovou skupinu samostatně v rámci nezávislé anatomické ROI včetně bilaterálního caudate, putamen a nucleus accumbens pomocí původního modelu učení zesílení (Obr. 2b). Striatální regiony významně spojené s chybou pozitivní predikce se u dospívajících i dospělých nepřekrývaly. Zatímco dospělí v této studii měli aktivitu ve ventrální striatální oblasti konzistentně vidět ve studiích zkoumajících chyby predikce u dospělých, adolescenti měli aktivitu v dorsální oblasti. Děti neměly ve striatu žádnou aktivitu související s chybou pozitivní predikce.
Naše výsledky rozšiřují předchozí nálezy zvýšené odměny související s neurální aktivitou během dospívání8 prokázáním, že toto zjištění je specifické pro chybu predikce ve srovnání se signály ohodnocení. Vývojové rozdíly v reakci na predikční chybu pravděpodobně odrážejí rozdíly ve fázové signalizaci dopaminu13. Pokud je to správné, poskytuje to přímé vysvětlení rizikového chování při hledání odměn, které je u dospívajících často pozorováno. Zvýšené rizikové chování v adolescenci by teoreticky mohlo odrážet buď sníženou citlivost na potenciální negativní výsledky nebo zvýšenou citlivost na potenciální pozitivní výsledky. Věříme, že naše data jsou v souladu s posledními: to znamená, že zvýšené signály predikčních chyb (údajně odrážející větší fázové dopaminové signály) odrážejí větší dopad pozitivních výsledků14, což má za následek zvýšenou motivaci k získání pozitivních výsledků (a tedy k většímu riskování). Reakce na nadměrně aktivní dopaminergní predikci u dospívajících by tedy mohla vést ke zvýšení hledání odměn, zejména ve spojení s nezralým kognitivním kontrolním systémem.1.
Současná zjištění mohou objasnit, proč předchozí studie přinesly nekonzistentní účinky věku na zpracování odměn. Zaprvé, ne všechny studie porovnávaly dospívající děti a dospělé, což znamená, že možnost nelineárních vztahů s věkem nemohla být zaznamenána. Dále, definice „dospívající“ nebyla v rámci studií konzistentní. Za druhé je důležité si uvědomit, že zde používaný pravděpodobnostní učební úkol nebyl sám o sobě riskantním rozhodovacím úkolem, takže se liší od ostatních úkolů používaných v literatuře o odměňování a riskování. Za třetí, naše výsledky naznačují, že správné porozumění vývojovým změnám ve zpracování odměn vyžaduje použití modelových přístupů spolu s rozkladem jednotlivých složek zkoušky (stimul, výběr a zpětná vazba).
Stále více si uvědomujeme, že dospívání je jedinečným obdobím v psychologickém vývoji a že rizikové chování při hledání odměn, ke kterému dochází během tohoto období, může vést k významné morbiditě a úmrtnosti, včetně náhodné smrti a nástupu drogové závislosti. Pochopení nervového základu rozhodování dospívajících je tedy kritickou výzvou. Tato práce naznačuje, že jedním z přispěvatelů k dospívání při hledání odměn může být přítomnost zesílených signálů chyb predikce, což poskytuje nový cíl pro budoucí studie tohoto důležitého období vývoje.
Poděkování
Tento výzkum podpořili Národní ústav duševního zdraví (5R24 MH072697), Národní institut zneužívání drog (5F31 DA024534), McDonnell Foundation a Della Martin Foundation.
Poznámky pod čarou
Autorské příspěvky JRC pomohl navrhnout experimenty, provedl sběr a analýzu dat a napsal rukopis. Experimenty navrhly RFA, RMB a SYB. FWS přispěl k získávání dat. BJK a RAP navrhly experimenty a pomohly napsat rukopis.
Konkurenční zájmy Autoři prohlašují, že nemají konkurenční finanční zájmy.