Un răspuns unic la adolescent pentru a recompensa erorile de predicție (2010)

Nat Neurosci. 2010 iunie; 13 (6): 669-71. Epub 2010 Mai 16.

Cohen JR, Asarnow RF, Sabb FW, Bilder RM, Bookheimer SY, Knowlton BJ, Poldrack RA.

Sursă

Departamentul de Psihologie, Universitatea din California Los Angeles, Los Angeles, California, SUA. [e-mail protejat]

Abstract

Lucrările anterioare au arătat că adolescenții umani pot fi hipersensibili la recompense, dar nu se știe care este aspectul răsplăti prelucrarea este responsabil pentru acest lucru. Am separat valoarea deciziei și prezicere eroare semnale și a constatat că neural prezicere semnale de eroare în striatum au atins punctul culminant în adolescență, în timp ce semnalele valorii deciziei neuronale au variat în funcție de modul în care a fost modelată valoarea. Acest lucru sugerează că a crescut dopaminergic prezicere răspunsul la eroare contribuie la adolescent răsplăti caută.

Adolescența este o perioadă unică în dezvoltarea psihologică, caracterizată prin creșterea alegerilor și acțiunilor riscante în comparație cu copiii și adulții. Aceasta poate reflecta dezvoltarea funcțională relativ timpurie a sistemelor limbice afective și de recompensare în comparație cu cortexul prefrontal¹, astfel încât adolescenții tind să ia decizii proaste și alegeri riscante mai des decât copiii (care nu sunt încă pe deplin sensibili la recompense) și adulții (care sunt sensibili la recompense, dar au capacitatea de a exercita controlul asupra pretențiilor de răsplată).

Conform teoriilor de decizie comportamentale, alegerile sunt determinate de valoarea atribuită fiecărei alegeri potențiale (valoarea deciziei)². Valoarea deciziei este calculată de un sistem în cortexul prefrontal medial care servește ca o cale comună pentru reprezentarea valorii³^,⁴. Cu toate acestea, pentru a se adapta într-o lume schimbătoare sau zgomotoasă, aceste valori trebuie actualizate pe baza experienței. Ratele de predicție a erorilor de recompensare reflectă diferența dintre valoarea așteptată a unei acțiuni și rezultatul real al acțiunii⁵, și sunt codificați prin activitatea fazică în sistemul mezolimbic de dopamină⁶. În fMRI, acestea sunt de obicei observate în striatum ventral, reflectând producția dopaminergică (de exemplu, ⁷). Natura semnalelor de eroare de predicție la copii sau adolescenți este necunoscută. Adolescenții pot avea un răspuns striat de hipersensibilitate la recompensă⁸, deși această constatare este oarecum inconsecventă⁹^,¹⁰. Am examinat dacă adolescența este asociată cu schimbări unice în semnalele de valoare de decizie sau de eroare de predicție, folosind o paradigmă de învățare probabilistică¹¹ (Fig. 1; vedea Metode suplimentare pe net). Am estimat atât semnalul de decizie cât și semnalul de eroare de predicție pentru fiecare încercare în timpul învățării folosind un model simplu de învățare⁵. Folosind analizele parametrice fMRI, am identificat regiunile creierului ale căror răspunsuri au fost modulate în conformitate cu aceste semnale și au examinat modul în care acest răspuns sa schimbat odată cu vârsta, de la copilărie până la maturitate. Am examinat ambele efecte liniare (care reflectă tendințele generale de maturare sau dezvoltare) și efectele patratice (care reflectă efectele specifice adolescenților) cu vârsta. Această lucrare reprezintă prima examinare a acestor subcomponente de luare a deciziilor în cadrul dezvoltării.

Proiectare experimentală. Participanții sănătoși 45 (copii 18 în vârstă de 8-12, adolescenți 16 cu vârsta de 14-19 și adulți 11 în vârstă de 25-30) au efectuat o probă de învățare probabilistică în timpul achiziției de fMRI. A fost obținut consimțământul informat în scris. Participanți ...

În mod comportamental, toți participanții au devenit mai exacți și mai rapizi cu instruirea pentru stimuli previzibili, dar nu pentru stimulii aleatorii (interacțiunea F (5,210) = 9.85, P<0.0001 pentru precizie și F (5,210) = 6.60, P<0.0001 pentru timpii de răspuns; Masa suplimentară 1 și Fig. 1 pe net). În mod crucial, a existat o interacțiune de răsplată x vârstă pentru timpii de răspuns (F (2,42) = 5.03, P = 0.01). Testele post-hoc au arătat că adolescenții au fost singurul grup de vârstă care a reacționat semnificativ mai repede la stimulii asociați cu recompense mari comparativ cu recompensele mici (t (15) = 3.24, P = 0.006; pentru copii t (17) = -0.32, P = 0.75 și pentru adulți t (10) = 1.90, P = 0.09).

Am modelat datele fMRI pentru a permite o estimare separată a răspunsurilor neurale la stimul și feedback (Metode suplimentare și Fig. 2 pe net; pentru efectele principale ale întregului creier de a vedea stimulii și a primi feedback despre răspunsuri, a se vedea Figurile suplimentare. 3-4 și tabelele 2-3 pe net). Am analizat modul în care corelațiile neuronale cu semnale decizionale bazate pe model (valoarea deciziei și eroarea de predicție) au fost legate de vârstă.

Rezultatele RMN. (a) Regiuni care prezintă corelații cu vârsta atunci când se corectează la nivelul întregului creier la z> 2.3, P<0.05. Regiunile girus striatale și unghiulare au fost corelate negativ cu vârsta²; deoarece vârsta medie² a fost scos din ...

Am analizat tendințele patratice ale erorilor predictive pozitive la feedback și am identificat două regiuni în care adolescenții au prezentat un răspuns hipersensibil în comparație cu alte grupe de vârstă - striatum și gyrus angular. O zonă în cortexul prefrontal medial a arătat un efect linear negativ al vârstei asupra valorii deciziei de stimulare, astfel încât participanții mai tineri au avut un semnal de decizie mai puternic în această regiune în comparație cu participanții mai în vârstă; această regiune a fost puternic asociată cu valoarea stimulului orientată spre obiective în activitatea anterioară la adulți (Fig. 2a)¹². Astfel, în timp ce răspunsul la feedback-ul pozitiv imprevizibil a atins punctul culminant al adolescenței, sensibilitatea la valoarea stimulului a scăzut liniar cu vârsta (pentru loturile între vârstă și fiecare dintre regiunile de interes de mai sus, vezi Imagine suplimentară 5 pe net).

Având în vedere că valoarea deciziei se dezvoltă prin învățarea bazată pe erori în model, a fost surprinzător faptul că valoarea deciziei a arătat o traiectorie diferită legată de vârstă decât eroarea de predicție. Cu toate acestea, datorită structurii sarcinii, este posibil ca alegerea să fie condusă de alți factori dincolo de învățarea prin întărire (de exemplu, memoria explicită). Pentru a clarifica rezultatele, am rulat un al doilea model care a calculat valoarea deciziei într-un mod mai integrativ ca proporție a studiilor anterioare pe care a fost ales răspunsul optim pentru fiecare stimul (Lin, Adolphs & Rangel, nepublicat; Metode suplimentare pe net). Am analizat valorile erorilor de predicție din acest model și am constatat că acestea au reflectat rezultatele analizelor noastre inițiale, arătând regiuni în striatum și cortexul parietal, împreună cu regiunile ventriculare laterale prefrontale, unde răspunsul neuronal la eroarea de predicție a atins punctul culminant în adolescență. Analiza valorii deciziei din acest model a arătat atât relații liniare cât și neliniare între vârstă și activitatea neurală într-un număr de regiuni, incluzând cortexul parietal lateral și striatum (Figura complementară 6 și tabelul 5 pe net). Analizele exploratorii (non-independente) privind ROI au arătat că răspunsul neuronal la valoarea decizională în acest model pare să crească între copilărie și adolescență, dar apoi asimptat între adolescență și vârsta adultă (Imagine suplimentară 7 pe net). Aceste rezultate au demonstrat că răspunsul la eroarea de predicție a vârstei în adolescență a fost robust pentru diferite modele, în timp ce schimbările legate de vârstă în semnalele de decizie au fost sensibile la specificația modelului.

Pe baza lucrărilor anterioare care arată că striatumul ventral este în mod constant sensibil la feedback-ul pozitiv neașteptat, așa cum se reflectă în semnalele de eroare de predicție a recompenselor bazate pe model (de exemplu,⁷), am examinat localizarea răspunsurilor legate de erorile de predicție pentru fiecare grup de vârstă separat, într-un ROI anatomic independent, inclusiv caudatul bilateral, putamen și nucleul accumbens folosind modelul original de învățare a armăturii (Fig. 2b). Zonele regresive semnificativ legate de eroarea de predicție pozitivă nu s-au suprapus pentru adolescenți și adulți. În timp ce adulții din acest studiu aveau activitate în regiunea striatală ventrală observată în mod constant în studiile care examinează eroarea de predicție la adulți, adolescenții aveau activitate într-o regiune mai dorsală. Copiii nu au avut activitate în striatum legat de eroarea de predicție pozitivă.

Rezultatele noastre prelungesc concluziile anterioare privind cresterea activitatii neuronale legate de recompense in timpul adolescentei⁸ demonstrând că această constatare este specifică erorii de predicție, comparativ cu semnalele de evaluare. Diferențele de dezvoltare în răspunsul la eroarea de predicție reflectă probabil diferențele în semnalizarea fazică a dopaminei¹³. Dacă este corect, aceasta oferă o explicație directă pentru comportamentul riscant de căutare a recompensei adesea observat la adolescenți. Comportamentul riscant crescut în adolescență ar putea, în teorie, să reflecte fie o sensibilitate scăzută la potențialele rezultate negative, fie o sensibilitate sporită la potențialele rezultate pozitive. Considerăm că datele noastre sunt în concordanță cu cele din urmă: adică semnalele de eroare de predicție crescute (care reflectă probabil semnalele mai mari ale dopaminei fazice) reflectă un impact mai mare al rezultatelor pozitive¹⁴, care se propune să ducă la o motivație sporită pentru a obține rezultate pozitive (și, prin urmare, o asumare de risc mai mare). Astfel, un răspuns al erorilor de predicție a dopaminei cu reacție hiperactivă la adolescenți poate duce la o creștere a cererii de recompense, în special atunci când este cuplată cu un sistem de control cognitiv imatur¹.

Constatările de față pot pune în lumină motivele pentru care studiile anterioare au dat naștere unor efecte incoerente ale vârstei asupra procesării de premiere. În primul rând, nu toate studiile au comparat adolescenții atât cu copiii, cât și cu adulții, ceea ce înseamnă că nu a putut fi observată posibilitatea unor relații neliniare cu vârsta. În plus, definiția "adolescentului" nu a fost consecventă în toate studiile. În al doilea rând, este important de menționat că sarcina de învățare probabilistică folosită aici nu a fost o sarcină de luare a deciziilor riscante per se, deci este diferită de alte sarcini utilizate în literatura de recompensă și de asumare a riscurilor. În al treilea rând, rezultatele noastre sugerează că o înțelegere corectă a schimbărilor de dezvoltare în procesarea recompenselor necesită utilizarea abordărilor bazate pe modele, împreună cu descompunerea componentelor individuale ale procesului (stimul, alegere și feedback).

Se observă din ce în ce mai mult că adolescența este o perioadă unică în dezvoltarea psihologică și că comportamentul riscant, care caută recompense care apare în această perioadă, poate duce la o morbiditate și o mortalitate semnificative, inclusiv moartea accidentală și apariția dependenței de droguri. Astfel, înțelegerea bazei neuronale a procesului decizional al adolescenților este o provocare critică. Lucrarea de față sugerează că un contribuitor la căutarea de recompense adolescent poate fi prezența unor semnale de eroare predictivă îmbunătățită, care oferă o țintă nouă pentru studii viitoare ale acestei perioade importante în dezvoltare.

Material suplimentar

1

Faceți clic aici pentru a vizualiza.^{(2.9M, pdf)}

recunoasteri

Această cercetare a fost susținută de Institutul Național de Sănătate Mintală (5R24 MH072697), Institutul Național de Abuzuri de Droguri (5F31 DA024534), Fundația McDonnell și Fundația Della Martin.

Note de subsol

Contribuțiile autorului JRC a ajutat la proiectarea experimentelor, achiziționarea și analiza datelor, și a scris manuscrisul. RFA, RMB și SYB au proiectat experimentele. FWS a contribuit la achiziția de date. BJK și RAP au proiectat experimentele și au ajutat la scrierea manuscrisului.

Interese concurente Autorii declară că nu au interese financiare concurente.

Referinte

1. Casey BJ, Getz S, Galvan A. Dev Rev. 2008;28: 62-77. [Articol gratuit PMC] [PubMed]

2. Kahneman D, Tversky A. Econometrica. 1979;47: 263-91.

3. Chib VS, Rangel A, Shimojo S, O'Doherty JP. J Neurosci. 2009;29: 12315-20. [PubMed]

4. Tom SM, Fox CR, Trepel C, Poldrack RA. Știință. 2007;315: 515-8. [PubMed]

5. Rescorla RA, Wagner AR. În: Condiționarea clasică II: Cercetarea și teoria curente. Black A, Prokasy WF, editori. Appleton Century Crofts; New York, NY: 1972. pp. 64-99.

6. Schultz W, Dayan P, Montague PR. Știință. 1997;275: 1593-9. [PubMed]

7. Pagnoni G, Zink CF, Montague PR, Berns GS. Nat Neurosci. 2002;5: 97-8. [PubMed]

8. Galvan A, și colab. J Neurosci. 2006;26: 6885-92. [PubMed]

9. Bjork JM, și colab. J Neurosci. 2004;24: 1793-802. [PubMed]

10. May JC și colab. Biol Psihiatrie. 2004;55: 359-66. [PubMed]

11. Knowlton BJ, Mangels JA, Squire LR. Știință. 1996;273: 1399-402. [PubMed]

12. Hare TA, O'Doherty J, Camerer CF, Schultz W, Rangel A. J Neurosci. 2008;28: 5623-30. [PubMed]

13. D'Ardenne K, McClure SM, Nystrom LE, Cohen JD. Știință. 2008;319: 1264-7. [PubMed]

14. Berridge KC, Robinson TE. Brain Res Apocalipsa 1998;28: 309-69. [PubMed]