Predictivitatea modulează răspunsul creierului uman pentru a recompensa (2001)

OBSERVAȚII: Recompense imprevizibile duc la vârfuri mai mari de dopamină. Aceasta este ceea ce face ca Internetul Internet de mare viteză să fie diferit de porno din trecut
 
J Neurosci. 2001 Apr 15;21(8):2793-8.
 

Sursă

Departamentul de Psihiatrie și Științele Comportamentale, Școala de Medicină a Universității Emory, Atlanta, Georgia 30322, SUA. [e-mail protejat]

Abstract

Anumite clase de stimuli, cum ar fi alimentele și medicamentele, sunt foarte eficiente în activarea regiunilor de recompensă. Arătăm la om că activitatea în aceste regiuni poate fi modulată prin predictibilitatea livrării secvențiale a doi stimuli ușor plăcuți, suc de fructe și apă administrate oral. Folosind imagini cu rezonanță magnetică funcțională, activitatea de a recompensa stimuli atât în ​​nucleul accumbens cât și în cortexul orbitofrontal medial a fost cea mai mare atunci când stimuli erau imprevizibili. Mai mult, preferința declarată a subiecților fie pentru suc, fie pentru apă nu a fost direct corelată cu activitatea din regiunile de recompensă, ci a fost corelată cu activitatea din cortexul senzorimotor. Pentru stimuli plăcuți, aceste descoperiri sugerează că predictibilitatea modulează răspunsul regiunilor de recompensă umană, iar preferința subiectivă poate fi disociată de acest răspuns.

Introducere

Obținerea de recompense naturale, cum ar fi mâncarea, băutura și sexul este o influență externă majoră asupra comportamentului uman. Cu toate acestea, problema modului în care recompensele afectează comportamentul uman rămâne în primul rând de nerezolvat. Există mulți factori care contribuie la acest decalaj în cunoștințele noastre; cu toate acestea, un blocaj rutier a fost dificultatea de a defini și măsura efectele izolate ale recompenselor asupra comportamentului uman sau activării creierului. La animale, recompensa este definită ca un concept operațional: un stimul este considerat răsplătitor dacă întărește pozitiv un comportament (Hull, 1943; Rescorla și Wagner, 1972; Robbins și Everitt, 1996), adică crește în mod fiabil probabilitatea comportamentului. Același concept se aplică și oamenilor; cu toate acestea, oamenii au capacitatea de a exercita tot felul de control executiv asupra acțiunilor lor și, prin urmare, doar analizele comportamentale sunt o modalitate incompletă de a testa procesarea recompensei. În mod similar, rapoartele explicite despre aprecieri și neplăceri, adică preferințe, sunt confundate de percepția subiectivă a individului asupra a ceea ce îi place și a ceea ce alege să raporteze. Pentru a depăși aceste dificultăți experimentale, s-ar dori să monitorizăm simultan producția comportamentală, preferința subiectivă și răspunsul creierului în timpul unei sarcini bine definite. Luând o astfel de abordare, raportăm aici că activitatea în regiunile de recompensare umană este mai strâns corelată cu predictibilitatea unei secvențe de stimuli plăcuti decât cu preferințele declarate explicit.

La om, activarea zonelor de recompensare poate fi vizualizată cu ajutorul funcției de rezonanță magnetică funcțională (RMN) după administrarea de medicamente, cum ar fi cocaina (Breiter și colab., 1997); cu toate acestea, astfel de perfuzii nu pot fi reprezentative pentru prelucrarea normală a recompenselor din cauza efectelor farmacologice directe și indirecte ale cocainei. În plus, medicamente precum cocaina pot acționa asupra diferitelor părți ale sistemului de recompense decât așa-numitele recompense naturale, cum ar fi alimente și apă (Bradberry și colab., 2000; Carelli și colab., 2000). Recompensele condiționate, de exemplu, banii, pot acționa și asupra diferitelor părți ale sistemului de recompense (Thut și colab., 1997; Elliott și colab., 2000; Knutson și colab., 2000) și poate să nu fie o sondă adecvată a circuitelor de recompense primare la om. O abordare alternativă este sugerată de experimente care demonstrează că predictibilitatea unui stimul primordial primitor este un parametru critic pentru activarea căilor de recompensare (Schultz și colab., 1992, 1997; Schultz, 1998; Garris și colab., 1999). Înregistrările fiziologice la primatele non-umane au demonstrat că neuronii din regiuni precum zona tegmentală ventrală (VTA), nucleul accumbens și striatul ventral răspund într-o manieră adaptativă la stimulii răsplătitori precum sucul de fructe sau apa (Shidara și colab., 1998). Astfel, predictibilitatea unei secvențe de stimuli poate recruta ea însăși structuri neuronale legate de recompensă într-o manieră detectabilă cu IRMM. Mai mult, modelele teoretice de eliberare de dopamină sugerează că recompensele imprevizibile ar trebui să producă o activitate mai mare în aceste regiuni (Schultz și colab., 1997). Am căutat să testăm această ipoteză folosind RMN pentru a măsura efectul predictibilității asupra răspunsurilor creierului uman la secvențe de stimuli punctuți și plăcuți.

MATERIALE SI METODE

Subiecte. Douăzeci și cinci de adulți normali s-au supus scanării RMN în timp ce li s-au administrat cantități mici fie din suc de fructe pe cale orală, fie din apă. Subiecții au variat de la 18 până la 43 și toți subiecții au dat consimțământul informat pentru un protocol aprobat de Comitetul de Investigații Umane al Universității Emory.

Experimental. În timp ce se aflau în scaner, subiecții au primit cantități mici de suc de fructe și apă administrate oral, într-o manieră previzibilă sau imprevizibilă. Am ales o livrare secvențiată de suc de fructe și apă din trei motive: (1) oamenii găsesc atât sucul, cât și apa pentru a fi subiectiv plăcute; (2) ambii stimuli sunt folosiți de rutină ca stimuli de întărire, în timp ce antrenează primate non-umane în sarcini comportamentale; și (3) neuronii dopaminergici din creierul mijlociu și, probabil, neuronii pe care îi proiectează, arată modificări fazice ale vitezei de tragere, în funcție de predictibilitatea temporală a stimulilor secvențiali (Schultz și colab., 1992). Participanții au primit atât sucul, cât și apa, într-o manieră previzibilă sau imprevizibilă în două runde de scanare (Fig. 1). Pe parcursul previzibilului, s-au alternat bolurile de suc și apă la un interval fix de 10 sec. În timpul rulării imprevizibile, ordinea sucului și a apei a fost randomizată, iar intervalul de stimul a fost de asemenea randomizat prin prelevarea unei distribuții a intervalului Poisson cu o medie de 10 sec. Fiecare alergare a durat 5 min și ordinea celor două rulări (previzibile sau imprevizibile) a fost randomizată pe subiecți. Deoarece timpul de adaptare fie la predictibilitate, fie în imprevizibilitate era necunoscut și pentru că schimbarea frecventă a condițiilor ar putea provoca o interacțiune între ei, adică „predictibilitatea predictibilității”, am ales să separăm condițiile pe rulări de scanare, mai degrabă decât să folosim blocuri de condiții mai mici în cadrul rulărilor de scanare. Deoarece toate aspectele experimentului au vizat manipularea predictibilității, am ales să nu repetăm ​​condițiile în cadrul subiecților și, în schimb, ne-am concentrat pe studierea unui număr mai mare de subiecți.

Fig. 1.  

Proiectarea experimentului fMRI. S-a utilizat un design factorial 2 × 2, cu factori de preferință (suc sau apă) și predictibilitate (previzibil sau imprevizibil). Subiecții au primit 0.8 ml boluri de suc și apă într-o secvență previzibilă sau imprevizibilă. Folosind fMRI legate de evenimente, activarea creierului a fost analizată în termeni de preferință și predictibilitate, precum și interacțiunea dintre ei.

Subiecții au primit 0.8 ml bolusuri orale atât de suc de fructe, cât și de apă prin intermediul a două tuburi de plastic. Un dispozitiv de gură ținea capetele tubului pe locul său peste limbă, cu sucul de fructe infuzat din partea stângă a dispozitivului bucal și apa din dreapta. Tuburile aveau ∼10 m lungime și erau conectate la o pompă cu seringă dublă controlată de computer (Harvard Apparatus, Holliston, MA) în afara camerei scanerului. Subiecții nu au îndeplinit nicio altă sarcină în timpul scanării și au fost instruiți să înghită pur și simplu lichidul de fiecare dată când a fost administrat. După sesiunea de scanare, subiecții au fost rezumați pentru preferințele lor fluide.

Achiziționarea datelor RMN. Scanarea a fost efectuată pe un scaner 1.5 Tesla Philips NT. După achiziționarea unei scanări anatomice cu o rezoluție înaltă de greutate T1, subiecții au suferit două rulări funcționale ale creierului întreg de scanări 150 fiecare (imagistică ecografică, ecou recuperat gradient; timp de repetiție, 2000 msec; timp de ecou, ​​40 msec; unghi flip, 90 °; 64 × 64 matrice, 24 5 mm felii axiale dobândite paralel cu linia comisurală anteroposterior) pentru măsurarea efectului de dependență a nivelului de oxigenare a sângelui (BOLD) (Kwong și colab., 1992; Ogawa și colab., 1992). Mișcarea capului a fost redusă la minimum prin capitonare și reținere.

Analiza. Datele au fost analizate utilizând maparea parametrilor statistice (SPM99; Wellcome Department of Cognitive Neurology, London, Marea Britanie) (Friston și colab., 1995b). Corecția mișcării la prima scanare funcțională a fost efectuată la subiecți utilizând o transformare a corpului rigid cu șase parametri. Deoarece înghițirea provoacă inevitabil mișcări semnificative ale capului, parametrii de corecție a mișcării au fost de asemenea utilizați pentru a determina dacă mișcarea capului diferă semnificativ între condiții. Media imaginilor corectate de mișcare a fost apoi coregistered la RMN structural de 24 de feluri individuale folosind o transformare afină de 12 parametri. Imaginile au fost apoi normalizate spațial la șablonul Institutului Neurologic din Montreal (MNI) (Talairach și Tournoux, 1988) prin aplicarea unei transformări afine a parametrilor 12, urmată de o deformare neliniară folosind funcții de bază (Ashburner și Friston, 1999). Imaginile au fost ulterior netezite cu un nucleu gaussian izotropic 8 mm și o bandă-pass filtrate în domeniul temporal. O analiză statistică cu efecte aleatorii, legată de evenimente, a fost efectuată cu SPM99 (Friston și colab., 1995a, 1999). Experimentul a fost analizat ca un design factorial 2 × 2. În primul rând, a fost specificat un model liniar general separat (GLM) pentru fiecare subiect, cu patru condiții reprezentând cele patru tipuri de evenimente posibile: fluid predictibil - preferat, lichid predictibil - nepreferit, imprevizibil - fluid preferat și imprevizibil - fluid nepreferit. Patru vectori ai funcțiilor delta cu timpi corespunzători fiecărui eveniment au fost creați pentru fiecare din cele patru condiții. Acestea au fost implicate cu o funcție generică de răspuns hemodinamic și au intrat într-o matrice de proiectare în patru coloane. Media fiecărei rulări de scanare a fost eliminată pe o bază vocală. Am calculat trei imagini de contrast pe două fețe care corespundeau principalelor efecte ale preferinței [vector contrast (1-11-1)], predictibilitate [vector contrast (11-1-1)] și termenul de interacțiune [vector contrast (1) -1-11)]. Interacțiunea descrie modul în care predictibilitatea modulează efectul preferințelor. Aceste imagini de contrast individuale au fost introduse într-o analiză de nivelul al doilea, folosind un singur eșantion separat t test (df = 24) pentru fiecare latură a fiecărui termen din GLM (un număr de șase contraste). Am pragat aceste hărți statistice sumare la p <0.001 (necorectat pentru comparații multiple). Aceste hărți au fost suprapuse pe o imagine structurală de înaltă rezoluție în orientare MNI.

Model teoretic. Ca instrument pentru proiectarea și interpretarea experimentului fMRI, am folosit un model de rețea neuronală existentă de eliberare de dopamină pentru a simula răspunsul creierului la diferite tipare temporale de stimuli recompensatori (Fig.2). Acest model s-a bazat pe metoda diferențelor temporale (TD), care postulează că o substanță care consolidează sinaptic, de exemplu, dopamina, este eliberată ca răspuns la erori în predicția recompenselor (Schultz și colab., 1997). Acest model a fost utilizat într-o mare varietate de aplicații, inclusiv sarcini de învățare complexe, cum ar fi backgammon (Sutton, 1988; Tesauro și Sejnowski, 1989), precum și prezicerea cu succes a activității neuronilor dopaminei în numeroase paradigme de condiționare (Houk și colab., 1995; Montague și colab., 1995) și sarcini de secvențare a motorului (Berns și Sejnowski, 1998).

Fig. 2.  

Modelul de rețea neuronală al experimentului și regiunile creierului asociate procesării informațiilor. A, Diagrama indică ipoteza noastră despre modul în care secvența de stimuli ar putea influența producția dopaminergică. În această ipoteză, am indicat că modificările producției dopaminergice ar putea influența structurile neuronale țintă într-o manieră detectabilă într-o măsurare FOLD BRI. Sucul și apa se dovedesc a fi ambele senzoriale (proiecție din timp finitrama ferestrei) și recompensă ( căi r) reprezentări în influența lor asupra activității dopaminergice. Pentru a genera un răspuns hemodinamic preconizat din această ipoteză, am realizat o fereastră de timp finită (cutii mici pentru suc și apă), care a determinat valoarea recompensei imediater(t) (1 dacă s-a produs suc, 0.5 dacă a apărut apă și 0 dacă nu a apărut stimul). Această manevră setează în mod arbitrar sucul de două ori mai mare decât valoarea apei. Aceasta nu este importantă pentru așteptarea principală generată de model.B, Efect de dopamină prevăzută pentru secvențe previzibile și imprevizibile de administrare de suc și apă. Axă orizontală este numărul de scanare. Axa verticala este răspunsul hemodinamic preconizat prevăzut de un model de diferență temporală. Scara de pe axa verticala este arbitrar. Punctul important de remarcat este că alergarea previzibilă avansează spre 0, în timp ce alergarea imprevizibilă rămâne cu o amplitudine ridicată pe tot parcursul. Urmele au fost generate prin transformarea unui nucleu de răspuns hemodinamic cu ieșirea unui model de diferență temporală. Acest lucru a sugerat că răspunsul mediu BOLD ar fi mai mare atunci când stimulii erau imprevizibili.

Pe scurt, învățarea TD depinde de două presupuneri primare. În primul rând, adaptarea pe termen scurt într-un anumit circuit neuronal are loc cu scopul de a prezice o sumă actualizată a tuturor recompenselor viitoare. Definiția unei recompense depinde de contextul în care este primită. Dacă o recompensă putativă crește apariția unui anumit comportament, atunci este considerat un consolidator pozitiv. În funcție de starea internă a animalului, aceeași recompensă poate să nu consolideze un comportament, de exemplu, atunci când animalul este satiat. În contextul unui experiment RMN, care este în general nenatural, o substanță familiară apetitivă, cum ar fi apa sau sucul de fructe, este subiectiv experimentată ca fiind plăcută și, prin urmare, plină de satisfacții. În al doilea rând, predicțiile de recompensă depind doar de reprezentarea actuală a unui set de stimuli. Reprezentarea stimulului este oarecum arbitrară în model și include o anumită reprezentare înapoi în timp, adică o urmă de stimul. Pentru substanțe precum apa sau sucul de fructe, există atât dimensiuni senzoriale (de exemplu, temperatura și senzația tactilă pe limbă), cât și recompensa reală, care este subiectiv experimentată ca plăcere. Prin urmare, este rezonabil să considerăm dimensiunile tactile ale livrării de fluide drept neutre și distincte de dimensiunea răsplătitoare. În mod similar, aceste dimensiuni distincte se presupun că sunt procesate de diferite circuite ale creierului, care pot fi imaginate cu fMRI. Pentru a face o mapare a ieșirii modelului pe o dimensiune analogă măsurării obținute cu fMRI, am însumat rezultatele atât ale căilor neutre cât și ale celor recompense, pe care le-am presupus convergente în striatul ventral și nucleul accumbens. Recunoaștem că nu există dovezi directe pentru acest lucru și, în funcție de receptorul specific, dopamina poate avea efecte variabile asupra activității neuronale. Modelul exact a fost introdus în model, care a fost simulat cu Matlab 5.3 (MathWorks, Natick, MA). Rezultatele corespunzătoare atât neuronilor dopaminei putative, cât și siturilor lor de proiecție au fost calculate pentru rulajele previzibile și imprevizibile (Fig. 2).

Ar trebui să fim atenți să subliniem cititorilor că utilizarea noastră a modelului de diferență temporală pentru a ne explica designul și interpretarea ulterioară (mai jos) se bazează pe succesul său anterior în descrierea modificărilor producției de vârf în neuronii dopaminergici la primate care suferă de sarcini legate de comportament. Există și alte descrieri computationale plauzibile, care ar putea fi de asemenea suficiente.

REZULTATE

După scanări, subiecții au fost întrebați cu privire la preferința lor pentru cei doi stimuli. Optzeci dintre subiecții 25 (72%) au preferat sucul, iar restul au preferat apa. Majoritatea subiecților aveau o preferință distinctă pentru unul sau altul, deși nu le-am cerut să cuantifice acest lucru. Deși a existat o mișcare semnificativă a capului în timpul scanărilor, toate traducerile și rotațiile din jurul fiecărui stimul au fost în general mici și nu au fost semnificativ diferite între niciuna dintre afecțiuni. De exemplu, media ± traducere SD asociată cu fiecare stimul a fost 0.041 ± 0.069 mm în condiția previzibilă și 0.044 ± 0.069 mm în condiția imprevizibilă (împerecheată t Test;p = 0.853).

Răspunsul creierului la fluidul preferat a arătat o activitate diferențial surprinzător de mică în raport cu fluidul nepreferit (tabel1). Nu am observat nicio diferență semnificativă de activitate în regiunile de recompensă clasice, cum ar fi nucleul accumbens, hipocampul sau cortexul prefrontal medial. Modificarea activității principale pentru preferințe> nepreferite a avut loc în cortexul somatosenzorial într-o zonă în apropierea regiunii gurii și a limbii (t = Coordonate 4.19, MNI, −60, −12, 16).

Tabelul 1.  

Regiuni cerebrale care prezintă modificări semnificative în activitatea măsurată (p <0.001 necorectat; dimensiunea clusterului> 10 voxeli, cu excepția cazului în care se menționează)

Efectul principal al predictibilității a fost substanțial mai mare decât efectul principal al preferinței (Fig. 3). Pentru rulajul imprevizibil în raport cu rulajul previzibil, activarea bilaterală a fost observată într-o mare întindere de cortex orbitofrontal medial care a inclus nucleul accumbens (tabel 1). Zonele suplimentare de activare au inclus o suprafață mare de cortex parietal bilateral și paracentral și activări focale mici atât în ​​nucleul mediodorsal stâng al talamului cât și în cerebelul drept. Deoarece niciuna dintre aceste regiuni nu s-a suprapus cu efectul principal al preferinței, acestea au fost activate maxim de stimuli imprevizibili, indiferent de preferință. Pentru alergarea previzibilă în raport cu rularea imprevizibilă, a fost activată o zonă a gyrusului temporal superior drept, precum și activări focale în gyrusul precentral stâng și în cortexul orbitofrontal lateral drept.

Fig. 3.  

Principalul efect al predictibilității a arătat că regiunile legate de recompense au avut un răspuns BOLD mai mare la stimulii imprevizibili. A, Planurile centrate la (0, 4, −4) arată că nucleul bilateral accumbens / striat ventral (NAC) și cortexul parietal superior bilateral au fost mai active în starea previzibilă. B, O regiune mică din girul temporal superior drept a fost relativ mai activată de stimulii previzibili. Semnificația a fost redusă lap <0.001 și o măsură> 10 voxeli adiacenți.

Interacțiunea dintre preferințe și predictibilitate a identificat zonele în care un efect a modulat-o pe celălalt independent de ambele efecte principale. Insula dreaptă, cingulatul posterior stâng și cerebelul drept au afișat o interacțiune semnificativă pentru contrast (preferat - nepreferit) × (previzibil - imprevizibil). Contrastul opus, (preferat - neprefăcut) × (imprevizibil - previzibil), nu a dezvăluit nicio activare semnificativă la p <0.001 nivel; cu toate acestea, o mică regiune în girusul temporal superior stâng (coordonatele MNI, -48, -4, -16) a fost semnificativă la nivelul p <0.01 nivel (t = 3.15).

Simularea computerului a sugerat că recompensele imprevizibile ar trebui să evoce mai multă eliberare de dopamină decât cele previzibile.2 B). Când recompensele sunt previzibile, fiecare stimul prezice perfect cea ulterioară, iar semnalul de eroare, care se presupune că este mediat de dopamină, scade treptat. Când recompensele sunt imprevizibile, nu există nicio ocazie ca sistemul să învețe, iar răspunsul la fiecare stimul este mai mare.

DISCUŢIE

Rezultatele noastre au demonstrat o separare interesantă în răspunsul creierului la predictibilitate și la rapoartele subiective de preferință. Răspunsul creierului la preferințe a fost exclusiv cortical, dar răspunsul la predictibilitate a arătat activarea specifică a sistemelor de recompensă, de asemenea, cunoscute a fi ținta neuronilor dopaminergici din creierul mijlociu. Dacă presupunem că activarea acestor zone de recompensă este plăcută oamenilor, atunci această constatare sugerează că raportul subiectiv al preferinței poate fi disociat de circuitele neuronale cunoscute ca fiind determinanți puternici ai comportamentelor condiționate.

Atât apa cât și sucul de fructe au provocat activări semnificative pe tot creierul și, deși o parte din acest răspuns a fost atribuit aspectelor motorii ale sarcinii, subseturile specifice ale acestor regiuni au fost descompuse în dimensiuni ale preferinței și predictibilității. Efectul preferinței a fost limitat la regiunile corticale asociate procesării senzoriale, iar stimulul preferat a dus la o activare mai mare în aceste regiuni. Aceste regiuni se află în apropierea cortexului senzorimotor, cunoscut a fi activat în timpul mișcărilor limbii (Corfield și colab., 1999) și înghițire (Hamdy și colab., 1999). În lucrările anterioare asupra răspunsului creierului la mișcarea limbii, a existat o activare substanțială a cerebelului, o constatare absentă în principal în efectul principal al preferinței. Răspunsul cerebral diferențial, adică, preferat - nepreferit, elimină regiunile comune de activare; prin urmare, absența activării cerebelare sugerează că mișcările diferențiale ale limbii sunt puțin probabil să fie cauza modelului de activare corticală pentru preferință subiectivă. Faptul că o regiune somatosenzorială a fost corelată cu preferințele declarate a sugerat faptul că unele prelucrări neuronale diferențiale au avut loc pentru cei doi stimuli. A fost surprinzător faptul că acest lucru s-a manifestat într-o zonă primară de procesare senzorială și nu în zonele clasice de recompensare. Deși subiecții au fost obligați să desemneze o substanță față de cealaltă ca preferință, ambele fluide au fost alese în mod intenționat pentru a fi plăcute, în contradicție cu una fiind aversivă. Deoarece ambele lichide erau în general plăcute, efectul preferinței ar putea să nu fi fost suficient de puternic pentru a duce la o diferență semnificativă de activitate în regiunile de recompensare. Acest lucru ar fi în concordanță cu constatările conform cărora neuronii dopaminei din creierul mijlociu sunt activi în mod preferențial de stimuli apetitivi și nu de aversivi (Mirenowicz și Schultz, 1996). Cu toate acestea, concluziile noastre sugerează o diferențiere a sistemului de preferințe subiective față de recompensa simplă, care susține ipoteze anterioare conform cărora „a dori” nu este același lucru cu „a plăcea” (Robinson și Berridge, 1993).

Spre deosebire de efectul preferinței, imprevizibilitatea a fost corelată ca un efect principal semnificativ cu activitatea din nucleul accumbens, talamus și orbită frontală medială, în timp ce predictibilitatea a fost corelată predominant cu activitatea din girul temporal superior drept. Primele regiuni corespund îndeaproape cu siturile de proiecție ale dopaminei cunoscute (Koob, 1992; Cooper și colab., 1996). A fost oarecum surprinzător faptul că imprevizibilitatea, și nu preferința, a fost corelată cu activitatea din aceste domenii de recompensare. Dacă activitatea crescută în aceste regiuni era asociată cu plăcerea, atunci s-ar putea concluziona că recompensele imprevizibile erau mai plăcute decât cele previzibile. Cu toate acestea, majoritatea subiecților nu au observat nicio diferență între condițiile previzibile și imprevizibile. Dacă recompensele imprevizibile erau mai plăcute decât cele previzibile sau invers, atunci aceasta trebuie să se producă la nivel subconștient. O explicație alternativă presupune că dopamina este eliberată în cantități crescute la recompense neașteptate (Montague și colab., 1996; Schultz și colab., 1997;Schultz, 1998). Dopamina poate scădea excitabilitatea neuronală (Cooper și colab., 1996) și poate restricționa direct microvasculatura (Krimer și colab., 1998), dar activitatea accumbens crescută a fost asociată și cu plăcerea subiectivă a cocainei (Breiter și colab., 1997). Aceste constatări sugerează că creșterea observată a activării cu imprevizibilitate ar putea fi legată de eliberarea crescută a dopaminei, fie din cauză că accumbens proiectează VTA, fie pentru că primește o proiecție din partea VTA, oricare dintre acestea ar fi în concordanță cu rezultatele modelului. Această interpretare ar trebui să fie temperată cu două fapte importante: (1) mecanismele care ar cupla transmiterea dopaminergică crescută la modificările semnalului BOLD nu sunt cunoscute și (2) nu avem nicio măsură independentă de transmisie dopaminergică, ci doar modificări în răspunsul BOLD. Posibilitatea ca noi să observăm schimbări indirecte în activitatea dopaminergică este excitantă, dar nu poate fi decisă fără echivoc într-un experiment RMN. Cu toate acestea, în concordanță cu descoperirile anterioare folosind tomografia cu emisie de pozitron, dopamina este eliberată în striatul ventral în condiții de stimulare monetară (Koepp și colab., 1998). Împreună cu efectul amplificator al imprevizibilității, acesta este, de asemenea, în concordanță cu efectele ipotetice ale dopaminei asupra „câștigului” neuronal (Cohen și Servan-Schreiber, 1992), cu rezultatul final că unele regiuni vor crește și altele vor scădea.

Regiunile specifice activate relativ prin imprevizibilitate corespundeau regiunilor creierului asociate funcțiilor apetitive. În plus față de nucleul accumbens, cortexul orbitofrontal medial a arătat un efect principal pentru imprevizibilitate. Această regiune s-a arătat în primate că integrează atât aspectele satisfăcătoare, cât și cele neutre ale senzațiilor gustative și se crede că reflectă în primul rând valorile motivaționale ale acestor stimuli (Rolls, 2000). Această regiune conține, de asemenea, neuroni care discriminează preferința relativă pentru recompensă (Tremblay și Schultz, 1999). Cortexul orbitofrontal este de obicei dificil de imaginat cu RMN din cauza artefactului de sensibilitate din sinusurile nazale (Ojemann și colab., 1997). Cu toate acestea, regiunea pe care am identificat-o este, în general, superioară și caudală față de locația obișnuită a artefactului. Această regiune a fost considerată anterior sensibilă la gusturi plăcute (Francis și colab., 1999). O a doua regiune, în lobul parietal superior, probabil nu a fost legată de aspectele răsplătitoare ale sarcinii, ci mai degrabă de rezultatul schimbărilor în atenție. Această regiune a fost implicată anterior în atenția visuospatială, în special în timpul încălcărilor așteptărilor (Nobre și colab., 1999). O altă regiune, din cortexul temporal stâng, a arătat o granulație semnificativă la graniță prin imprevizibilitate. În experimentele RMN recente, lobul temporal stâng a fost asociat cu procesarea predictibilității stimulilor secvențiali (Bischoff-Grethe și colab., 2000). Aici, extindem aceste descoperiri anterioare de la stimuli neutri la stimuli plăcuți, sugerând că această regiune poate efectua o monitorizare generică a predictibilității independent de valența stimulului.

Regiunile creierului pe care le-am identificat ca răspuns la imprevizibilitate, fie direct, fie modulator, au fost implicate într-o serie de experimente privind recompensele financiare. Banii pot fi recompensatori pentru oameni, dar se întăresc doar pentru că au dobândit aceste proprietăți prin condiționarea complexă. Similar cu constatarea că cocaina acționează asupra diferiților neuroni decât armatorii naturali (Carelli și colab., 2000), este posibil ca armatoarele condiționate, cum ar fi banii, să acționeze asupra diferitelor sisteme neuronale decât armatoarele naturale, cum ar fi alimentele și apa. Activitatea atât în ​​striatul ventral, cât și în creierul central a fost corelată cu nivelurile absolute de recompensă financiară (Thut și colab., 1997;Delgado și colab., 2000; Elliott și colab., 2000; Knutson și colab., 2000), constatare absentă în special în rezultatele noastre. După cum s-a menționat anterior, atât sucul, cât și apa au fost ușor plăcute și, astfel, este posibil să nu fi existat o diferență substanțială în ceea ce privește recompensa absolută, deși am presupus o ușoară diferență în modelul teoretic. De asemenea, nu am folosit stimuli aversivi sau nimic care ar putea fi interpretat ca o recompensă negativă, care poate fi de asemenea responsabil pentru această diferență. Interesant este că regiunile pe care le-am identificat ca fiind direct afectate sau amplificate de imprevizibilitate corespundeau regiunilor găsite anterior ca fiind sensibile la dependența de context a recompensei financiare (Rogers și colab., 1999; Elliott și colab., 2000). În particular, atât cingulatul subgenual, cât și talamul medial au fost corelate cu imprevizibilitatea în studiul nostru și s-au găsit dependenți de context de Elliott și colab. (2000).

Deoarece predictibilitatea a modulat efectul preferinței, este important să distingem sursele potențiale de predicție. Într-un experiment clasic de condiționare, un stimul neutru precede recompensa. După antrenament, stimulul anterior neutru devine predictor, sau stimul condiționat. Deoarece există relativ puține date despre utilizarea stimulilor orali în RMN, am ales să simplificăm experimentul și controlul pentru aspectele motorii ale sarcinii, folosind doi stimuli orali diferiți, apa și sucul de fructe. Astfel, sursa de predicție din experimentul nostru a venit neapărat din succesiunea stimulilor înșiși. În unele moduri, acest lucru este mai simplu decât introducerea unei alte modalități de stimulare, cum ar fi un indiciu vizual, dar, deoarece ambii stimuli au fost mulțumitori, nu putem face concluzii cu privire la procesul de condiționare. Atât modelul teoretic (Schultz și colab., 1997) și date neurofiziologice (Schultz și colab., 1992, 1993) sugerează că predicțiile de recompensă sunt calculate în intervalul precedent livrării recompensei. Deoarece nu știm scala de timp în care sunt calculate aceste predicții, am ales să analizăm experimentul ca fiind doar două condiții, previzibile și imprevizibile. Prin menținerea unui interval psihologic rezonabil între stimuli, 10 sec, nu a existat suficient timp pentru a rezolva diferențele în procesarea interstimulului. Se presupune că o astfel de prelucrare are loc și acest lucru ar putea fi rezolvat cu un experiment conceput diferit.

În rezumat, activitatea în regiunile de recompensă umană poate fi modulată prin predictibilitatea temporală a recompenselor primare, cum ar fi apa și sucul. Aceste rezultate oferă un suport important pentru modelele de calcul care postulează că erorile în predicția recompenselor pot conduce la modificarea sinaptică și extind aceste concluzii de la primatele neumane la oameni. Specificitatea regională a acestei modulații sugerează, de asemenea, că informațiile, astfel cum sunt întruchipate de predictibilitatea relativă a unui flux de stimul, pot fi o formă de monedă neurală care poate fi detectată cu ajutorul IRM.

Note de subsol

    • Primit Noiembrie 11, 2000.
    • Revizuirea a fost primită Ianuarie 17, 2001.
    • Admis Ianuarie 26, 2001.
  • Această lucrare a fost susținută de Institutul Național pentru Subvenții privind Abuzul de Droguri K08 DA00367 (către GSB) și RO1 DA11723 (către PRM), Alianța Națională pentru Cercetare în Schizofrenie și Depresiune (GSB) și Fundația Familiei Kane (PRM). Mulțumim lui H. Mao, R. King și M. Martin pentru asistența lor pentru colectarea datelor.

    Corespondența poate fi adresată fie Gregory S. Berns, Departamentul de Psihiatrie și Științele Comportamentale, Școala de Medicină Universitară Emory, 1639 Pierce Drive, Suite 4000, Atlanta, GA 30322, E-mail:[e-mail protejat]sau P. Citiți Montague, divizia de neuroștiință, Colegiul de medicină Baylor, 1 Baylor Plaza, Houston, TX 77030, e-mail:[e-mail protejat].

articole care citeaza acest articol