Rata de învățare ghidată dincolo de dopamină în nucleul accumbens: funcțiile integrative ale rețelelor cortico-bazale ale ganglionilor (2008)

Eur J Neurosci. 2008 Oct;28(8):1437-48. doi: 10.1111/j.1460-9568.2008.06422.x.

Yin HH1, Ostlund SB, Balleine BW.

Abstract

Aici provocăm ideea că învățarea bazată pe recompensă este controlată exclusiv de calea mezoacumbens care decurge din neuronii dopaminergici din zona tegmentală ventrală și se proiectează la nucleul accumbens. Această opinie acceptată pe scară largă presupune că recompensa este un concept monolit, dar munca recentă a sugerat altfel. Se pare că, în învățarea bazată pe recompensă, funcțiile striatelor ventrale și dorsale și circuitele ganglionale cortico-bazale asociate cu ele pot fi disociate. In timp ce nucleul accumbens este necesar pentru dobandirea si exprimarea anumitor raspunsuri apetisante Pavlovian si contribuie la controlul motivational al performantelor instrumentale, striatumul dorsal este necesar pentru dobandirea si exprimarea actiunilor instrumentale. Astfel de constatări sugerează existența mai multor sisteme funcționale independente, dar care interacționează, care sunt implementate în rețelele ganglionale cortico-bazale organizate ierarhic și ierarhic implicate în comportamente apetisante, variind de la răspunsurile de abordare Pavlovian la acțiunile instrumentale direcționate către scop, controlate de contingențele de acțiune-rezultat.

Cuvinte cheie: striatum, dopamină, ganglioni bazali, învățare, nucleu accumbens, recompensă

În literatura recente a devenit obișnuit să se găsească un concept monolit de "recompensă" aplicat uniform în comportamentul apetitant, indiferent dacă este vorba de ceva bun pentru organism (de obicei din perspectiva experimenterului) sau folosit interschimbabil cu termeni mai în vârstă "consolidare" sau "stimulare". Această stare de lucruri este încurajată, dacă nu ea însăși, de consecința concentrării pe un singur substrat neural pentru "recompensă" care implică eliberarea dopaminei (DA) în nucleul accumbens (Berke și Hyman, 2000; Grace și colab., 2007).

Legătura dintre calea și recompensa mesoaccumbens, recunoscută acum zeci de ani, a fost revigorată prin dovezi mai recente că semnalul fazic DA codifică o eroare de predicție a recompensării, care probabil servește ca un semnal didactic în învățarea asociativăg (Schultz și colab., 1997). Conform celei mai populare interpretări, la fel cum există un singur semnal de recompensă, există un singur semnal pentru învățarea bazată pe recompensă, care în acest caz înseamnă asocierea unui stimul și a unei recompense (Montague și colab., 2004). Problema modului în care acest tip de învățare controlează comportamentul adaptiv a fost totuși neglijată; se presupune pur și simplu că semnalul dopaminei este suficient atât pentru învățarea predictivă, cât și pentru răspunsurile condiționale generate de aceasta, și pentru acțiunile orientate spre scop, ghidate de asocierea lor cu recompensa. În consecință, majoritatea cercetărilor în domeniul recompensei și al dependenței se axează pe semnalarea DA și pe plasticitatea asociată în calea mesoacumbens (Berridge și Robinson, 1998; Hyman și colab., 2006; Grace și colab., 2007).

Această viziune a procesului de recompensare, așa cum este recunoscută din ce în ce mai mult (Cardinal și colab., 2002; Balleine, 2005; Everitt și Robbins, 2005; Hyman și colab., 2006), este atât inadecvată, cât și înșelătoare. Este inadecvată deoarece nici achiziția, nici performanța acțiunilor direcționate către scop nu pot fi explicate în termenii proceselor asociative care mediază învățarea prin stimulare-recompensă. În plus, este înșelătoare, deoarece focalizarea exclusivă asupra activității în calea mesoacumbens, care nu este nici necesară, nici suficientă pentru acțiunile orientate spre scopuri, a atenționat atenția de la întrebarea mai fundamentală a exact care sunt acțiunile direcționate către scopuri și modul în care acestea sunt puse în aplicare de creier. Într-adevăr, conform unor dovezi convergente dintr-o varietate de abordări experimentale, ceea ce anterior a părut a fi un singur mecanism de recompensă poate cuprinde de fapt mai multe procese cu efecte comportamentale distincte și substraturi neuronaleCorbit și colab., 2001; O'Doherty și colab., 2004; Yin și colab., 2004; Delgado și colab., 2005; Yin și colab., 2005b; Haruno și Kawato, 2006a; Tobler și colab., 2006; Jedynak și colab., 2007; Robinson și colab., 2007; Tobler și colab., 2007).

Aici încercăm să expunem câteva dintre problemele asociate modelului actual de mesoaccumbens și să propunem în locul său un alt model de învățare bazată pe recompense. Vom argumenta că striatumul este o structură extrem de eterogenă care poate fi împărțită în cel puțin patru domenii funcționale, fiecare acționând ca un hub într-o rețea funcțională distinctă cu alte componente cortical, thalamic, pallidal și midbrain. Funcțiile integrative ale acestor rețele, de la producerea răspunsurilor necondiționate provocate de răsplată la controlul acțiunilor direcționate către scop, pot fi disociate și studiate folosind teste comportamentale contemporane.

Predicție și control

Calea mesoaccumbens este adesea presupusă a fi necesară pentru obținerea unei asocieri între recompensa și stimulii de mediu care prezică această recompensă. De exemplu, în unele dintre experimentele care examinează activitatea fazică a celulelor DA obținute prin recompensă, maimuțele au fost instruite să asocieze un stimul cu livrarea de suc (Waelti și colab., 2001) și ulterior să răspundă stimulului cu o lingură de răspuns condiționată (CR). Linsul maimuței poate fi direcționat în funcție de țintă, deoarece consideră că este necesar să se obțină suc. Alternativ, lingerea poate fi provocată de stimulul antecedent cu care sucul este asociat. Care dintre acești factori determinanți ai linsului maimuțelor este controlul comportamentului în orice situație particulară nu este cunoscută a priori, și nu poate fi determinată prin observație superficială; aceasta poate fi determinată numai prin teste concepute special pentru acest scop. Aceste teste, care s-au dezvoltat de mai multe decenii, formează nucleul progreselor moderne majore în studiul învățării și comportamentului (Tabelul 1). Din utilizarea acestor teste, care urmează să fie discutate mai jos, știm acum că același răspuns comportamental - indiferent dacă este vorba de o abordare ambulatorie, de orientare sau de apăsare a unei pârghii - poate apărea din mai multe influențe care sunt disociabile experimental.

Tabelul 1  

Educație îndrumată cu recompensă

Insensibilitatea față de ambiguitatea centrală în determinanții reali ai comportamentului este, prin urmare, principala problemă cu analiza neuroștiințifică actuală a învățării bazate pe recompensă. To să înțelegem importanța acestei probleme, este necesar să apreciem diferențele dintre modul în care învățarea predictivă (sau cea Pavloviană) și comportamentul apetitual de control al învățării (sau instrumentale) de învățare. Într-adevăr, judecând după cât de des aceste două procese au fost combinate în literatura de specialitate, o scurtă trecere în revistă a acestei distincții pare a fi un punct de pornire util pentru discuția noastră.

În condiționarea condiționată a Pavlovian, recompensa (stimulul necondiționat sau SUA) este asociată cu un stimul (stimul condiționat sau CS), indiferent de comportamentul animalului, în timp ce în învățarea instrumentală, recompensa este condiționată de acțiunile animalelor. Întrebarea critică în ambele situații este, totuși, dacă asociația de stimulare-recompensă sau asocierea-răsplată-acțiune controlează comportamentul.

Oricât de simplu ar părea, această întrebare a evitat anchetatorii timp de multe decenii, în mare măsură, deoarece răspunsurile comportamentale în aceste situații pot apărea identice.

Astfel, răspunsurile condiționate (CR) controlate de asociația de stimulare-recompensă Pavlovian pot avea adesea o furnică de direcționare a țelurilor față de ele. Chiar si salivarea, CR originala a lui Pavlov, ar fi putut fi produsa de cainii sai ca o incercare deliberata de a facilita ingestia. Tocmai din cauza acestei ambiguități, cea mai evidentă explicație - și anume că în condiționarea lui Pavlovian este învățată asocierea rezultat-stimul, în timp ce, în condiționarea instrumentală, asociația de acțiune-rezultat este învățată - nu a reușit să câștige prea mult sprijin timp de multe deceniiSkinner, 1938; Ashby, 1960; Bolles, 1972; Mackintosh, 1974). Cu toate acestea, deși multe CR Pavlovian sunt autonome sau consumatoare, alte CR, cum ar fi comportamentul de abordare față de o recompensă, nu sunt atât de convenabil caracterizate (Rescorla și Solomon, 1967); într-adevăr, ele pot fi ușor confundate cu acțiuni instrumentale (Brown și Jenkins, 1968; Williams și Williams, 1969; Schwartz și Gamzu, 1977). Acum știm că, în ciuda unei asemănări superficiale, CR-urile Pavlovian și acțiunile instrumentale orientate spre țintă diferă în structura reprezentativă care controlează performanța răspunsului (Schwartz și Gamzu, 1977).

Modalitățile cele mai directe de a stabili dacă realizarea unui răspuns este mediată de o recompensă de stimulare sau de o acțiune de recompensare este de a examina performanța specifică de contingență. Exemplul de salivare este instructiv aici. Sheffield (1965) testat dacă salivarea în condiționarea Pavloviană a fost controlată de relația sa cu recompensa sau cu asociația de stimulare-recompensă. În experimentul său, câinii au primit legături între un ton și o recompensă alimentară (Sheffield, 1965). Cu toate acestea, în cazul în care câinii au salivat în timpul tonului, atunci mâncarea nu a fost livrată în acel studiu. Acest aranjament a menținut o relație Pavloviană între ton și hrană, dar a eliminat orice asociere directă între salivare și livrarea de alimente. Dacă salivarea este o acțiune controlată de relația sa cu alimentele, atunci câinii trebuie să oprească salivarea - într-adevăr, ei nu ar trebui să obțină niciodată salivare a tonului. Sheffield a descoperit că relația dintre tonul și hrana Pavlovian a controlat salivarea CR. În cursul ansamblului de alimente cu tonuri albe 800, câinii au dobândit și au menținut salivarea tonului, chiar dacă acest lucru a dus la pierderea majorității alimentelor pe care le-ar fi putut obține fără a le saliveze. O concluzie similară a fost realizată de alții în studii cu oameni (Pitherii, 1985) și alte animale (Brown și Jenkins, 1968; Williams și Williams, 1969; Olanda, 1979); în toate cazurile, se pare că, în ciuda varietății lor, răspunsurile lui Pavlovian nu sunt controlate de relația lor cu recompensa - adică de contingența de acțiune-rezultat.

Termenul contingență se referă la relația condiționată dintre un eveniment "A" și altul, "B", astfel încât apariția lui B depinde de A. O relație de acest fel poate fi ușor degradată prin prezentarea lui B în absența lui A. manipularea experimentală, denumită degradare de urgență, este efectuată în mod obișnuit prin prezentarea unei recompense independent de stimulul predictiv sau acțiunea. Deși această abordare a fost inițial dezvoltată pentru a studia condiționarea Pavlovian (Rescorla, 1968), degradarea instrumentală a contingentelor a devenit, de asemenea, un instrument comun (Hammond, 1980). Atunci când aceste contingențe sunt manipulate direct, conținutul învățământului este dezvăluit: de exemplu, în autosapărarea, un CR Pavlovian "deghizat" ca o acțiune instrumentală este perturbat de manipulări ale contingenței mai degrabă Pavlovian decât instrumental (Schwartz și Gamzu, 1977).

Activitățile instrumentale direcționate către obiective sunt caracterizate de două criterii: 1) sensibilitatea la modificările valorii rezultatului și 2) sensibilitatea la schimbările în situația de urgență dintre acțiune și rezultat (Dickinson, 1985; Dickinson și Balleine, 1993). Sensibilitatea numai la devalorizarea rezultatului trebuie subliniată, nu este suficientă pentru a caracteriza un răspuns ca fiind direcționat spre destinație, deoarece unele răspunsuri Pavlovian pot fi, de asemenea, sensibile la această manipulare (Holland și Rescorla, 1975). Cu toate acestea, performanța acțiunilor instrumentale direcționate către scopuri este, de asemenea, sensibilă la manipularea contingenței de acțiune-rezultat, în timp ce răspunsurile Pavlovian sunt sensibile la manipularea contingenței stimulului-rezultat (Rescorla, 1968; Davis și Bitterman, 1971; Dickinson și Charnock, 1985). O excepție importantă poate fi găsită în cazul obiceiurilor (vezi mai jos), care sunt mai asemănătoare cu răspunsurile Pavlovian în insensibilitatea lor relativă față de schimbările intervenite în instrumental, dar sunt, de asemenea, impermeabile la devalorizarea rezultatului deoarece rezultatul nu este parte a structurii reprezentative care controlează performanța (cf. Dickinson, 1985 și mai jos pentru discuții ulterioare).

Pentru a rezuma, deci, este extrem de important ca un răspuns special să fie definit în mod clar în termenul contingenței de control, mai degrabă decât prin forma de răspuns sau prin sarcina comportamentală utilizată pentru stabilirea acesteia. Fără a examina contingența controlată într-o situație dată, atât comportamentul, cât și procesele neuronale găsite pentru a media comportamentul sunt probabil greșit caracterizate. În cele din urmă, după cum vom argumenta, acele contingențe de control, dobândite prin învățare și implementate de sisteme neuronale distincte, comportament de control, deși pot împărți aceeași "cale finală comună". Astfel, provocarea centrală este să depășim aparențele pentru a descoperi comportamentul care controlează contingentele de bază (pentru un rezumat a se vedea Tabelul 1). Pentru a afirma că structurile neuronale specifice mediază capacități psihologice specifice, de exemplu orientarea spre țintă, statutul comportamentului trebuie evaluat cu ajutorul testelor comportamentale adecvate. A face altfel este de a invita confuzii, pe măsură ce grupurile se întreabă asupra determinanților neuronali adecvați, în timp ce nu reușesc să recunoască faptul că sarcinile lor comportamentale ar putea măsura diferite fenomene. Ceea ce contează, în cele din urmă, este ceea ce animalul învață de fapt, nu ceea ce experimentatorul crede că animalul învață și ceea ce animalul învață de fapt nu poate fi dezvăluit decât prin teste care antrenează direct conținutul învățării.

Distincția instrumentală pavloviană ar fi fost banală dacă animalul a reușit să învețe același lucru (să spunem o asociere între stimul și recompensă) indiferent de aranjamentele experimentale. Folosind cele mai comune măsuri de învățare disponibile pentru neuroștiințe astăzi, pur și simplu nu există nici o modalitate de a spune. Astfel, cercetătorii adesea pretind că studiază un comportament orientat spre scop, fără a examina dacă comportamentul în cauză este, de fapt, direcționat spre obiectiv. Deși diferitele tipuri de învățare se presupune că rezultă din utilizarea unor "sarcini" sau "paradigme" diferite, cercetătorii nu reușesc să ofere o rațiune adecvată pentru ipotezele lor.

Un exemplu clasic al acestei probleme este folosirea labirinilor pentru a studia învățarea. O problemă cu experimentele labirintului și cu testele asociate, ca și preferința locului condiționat, este dificultatea disocierii experimentale a influenței factorilor Pavlovian (recompensă stimul-recompensă) și a factorilor instrumentali (răsplată-acțiune) asupra comportamentului (Dickinson, 1994; Yin și Knowlton, 2002). Astfel, trecerea printr-un labirint T pentru obținerea hranei ar putea reflecta o strategie de răspuns (la stânga) sau pur și simplu o abordare condiționată față de un punct de reper extra-labirint controlat de asociația cu alimente-tipice (Restul, 1957). O modalitate de a testa dacă acesta din urmă joacă un rol în performanță este de a inversa labirintul; acum răspunsul elevilor ar trebui să continue să se întoarcă la stânga, în timp ce cei care folosesc indicii extra-labirint ar trebui să se întoarcă la dreapta. Dar sunt cei care continuă să dea stânga într-adevăr folosind o strategie de răspuns sau se apropie doar de unii Intra-un tact asociat cu alimentele? Nu este o chestiune simplă să aflăm, deoarece controalele obișnuite pentru controlul comportamentului Pavlovian nu pot fi aplicate cu ușurință în studii de labirint. Unul dintre acestea, controlul bidirecțional, stabilește că animalele pot exercita controlul asupra unui anumit răspuns, cerând inversarea direcției răspunsului respectiv pentru a câștiga recompense (Hershberger, 1986; Heyes și Dawson, 1990). Din păcate, într-un labirint, inversarea răspunsului poate să nu fie încă suficientă pentru a stabili o acțiune ca fiind direcționată spre obiectiv, deoarece inversarea poate fi realizată prin stingerea relației de stimulare-recompensă existentă și înlocuirea acesteia cu alta. De exemplu, un șobolan care se apropie de un anumit indiciu intra-labirint poate învăța, în timpul inversării, că nu mai este asociat cu recompensa, ci că există un alt stimulent, care duce la obținerea unei abordări a CR față de noul stimul. Astfel, ei își pot inversa aparent răspunsul fără a fi codificat vreodată contingența răspuns-recompensă. Deoarece această posibilitate nu poate fi testată în practică, folosirea labirinilor, a procedurilor de preferință a locului sau a sarcinilor simple locomotorii pentru studierea proceselor de învățare direcționate către scopuri este deosebit de periculoasă și poate conduce la identificarea greșită a proceselor care controlează comportamentul împreună cu rolul specific al oricărui neural proceselor care au fost constatate (Smith-Roe și Kelley, 2000; Hernandez și colab., 2002; Atallah și colab., 2007).

Nucleus accumbens nu este necesar pentru învățarea instrumentală

Inadecvările analizei comportamentale actuale devin deosebit de clare în studiul nucleului accumbens. Multe studii au sugerat că această structură este critică pentru achiziționarea de acțiuni orientate spre scopuri (Hernandez și colab., 2002; Goto și Grace, 2005; Hernandez și colab., 2005; Pothuizen și colab., 2005; Taha și câmpurile, 2006; Atallah și colab., 2007; Cheer și colab., 2007; Lerchner și colab., 2007). Dar această concluzie a fost realizată în mare măsură numai pe baza unor măsuri de modificare a performanței, folosind sarcini în care comportamentul de control al situațiilor de urgență este ambiguu. Deși observația că o manipulare împiedică obținerea unui răspuns comportamental ar putea indica un deficit de învățare, ele ar putea reflecta și un efect asupra inițiere sau motivare a răspunsului. De exemplu, o deteriorare a achiziției de presare a pârghiilor poate reflecta adesea un efect asupra performanței, mai degrabă decât asupra învățării (Smith-Roe și Kelley, 2000). Curbele de achiziție, ca reprezentări incomplete ale oricărui proces de învățare, trebuie interpretate cu prudență (Gallistel și colab., 2004). Din păcate, distincția dintre învățare și performanță, probabil cea mai veche lecție din studiul învățării, este adesea ignorată astăzi.

O analiză mai detaliată arată că accumbensul nu este nici necesar, nici suficient pentru învățarea instrumentală. Leziunile carcasei accumbens nu modifică sensibilitatea performanței la devalorizarea rezultatului (de Borchgrave et al, 2002; Corbit și colab., 2001) sau la degradarea instrumentală de urgență (Corbit și colab., 2001), în timp ce leziunile nucleului accumbens au descoperit că reduc sensibilitatea la devalorizare fără a afecta sensibilitatea șobolanilor la degradarea selectivă a contingenței instrumentale (Corbit și colab., 2001). Alte studii care evaluează efectul manipulărilor accumbens asupra obținerii unui răspuns nou în studiile de întărire condiționată au constatat în mod constant un efect asupra performanței legate de recompense, în special creșterea performanței amfetaminei, dar nu asupra achiziției de răspuns per se (Parkinson și colab., 1999). De asemenea, un studiu sistematic efectuat de Cardinal și Cheung nu a găsit nici un efect al leziunilor de bază accumbens asupra achiziției unui răspuns de presă al pârghiei în cadrul unui program de întărire continuă; depresie a fost observată doar cu întârzierea întăririi (Cardinalul și Cheung, 2005).

Deși accumbens nu codifică contingența instrumentală (Balleine & Killcross, 1994; Corbit, Muir & Balleine, 2001), dovezi considerabile sugerează că acesta joacă un rol fundamental în instrumental performanță, un rol pe care acum îl putem defini mai bine în lumina lucrărilor recente. După cum sa concluzionat în mai multe studii, accumbens este critică pentru anumite tipuri de condiționări apreciabile Pavlovian și mediază atât efectele excitatorii nespecifice pe care indicii de recompensare le pot avea asupra performanței instrumentale, cât și influențele specifice rezultatelor asupra selecției de răspuns produse prin astfel de indicii. Leziunile miezului sau ale cingulatei anterioare, o sursă majoră de intrare corticală la miez sau o deconectare între aceste două structuri, afectează dobândirea comportamentului de apropiere Pavlovian (Parkinson și colab., 2000). Infuzia locală a unui antagonist al receptorilor dopaminergici D1 sau a unui antagonist al receptorilor de glutamat NMDA imediat după formare a afectat de asemenea această formă de învățare fără a afecta performanța (Dalley și colab., 2005). Aceste date sunt de acord cu măsurile in vivo activitate neuronală. De exemplu, Carelli și colegii săi au descoperit că neuronii din nucleul accumbens își pot schimba activitatea în mod sistematic în timpul învățării unei sarcini de autoshaping Pavlovian (Day și colab., 2006; Zi și Carelli, 2007).

Neuronii din regiunea cochiliei par a fi reglați la recompense și stimuli aversivi, chiar înainte de orice experiență de învățare; aceștia sunt, de asemenea, capabili să dezvolte răspunsuri la CS-urile care prezic aceste rezultate (Roitman și colab., 2005). Munca lui Berridge și a colegilor, în plus, a ridicat posibilitatea ca anumite regiuni ale cochiliei nucleului accumbens și ale ventralului pallidum din aval să poată fi caracterizate drept "hotspoturi hedonice". Aceste zone modulează în mod direct răspunsurile hedonice necondiționate la recompense, cum ar fi reactivitatea gustului. De exemplu, agoniștii receptorilor opioizi în aceste regiuni pot amplifica semnificativ reactivitatea gustului ingerator la zaharoză. Asemenea regiuni foarte localizate sunt încorporate în rețele mai largi care nu joacă un rol în comportamentul apetit consumator (Taha și câmpurile, 2005; Pecina și colab., 2006; Taha și câmpurile, 2006).

Distincția în rolurile relative ale miezului și ale coajelor pare a fi una dintre comportamentele apetisante pregătitoare și consumatoare, care pot fi ușor modificate prin experiență prin diferite tipuri de condiționare Pavloviană. Răspunsurile pregătitoare precum abordarea sunt legate de calitățile emoționale generale ale rezultatului, în timp ce comportamentele consumatoare sunt legate de calități senzoriale mai specifice; ele sunt, de asemenea, sensibile la diferite tipuri de CS, de exemplu răspunsurile pregătitoare sunt mai ușor condiționate cu un stimul cu durată lungă (Konorski, 1967; Dickinson și Dearing, 1979; Balleine, 2001; Dickinson și Balleine, 2002).

În orice caz, dovezile care implică accumbens în unele aspecte ale condiționării Pavlovian este copleșitoare. Cu toate acestea, nu este singura structură implicată și alte rețele, cum ar fi cele care implică diferitele nuclee amigdaloide, par să joace un rol central atât în ​​componentele pregătitoare, cât și în cele consumatoare ale condiționării Pavlovian (Balleine și Killcross, 2006).

O funcție care poate fi atribuită în mod clar accumbenilor este integrarea influențelor Pavlovian asupra comportamentului instrumental. CR-urile Pavlovian, inclusiv cele care reflectă activarea stărilor motivaționale centrale, cum ar fi pofta și excitarea, pot exercita o puternică influență asupra performanței acțiunilor instrumentale (Trapold și Overmier, 1972; Lovibond, 1983; Olanda, 2004). De exemplu, un CS care prezice în mod independent livrarea de alimente poate crește răspunsul instrumental pentru aceleași alimente. Acest efect este frecvent studiat folosind paradigma de transfer instrumental Pavlovian (PIT). În PIT, animalele primesc etape separate de pregătire Pavloviană și instrumentală, în care învață, în mod independent, să asocieze un tac cu alimente și să apese o pârghie pentru aceeași mâncare. Apoi, pe studiile sonde, tacul este prezentat cu pârghia disponibilă și se măsoară înălțimea ratelor de răspuns în prezența CS. Au fost identificate două forme de PIT; unul legat de efectul general generat de indicii de recompensă și un al doilea efect mai selectiv asupra performanței alegerii produse de statutul predictiv al unui tac cu privire la o recompensă specifică, spre deosebire de altele. Cochilii accumbens sunt necesari pentru această formă de PIT specifică rezultată, dar nu este nici necesară pentru forma anterioară, mai generală, nici pentru sensibilitatea la devalorizarea rezultatului; prin contrast, leziunile nucleului accumbens reduc sensibilitatea atât la devalorizarea rezultatului, cât și la forma generală a PIT, dar lasă în mod inerent PIT specific pentru rezultate (Corbit și colab., 2001; (Balleine și Corbit, 2005).

Un studiu recent a oferit o perspectivă mai aprofundată asupra rolului cochiliei accumbens în PIT specific pentru rezultate (Wiltgen și colab., 2007). Exprimarea controlată a proteinei kinazei II (CaMKII) dependentă de calciu / calmodulină în striatum nu a afectat învățarea instrumentală sau cea Pavloviană, dar a eliminat PIT-ul specific. Acest deficit în PIT nu a fost permanent și ar putea fi inversat prin oprirea expresiei transgene cu doxiciclină, demonstrând că deficitul a fost asociat doar cu performanța. Creșterea artificială a nivelului de CaMKII în striatum blochează, prin urmare, transferul specific de rezultate al motivației de stimulare de la sistemul Pavlovian la sistemul instrumental. Interesant, sa constatat că transformarea transgenei CaMKII reduce excitabilitatea neuronilor în cochilia accumbens, fără a afecta transmisia bazală sau rezistența sinaptică.

Striatul dorsal

Striatul dorsal, de asemenea cunoscut sub numele de neostriatum sau caudate-putamen, primește proiecții masive din așa-numitul neocortex. Acesta poate fi împărțit în continuare într-o regiune asociativă, care la rozătoare este mai medială și continuă cu striatum ventral și o regiune senzorimotor care este mai laterală (Groenewegen și colab., 1990; Joel și Weiner, 1994). În ansamblu, striatumul dorsal este inervat de celule DA din substantia nigra pars compacta (SNc) și primește numai proiecții slabe de la neuronii VTA DA (Joel și Weiner, 2000). Lucrările anterioare privind striatumul dorsal s-au concentrat în special pe rolul său în învățarea habitului de răspuns-stimul (SR) (Miller, 1981; Alb, 1989). Această viziune se bazează pe legea efectului, conform căreia o recompensă acționează pentru întărirea sau întărirea unei asocieri SR între stimulii de mediu și răspunsul efectuat, ca urmare a faptului că tendința de a efectua acest răspuns crește în prezența acelor stimuli (Thorndike, 1911; Hull, 1943; Miller, 1981). Astfel, calea corticostriatală se ghidează să medieze învățarea SR cu DA acționând ca semnal de armare (Miller, 1981; Reynolds și Wickens, 2002).

Modelele SR au avantajul de a conține o regulă parsimonioasă pentru traducerea învățării în performanță. Un model bazat pe așteptările legate de acțiune, în schimb, este mult mai complicat deoarece credința "Acțiunea A duce la rezultatul O" nu trebuie neapărat să fie transpusă în acțiune (Guthrie, 1935; Mackintosh, 1974); informațiile de acest tip pot fi utilizate atât pentru a efectua "A", cât și pentru a evita efectuarea "A". Din acest motiv, teoriile tradiționale s-au abătut de la cea mai evidentă explicație - și anume că animalele pot dobândi o contingență de acțiune-rezultat care să indice comportamentul alegerilor. Cu toate acestea, ultimele decenii au vizat o revizuire substanțială a legii efectului (Adams, 1982; Colwill și Rescorla, 1986; Dickinson, 1994; Dickinson și colab., 1996). Trezultatele multor studii au demonstrat că acțiunile instrumentale pot fi cu adevărat direcționate către obiective, adică sensibile la schimbările în valoarea recompensă, precum și la eficacitatea cauzală a acțiunii (vezi Dickinson & Balleine, 1994; 2002; Balleine, 2001 pentru comentarii). Cu toate acestea, pe parcursul instruirii extinse în condiții constante, chiar și acțiunile nou dobândite pot deveni relativ automate și stimulate - un proces cunoscut sub numele de formare a obiceiurilor (Adams și Dickinson, 1981; Adams, 1982; Yin și colab., 2004). Obiceiurile astfel definite, fiind provocate în mod automat de stimuli antecedenți, nu sunt controlați de așteptarea sau reprezentarea rezultatului; ele sunt, prin urmare, impermeabile la modificările rezultatelor. Din această perspectivă, legea efectului este, prin urmare, un caz special care se aplică numai comportamentului obișnuit.

Clasificarea curentă a comportamentului instrumental o împarte în două clase. Tprima clasă cuprinde acțiuni direcționate către scop, controlate de contingența instrumentală; cel de-al doilea comportament obișnuit, impermeabil la schimbarea valorii rezultatului (Tabelul 1). Folosind teste comportamentale cum ar fi devalorizarea rezultatului și degradarea instrumentală de contingență, Yin et al a stabilit o disociere funcțională între striatumul dorsal (striatum dorsolateral, DLS) și regiunile asociative (striatum dorsomedial, DMS)Yin și Knowlton, 2004; Yin și colab., 2004, 2005a; Yin și colab., 2005b; Yin și colab., 2006a). Leziunile DLS au afectat dezvoltarea obiceiurilor, rezultând într-un mod de control al comportamentului orientat mai mult către scopuri. Leziunile DMS au efectul opus și duc la o trecere de la controlul orientat spre obiectiv la controlul obișnuit. Yin et al a concluzionat, prin urmare, că DLS și DMS pot fi disociate funcțional în ceea ce privește tipul de structuri asociative pe care le suportă: DLS este critică pentru formarea habituală, în timp ce DMS este critică pentru obținerea și exprimarea acțiunilor direcționate către țintă. Această analiză prevede că, în anumite condiții (de exemplu, formarea extinsă), controlul acțiunilor se poate transforma de la sistemul dependent de DMS la sistemul dependent de DLS, o concluzie care este în acord cu literatura considerabilă privind primatele, inclusiv neuroimagistica umanăHikosaka și colab., 1989; Jueptner și colab., 1997a; Miyachi și colab., 1997; Miyachi și colab., 2002; Delgado și colab., 2004; Haruno și colab., 2004; Tricomi și colab., 2004; Delgado și colab., 2005; Samejima și colab., 2005; Haruno și Kawato, 2006a, b; Lohrenz și colab., 2007; Tobler și colab., 2007). Ar trebui să ne amintim, desigur, t(de ex. dorsală sau ventrală) nu poate fi un ghid de încredere în compararea striatumului rozătoarelor și striatumului primat; astfel de comparații ar trebui făcute cu prudență, după o analiză atentă a conectivității anatomice.

Efectele leziunilor striate dorsale pot fi comparate cu cele ale leziunilor accumbens (Smith-Roe și Kelley, 2000; Atallah și colab., 2007). Așa cum am menționat deja, testele standard pentru stabilirea unui comportament ca fiind "orientat spre obiectiv" sunt devalorizarea și degradarea rezultatului incidentului de acțiune-rezultat (Dickinson și Balleine, 1993). Leziunile DMS conduc comportamentul insensibil la ambele manipulări (Yin și colab., 2005b), în timp ce leziunile nucleului sau cochiliei accumbens nu (Corbit și colab., 2001). Mai mult, testele de probă ale acestor teste comportamentale sunt de obicei efectuate în extincție, fără prezentarea oricărei recompense, pentru a evalua ceea ce animalul a învățat fără contaminare prin învățare nouă. Prin urmare, ele probează direct structura de reprezentare care controlează comportamentul. Ca un control experimental suplimentar, adesea este util să se efectueze un test separat de devalorizare, în care sunt livrate efectiv recompense - așa-numitul "test recompensat". Leziunile DMS nu au eliminat sensibilitatea față de devalorizarea rezultatelor pe testul recompensat, așa cum ar trebui să se aștepte de la livrarea unui rezultat devalorizat condiționat dintr-o acțiune, poate suprima acțiunea independent de codificarea rezultatelor acțiunii. Cu toate acestea, leziunile de coajă de acumben nu au afectat sensibilitatea la devalorizarea rezultatului fie la testul de extincție, fie la testul recompensat, în timp ce leziunile de bază accumbens au eliminat sensibilitatea la devalorizare la ambele teste (Corbit și colab., 2001). Sensibilitatea la degradarea de urgență, cu toate acestea, nu a fost afectată de nici o leziune, demonstrând că, după leziunile accumbens, șobolanii au fost capabili să codifice și să recupereze reprezentările de acțiune-rezultat.

Rolul dopaminei: mezolimbic vs. nigrostriatal

Încă de la studiile de pionierat asupra activității fazice a neuronilor DA la maimuțe, o presupunere comună în domeniu este că toate celulele DA se comportă în mod esențial în același mod (Schultz, 1998a; Montague și colab., 2004). Cu toate acestea, datele disponibile, precum și conectivitatea anatomică, sugerează altfel. De fapt, analiza de mai sus a heterogenității funcționale în striatum poate fi extinsă și la celulele DA din miezul miezului.

Celulele DA pot fi împărțite în două grupe majore: VTA și substantia nigra pars compacta (SNc). Deși proiecția de la VTA către accumbens a fost centrul atenției în domeniul învățării legate de recompense, calea nigrostriatală mult mai masivă a fost relativ neglijată, cu o atenție deosebită acordată în primul rând rolului său în boala Parkinson. Gândirea actuală cu privire la rolul lui DA în învățare a fost puternic influențată de propunerea că activitatea fazică a celulelor DA reflectă o eroare de predicție a recompenselorr (Ljungberg și colab., 1992; Schultz, 1998b). eun cea mai obișnuită sarcină de condiționare Pavlovian folosită de Schultz și de colegi, acești neuroni se declanșează ca răspuns la recompensa (SUA), dar, prin învățare, activitatea evocată de SUA este transferată la CS. Atunci când SUA este omisă după învățare, celulele DA prezintă o depresie scurtă în activitate la momentul așteptat al livrării (Waelti și colab., 2001; Fiorillo și colab., 2003; Tobler și colab., 2003). Aceste date formează baza unei varietăți de modele computaționale (Schultz și colab., 1997; Schultz, 1998b; Brown și colab., 1999; Montague și colab., 2004).

Având în vedere multiplele niveluri de control în mecanismele de sinteză și eliberare, spikingul neuronilor DA nu poate fi asimilat cu eliberarea DA, deși s-ar aștepta ca aceste două măsuri să fie foarte corelate. Într-adevăr, așa cum arată un studiu recent realizat de Carelli și colegii săi folosind voltammetria ciclică de scanare rapidă, eliberarea actuală de DA în nucleul accumbens pare să fie corelată cu o eroare de predicție în condiționarea condiționată a Pavlovian (Day și colab., 2007). Ei au descoperit un semnal fazic DA în nucleul accumbens imediat după primirea recompenselor de zaharoză în autoșaparea Pavlovian. După condiționarea extinsă a lui Pavlovian, acest semnal nu mai era găsit după recompensa în sine, ci sa mutat în schimb la CS. Această constatare susține ipoteza inițială de "eroare de predicție". Este, de asemenea, în concordanță cu lucrările anterioare care prezintă performanțe depreciate ale CR Pavlovian după antagonismul receptorului DA sau a depleției DA în nucleul accumbens (Di Ciano și colab., 2001; Parkinson și colab., 2002). Cu toate acestea, o observație din studiu este nouă și are un interes considerabil: după o condiționare prelungită cu un CS + care prezice o recompensă și un CS - care nu prevede recompensa, un semnal similar, deși mai mic, a fost observat și după CS- a arătat, de asemenea, o ușoară scufundare imediat (500 ~ 800 milisecunde după debutul taciei) după vârful inițial (Day și colab., 2007, Figura 4). În acest stadiu de învățare, animalele aproape nu se apropie niciodată de CS -, dar abordează consistent CS +. Astfel, semnalul DA fazic imediat după predictor poate să nu joace un rol de cauzalitate în generarea răspunsului de apropiere, deoarece este prezent chiar și în absența răspunsului. Indiferent dacă un astfel de semnal este încă necesar pentru a învăța contingența stimulului-recompensă rămâne neclar, dar răspunsul fazic observat la CS- cu siguranță nu este prezis de nici unul dintre modelele actuale.

Interesant este faptul că epuizarea DA locală afectează performanța acestei sarcini (Parkinson și colab., 2002). Întrucât un semnal fazic DA este observat după CS-, care nu generează deloc CR, eliminarea atât a DA-ului fazic cât și a tonicului DA prin epuizare locală nu afectează performanțele CR. Un astfel de model sugerează că un semnal fazic DA în accumbens nu este necesar pentru performanța CR Pavlovian, dar poate juca un rol în învățare, în timp ce un semnal DA mai încet și mai tonic (probabil abolit în studiile de epuizare) este mai important pentru performanță răspunsului de abordare (Cagniard și colab., 2006; Yin și colab., 2006b; Niv și colab., 2007). Această posibilitate rămâne testată.

Deși nu există dovezi directe pentru rolul cauzal al semnalului fazic DA în învățare, ipoteza "erorii de predicție" a atras totuși multă atenție, deoarece este tocmai tipul de semnal didactic folosit în modelele proeminente de învățare, cum ar fi modelul Rescorla-Wagner și extinderea sa în timp real a algoritmului de învățare a amplificării diferenței temporale (Schultz, 1998b). Conform acestei interpretări, învățarea apetitului este determinată de diferența dintre recompensa primită și cea așteptată (sau între două predicții de recompense temporare succesive). Un astfel de semnal de predare este reglementat de feedback-ul negativ de la toți predictorii recompensei (Schultz, 1998b). Dacă nici o răsplată nu urmează predictorul, atunci mecanismul de feedback negativ este demascat ca o scădere a activității neuronilor DA. Astfel, învățarea presupune reducerea progresivă a erorii de predicție.

Eleganța semnalului didactic din aceste modele a distras unele dintre ele din realitatea anatomică. În studiul de la Day și colab. (2007), semnalul DA din accumbens provine cel mai mult din celulele din VTA, dar pare puțin probabil ca alte celule DA, cu conectivitate anatomică complet diferită, să prezinte același profil de răspuns și să furnizeze același semnal. Un gradient în ceea ce privește semnalul celulelor DA este mai probabil, deoarece celulele DA proiectează în diferite regiuni striatale cu funcții complet diferite și primesc, la rândul lor, semnale distincte de răspuns negativ din diferite regiuni striatale (Joel și Weiner, 2000; Wickens și colab., 2007). Mecanismele de absorbție și degradare, precum și receptorii presinaptici care reglează eliberarea dopaminei, prezintă de asemenea variații considerabile în striat (Cragg și colab., 2002; Rice și Cragg, 2004; Wickens și colab., 2007; Rice și Cragg, 2008).

Noi propunem, prin urmare, că calea mezoaccumbens joacă un rol mai restrâns în învățarea Pavloviană, în dobândirea valorii statelor și a stimulilor, în timp ce calea nigrostriatală este mai importantă pentru învățarea instrumentală, pentru dobândirea valorilor acțiunilor. Tpălăria este că semnalul DA fazic poate codifica diferite erori de predicție, mai degrabă decât o singură eroare de predicție, așa cum se presupune în prezent. Trei linii de dovezi susțin acest argument. În primul rând, epuizarea genetică a DA în calea nigrostriatală afectează dobândirea și performanța acțiunilor instrumentale, în timp ce epuizarea DA în calea mezolimbică nu (Sotak și colab., 2005; Robinson și colab., 2007). În al doilea rând, celulele DA din SNc pot codifica valoarea acțiunilor, similare celulelor din regiunea țintă striatală (Morris și colab., 2006). În al treilea rând, leziunea selectivă a proiecției nigrostriatale la DLS afectează formarea obiceiurilor (Faure și colab., 2005).

Lucrările recente realizate de Palmiter și colegi au arătat că șoarecii cu deficit de DA cu inginerie genetică sunt sever afectați în ceea ce privește învățarea și performanța instrumentală, însă performanța acestora ar putea fi restabilită fie prin injectarea L-DOPA, fie prin transferul de gene virale pe calea nigrostriatalăSotak și colab., 2005; Robinson și colab., 2007). Prin contrast, recuperarea DA în striatum ventral nu a fost necesară pentru a restabili comportamentul instrumental. Deși modul în care semnalele DA permit învățarea instrumentală rămâne o chestiune deschisă, o posibilitate evidentă este aceea că ar putea codifica valoarea acțiunilor inițiate de sine, adică cât de mult se prevede recompensa, dat fiind un anumit mod de acțiune.

Stratul dorsal, ca întreg, conține cea mai mare expresie a receptorilor DA din creier și primește cea mai masivă proiecție dopaminergică. Proiecția DA la DMS poate juca un rol diferit în învățare decât proiecția la DLS, deoarece aceste două regiuni diferă semnificativ în profilul temporal al eliberării, absorbției și degradării DA (Wickens și colab., 2007). Noi presupunem că proiecția DA la DMS de la SNC medial este critică pentru învățarea de rezultate, în timp ce proiecția DA către DLS din partea SNc laterală este critică pentru formarea obiceiurilor. Dacă acest lucru este adevărat, ar trebui să se aștepte ca celulele DA din SNc să codifice eroarea de predicție a recompensării bazată pe acțiunile generate de sine - eroarea de predicție instrumentală - mai degrabă decât cea bazată pe CS. Dovezi preliminare în sprijinul acestei afirmații provin dintr-un studiu recent realizat de Morris et al, care a înregistrat neuronii SNc în timpul unei activități instructive de învățare (Morris și colab., 2006). Maimuțele s-au antrenat să-și miște brațele ca răspuns la un stimul discriminativ (S.D) care a indicat mișcarea corespunzătoare și probabilitatea de recompensă. SD a determinat activitate fazică în neuronii DA corespunzând valorii de acțiune bazată pe probabilitatea de recompensă preconizată a unei acțiuni particulare. Cel mai interesant, deși răspunsul DA la SD crescut cu valoarea de acțiune, inversul a fost adevărat al răspunsului DA la răsplata însăși, în concordanță cu ideea că acești neuroni codifică o eroare de predicție asociată cu acea valoare. Nu este surprinzător că ținta primară striatală a acestor celule, nucleul caudat, este cunoscută că conține neuroni care codifică valori de acțiune (Samejima și colab., 2005). Trebuie remarcat totuși că acest studiu nu a utilizat sarcini comportamentale care evaluează fără echivoc valoarea acțiunilor. O predicție clară a modelului nostru este că activitatea DA fazică va însoți performanța acțiunilor, chiar și în absența unui S explicitD. De exemplu, anticipăm arderea spontană a neuronilor DA nigrali în momentul unei acțiuni inițiate de auto-câștigători.

Din punctul nostru de vedere, în timp ce semnalul DA mesoaccumbens reflectă valoarea CS, semnalul nigrostriatal, probabil din acei neuroni proiectați în DMS, reflectă valoarea acțiunii în sine, sau de orice SD care prezice această valoare. În plus, învățarea instrumentală și cea Pavlovian pare să implice o formă de feedback negativ pentru a controla semnalul didactic eficient. De fapt, proiecțiile directe de la striatum la neuronii DA midbrain (Figura 2) au fost mult timp propuse ca implementarea neurală a acestui tip de feedback negativ (Houk și colab., 1995), iar puterea și natura intrărilor inhibitoare pot varia considerabil de la o regiune la alta.

Figura 2  

Rețelele ganglionilor cortico-bazali

O eroare de predicție, conform modelelor curente, este un semnal de predare care determină cât de mult are loc învățarea. Atâta timp cât este prezent, învățarea continuă. Cu toate acestea, se pare că această afirmație apare, o eroare de predicție pentru valoarea de acțiune, deși similară sintactic cu eroarea de prognoză Pavlovian, are caracteristici unice care nu au fost examinate extensiv. În modelele tradiționale precum modelul Rescorla-Wagner, care abordează exclusiv condiția Pavlovian (deși cu un succes limitat), caracteristica cheie este feedback-ul negativ care reglementează eroarea de predicție. Această ieșire reprezintă predicția dobândită, mai exact sumă din toți predictorii curenți, cum sunt capturați de stimulii compuși utilizați în mod tipic în experimentele de blocare (Rescorla, 1988). Este această sumare a predictorilor disponibili pentru a stabili un termen global de eroare care este principala inovație în această clasă de model. Cu toate acestea, pentru acțiunile instrumentale, termenii individuali de eroare par mai probabili, deoarece este dificil să vedem cum feedback-ul negativ ar prezenta simultan valoarea mai multor acțiuni atunci când se poate efectua o singură acțiune la un moment dat. Desigur, există o serie de soluții posibile. De exemplu, dată fiind o anumită stare (implementată experimental de către un S distinctD), posibilele cursuri de acțiuni ar putea fi într-adevăr reprezentate simultan ca predicții dobândite. Dar principala dificultate cu erorile instrumentale de predicție are legătură cu natura acțiunii însăși. O predicție Pavlovian urmărește automat prezentarea stimulului, care este independent de organism. O eroare de predicție instrumentală trebuie să abordeze elementul de control, deoarece predicția este ea însăși acțiune-contingentă și o acțiune deliberată este emisă spontan, bazată pe urmărirea de către animale a consecințelor acțiunii, mai degrabă decât pe stimuli antecedenți. În final, este tocmai o neglijare generală a naturii spontane a acțiunilor direcționate către scopuri, atât în ​​neuroștiință, cât și în psihologie, care a distrus distincția dintre procesele de învățare Pavlovian și instrumental și natura erorilor de predicție implicate. Rămâne de stabilit, prin urmare, ce tip de semnal de feedback negativ, dacă există, reglementează dobândirea valorilor de acțiune (Dayan și Balleine, 2002).

În cele din urmă, lucrările recente au implicat, de asemenea, proiecția nigrostriatală de la SNC lateral la DLS în special în formarea obișnuită. Faure et al le-a leșat selectiv celulele DA care au fost proiectate în DLS utilizând 6-OHDA și au constatat că această manipulare are un efect surprinzător de mic asupra ratei de presare a pârghiei, deși a afectat formarea habitului, măsurată utilizând devalorizarea rezultatuluiFaure și colab., 2005). Adică, animalele lezate au răspuns într-un mod orientat spre scopuri, deși, într-un grup de control, formarea a generat un comportament obișnuit insensibil la devalorizarea rezultatului. Deteriorarea locală a DA este, așadar, similară cu leziunile excitotoxice ale DLS, prin aceea că ambele manipulări întârzie formarea obiceiurilor și favorizează dobândirea unor acțiuni direcționate către scop (Yin și colab., 2004). Un semnal fazic DA esențial pentru formarea obișnuită este deja bine descris de semnalul de armare efectiv în algoritmii de învățare a armăturii temporale de diferențiere temporală inspirat de lucrarea lui Hull și SpenceHull, 1943; Spence, 1947, 1960; Sutton și Barto, 1998).

Corpurile ganglionilor cortico-bazali

Până în prezent am discutat despre eterogenitatea funcțională în striatum, totuși ar fi înșelătoare să sugerăm că orice zonă striatală ar putea, să spunem, să traducă contingența de acțiune-rezultat în realizarea unei acțiuni de la sine. Mai degrabă, emisferele cerebrale sunt organizate ca unități funcționale iteratoare care constau în rețele de ganglioni cortico-bazali (Swanson, 2000; Zahm, 2005). Tstriatum, fiind stația de intrare a întregii ganglioni bazali, servește ca un hub unic în motivul rețelei cortico-bazale a ganglionilor, capabil să integreze intrările cortical, thalamic și midbrain. Așa cum am descris mai sus, deși este o structură continuă, diferite regiuni striatale par să participe la rețele funcționale distincte, de exemplu accumbens acționează ca un hub în rețeaua limbic și DLS în rețeaua senzorimotor. Datorită proprietății reentante a unor astfel de rețele, cu toate acestea, niciuna dintre componentele acestei structuri nu este în amonte sau în aval în vreun sens absolut; de exemplu, sistemul talamocortic este atât sursa unei intrări majore în striat, cât și în țara ambelor căi striodo-palidale și striat-nigrale.

Deși buclele ganglionare bazale paralel reentante au fost recunoscute de mult (Alexander și colab., 1986), subliniem rolurile funcționale distincte ale acestor circuite bazate pe structuri de reprezentare definite operațional și pe interacțiunile dintre circuite în generarea comportamentelor integrative. Pe această bază, pot fi identificate cel puțin patru astfel de rețele: rețelele limbice care implică coaja și miezul accumbens, rețeaua asociativă care implică striatum asociativ (DMS) și rețeaua senzorimotoare care implică striatum senzorimotor (DLS). Funcțiile lor variază de la medierea controlului apreciativ al UR-urilor și CR-urilor Pavlovian la acțiunile instrumentale (Figura 1).

Figura 1  

Domeniile funcționale majore ale striatumului. O ilustrare a striatumului dintr-o secțiune coronală reprezentând jumătate din creier (Paxinos și Franklin, 2003). Rețineți că aceste patru domenii funcționale sunt anatomice continue și corespund aproximativ cu ceea ce ...

După cum sa menționat deja, striatumul ventral constă în principal din nucleul accumbens, care poate fi împărțit în continuare în cochilie și miez, fiecare participând într-o rețea funcțională distinctă. Proiecțiile corticale (glutamatergice) ale cochiliei apar din cortexul orbital infralimbic, central și lateral, în timp ce proiecțiile către miez provin din mai multe regiuni ale liniei mediane dorsale ale cortexului prefrontal cum ar fi cortexul ventral și dorsal prelimbic și cingulat anteriorGroenewegen și colab., 1990; Zahm, 2000, 2005). În cadrul acestor rețele de funcții, dovezile revizuite mai sus sugerează că cochilia este implicată în recompensele UR și în achiziționarea de CR-uri consumatoare; nucleul în comportamentul exploratoriu, în special achiziția și exprimarea răspunsurilor abordării Pavlovian. Cel puțin două rețele majore pot fi identificate în cadrul rețelei cortico-bazale ventrale sau limbice cortico-bazale mai mari, unul pentru consumator și altul pentru comportamente pregătitoare și modificarea lor prin condiționarea Pavloviană (Figura 1).

De asemenea, striatumul dorsal poate fi împărțit în cel puțin două regiuni majore, asociative și senzorimotoare, cu o rețea funcțională distinctă asociată cu fiecare. Striatul asociativ (caudat și părți ale putamenului anterior în primate) conține neuroni care se trag în așteptarea recompenselor-răsplată contingentă și schimba tragerea lor în funcție de mărimea recompensei așteptateHikosaka și colab., 1989; Hollerman și colab., 1998; Kawagoe și colab., 1998). În rețeaua asociativă, cortexul asociativ prefrontal și parietal și ținta acestuia în DMS sunt implicate în memoria tranzitorie, atât prospectivă, sub forma așteptărilor de rezultat, cât și retrospective, ca o înregistrare a copiilor recente de efemer (Konorski, 1967). Nivelul senzorimotor, pe de altă parte, cuprinde cortexul senzorimotor și țintele sale în ganglionii bazali. Ieșirile acestui circuit sunt îndreptate spre cortexurile motoare și rețelele motoarelor stem din creier. Activitatea neuronală în striatum senzorimotor nu este, în general, modulată de speranța de recompensă, prezentând mai multă activitate legată de mișcare decât neuronii în striatum asociativ (Kanazawa și colab., 1993; Kimura și colab., 1993; Costa și colab., 2004). În plus, în plus față de gradientul medial-lateral, există o eterogenitate funcțională semnificativă de-a lungul axei anterioare posterioare a striatumului dorsal, deși nu sunt disponibile date suficiente pentru a permite o clasificare detaliată (Yin și colab., 2005b).

Studiile s-au concentrat doar pe componentele corticale și striatale ale acestor rețele. În general, leziunile unei zone corticale au efecte similare cu leziunile țintei striate (Balleine și Dickinson, 1998; Corbit și Balleine, 2003; Yin și colab., 2005b). Dar celelalte componente din rețea ar putea suporta funcții similare. De exemplu, leziunile nucleului mediodorsal al talamusului, o componentă a rețelei asociative, au descoperit că elimină sensibilitatea la devalorizarea rezultatului și degradarea contingenților în același mod ca leziunile la DMS și la cortexul prelimbic (Corbit și colab., 2003). Astfel, deși modelul nostru general prezice deficite comportamentale similare după deteriorarea fiecărei componente a unei rețele, ea sugerează, de asemenea, pentru orice structură dată, cum ar fi pallidum sau thalamus, mai multe domenii funcționale.

Interacțiunea dintre rețele

În cele mai multe condiții, învățarea Pavloviană și instrumentală pare să aibă loc în paralel. Fenomene precum PIT, totuși, demonstrează măsura în care aceste procese distincte pot interacționa. Având în vedere sistemele funcționale independente, următorul pas este de a înțelege modul în care aceste sisteme sunt coordonate pentru a genera comportamente. O propunere atractivă, în concordanță cu lucrările anatomice recente, este că rețelele prezentate mai sus sunt organizate ierarhic, fiecare servind ca intermediar labil și funcțional în ierarhie, permițând transmiterea de informații de la un nivel la altul. În special, conexiunile spiralate recent descoperite între striatum și midbrain sugerează o organizație anatomică care poate implementa interacțiuni între rețele (Figura 2). După cum observă Haber și colegii, neuronii striatali trimit proiecții directe inhibitorii la neuronii DA din care primesc proiecții DA reciproce și proiectează de asemenea neuronilor DA care, la rândul lor, se proiectează într-o zonă striatală diferităHaber și colab., 2000). Aceste proiecții permit propagarea în avans a informației într-o singură direcție, de la rețelele limbice la rețelele asociative și senzorimotorii. De exemplu, o predicție Pavloviană (valoarea dobândită a CS) ar putea reduce semnalul didactic eficient la nivelul limbic, în timp ce coincident potențează semnalul DA la nivelul următor. Anularea semnalului didactic eficient este în mod normal pusă în aplicare printr-un semnal de reacție negativ printr-o proiecție inhibitoare, de exemplu, de la neuronii de proiecție spina mediană GABAergic de la striatum la neuronii DA. Între timp, așa cum a sugerat organizația anatomică (Haber și colab., 2000; Haber, 2003), potențarea semnalului DA pentru rețeaua ganglionară cortico-bazală învecinată (nivelul următor al ierarhiei) ar putea fi implementată prin proiecții dezinhibitoare (adică neuronii proiecției striate GABAergic la interneuronii GABAergici neuroni la neuroni DA). Astfel, valoarea învățată a rețelei limbic poate fi transferată în rețeaua asociativă, permițând adaptarea comportamentală să fie rafinată și amplificată cu fiecare iterație (Ashby, 1960). Acest model prezice implicarea progresivă a diferitelor rețele neuronale în diferitele etape ale învățării, sugestie susținută de o varietate de date (Jueptner și colab., 1997b; Miyachi și colab., 1997; Miyachi și colab., 2002; Yin, 2004; Everitt și Robbins, 2005; Yin și Knowlton, 2005; Belin și Everitt, 2008).

Fenomene care necesită interacțiunea dintre procese funcționale distincte, cum ar fi PIT, oferă o bază fertilă de testare pentru modelele de acest tip. Într-adevăr, modelul ierarhic este în acord cu recentele descoperiri experimentale despre PIT. Potrivit modelului, interacțiunile Pavlovian-instrumentale sunt mediate de conexiunile reciproce dintre neuronii striatum și DA. DA pare a fi critic pentru transferul general, care este eliminat de antagoniștii DA și de inactivarea locală a VTA (Dickinson și colab., 2000; Murschall și Hauber, 2006); întrucât perfuzia locală a amfetaminei, care probabil creșteri ale nivelurilor de DA, în accumbens poate spori semnificativ (Wyvell și Berridge, 2000). Pe de altă parte, rolul dopaminei striate ventrale în transferul specific este mai puțin clar. Unele dovezi sugerează că ar putea fi scutită după inactivarea VTA (Corbit și colab., 2007) dar ca Corbit și Janak (2007) raportat recent, transferul specific este eliminat prin inactivarea DLS, sugerând că acest aspect al controlului stimulului asupra selecției acțiunii ar putea implica proiecția nigrostriatală (Corbit și Janak, 2007). În acord cu perspectiva ierarhică, Corbit și Janak (2007) a constatat că, în timp ce inactivarea DLS a eliminat efectul excitativ selectiv al indicațiilor paloviene (așa cum s-a observat după leziunile cochiliei accumbens prin Corbit și colab., 2001), inactivarea DMS a eliminat numai selectivitatea rezultată a transferului, păstrând în același timp efectul excitativ general al acestor indici, o tendință observată și după leziunile thalamusului mediodorsal, care face parte din rețeaua asociativă a ganglionilor cortico-bazali (Ostlund și Balleine, 2008). Pe baza acestor rezultate preliminare, DMS pare să medieze numai un transfer specific, în timp ce DLS ar putea fi necesar atât pentru efectele excitative specifice, cât și pentru cele generale ale repetițiilor lui Pavlovian asupra acțiunilor instrumentale.

Interesant este faptul că striatumul limbic se proiectează pe scară largă la celule DA care se proiectează la striatul dorsal (Nauta și colab., 1978; Nauta, 1989); proiecțiile dopaminergice la striat și proiecțiile striatale înapoi la miezul central sunt foarte asimetrice (Haber, 2003). Striatul limbic primește o intrare limitată de la neuronii DA, dar trimite o cantitate extinsă la un set mult mai mare de neuroni DA, iar contrariul este valabil pentru striatum senzorimotor. Astfel, rețelele limbice sunt într-o poziție perfectă pentru a controla rețelele asociative și senzorimotorii. Aici neuroanatomia este de acord cu datele comportamentale că facilitarea Pavlovian a comportamentului instrumental este mult mai puternică decât invers; într-adevăr, dovezi considerabile sugerează că acțiunile instrumentale au tendința de a inhiba, mai degrabă decât de a excita, CR-urile Pavloviene - o constatare care încă așteaptă o explicație neurobiologicăEllison și Konorski, 1964; Williams, 1965).

concluzii

Modelul ierarhic discutat aici, trebuie remarcat, este foarte diferit de cel al celor care se bazează exclusiv pe cortexul și conexiunile pe distanțe lungi între zonele corticale (Fuster, 1995). Acesta încorporează componentele și conectivitatea cunoscută a creierului, mai degrabă decât să-l privească ca un potpuriu de module corticale care, într-un mod nespecificat, implementează o gamă largă de funcții cognitive. De asemenea, evită ipotezele, moștenite de la 19th neurologia secolului, că cortexul cerebral, în general, și în special cortexul prefrontal, formează cumva o unitate omunulară "superioară" care controlează întregul creier (Miller și Cohen, 2001).

Mai mult, câteva predicții specifice pot fi derivate din modelul prezent: (i) Ar trebui să existe erori de predicție distincte pentru acțiunile generate de sine și pentru stări / stimuli cu proprietăți care reflectă substraturile lor neuronale diferite și rolurile funcționale. (ii) Componentele palidale și talamice ale fiecărei rețele discrete de ganglioni cortico-bazali sunt, de asemenea, de așteptat să fie necesare pentru tipul de control comportamental ipotezat pentru fiecare rețea, nu doar componentele corticale și striatale. (iii) Trebuie să existe o implicare progresivă a diferitelor rețele neuronale în diferitele etape ale învățării. (iv) activitatea Accumbens poate controla direct neuronii DA și, la rândul lor, activitatea striatală dorsală. Pe baza unui raport de către Olanda (2004) sugerând că PIT crește cu instruirea instrumentală, acest control "limbic" al rețelelor asociative și senzorimotorii este de așteptat să se consolideze cu o pregătire extinsă.

Fără date detaliate, este încă prea devreme să oferim o prezentare oficială a modelului ierarhic. Cu toate acestea, discuția de mai sus ar trebui să clarifice faptul că versiunile actuale ale ipotezei de recompensă a mesoaccumbens se bazează pe ipoteze problematice privind natura procesului de recompensă și utilizarea unor măsuri comportamentale inadecvate. Principiile unificatoare, întotdeauna scopul întreprinderii științifice, pot fi întemeiate doar pe realitatea datelor experimentale, oricât de greoaie ar fi acestea. Deoarece funcția creierului este, în cele din urmă, generarea și controlul comportamentului, analiza comportamentală detaliată va fi cheia înțelegerii proceselor neuronale, la fel cum o descriere amănunțită a imunității înnăscute și dobândite permite elucidarea sistemului imunitar. Deși aparent un truism, cu greu poate fi subliniat faptul că putem înțelege mecanismele creierului în măsura în care funcțiile lor sunt descrise și măsurate cu precizie. Atunci când studiul funcției neuronale se bazează pe capacități psihologice stabilite experimental, de exemplu, reprezentarea contingențelor rezultatului acțiunii și a rezultatului stimulului, organizarea anatomică cunoscută, precum și mecanismele fiziologice sunt văzute într-o nouă lumină, conducând la formulări de noi ipotezele și proiectarea de noi experimente. Ca prim pas în această direcție, sperăm că cadrul discutat aici va servi drept un punct de plecare util pentru investigații viitoare.

recunoasteri

Dorim să-i mulțumim lui David Lovinger pentru sugestii utile. HHY a fost susținută de Divizia de Intramural Clinic și de Cercetare de bază a NIH, NIAAA. SBO este susținută de NIH acordarea MH 17140 și BWB de către NIH subvenții MH 56446 și HD 59257.

Referinte

  1. Adams CD. Variații în sensibilitatea răspunsului instrumental la întărirea devalorizării. Jurnal trimestrial de psihologie experimentală. 1982; 33b: 109-122.
  2. Adams CD, Dickinson A. Instrumental răspunzând după întărirea devalorizării. Jurnalul trimestrial al Psihologiei Experimentale. 1981; 33: 109-122.
  3. Alexander GE, DeLong MR, Strick PL. Organizarea paralelă a circuitelor segregate funcțional care leagă ganglionii bazali și cortexul. Annu Rev Neurosci. 1986; 9: 357-381. [PubMed]
  4. Ashby WR. Design pentru un creier. a doua editie. Chapman & Hall; 1960.
  5. Atallah HE, Lopez-Paniagua D, Rudy JW, O'Reilly RC. Substraturi neuronale separate pentru învățarea și performanța abilităților în striatul ventral și dorsal. Nat Neurosci. 2007; 10: 126–131. [PubMed]
  6. Balleine BW. Procese de stimulare în condiționarea instrumentală. În: Mowrer RR, Klein SB, editori. Manual de teorii de învățare contemporană. Mahwah, NJ, SUA: Lawrence Erlbaum Associates, Inc., editori; 2001. pp. 307-366.
  7. Balleine BW. Bazele neurale ale alimentației: afectează, stimulează și recompensează circuitele corticostriatolimbice. Physiol Behav. 2005; 86: 717-730. [PubMed]
  8. Balleine BW, Dickinson A. Acțiunea instrumentală direcționată către scop: învățarea de urgență și stimulare și substraturile lor corticale. Neuropharmacology. 1998; 37: 407-419. [PubMed]
  9. Balleine BW, Corbit LH. Leziunile nucleului accumbens și al cochiliei produc efecte disociabile asupra formelor generale și a celor specifice transferului instrumental palovian; Reuniunea anuală a Societății pentru Neuroștiințe; 2005.
  10. Balleine BW, Killcross S. Procesare paralelă de stimulare: o vedere integrată a funcției amigdale. Tendințe Neurosci. 2006; 29: 272-279. [PubMed]
  11. Belin D, Everitt BJ. Sugestiile de căutare a cocainei depind de conectivitatea serială dependentă de dopamină, care leagă Ventral cu Striatumul Dorsal. Neuron. 2008; 57: 432-441. [PubMed]
  12. Berke JD, Hyman SE. Dependența, dopamina și mecanismele moleculare ale memoriei. Neuron. 2000; 25: 515-532. [PubMed]
  13. Berridge KC, Robinson TE. Care este rolul dopaminei în recompensă: impactul hedonic, învățarea recompensă sau semnificația stimulentelor? Brain Res Brain Res Rev. 1998; 28: 309-369. [PubMed]
  14. Bolles R. Consolidarea, speranța și învățarea. Revizuirea psihologică. 1972; 79: 394-409.
  15. Brown J, Bullock D, Grossberg S. Cum ganglionii bazali folosesc căi de învățare excitative și inhibitive paralele pentru a răspunde selectiv la indiciile neașteptate de recompensare. J Neurosci. 1999; 19: 10502-10511. [PubMed]
  16. Brown PL, Jenkins HM. Formarea automată a cheii porumbelului porumbelului. Jurnalul analizei experimentale a comportamentului. 1968; 11: 1–8. [Articol gratuit PMC] [PubMed]
  17. Cagniard B, Beeler JA, Britt JP, McGehee DS, Marinelli M, Zhuang X. Dopamina scade performanța în absența unei noi învățări. Neuron. 2006; 51: 541-547. [PubMed]
  18. Cardinalul RN, Cheung TH. Leziunile miezului nucleului accumbens întârzie învățarea instrumentală și performanța cu întărire întârziată la șobolan. BMC Neurosci. 2005; 6: 9. [Articol gratuit PMC] [PubMed]
  19. Cardinalul RN, Parkinson JA, Sala J, Everitt BJ. Emoția și motivația: rolul amigdalei, striatum ventral și cortexul prefrontal. Neurosci Biobehav Rev. 2002; 26: 321-352. [PubMed]
  20. Cheer JF, Aragona BJ, Heien ML, Seipel AT, Carelli RM, Wightman RM. Coordonarea activității de eliberare a dopaminei și a activității neuronale determină comportamentul orientat spre obiectiv. Neuron. 2007; 54: 237-244. [PubMed]
  21. Colwill RM, Rescorla RA. Structuri asociative în învățarea instrumentală. În: Bower G, redactor. Psihologia învățării și a motivației. New York: Academic Press; 1986. pp. 55-104.
  22. Corbit LH, Balleine BW. Rolul cortexului prelimbic în condiționarea instrumentală. Behav Brain Res. 2003; 146: 145-157. [PubMed]
  23. Corbit LH, Janak PH. Inactivarea striatului dorsal lateral, dar nu medial, elimină impactul excitativ al stimulilor Pavlovian asupra răspunsului instrumental. J Neurosci. 2007; 27: 13977-13981. [PubMed]
  24. Corbit LH, Muir JL, Balleine BW. Rolul nucleului accumbens în condiționarea instrumentală: Dovada unei disociere funcțională între nucleul accumbens și coajă. Revista de Neuroștiințe. 2001; 21: 3251-3260. [PubMed]
  25. Corbit LH, Muir JL, Balleine BW. Leziunile thalamului mediodorsal și nucleelor ​​talamice anterioare produc efecte disociabile asupra condiționării instrumentale la șobolani. Eur J Neurosci. 2003; 18: 1286-1294. [PubMed]
  26. Corbit LH, Janak PH, Balleine BW. Forme generale și specifice pentru transferul instrumental Pavlovian: efectul schimbărilor în starea motivațională și inactivarea zonei tegmentale ventrale. Eur J Neurosci. 2007; 26: 3141-3149. [PubMed]
  27. Costa RM, Cohen D, Nicolelis MA. Plasticitate corticostriatală diferențială în timpul învățării abilităților motorii rapide și lente la șoareci. Curr Biol. 2004; 14: 1124-1134. [PubMed]
  28. Cragg SJ, Hille CJ, Greenfield SA. Domeniile funcționale ale striatului dorsal al primatului non-uman sunt definite de comportamentul dinamic al dopaminei. J Neurosci. 2002; 22: 5705-5712. [PubMed]
  29. Dalley JW, Laane K, Theobald DE, Armstrong HC, Corlett PR, Chudasama Y, Robbins TW. Modularea temporală limitată a memoriei Pavlovian apetită de receptorii D1 și NMDA în nucleul accumbens. Proc Natl Acad Sci SUA A. 2005; 102: 6189-6194. [Articol gratuit PMC] [PubMed]
  30. Davis J, Bitterman ME. Armarea diferențială a unui alt comportament (DRO): o comparație de control jignit. Oficial al analizei experimentale a comportamentului. 1971; 15: 237-241. [Articol gratuit PMC] [PubMed]
  31. Ziua JJ, Carelli RM. Nucleul accumbens și învățarea recompensării Pavlovian. Neurolog. 2007; 13: 148-159. [Articol gratuit PMC] [PubMed]
  32. Ziua JJ, Wheeler RA, Roitman MF, Carelli RM. Neuronii nucleului accumbens codifică comportamentele abordării Pavlovian: dovezi ale unei paradigme de autosapărare. Eur J Neurosci. 2006; 23: 1341-1351. [PubMed]
  33. Ziua JJ, Roitman MF, Wightman RM, Carelli RM. Învățarea asociativă mediază schimbările dinamice în semnalizarea dopaminei în nucleul accumbens. Nat Neurosci. 2007; 10: 1020-1028. [PubMed]
  34. Dayan P, Balleine BW. Recompensă, motivație și învățare prin întărire. Neuron. 2002; 36: 285-298. [PubMed]
  35. Delgado MR, Stenger VA, Fiez JA. Motivația răspunsurilor dependente în nucleul caudat uman. Cereb Cortex. 2004; 14: 1022-1030. [PubMed]
  36. Delgado MR, Miller MM, Inati S, Phelps EA. Un studiu fMRI de învățare a probabilității legate de recompense. Neuroimage. 2005; 24: 862-873. [PubMed]
  37. Di Ciano P, Cardinalul RN, Cowell RA, Micul SJ, Everitt BJ. Implicarea diferențială a receptorilor NMDA, AMPA / kainate și dopaminergici în nucleul nucleului accumbens în achiziția și performanța comportamentului de abordare pavloviană. J Neurosci. 2001; 21: 9471-9477. [PubMed]
  38. Dickinson A. Acțiuni și obiceiuri: dezvoltarea autonomiei comportamentale. Tranzacțiile filosofice ale Societății Regale. 1985; B308: 67-78.
  39. Dickinson A. Instrumental Conditioning. In: Mackintosh NJ, redactor. Învățarea și cunoașterea animalelor. Orlando: Academic; 1994. pp. 45-79.
  40. Dickinson A, Dearing MF. Apetitul-aversive interactiuni si procese inhibitoare. În: Dickinson A, Boakes RA, editori. Mecanism de învățare și motivație. Hillsadale, NJ: Lawrence Erlbaum Associates; 1979.
  41. Dickinson A, Charnock DJ. Efecte de contingență cu întărire instrumentală menținută. Jurnal trimestrial de psihologie experimentală. Psihologie comparativă și fiziologică. 1985; 37: 397-416.
  42. Dickinson A, Balleine B. Acțiuni și răspunsuri: Psihologia duală a comportamentului. În: Eilan N, McCarthy RA, ș.a., editori. Reprezentarea spațială: probleme în filosofie și psihologie. Malden, MA, SUA: Blackwell Publishers Inc .; 1993. pp. 277-293.
  43. Dickinson A, Balleine B. Rolul învățării în funcționarea sistemelor motivaționale. În: Pashler H, Gallistel R, editori. Manualul lui Steven de psihologie experimentală (ed. A 3-a), Vol. 3: Învățare, motivație și emoție. New York, NY, SUA: John Wiley & Sons, Inc .; 2002. pp. 497-533.
  44. Dickinson A, Smith J, Mirenowicz J. Disocierea învățământului de stimulare Pavlovian și instrumental sub antagoniști ai dopaminei. Behav Neurosci. 2000; 114: 468-483. [PubMed]
  45. Dickinson A, Campos J, Varga ZI, Balleine B. Condiționare instrumentală bidirecțională. Jurnal trimestrial de psihologie experimentală: psihologie comparativă și fiziologică. 1996; 49: 289-306. [PubMed]
  46. Ellison GD, Konorski J. Separarea reacțiilor salivare și motorii la condiționarea instrumentală. Ştiinţă. 1964; 146: 1071-1072. [PubMed]
  47. Everitt BJ, Robbins TW. Sisteme neurale de întărire a dependenței de droguri: de la acțiuni la obiceiuri la constrângere. Nat Neurosci. 2005; 8: 1481-1489. [PubMed]
  48. Faure A, Haberland U, Conde F, El Massioui N. Lesion la sistemul de dopamină nigrostriatal perturbe formarea obiceiurilor de stimulare-răspuns. J Neurosci. 2005; 25: 2771-2780. [PubMed]
  49. Fiorillo CD, Tobler PN, Schultz W. Codificarea discretă a probabilității de recompensă și incertitudinea neuronilor dopaminergici. Ştiinţă. 2003; 299: 1898-1902. [PubMed]
  50. Fuster JM. Memorie în cortexul cerebral. Cambridge: presă MIT; 1995.
  51. Gallistel CR, Fairhurst S, Balsam P. Curba de învățare: implicațiile unei analize cantitative. Proc Natl Acad Sci SUA A. 2004; 101: 13124-13131. [Articol gratuit PMC] [PubMed]
  52. Du-te Y, Grace AA. Modularea dopaminergică a unității limbic și corticale a nucleului accumbens în comportamentul orientat spre țintă. Nat Neurosci. 2005; 8: 805-812. [PubMed]
  53. Grace AA, Floresco SB, Goto Y, Lodge DJ. Reglarea arderii neuronilor dopaminergici și controlul comportamentelor orientate spre țintă. Tendințe Neurosci. 2007; 30: 220-227. [PubMed]
  54. Groenewegen HJ, Berendse HW, Wolters JG, Lohman AH. Relația anatomică dintre cortexul prefrontal și sistemul striatopallidal, talamusul și amigdala: dovada unei organizări paralele. Prog Brain Res. 1990; 85: 95-116. discuție 116-118. [PubMed]
  55. Guthrie ER. Psihologia învățării. New York: Harpers; 1935.
  56. Haber SN. Ganglia bazală primată: rețele paralele și integrative. J Chem Neuroanat. 2003; 26: 317-330. [PubMed]
  57. Haber SN, Fudge JL, McFarland NR. Căile sterigorigrostriatale la primate formează o spirală ascendentă de la coajă la striatrul dorsolateral. J Neurosci. 2000; 20: 2369-2382. [PubMed]
  58. Hammond LJ. Efectul contingenței asupra condiționării apetitului comportamentului liber-operator. Jurnalul Analizei Experimentale a Comportamentului. 1980; 34: 297-304. [Articol gratuit PMC] [PubMed]
  59. Haruno M, Kawato M. Modelul de reinstruire-învățare heterarhică pentru integrarea mai multor bucle cortico-striatale: examinarea fMRI în procesul de stimulare-acțiune-asociere a învățării asociațiilor. Neural Netw. 2006a; 19: 1242-1254. [PubMed]
  60. Haruno M, Kawato M. Diferite corelații neuronale ale așteptărilor de răsplată și ale erorii așteptărilor de răsplată în nucleul putamen și caudate în timpul învățării de stimulare-acțiune-recompensare. J Neurophysiol. 2006b; 95: 948-959. [PubMed]
  61. Harlow M, Kuroda T, Doya K, Toyama K, Kimura M, Samejima K, Imamizu H, Kawato M. Un corelat neural al învățării comportamentale bazate pe recompensă în nucleul caudat: un studiu de imagistică prin rezonanță magnetică funcțională a unei sarcini decizionale stochastice. J Neurosci. 2004; 24: 1660-1665. [PubMed]
  62. Hernandez PJ, Sadeghian K, Kelley AE. Consolidarea timpurie a învățării instrumentale necesită sinteza proteinelor în nucleul accumbens. Nat Neurosci. 2002; 5: 1327-1331. [PubMed]
  63. Hernandez PJ, Andrzejewski ME, Sadeghian K, Panksepp JB, Kelley AE. Funcția AMPA / kainat, NMDA și dopamina D1 în nucleul nucleului accumbens: un rol limitat în contextul codării și consolidării memoriei instrumentale. Aflați Mem. 2005; 12: 285-295. [Articol gratuit PMC] [PubMed]
  64. Hershberger WA. O abordare prin ochelari. Învățarea și comportamentul animalelor. 1986; 14: 443-451.
  65. Heyes CM, Dawson GR. O demonstrație a învățării observaționale la șobolani utilizând un control bidirecțional. Jurnalul trimestrial al psihologiei experimentale. 1990; 42 (1): 59-71. [PubMed]
  66. Hikosaka O, Sakamoto M, Usui S. Proprietățile funcționale ale neuronilor caudați de maimuță. III. Activități legate de așteptarea țintei și a recompensei. J Neurophysiol. 1989; 61: 814-832. [PubMed]
  67. Holland PC. Relațiile dintre transferul instrumental de tip Pavlovian și întărirea devalorizării. J Exp Psihol Anim Behav Proces. 2004; 30: 104-117. [PubMed]
  68. Olanda PC, Rescorla RA. Efectul a două moduri de a devaloriza stimulul necondiționat după condiționarea apetitului de ordinul întâi și al doilea. J Exp Psihol Anim Behav Proces. 1975; 1: 355-363. [PubMed]
  69. Hollerman JR, Tremblay L, Schultz W. Influența așteptărilor de recompensă asupra activității neuronale legate de comportament în striatum de primate. J Neurophysiol. 1998; 80: 947-963. [PubMed]
  70. Houk JC, Adams JL, Barto AG. Un model al modului în care ganglionii bazali generează și utilizează semnale neuronale care prevăd armarea. În: Houk JC, JD, DB, editori. Modele de procesare a informațiilor în ganglionii bazali. Cambridge, MA: MIT Press; 1995. pp. 249-270.
  71. Hull C. Principiile comportamentului. New York: Appleton-Century-Crofts; 1943.
  72. Hyman SE, Malenka RC, Nestler EJ. Mecanisme neurale de dependență: rolul învățării și memoriei legate de recompense. Annu Rev Neurosci. 2006; 29: 565-598. [PubMed]
  73. Jedynak JP, Uslaner JM, Esteban JA, Robinson TE. Metodă de plasticitate indusă de metamfetamină în striatumul dorsal. Eur J Neurosci. 2007; 25: 847-853. [PubMed]
  74. Joel D, Weiner I. Organizarea circuitelor ganglionale-thalamocortice bazale: deschise interconectate, nu segregate. Neuroscience. 1994; 63: 363-379. [PubMed]
  75. Joel D, Weiner I. Legăturile sistemului dopaminergic cu striatumul la șobolani și primate: o analiză cu privire la organizarea funcțională și compartamentală a striatumului. Neuroscience. 2000; 96: 451-474. [PubMed]
  76. Jueptner M, Frith CD, Brooks DJ, Frackowiak RS, Passingham RE. Anatomia învățării motorii. II. Structurile subcortice și învățarea prin încercări și erori. J Neurophysiol. 1997a; 77: 1325-1337. [PubMed]
  77. Jueptner M, Stephan KM, CD-ul Frith, Brooks DJ, Frackowiak RS, Passingham RE. Anatomia învățării motorii. I. Cortexul frontal și atenția la acțiune. J Neurophysiol. 1997b; 77: 1313-1324. [PubMed]
  78. Kanazawa I, Murata M, Kimura M. Rolurile dopaminei și receptorii ei în generarea mișcărilor corecte. Adv Neurol. 1993; 60: 107-112. [PubMed]
  79. Kawagoe R, Takikawa Y, Hikosaka O. Așteptările de recompensă modulează semnalele cognitive în ganglionii bazali. Nat Neurosci. 1998; 1: 411-416. [PubMed]
  80. Kimura M, Aosaki T, Ishida A. Aspecte neurofiziologice ale rolurilor diferențiale ale nucleului putamen și caudatei în mișcarea voluntară. Adv Neurol. 1993; 60: 62-70. [PubMed]
  81. Konorski J. Activitatea de integrare a creierului. Chicago: Universitatea din Chicago Press; 1967.
  82. Lerchner A, La Camera G, Richmond B. Știind fără a face. Nat Neurosci. 2007; 10: 15-17. [PubMed]
  83. Ljungberg T, Apicella P, Schultz W. Răspunsurile neuronilor dopaminei de maimuță în timpul învățării reacțiilor comportamentale. J Neurophysiol. 1992; 67: 145-163. [PubMed]
  84. Lohrenz T, McCabe K, Camerer CF, Montague PR. Semnătură neurală a semnalelor fictive de învățare într-o sarcină secvențială de investiții. Proc Natl Acad Sci SUA A. 2007; 104: 9493-9498. [Articol gratuit PMC] [PubMed]
  85. Lovibond PF. Facilitarea comportamentului instrumental printr-un stimulent condus de apetitul Pavlovian. J Exp Psihol Anim Behav Proces. 1983; 9: 225-247. [PubMed]
  86. Mackintosh NJ. Psihologia învățării animalelor. Londra: Academic Press; 1974.
  87. Miller EK, Cohen JD. O teorie integrativă a funcției cortexului prefrontal. Annu Rev Neurosci. 2001; 24: 167-202. [PubMed]
  88. Miller R. Semnificația și scopul în creierul intact. New York: Oxford University Press; 1981.
  89. Miyachi S, Hikosaka O, Lu X. Activarea diferențială a neuronilor striatali de maimuță în fazele timpurii și târzii ale procesului de învățare. Exp Brain Res. 2002; 146: 122-126. [PubMed]
  90. Miyachi S, Hikosaka O, Miyashita K, Karadi Z, Rand MK. Role diferențiale ale striatumului de maimuță în învățarea mișcării succesive a mâinilor. Exp Brain Res. 1997; 115: 1-5. [PubMed]
  91. Montague PR, Hyman SE, Cohen JD. Role computaționale pentru dopamină în controlul comportamental. Natură. 2004; 431: 760-767. [PubMed]
  92. Morris G, Nevet A, Arkadir D, Vaadia E, Bergman H. Nebraonii dopaminei Midbrain codifică deciziile pentru acțiunile viitoare. Nat Neurosci. 2006; 9: 1057-1063. [PubMed]
  93. Murschall A, Hauber W. Inactivarea zonei tegmentale ventrale a desființat influența generală excitatoare a reperelor Pavlovian asupra performanței instrumentale. Aflați Mem. 2006; 13: 123-126. [PubMed]
  94. Nauta WJ, Smith GP, Faull RL, Domesick VB. Conexiuni efecte și aferente nigre ale nucleului accumbens septi la șobolan. Neuroscience. 1978; 3: 385-401. [PubMed]
  95. Nauta WJH. Legăturile reciproce ale corpului striat cu cortexul cerebral și sistemul limbic: un substrat comun pentru mișcare și gândire? În: Mueller, redactor. Neurologia și psihiatria: o întâlnire a minților. Basel: Karger; 1989. pp. 43-63.
  96. Niv Y, Daw ND, Joel D, Dayan P. Tonic dopamina: costuri de oportunitate și controlul vigorii răspunsului. Psihofarmacologie (Berl) 2007; 191: 507-520. [PubMed]
  97. O'Doherty J, Dayan P, Schultz J, Deichmann R, Friston K, Dolan RJ. Rolurile disciplinabile ale striatului ventral și dorsal în condiționarea instrumentală. Ştiinţă. 2004; 304: 452-454. [PubMed]
  98. Ostlund SB, Balleine BW. Implicarea diferențială a amigdalei basolaterale și a talamusului mediodoral în selecția de acțiune instrumentală. J Neurosci. 2008; 28: 4398-4405. [Articol gratuit PMC] [PubMed]
  99. Parkinson JA, Willoughby PJ, Robbins TW, Everitt BJ. Deconectarea cortexului cingular anterior și a nucleului nucleului accumbens afectează comportamentul de apropiere Pavlovian: dovezi suplimentare pentru sistemele limbice coronate-ventral striatopalidice. Behav Neurosci. 2000; 114: 42-63. [PubMed]
  100. Parkinson JA, Dalley JW, Cardinal RN, Bamford A, Fehnert B, Lachenal G, Rudarakanchana N, Halkerston KM, Robbins TW, Everitt BJ. Nucleus accumbens epuizarea dopaminei afectează atât dobândirea cât și performanța comportamentului apreciativ al abordării Pavlovian: implicații pentru funcția de dopamină mesoaccumbens. Behav Brain Res. 2002; 137: 149-163. [PubMed]
  101. Paxinos G, Franklin K. Creierul mouse-ului în coordonate stereotaxice. New York: Academic Press; 2003.
  102. Pecina S, Smith KS, Berridge KC. Locurile fierbinți hedonice din creier. Neurolog. 2006; 12: 500-511. [PubMed]
  103. Pothuizen HH, Jongen-Relo AL, Feldon J, Yee BK. Disocierea dublă a efectelor nucleului accumbens selectiv și a leziunilor cochiliei asupra comportamentului de alegere impulsivă și a învățării de saliență la șobolani. Eur J Neurosci. 2005; 22: 2605-2616. [PubMed]
  104. Rescorla RA. Probabilitatea șocului în prezența și absența CS în condiționarea fricii. J Comp Physiol Psychol. 1968; 66: 1-5. [PubMed]
  105. Rescorla RA. Studii comportamentale ale condiționării Pavlovian. Annu Rev Neurosci. 1988; 11: 329-352. [PubMed]
  106. Rescorla RA, Solomon RL. Teoria învățării în două procese: relațiile dintre condiționarea Pavlovian și învățarea instrumentală. Psiholog Rev 1967; 74: 151-182. [PubMed]
  107. Restle F. Discriminarea indiciilor în labirinturi: o rezolvare a întrebării „loc-vs.-răspuns”. Revizuirea psihologică. 1957; 64: 217. [PubMed]
  108. Reynolds JN, Wickens JR. De plasticitate dependentă de dopamină a sinapselor corticostriatale. Neural Netw. 2002; 15: 507-521. [PubMed]
  109. Rice ME, Cragg SJ. Nicotina amplifică semnalele de dopamină legate de recompensă în striatum. Nat Neurosci. 2004; 7: 583-584. [PubMed]
  110. Rice ME, Cragg SJ. Derivarea dopaminei după eliberarea cuantică: Relatarea transmiterii dopaminei în calea nigrostriatală. Brain Res Rev. 2008 [Articol gratuit PMC] [PubMed]
  111. Robinson S, Apa de ploaie AJ, Hnasko TS, Palmiter RD. Restaurarea virală a semnalizării dopaminei la striatumul dorsal restabilește condiționarea instrumentală la șoarecii cu deficit de dopamină. Psihofarmacologie (Berl) 2007; 191: 567-578. [PubMed]
  112. Roitman MF, Wheeler RA, Carelli RM. Neuronii nucleului Nucleus Accumbens sunt reglați în mod natural pentru a stimula stimularea și stimularea aversivă, codifică predictorii și sunt legați de producția de motor. Neuron. 2005; 45: 587-597. [PubMed]
  113. Samejima K, Ueda Y, Doya K, Kimura M. Reprezentarea valorilor de recompensă specifice acțiunii în striatum. Ştiinţă. 2005; 310: 1337-1340. [PubMed]
  114. Schultz W. Semnalul fazic de recompensă al neuronilor dopaminei primate. Adv Pharmacol. 1998a; 42: 686-690. [PubMed]
  115. Schultz W. Semnal de recompensă predictivă a neuronilor dopaminergici. J Neurophysiol. 1998b; 80: 1-27. [PubMed]
  116. Schultz W, Dayan P, Montague PR. Un substrat neural de predicție și recompensă. Ştiinţă. 1997; 275: 1593-1599. [PubMed]
  117. Schwartz B, controlul Gamzu E. Pavlovian asupra comportamentului operatorului. In: Honig W, Staddon JER, editori. Manual de comportament operant. New Jersey: Sala Prentice; 1977. pp. 53-97.
  118. Sheffield FD. Relația dintre condiționarea clasică și instrumentală. În: Prokasy WF, editor. Condiții clasice. New York: Appleton-Century-Crofts; 1965. pp. 302-322.
  119. Skinner B. Comportamentul organismelor. New York: Appleton-Century-Crofts; 1938.
  120. Smith-Roe SL, Kelley AE. Coactivarea activității receptorilor NMDA și dopaminergici D1 în nucleul nucleului accumbens este necesară pentru învățarea instrumentală apetită. J Neurosci. 2000; 20: 7737-7742. [PubMed]
  121. Sotak BN, Hnasko TS, Robinson S, Kremer EJ, Palmiter RD. Dysregularea semnalizării dopaminei în striatul dorsal inhibă hrănirea. Brain Res. 2005; 1061: 88-96. [PubMed]
  122. Spence K. Rolul consolidării secundare în învățarea întârziată a recompensei. Revizuirea psihologică. 1947; 54: 1-8.
  123. Spence K. Teoria și învățarea comportamentului. Englewood Cliffs, NJ: Prentice-Hall; 1960.
  124. Sutton RS, Barto AG. Consolidarea învățării. Cambridge: MIT Press; 1998.
  125. Swanson LW. Reglementarea emisferei cerebrale a comportamentului motivat. Brain Res. 2000; 886: 113-164. [PubMed]
  126. Taha SA, Fields HL. Codificarea gustului și comportamentelor apetisante de către populațiile neuronale distincte în nucleul accumbens. J Neurosci. 2005; 25: 1193-1202. [PubMed]
  127. Taha SA, Fields HL. Inhibițiile neuronilor nucleului accumbens codifică un semnal de gât pentru comportamentul orientat spre recompensă. J Neurosci. 2006; 26: 217-222. [PubMed]
  128. Thorndike EL. Inteligența animalelor: studii experimentale. New York: Macmillan; 1911.
  129. Tobler PN, Dickinson A, Schultz W. Codificarea unei omisiuni recompensate a recompenselor de către neuronii dopaminergici într-o paradigmă de inhibiție condiționată. J Neurosci. 2003; 23: 10402-10410. [PubMed]
  130. Tobler PN, O'Doherty JP, Dolan RJ, Schultz W. Învățarea neuronală umană depinde de erorile de predicție a recompensei în paradigma de blocare. J Neurofiziol. 2006; 95: 301-310. [Articol gratuit PMC] [PubMed]
  131. Tobler PN, O'Doherty JP, Dolan RJ, Schultz W. Codificarea valorii de recompensă distinctă de codificarea incertitudinii legate de atitudinea de risc în sistemele de recompensare umană. J Neurofiziol. 2007; 97: 1621–1632. [Articol gratuit PMC] [PubMed]
  132. Trapold MA, Overmier JB. Clasic Conditioning II: Cercetări curente și teorie. Appleton-Century-Crofts; 1972. Al doilea proces de învățare în învățarea instrumentală; pp. 427-452.
  133. Tricomi EM, Delgado MR, Fiez JA. Modelarea activității caudate prin contingență de acțiune. Neuron. 2004; 41: 281-292. [PubMed]
  134. Waelti P, Dickinson A, Schultz W. Răspunsurile la dopamină respectă ipotezele de bază ale teoriei învățării formale. Natură. 2001; 412: 43-48. [PubMed]
  135. NM alb. O ipoteză funcțională privind matricea striatală și patch-uri: medierea memoriei SR și a recompensei. Life Sci. 1989; 45: 1943-1957. [PubMed]
  136. Wickens JR, Budd CS, Hyland BI, Arbuthnott GW. Contribuții stridente la recompensarea și luarea deciziilor: sensibilitatea variațiilor regionale într-o matrice de procesare reiterată. Ann NY Acad Sci. 2007; 1104: 192-212. [PubMed]
  137. Williams DR. Clasificarea condițiilor și motivația stimulentelor. În: Prokasy WF, editor. Condiții clasice. New York: Appleton-Century-Crofts; 1965. pp. 340-357.
  138. Williams DR, Williams H. Întreținerea automată a porumbelului: hrănirea susținută în ciuda ne-armării contingente. Oficial al analizei experimentale a comportamentului. 1969; 12: 511-520. [Articol gratuit PMC] [PubMed]
  139. Wiltgen BJ, Legea M, Ostlund S, Mayford M, Balleine BW. Influența indicațiilor Pavlovian asupra performanței instrumentale este mediată de activitatea CaMKII în striatum. Eur J Neurosci. 2007; 25: 2491-2497. [PubMed]
  140. Wyvell CL, Berridge KC. Amfetamina intra-accumbens mărește importanța stimulentelor condiționate a recompenselor de zaharoză: sporirea recompensei "dorind" fără o consolidare a "plăcerii" sau a unei reacții de întărire a răspunsului. J Neurosci. 2000; 20: 8122-8130. [PubMed]
  141. Yin HH. Departamentul de Psihologie. Los Angeles: UCLA; 2004. Rolul striatumului dorsal în acțiunile orientate spre țintă.
  142. Yin HH, Knowlton BJ. Devalorizarea armelor de forță elimină preferința condiționată condiționată: dovezi pentru asociațiile de stimul-stimul. Behav Neurosci. 2002; 116: 174-177. [PubMed]
  143. Yin HH, Knowlton BJ. Contribuțiile subregiunilor striatale la învățarea locului și a răspunsului. Aflați Mem. 2004; 11: 459-463. [Articol gratuit PMC] [PubMed]
  144. Yin HH, Knowlton BJ. Dependență și învățare. În: Stacy A, redactor. Manual de cunoaștere implicită și dependență. Thousand Oaks: Sage; 2005.
  145. Yin HH, Knowlton BJ, Balleine BW. Leziunile striaturii dorsolaterale păstrează speranța rezultată, dar perturbe formarea obiceiurilor în învățarea instrumentală. Eur J Neurosci. 2004; 19: 181-189. [PubMed]
  146. Yin HH, Knowlton BJ, Balleine BW. Blocarea receptorilor NMDA în striatum dorsomedial previne învățarea rezultatelor acțiunii în condiționarea instrumentală. Eur J Neurosci. 2005a; 22: 505-512. [PubMed]
  147. Yin HH, Knowlton BJ, Balleine BW. Inactivarea striatumului dorsolateral îmbunătățește sensibilitatea la modificările survenite în acțiunea-rezultat în condiționarea instrumentală. Behav Brain Res. 2006a; 166: 189-196. [PubMed]
  148. Yin HH, Zhuang X, Balleine BW. Învățarea instrumentală la șoarecii hiperdopaminergici. Neurobiol Aflați Mem. 2006b; 85: 283-288. [PubMed]
  149. Yin HH, Ostlund SB, Knowlton BJ, Balleine BW. Rolul striatumului dorsomedial în condiționarea instrumentală. Eur J Neurosci. 2005b; 22: 513-523. [PubMed]
  150. Zahm DS. O perspectivă neuroanatomică integrativă asupra unor substraturi subcortice de răspuns adaptiv cu accent pe nucleul accumbens. Neurosci Biobehav Rev. 2000; 24: 85-105. [PubMed]
  151. Zahm DS. Teoria în evoluție a „macrosistemelor” funcțional-anatomice a creierului bazal. Neurosci Biobehav Rev. 2005 [PubMed]