Semnalul de recompensă predictivă a neuronilor dopaminergici (1998)

J Neurophysiol. 1998 Jul;80(1):1-27.

Schultz W.1.

Abstract

Efectele leziunilor, blocarea receptorilor, auto-stimularea electrică și drogurile de abuz sugerează că sistemele de dopamină ale creierului mijlociu sunt implicate în procesarea informațiilor de recompensă și a comportamentului abordării în învățare. Majoritatea neuronilor dopaminici prezintă activări fazice după recompense primare de lichide și alimente și stimulează condițiile vizuale și auditive care prevăd recompensele. Acestea arată răspunsuri bifazice, de activare-depresie după stimuli care seamănă cu stimuli care prezic recompensă sau sunt noi sau deosebit de evidente. Cu toate acestea, doar puține activări fazice urmează stimuli aversivi. Astfel, neuronii dopaminei etichetează stimulii de mediu cu valoare apetisantă, prezic și detectează recompense și semnalează evenimente de alertare și motivare. Nereușind discriminarea între recompense diferite, neuronii dopamină par să emită un mesaj de alertă despre prezența surprinzătoare sau absența recompenselor. Toate răspunsurile la recompense și la estimarea recompenselor depind de predictibilitatea evenimentelor. Neuronii Dopamine sunt activate prin evenimente răsplătitoare mai bune decât cele prevăzute, rămân neinfluențate de evenimente la fel de bune ca cele prognozate și sunt deprimate de evenimente care sunt mai rele decât cele prevăzute. Prin semnalizarea recompenselor în funcție de o eroare de predicție, răspunsurile la dopamină au caracteristicile formale ale unui semnal de predare postulat de teoriile învățării de consolidare. Răspunsurile dopaminei se transferă în timpul învățării de la recompensele primare la stimulii care prezic recompensele. Acest lucru poate contribui la mecanisme neuronale care stau la baza acțiunii retrograde a recompenselor, unul dintre principalele puzzle-uri în învățarea de consolidare. Răspunsul la impuls eliberează un impuls scurt de dopamină asupra multor dendrite, difuzând astfel un semnal de întărire destul de global către neuronii postsinaptici. Acest semnal poate îmbunătăți comportamentul abordării prin furnizarea de informații despre recompense în avans înainte de apariția comportamentului și poate contribui la învățare prin modificarea transmiterii sinaptice. Semnalul de recompensă a dopaminei este completat de activitatea neuronilor din striatum, cortexul frontal și amigdala, care procesează informații specifice despre recompensă, dar nu emit un semnal de eroare de predicție a recompenselor globale. O cooperare între diferitele semnale de recompensă poate asigura utilizarea unor recompense specifice pentru consolidarea comportamentelor selective. Printre celelalte sisteme de proiecție, neuronii noradrenalină servesc predominant mecanismelor de atenție, iar recompensele neuronale ale nucleului bazalis sunt eterogene. Fibrele de urcare cerebelară semnalează erori în performanța motorie sau erori în predicția de evenimente aversive pentru celulele Purkinje cerebeloase. Majoritatea deficiențelor în urma leziunilor de epuizare a dopaminei nu sunt explicate cu ușurință printr-un semnal defectuos de recompensă, dar pot reflecta absența unei funcții generale de activare a nivelurilor tonice de dopamină extracelulară. Astfel, sistemele de dopamină pot avea două funcții, transmiterea fazică a informațiilor despre recompense și activarea tonică a neuronilor postsinaptici.

INTRODUCERE

Când organismele multicelulare au apărut prin evoluția moleculelor de auto-reproducere, acestea au dezvoltat mecanisme endogene, de autoreglare, asigurând că nevoile lor de bunăstare și supraviețuire au fost satisfăcute. Subiecții se angajează în diferite forme de comportament de abordare pentru a obține resurse pentru menținerea echilibrului homeostatic și pentru reproducere. O clasă de resurse se numește recompense, care determină și întăresc comportamentul de abordare. Funcțiile recompenselor au fost dezvoltate în continuare în timpul evoluției mamiferelor superioare pentru a susține forme mai sofisticate de comportament individual și social. Astfel, nevoile biologice și cognitive definesc natura recompenselor, iar disponibilitatea recompenselor determină unii dintre parametrii de bază ai condițiilor de viață ale subiectului.

Recompensele sunt diferite forme fizice, sunt foarte variabile în timp și depind de mediul particular al subiectului. În ciuda importanței lor, recompensele nu influențează creierul prin intermediul receptorilor periferici dedicați, reglați la o serie limitată de modalități fizice, cum este cazul sistemelor senzoriale primare. Mai degrabă, informațiile despre recompense sunt extrase de creier dintr-o mare varietate de stimuli polisenzoriale, neomogene și inconstante prin utilizarea unor mecanisme neuronale particulare. Natura extrem de variabilă a recompenselor necesită grade ridicate de adaptare în sistemele neuronale care le prelucrează.

Unul dintre principalele sisteme neuronale implicate în procesarea informațiilor despre recompense pare a fi sistemul dopamină. Studiile comportamentale arată că proiecțiile de dopamină asupra striatului și cortexului frontal joacă un rol central în medierea efectelor recompenselor asupra comportamentului și învățării abordării. Aceste rezultate sunt derivate din leziunile selective ale diferitelor componente ale sistemelor de dopamină, administrarea sistemică și intracerebrală a medicamentelor antagoniste directe și indirecte ale receptorilor dopaminei, auto-stimulare electrică și auto-administrare a medicamentelor majore de abuz, cum ar fi cocaina, amfetamina, opiacee, alcool și nicotină (Beninger și Hahn 1983; Di Chiara 1995; Fibiger și Phillips 1986; Robbins și Everitt 1992; Robinson și Berridge 1993; Wise 1996; Wise and Hoffman 1992; Wise și colab. 1978).

Prezentul articol rezumă cercetări recente referitoare la semnalizarea stimulilor de motivare a mediului de către neuronii dopaminici și evaluează funcțiile potențiale ale acestor semnale pentru modificarea reacțiilor comportamentale prin raportare la organizarea anatomică, teorii de învățare, modele neuronale artificiale, alte sisteme neuronale și deficite după leziuni. Vor fi descrise toate caracteristicile de răspuns cunoscute ale neuronilor dopaminici, dar, în principal, răspunsurile la stimulii asociați recompenselor vor fi conceptualizate, deoarece acestea sunt cele mai bine înțelese în prezent. Datorită cantității mari de date disponibile în literatura de specialitate, sistemul principal discutat va fi proiecția de dopamină nigrostriatală, dar proiecțiile de la neuronii dopaminei cerebrale mijlocii la striatul ventral și cortexul frontal vor fi, de asemenea, luate în considerare, în măsura în care permite cunoștințele actuale.

RĂSPUNSURI ȘI PREDICȚII

Funcțiile recompenselor

Anumite obiecte și evenimente din mediu au o importanță motivațională deosebită prin efectele lor asupra bunăstării, supraviețuirii și reproducerii. În funcție de reacțiile comportamentale declanșate, valoarea motivațională a obiectelor de mediu poate fi apetisantă (răsplătitoare) sau aversivă (pedepsitoare). (Rețineți că „apetisant” este utilizat sinonim pentru „recompensant”, dar nu pentru „pregătitor”). Obiectele apetitive au trei funcții de bază separabile. În prima lor funcție, răsplătește abordarea provocată și comportamentul consumator. Acest lucru se datorează faptului că obiectele sunt etichetate cu valoare apetitivă prin mecanisme înnăscute sau, în cele mai multe cazuri, învățare. În a doua lor funcție, recompensele cresc frecvența și intensitatea comportamentului care duc la astfel de obiecte (învățare) și mențin comportamentul învățat prin prevenirea stingerii. Recompensele servesc ca întăritori pozitivi ai comportamentului în procedurile clasice și instrumentale de condiționare. În învățarea stimulativă generală, stimulii de mediu dobândesc valoare apetitivă în urma asociațiilor condiționate-recompensate clasic și induc comportamentul de abordare (Bindra 1968). În condiționarea instrumentală, recompensează „întări” comportamentele prin consolidarea asocierilor dintre stimuli și răspunsurile comportamentale (Legea efectului: Thorndike 1911). Aceasta este esența „a reveni pentru mai mult” și este legată de noțiunea comună de recompense obținute pentru că a făcut ceva bine. Într-o formă instrumentală de învățare stimulativă, recompensele sunt „stimulente” și servesc drept obiective ale comportamentului în urma asocierii dintre răspunsurile comportamentale și rezultatele (Dickinson și Balleine 1994). În a treia lor funcție, recompensele induc sentimente subiective de plăcere (hedonia) și stări emoționale pozitive. Stimulii avversivi funcționează în direcții opuse. Acestea induc răspunsuri de retragere și acționează ca întăritori negativi prin creșterea și menținerea comportamentului de evitare la prezentarea repetată, reducând astfel impactul evenimentelor dăunătoare. Mai mult, ele induc stări emoționale interne de furie, frică și panică.

Funcțiile predicțiilor

Prezicerile oferă informații în avans despre stimuli viitori, evenimente sau stări ale sistemului. Ele oferă avantajul de bază de a câștiga timp pentru reacțiile comportamentale. Unele forme de predicții atribuie valori motivaționale stimulilor de mediu prin asocierea cu rezultate particulare, identificând astfel obiecte de importanță vitală și discriminându-le de obiecte mai puțin valoroase. Alte forme codează parametrii fizici ai obiectelor prezise, ​​cum ar fi poziția spațială, viteza și greutatea. Prezicerile permit unui organism să evalueze evenimentele viitoare înainte de a se produce efectiv, permit selectarea și pregătirea reacțiilor comportamentale și crește probabilitatea de a se apropia sau de a evita obiectele etichetate cu valori motivaționale. De exemplu, mișcările repetate ale obiectelor din aceeași secvență permit unuia să prezică pozițiile viitoare și să pregătească deja următoarea mișcare în timp ce urmărește obiectul prezent. Aceasta reduce timpul de reacție între țintele individuale, accelerează performanța generală și are ca rezultat un rezultat anterior. Mișcările predictive ale ochilor îmbunătățesc performanța comportamentală prin focalizarea în avans (Flori și coborâre 1978).

La un nivel mai avansat, informațiile avansate furnizate de predicții permit luarea de decizii între alternative pentru a atinge anumite stări ale sistemului, abordarea obiectelor care apar rar sau evitarea efectelor adverse ireparabile. Aplicațiile industriale utilizează Controlul modelului intern pentru a prezice și reacționa la stările sistemului înainte de a se produce efectiv (Garcia și colab. 1989). De exemplu, tehnica „fly-by-wire” din aviația modernă calculează stările viitoare de avioane previzibile. Deciziile privind manevrele de zbor iau în considerare aceste informații și ajută la evitarea eforturilor excesive asupra componentelor mecanice ale avionului, reducând astfel greutatea și crescând gama de acțiuni.

Utilizarea informațiilor predictive depinde de natura evenimentelor viitoare reprezentate sau a stărilor de sistem. Reprezentările simple vizează în mod direct poziția obiectivelor viitoare și reacția comportamentală care urmează, reducând astfel timpul de reacție într-o manieră destul de automată. Formele mai mari de predicții se bazează pe reprezentări care permit o inferență logică, care poate fi accesată și tratată cu diferite grade de intenționalitate și alegere. Adesea sunt procesate în mod conștient la om. Înainte de apariția evenimentelor sau a stărilor de sistem prezente și reacțiile comportamentale, astfel de predicții permit evaluarea mentală a diferitelor strategii prin integrarea cunoștințelor din diferite surse, proiectarea diferitelor moduri de reacție și compararea câștigurilor și pierderilor din fiecare reacție posibilă.

Condiționarea comportamentului

Învățarea asociativă apetitivă implică împerecherea repetată și contingentă între un stimul arbitrar și o recompensă primară (Fig. 1). Acest lucru duce la un comportament de abordare din ce în ce mai frecvent indus de stimulul acum „condiționat”, care seamănă parțial cu comportamentul de abordare generat de recompensa primară și, de asemenea, este influențat de natura stimulului condiționat. Se pare că stimulul condiționat servește ca un predictor al recompenselor și, de multe ori pe baza unui impuls adecvat, stabilește o stare motivațională internă care duce la reacția comportamentală. Asemănarea reacțiilor de abordare sugerează că unele dintre componentele generale, pregătitoare ale răspunsului comportamental sunt transferate de la recompensa primară la cel mai timpuriu stimul condiționat, care prezice recompense. Astfel, stimulul condiționat acționează parțial ca un substitut motivațional pentru stimulul primar, probabil prin învățarea pavloviană (Dickinson 1980).

Fig. 1. 

Procesarea stimulilor apetitivi în timpul învățării. Un stimul arbitrar devine asociat cu un aliment primar sau o recompensă lichidă prin împerechere repetată și contingentă. Acest stimul condiționat, care prezice recompensă, induce o stare motivațională internă prin evocarea unei așteptări a recompensei, deseori pe baza unei foame sau a setei corespunzătoare, și provoacă reacția comportamentală. Această schemă reproduce noțiuni de bază ale teoriei motivației stimulente elaborate de Bindra (1968) și Bolle (1972). Se aplică condiționării clasice, unde recompensa este livrată automat după stimulul condiționat și condiționării instrumentale (operante), unde livrarea recompenselor necesită o reacție a subiectului la stimulul condiționat. Această schemă se aplică, de asemenea, condiționării aversive care nu mai sunt elaborate din motive de brevet.

Multe așa-numite „necondiționate” alimente și recompense lichide sunt probabil învățate prin experiență, după cum poate confirma orice vizitator în țări străine. Recompensa primară poate consta în gustul experimentat atunci când obiectul activează receptorii gustativi, dar acesta poate fi învățat din nou. Efectul de satisfacție final al obiectelor nutritive constă probabil în influențele lor specifice asupra variabilelor biologice de bază, cum ar fi concentrațiile de electroliți, glucoză sau aminoacizi în plasmă și creier. Aceste variabile sunt definite de nevoile vegetative ale organismului și apar prin evoluție. Animalele evită nutrienții care nu influențează variabile vegetative importante, de exemplu, alimentele care nu au aminoacizi esențiali precum histidina (Rogers și Harper 1970), treonină (Hrupka și colab. 1997; Wang și colab. 1996), sau metionină (Delaney și Gelperin 1986). Câteva recompense primare pot fi determinate de instincte înnăscute și susțin comportamentul abordării inițiale și ingestia în viața timpurie, în timp ce majoritatea recompenselor ar fi obținute în timpul experienței ulterioare de viață a subiectului. Aspectul fizic al recompenselor ar putea fi folosit pentru a prezice efectele vegetative mult mai lente. Acest lucru ar accelera dramatic detectarea recompenselor și ar constitui un avantaj major pentru supraviețuire. Învățarea recompenselor permite, de asemenea, subiecților să folosească o varietate mult mai mare de nutrienți ca recompense eficiente și, astfel, își crește șansa de supraviețuire în zonele cu resurse limitate.

RĂSPUNSURI ADAPTIVE LA STIMULI APETITIVI

Corpurile celulare ale neuronilor dopaminici sunt localizate mai ales în grupele de creier mijlociu A8 (dorsal până la substanța nigra laterală), A9 (pars compacta a substanței nigra) și A10 (zona tegmentală ventrală medială la substanța nigra). Acești neuroni eliberează dopamina neurotransmițătorului cu impulsuri nervoase din varicozitățile axonale din striat (nucleu caudat, putamen și striat ventral, inclusiv nucleus accumbens) și cortexul frontal, pentru a numi cele mai importante site-uri. Înregistrăm activitatea de impuls din corpii celulari a neuronilor dopaminici singulari în perioadele de 20-60 min cu microelectrozi mobili din poziții extracelulare în timp ce maimuțele învață sau îndeplinesc sarcini comportamentale. Impulsurile caracteristice polifazice, relativ lungi, descărcate la frecvențe joase, fac ca neuronii dopamină să se distingă ușor de alți neuroni ai creierului mijlociu. Paradigmele comportamentale utilizate includ sarcini de timp de reacție, sarcini directe și întârziate de mers fără distincție, răspunsuri întârziate spațiale și sarcini de alternanță, activități de evitare activă cu puful de aer și soluție salină, sarcini de discriminare vizuală operante și condiționate clasic, mișcări auto-inițiate și livrare neprevăzută a recompensă în absența unei sarcini formale. Despre neuronii 100-250 dopamina sunt studiați în fiecare situație comportamentală, iar fracțiunile neuronilor modulați pe sarcini se referă la aceste probe.

Studiile inițiale de înregistrare au căutat corelate ale deficitului motor parkinsonian și cognitiv la neuronii dopaminei, dar nu au reușit să găsească covariații clare cu mișcările brațului și ochilor (DeLong și colab. 1983; Schultz și Romo 1990; Schultz și colab. 1983) sau cu componente mnemonice sau spațiale ale sarcinilor de răspuns întârziat (Schultz și colab. 1993). În schimb, s-a constatat că neuronii dopaminici au fost activi într-o manieră foarte distinctivă prin caracteristicile răsplătitoare ale unei game largi de stimuli somatosenzoriali, vizuali și auditivi.

Activarea prin stimuli apetitivi primari

Aproximativ 75% dintre neuronii dopaminici prezintă activări fazice atunci când animalele ating o mică mușchi de hrană ascunsă în timpul mișcărilor exploratorii în absența altor stimuli fazici, fără a fi activați de mișcarea în sine (Romo și Schultz 1990). Neuronii de dopamină rămași nu răspund la niciunul dintre stimulii de mediu testați. Neuronii Dopamine sunt, de asemenea, activat de o picătură de lichid livrată la gură în afara oricărei sarcini comportamentale sau în timp ce învață astfel de paradigme diferite precum sarcini de reacție vizuală sau auditivă, răspuns sau alternanță spațială întârziată și discriminare vizuală, adesea la același animal (Fig. . 2 top) (Hollerman și Schultz 1996; Ljungberg și colab. 1991, 1992; Mirenowicz și Schultz 1994; Schultz și colab. 1993). Răspunsurile la recompensă apar independent de contextul de învățare. Astfel, neuronii dopaminei nu par să discrimineze între diferite obiecte alimentare și recompense lichide. Cu toate acestea, răspunsurile lor disting recompensele de obiectele nerevendite (Romo și Schultz 1990). Doar 14% dintre neuronii dopaminici arată activările fazice atunci când sunt prezentați stimuli aversivi primari, cum ar fi un puf de aer la mână sau o soluție salină hipertonică la gură, iar majoritatea neuronilor activi răspund și la recompense (Mirenowicz și Schultz 1996). Deși sunt nepericuloși, acești stimuli sunt aversivi prin faptul că perturbă comportamentul și induc reacții active de evitare. Cu toate acestea, neuronii dopaminici nu sunt în totalitate insensibili la stimuli aversivi, așa cum se arată prin depresii lente sau activări lente ocazionale după stimularea durerii în maimuțele anesteziate (Schultz și Romo 1987) și prin eliberarea crescută de dopamină striată după șoc electric și ciupit de coadă la șobolani treaz (Abercrombie et al. 1989; Doherty și Gratton 1992; Louilot și colab. 1986; Young și colab. 1993). Acest lucru sugerează că răspunsurile fazice ale neuronilor dopaminei raportează în mod preferențial stimuli de mediu cu valoare apetitivă primară, în timp ce evenimentele aversive pot fi semnalate cu un curs de timp considerabil mai lent.

Fig. 2. 

Neuronii Dopamina raportează recompense în funcție de o eroare în predicția recompenselor. Top: se produce o picătură de lichid, deși nu se prevede nicio recompensă în acest moment. Apariția recompenselor constituie astfel o eroare pozitivă în predicția recompensei. Neuronul Dopamina este activat prin apariția neprevăzută a lichidului. De mijloc: stimulul condiționat prezice o recompensă, iar recompensa apare în funcție de predicție, deci nici o eroare în predicția recompensei. Neuronul Dopamine nu reușește să fie activat de recompensa prevăzută (dreapta). De asemenea, arată o activare după stimulul de a prezice recompensa, care apare indiferent de o eroare în prezicerea recompensei ulterioare (stânga). De jos: stimulul condiționat prezice o recompensă, dar recompensa nu apare din cauza lipsei de reacție a animalului. Activitatea neuronului dopaminic este deprimată exact în momentul în care s-ar fi produs recompensa. Rețineți depresia care apare> 1 s după stimulul condiționat fără niciun stimul intervenit, dezvăluind un proces intern de așteptare a recompensei. Activitatea neuronală din cele 3 grafice urmează ecuația: răspunsul dopaminei (recompensă) = recompensă apărută - recompensă prezisă. CS, stimul condiționat; R, recompensă primară. Retipărit din Schultz și colab. (1997) cu permisiunea Asociației Americane pentru Avansarea Științei.

Imprevizibilitatea recompensei

O caracteristică importantă a răspunsurilor la dopamină este dependența lor de imprevizibilitatea evenimentelor. Activările care urmează recompense nu au loc atunci când recompense alimentare și lichide sunt precedate de stimuli fazici care au fost condiționate să prezică astfel de recompense (Fig. 2, de mijloc) (Ljungberg și colab. 1992; Mirenowicz și Schultz 1994; Romo și Schultz 1990). O diferență crucială între învățare și comportamentul dobândit pe deplin este gradul de imprevizibilitate a recompenselor. Neuronii Dopamine sunt activate prin recompense în faza de învățare, dar nu mai răspund după achiziția completă a sarcinilor de reacție vizuală și auditivă (Ljungberg și colab. 1992; Mirenowicz și Schultz 1994), sarcini cu răspuns întârziat spațial (Schultz și colab. 1993) și discriminări vizuale simultane (Hollerman și Schultz 1996). Pierderea răspunsului nu se datorează unei dezvoltări generale a insensibilității la recompense, întrucât activările în urma recompenselor furnizate în afara sarcinilor nu scad în decursul mai multor luni de experimentare (Mirenowicz și Schultz 1994). Importanța imprevizibilității include timpul de recompensă, așa cum este demonstrat de activările tranzitorii după recompense care sunt furnizate brusc mai devreme sau mai târziu decât a fost prevăzut (Hollerman și Schultz 1996). Luate împreună, apariția recompenselor, inclusiv timpul său, trebuie să fie neprevăzută pentru a activa neuronii dopaminici.

Depresia prin omiterea recompensei prevăzute

Neuronii Dopamina sunt deprimați exact la momentul apariției obișnuite a recompensei, atunci când o recompensă complet prevăzută nu reușește să apară, chiar și în absența unui stimul precedent imediat (Fig. 2, de jos). Acest lucru se observă atunci când animalele nu obțin recompensă din cauza comportamentului eronat, atunci când fluxul de lichid este oprit de experimentator în ciuda comportamentului corect sau când o valvă se deschide în mod auditiv fără a furniza lichid (Hollerman și Schultz 1996; Ljungberg și colab. 1991; Schultz și colab. 1993). Atunci când livrarea recompenselor este întârziată pentru 0.5 sau 1.0 s, apare o depresie a activității neuronale la momentul regulat al recompensei, iar o activare urmărește recompensa la noul moment (Hollerman și Schultz 1996). Ambele răspunsuri apar numai în câteva repetări până când noul timp de livrare a recompenselor devine din nou prevăzut. În schimb, obținerea de recompense mai devreme decât obișnuitul are ca rezultat o activare la noul moment al recompensei, dar nu reușește să inducă o depresie la momentul obișnuit. Acest lucru sugerează că livrarea de recompense neobișnuit timpurie anulează predicția recompensei pentru timpul obișnuit. Astfel neuronii dopaminei monitorizează atât apariția cât și timpul recompensei. În absența stimulilor care preced imediat recompensa omisă, depresiile nu constituie un răspuns neuronal simplu, ci reflectă un proces de așteptare bazat pe un ceas intern care urmărește timpul precis al recompensei.

Activare prin stimuli condiționați, care prezic recompense

Despre 55-70% dintre neuronii dopaminici sunt activați de stimuli vizibili și auditivi condiționați în diferitele sarcini condiționate clasic sau instrumental descrise anterior (Fig. 2, de mijloc și de jos) (Hollerman și Schultz 1996; Ljungberg și colab. 1991, 1992; Mirenowicz și Schultz 1994; Schultz 1986; Schultz și Romo 1990; P. Waelti, J. Mirenowicz și W. Schultz, date nepublicate). Primele răspunsuri la dopamină la lumina condiționată au fost raportate de Miller și colab. (1981) la șobolani tratați cu haloperidol, care a crescut incidența și activitatea spontană a neuronilor dopaminici, dar a dus la răspunsuri mai susținute decât la animalele nedorite. Deși răspunsurile apar aproape de reacțiile comportamentale (Nishino și colab. 1987), nu au legătură cu mișcările brațului și ale ochilor, deoarece apar și ipsilaterale cu brațul în mișcare și în încercări fără mișcări ale brațului sau ale ochilor (Schultz și Romo 1990). Stimulii condiționați sunt ceva mai puțin eficienți decât recompensele primare în ceea ce privește magnitudinea răspunsului și fracțiile neuronilor activați. Neuronii Dopamine răspund doar la apariția stimulilor condiționați și nu la compensarea lor, chiar dacă compensarea stimulului prezice recompensa (Schultz și Romo 1990). Neuronii dopaminei nu fac distincție între modalitățile vizuale și cele auditive ale stimulilor apetitivi condiționați. Cu toate acestea, ei fac discriminări între stimuli apetitivi și neutri sau aversivi, atât timp cât sunt fizic suficient de disimilați (Ljungberg și colab. 1992; P. Waelti, J. Mirenowicz și W. Schultz, date nepublicate). Doar 11% dintre neuronii dopaminici, cei mai mulți cu răspunsuri apetitive, arată activările fazice tipice, ca răspuns la stimulii vizuali sau auditivi aversivi condiționați în sarcini de evitare activă, în care animalele eliberează o cheie pentru a evita un puf de aer sau o picătură de soluție salină hipertonică. (Mirenowicz și Schultz 1996), deși o astfel de evitare poate fi considerată „răsplătitoare”. Aceste puține activări nu sunt suficient de puternice pentru a induce un răspuns mediu al populației. Astfel, răspunsurile fazice ale neuronilor dopaminei raportează în mod preferențial stimuli de mediu cu valoare motivațională apetisantă, dar fără a discrimina între diferitele modalități senzoriale.

Transfer de activare

Pe parcursul învățării, neuronii dopaminei sunt activate treptat de stimuli condiționați, care prevăd recompense și își pierd progresiv răspunsurile la alimentele primare sau la recompense lichide care devin prezise (Hollerman și Schultz 1996; Ljungberg și colab. 1992; Mirenowicz și Schultz 1994) (Fig. 2 și 3). În timpul unei perioade de învățare tranzitorie, atât recompensele, cât și stimulii condiționați determină activări ale dopaminei. Acest transfer de la recompensa primară la stimulul condiționat are loc instantaneu în neuronii dopamina singuri testați în două sarcini bine învățate, care au, respectiv, recompense neprevăzute și prezise (Romo și Schultz 1990).

Fig. 3. 

Transferul de răspuns al dopaminei la primul stimul predictiv. Răspunsurile la recompensele primare neprevăzute se transferă la stimuli premizători mai devreme. Toate afișările arată histogramele populației obținute prin medierea histogramelor de timp perievent normalizate ale tuturor neuronilor dopamină înregistrați în situațiile comportamentale indicate, independent de prezența sau absența unui răspuns. Top: în afara oricărei sarcini comportamentale, nu există răspuns la populație în neuronii 44 testați cu o lumină mică (date de la Ljungberg și colab. 1992), dar un răspuns mediu apare la 35 de neuroni la o picătură de lichid livrată la un gura din fața gurii animalului (Mirenowicz și Schultz 1994). De mijloc: răspuns la un stimul declanșator care prezice recompensă într-o sarcină spațială cu alegere 2, dar absența răspunsului la recompensă livrată în timpul performanței stabilite a sarcinii în aceiași neuroni 23 (Schultz și colab. 1993). De jos: răspuns la o instrucțiune care precede stimulul de declanșare a recompensării printr-un interval fix de 1 s într-o sarcină de atins spațială instruită (neuroni 19) (Schultz și colab. 1993). Baza de timp este împărțită din cauza unor intervale variate între stimuli condiționați și recompensă. Reedit din Schultz și colab. (1995b) cu permisiunea MIT Press.

Imprevizibilitatea stimulilor condiționați

Activările după stimuli condiționați, care prezic recompensă, nu apar atunci când acești stimuli înșiși sunt precedați la un interval fix de stimuli condiționați fazic în situații comportamentale complet stabilite. Astfel, cu stimuli condiționați în serie, neuronii dopaminici sunt activați de cel mai timpuriu stimul predictor de recompensă, în timp ce toți stimulii și recompensele care urmează în momentele previzibile ulterior sunt ineficiente (Fig. 3) (Schultz și colab. 1993). Doar stimuli secvențiali distanțați la întâmplare provoacă răspunsuri individuale. De asemenea, suprasolicitarea extinsă cu performanța înaltă stereotipată a sarcinilor atenuează răspunsurile la stimuli condiționați, probabil pentru că stimulii devin prevestiți de evenimentele din procesul precedent (Ljungberg și colab. 1992). Acest lucru sugerează că imprevizibilitatea stimulilor este o cerință comună pentru toți stimulatorii care activează neuronii dopaminici.

Depresia prin omiterea stimulilor condiționați prevăzuți

Date preliminare dintr-un experiment anterior (Schultz și colab. 1993) sugerează că și neuronii dopaminici sunt deprimați atunci când un stimul condiționat, care prevede recompensa este prevăzut la un moment fix de un stimul precedent, dar nu reușește să apară din cauza unei erori a animalului. Ca și în cazul recompenselor primare, depresiile apar la momentul apariției obișnuite a stimulului condiționat, fără a fi direct provocate de un stimul precedent. Astfel, depresia indusă de omisiune poate fi generalizată la toate evenimentele apetisante.

Activare-depresie cu generalizarea răspunsului

Neuronii Dopamina răspund, de asemenea, la stimuli care nu prezic recompense, dar seamănă îndeaproape cu stimuli care prezic recompense care apar în același context. Aceste răspunsuri constau în cea mai mare parte dintr-o activare urmată de o depresie imediată, dar, uneori, poate consta în activare pură sau depresie pură. Activările sunt mai mici și mai puțin frecvente decât cele care urmează stimuli care prezic recompensă, iar depresiile sunt observate în 30-60% dintre neuroni. Neuronii Dopamine răspund la stimuli vizuali care nu sunt urmați de recompensă, ci seamănă îndeaproape cu stimuli de predicție a recompenselor, în ciuda discriminării comportamentale corecte (Schultz și Romo 1990). Deschiderea unei cutii goale nu reușește să activeze neuronii dopaminei, dar devine eficientă în fiecare proces imediat ce cutia conține ocazional alimente (Ljungberg și colab. 1992; Schultz 1986; Schultz și Romo 1990) sau când o cutie vecină, identică, care conține mereu, se deschide în alternanță aleatorie (Schultz și Romo 1990). Cutia goală determină activări mai slabe decât caseta cu momeli. Animalele efectuează reacții indiscriminate de orientare oculară la fiecare cutie, dar se apropie doar de cutia momeală cu mâna. În timpul învățării, neuronii dopamină continuă să răspundă la stimuli condiționați anterior, care își pierd predicția de recompensă atunci când se schimbă contingențele de recompensă (Schultz și colab. 1993) sau să răspundă la noi stimuli care seamănă cu stimuli condiționați anterior (Hollerman și Schultz 1996). Răspunsurile apar chiar și la stimuli aversivi, prezentați în alternanță aleatorie, cu stimuli apetitori, condiționați fizic, similari din aceeași modalitate senzorială, răspunsul aversiv fiind mai slab decât cel apetisant (Mirenowicz și Schultz 1996). Răspunsurile generalizează chiar și până la stimuli apetitivi stingeți comportamental. Aparent, răspunsurile neuronale se generalizează la stimuli neapetitori din cauza asemănării lor fizice cu stimuli apetitivi.

Răspunsuri de noutate

Stimuli noi determină activări în neuronii dopaminici, care sunt adesea urmate de depresii și persistă atâta timp cât apar reacții de orientare comportamentală (de exemplu, sacade oculare). Activările scad împreună cu reacțiile de orientare după mai multe repetări de stimul, în funcție de impactul fizic al stimulilor. În timp ce diodele emițătoare de lumină mici provoacă cu greu răspunsuri noi, luminile intermitente și deschiderea rapidă vizuală și auditivă a unei cutii mici provoacă activări care se descompun treptat până la momentul inițial în timpul a <100 de studii (Ljungberg și colab. 1992). Clicurile puternice sau imaginile mari imediat în fața unui animal provoacă răspunsuri puternice de noutate care se descompun, dar care totuși induc activări măsurabile cu> 1,000 de teste (Hollerman și Schultz 1996; Horvitz și colab. 1997; Steinfels și colab. 1983). Figura 4 prezintă schematic diferitele magnitudini de răspuns cu stimuli noi de diferență fizică. Răspunsurile se descompun treptat cu expunerea repetată, dar pot persista la mărimi reduse cu stimuli foarte salienti. Mărimile de răspuns cresc din nou atunci când aceiași stimuli sunt condiționați apetitiv. În schimb, răspunsurile la stimuli noi, chiar mari, se reduc rapid atunci când stimulii sunt folosiți pentru condiționarea comportamentului de evitare activă (Mirenowicz și Schultz 1996). Foarte puțini neuroni (<5%) răspund pentru mai mult de câteva studii la stimuli vizibili, dar slabi din punct de vedere fizic, cum ar fi sfărâmarea hârtiei sau mișcările brute ale mâinilor experimentatorului.

Fig. 4. 

Cursuri de timp ale activării neuronilor dopaminei până la stimuli noi, de alertă și condiționat. Activările după noi stimuli scad cu expunerea repetată în timpul încercărilor consecutive. Mărimea lor depinde de sănătatea fizică a stimulilor, deoarece stimulii mai puternici induc activări mai mari, care uneori le depășesc pe cele după stimuli condiționați. Stimulii deosebit de importanți continuă să activeze neuronii dopaminici cu magnitudine limitată chiar și după ce și-au pierdut noutatea fără a fi împerecheați cu recompense primare. Activările consistente apar din nou când stimulii devin asociați cu recompensele primare. Această schemă a fost contribuită de Jose Contreras-Vidal.

Caracterul omogen al răspunsurilor

Experimentele efectuate până acum au relevat faptul că majoritatea neuronilor din grupele de celule dopaminice ale creierului mediu A8, A9 și A10 arată activări și depresii foarte similare într-o situație comportamentală dată, în timp ce neuronii dopaminici rămași nu răspund deloc. Există o tendință pentru fracții mai mari de neuroni care răspund în regiuni mai mediale ale creierului mijlociu, cum ar fi zona tegmentală ventrală și substanța mediană nigra, în comparație cu mai multe regiuni laterale, care ocazional ajung la semnificație statistică (Schultz 1986; Schultz și colab. 1993). Latențele de răspuns (50-110 ms) și duratele (<200 ms) sunt similare între recompensele primare, stimulii condiționați și stimulii noi. Astfel, răspunsul dopaminei constituie un semnal relativ omogen, al populației scalare. Este gradat în mărime prin reacția neuronilor individuali și prin fracția de neuroni care răspund în cadrul populației.

Rezumat 1: răspunsuri adaptive în timpul episoadelor de învățare

Caracteristicile răspunsurilor la dopamină la stimulii asociați recompenselor sunt ilustrate cel mai bine în episoadele de învățare în timpul cărora recompensele sunt deosebit de importante pentru obținerea de răspunsuri comportamentale. Semnalul de recompensă dopamină suferă modificări sistematice în timpul progresului învățării și apare la cel mai timpuriu stimul legat de recompensă fazică, acesta fiind fie o recompensă primară, fie un stimul predictiv al recompenselor (Ljungberg și colab. 1992; Mirenowicz și Schultz 1994). În timpul învățării, noii stimuli neutri intrinsec induc tranzitorii răspunsuri care slăbesc curând și dispar (Fig. 4). Recompensele primare apar imprevizibil în timpul împerecherii inițiale cu astfel de stimuli și provoacă activări neuronale. Odată cu împerecherea repetată, recompensele devin prezise de stimuli condiționați. Activările după recompensă scad treptat și sunt transferate la stimulul condiționat, care prezice recompensele. Dacă totuși, o recompensă prevăzută nu reușește să apară din cauza unei erori a animalului, neuronii dopaminici sunt deprimați în momentul în care s-ar fi produs recompensa. În timpul învățării repetate a sarcinilor (Schultz și colab. 1993) sau componente ale sarcinii (Hollerman și Schultz 1996), primii stimuli condiționați activează neuronii dopaminei în toate fazele de învățare, din cauza generalizării la stimuli similari învățați anterior, în timp ce stimulii condiționați ulterior și recompensele primare activează neuronii dopaminici doar în timp ce sunt incerti și sunt stabilite contingențe noi.

Rezumat 2: stimuli eficienți pentru neuronii dopaminici

Răspunsurile dopaminei sunt determinate de trei categorii de stimuli. Prima categorie cuprinde recompense primare și stimuli care au devenit predictori valoroși ai recompenselor prin împerecherea repetată și contingentă cu recompense. Acești stimuli formează o clasă comună de stimuli de predicție explicită a recompenselor, deoarece recompensele primare servesc ca predictori ai efectelor vegetative răsplătitoare. Stimulii eficienți au aparent o componentă de alertă, întrucât sunt eficienți doar stimulii cu debut clar. Neuronii Dopamina prezintă activări pure în urma stimulilor expliciti de predicție a recompenselor și sunt deprimați atunci când o recompensă prevăzută, dar omisă, nu reușește să apară (Fig. 5, top).

Fig. 5. 

Afișarea schematică a răspunsurilor neuronilor dopaminei la tipurile 2 de stimuli condiționați. Top: prezentarea unui stimul explicit de predicție a recompensei duce la activarea după stimul, niciun răspuns la recompensa prevăzută și depresie atunci când o recompensă prevăzută nu apare. De jos: prezentarea unui stimul care seamănă strâns cu un stimul condiționat, care prevede recompensa duce la activarea urmată de depresie, activarea după recompensă și niciun răspuns atunci când nu apare nicio recompensă. Activarea după stimul reflectă probabil generalizarea răspunsului din cauza asemănării fizice. Acest stimul nu prezice explicit o recompensă, ci este legat de recompensă prin asemănarea cu stimulul care prezice recompensa. În comparație cu stimulii de predicție explicită a recompenselor, activările sunt mai scăzute și sunt adesea urmate de depresii, astfel discriminând între stimuli condiționați (CS +) și stimulați nerecomandați (CS-). Această schemă rezumă rezultatele experimentelor anterioare și actuale (Hollerman și Schultz 1996; Ljungberg și colab. 1992; Mirenowicz și Schultz 1996; Schultz și Romo 1990; Schultz și colab. 1993; P. Waelti și W. Schultz, rezultate nepublicate).

A doua categorie cuprinde stimuli care generează răspunsuri generalizante. Acești stimuli nu prezic în mod explicit recompense, dar sunt eficienți datorită similitudinii lor fizice cu stimulii care au devenit predictori de recompensă explicită prin condiționare. Acești stimuli induc activări cu o mărime mai mică și implică mai puțini neuroni, în comparație cu stimuli expliciți care prezic recompensă (Fig. 5, de jos). Sunt urmate frecvent de depresii imediate. În timp ce activarea inițială poate constitui un răspuns apetisant generalizat care semnalează o posibilă recompensă, depresia ulterioară poate reflecta predicția de nicio recompensă într-un context general de predicție a recompenselor și poate anula presupunerea eronată a recompensei. Lipsa predicției explicite a recompensei este sugerată în continuare de prezența activării după recompensă primară și absența depresiei fără recompensă. Împreună cu răspunsurile la stimuli care prezic recompensă, se pare că activările dopaminei raportează o „etichetă” apetisantă pe stimuli care au legătură cu recompensele.

A treia categorie cuprinde stimuli noi sau deosebit de importanți care nu sunt neapărat legați de recompense specifice. Prin stimularea reacțiilor de orientare comportamentală, acești stimuli atrag atenția și comandă atenția. Cu toate acestea, au și funcții de motivare și pot fi satisfăcătoare (Fujita 1987). Stimulii noi sunt potențial apetitivi. Stimulii noi sau deosebit de importanți induc activări care sunt frecvent urmate de depresii, similare cu răspunsurile la stimuli generalizatori.

Astfel, răspunsurile fazice ale neuronilor dopaminei raportează evenimente cu efecte de motivare pozitive și potențial pozitive, cum ar fi recompense primare, stimuli care prevăd recompensă, evenimente asemănătoare recompenselor și stimuli de alertă. Cu toate acestea, nu detectează în mare măsură evenimente cu efecte motivaționale negative, cum ar fi stimuli aversivi.

Rezumat 3: semnal de eroare de predicție a recompensei dopaminei

Răspunsurile dopaminei la evenimentele explicite legate de recompensă pot fi cel mai bine conceptualizate și înțelese în termenii teoriilor formale ale învățării. Neuronii Dopamine raportează recompense în raport cu predicția lor, mai degrabă decât să semnalizeze recompense primare necondiționat (Fig. 2). Răspunsul la dopamină este pozitiv (activare) atunci când apar recompense primare, fără a fi prezis. Răspunsul este nul atunci când apar recompense așa cum s-a prevăzut. Răspunsul este negativ (depresia) atunci când sunt omise recompensele preconizate. Astfel neuronii dopamină raportează recompense primare în funcție de diferența dintre apariția și predicția recompensei, ceea ce poate fi denumită o eroare în predicția recompensei (Schultz și colab. 1995b, 1997) și este formalizat tentativ ca

DopamineResponse (Răsplăti)=RewardOccurred-RewardPredicted

Ecuația 1 Această sugestie poate fi extinsă la evenimentele apetitive condiționate, care sunt, de asemenea, raportate de neuronii dopaminici în raport cu predicția. Astfel, neuronii dopaminici pot raporta o eroare în prezicerea tuturor evenimentelor apetitive și Eq. 1 poate fi precizat în forma mai generală

DopamineResponse (ApEvent)=ApEventOccurred-ApEventPredicted

Ecuația 2Această generalizare este compatibilă cu ideea că majoritatea recompenselor sunt stimuli condiționați. Cu mai multe evenimente consecutive, bine stabilite care prezic recompense, doar primul eveniment este imprevizibil și provoacă activarea dopaminei.

CONNECTIVITATEA NEURONILOR DOPAMINE

Originea răspunsului la dopamină

Care intrări anatomice ar putea fi responsabile pentru selectivitatea și natura polisenzorială a răspunsurilor la dopamină? Ce activitate de intrare ar putea duce la codificarea erorilor de predicție, a induce transferul de răspuns adaptiv la cel mai devreme eveniment apetisant și neprevăzut timp de recompensă?

STRIATUL DORSAL ȘI VENTRAL.

Neuronii GABAergici din striosomii (patch-urile) proiectului de striatum într-o manieră largă topografică și parțial suprapusă, interdigitând neuronilor dopaminei în aproape întregul pars compact de substantia nigra, în timp ce neuronii matricii striatale mult mai mari intră în contact cu predominant neuronii nondopaminei pars reticulata de substantia nigra, pe lângă proiecția lor către globus pallidus (Gerfen 1984; Hedreen și DeLong 1991; Holstein și colab. 1986; Jimenez-Castellanos și Graybiel 1989; Selemon și Goldman-Rakic ​​1990; Smith și Bolam 1991). Neuronii din striatul ventral se proiectează într-o manieră nontopografică pentru pars compacta și pars reticulata a substanței mediane nigra și către zona tegmentală ventrală (Berendse și colab. 1992; Haber și colab. 1990; Lynd-Balta și Haber 1994; Somogyi și colab. 1981). Proiecția striatonigrală GABAergic poate exercita două influențe distinct diferite asupra neuronilor dopaminei, o inhibare directă și o activare indirectă (Grace și Bunney 1985; Smith și Grace 1992; Tepper și colab. 1995). Acesta din urmă este mediat de inhibarea striatică a neuronilor pars reticulata și de inhibarea GABAergică ulterioară de la colateralii axonici locali ai neuronilor pars reticulata de ieșire la neuronii dopaminici. Aceasta constituie o dublă legătură inhibitoare și duce la activarea netă a neuronilor dopaminici de către striat. Astfel, striosomii și striatul ventral se pot inhiba monosinaptic și matricea poate activa indirect neuronii dopaminici.

Neuronii striatici dorsali și ventrali prezintă o serie de activări care ar putea contribui la răspunsurile la recompensă cu dopamina, și anume răspunsurile la recompensele primare (Apicella și colab. 1991a; Williams și colab. 1993), răspunsuri la stimuli care prezic recompense (Hollerman și colab. 1994; Romo și colab. 1992) și activări susținute în timpul așteptării stimulilor care prezic recompense și recompense primare (Apicella și colab. 1992; Schultz și colab. 1992). Cu toate acestea, pozițiile acestor neuroni în raport cu striosomii și matricea sunt necunoscute, iar activările striatice care reflectă timpul de recompensare așteptat nu au fost încă raportate.

Răspunsurile polisenzoriale de recompensă ar putea fi rezultatul extragerii caracteristicilor în zonele de asociere corticală. Latențe de răspuns ale 30-75 ms în cortexul vizual primar și asociativ (Maunsell și Gibson 1992; Miller și colab. 1993) s-ar putea combina cu conducerea rapidă la striat și inhibarea dublă a substanței negre pentru a induce latențe de răspuns la dopamină scurte de <100 ms. În timp ce activitatea legată de recompensă nu a fost raportată pentru cortexul de asociere posterior, neuronii din cortexul prefrontal dorsolateral și orbital răspund recompenselor primare și stimulilor de predicție a recompensei și prezintă activări susținute în timpul așteptării recompensei (Rolls și colab. 1996; Thorpe și colab. 1983; Tremblay și Schultz 1995; Watanabe 1996). Unele răspunsuri la recompensă în cortexul frontal depind de imprevizibilitatea recompenselor (Matsumoto și colab. 1995; L. Tremblay și W. Schultz, rezultate nepublicate) sau reflectă erori de comportament sau recompense omise (Niki și Watanabe 1979; Watanabe 1989). Influența corticală asupra neuronilor dopaminici ar fi chiar mai rapidă printr-o proiecție directă, provenind din cortexul prefrontal la șobolani (Gariano și Groves 1988; Sesack și Pickel 1992; Tong și colab. 1996) dar fiind slab la maimuțe (Künzle 1978).

NUCLEUS PEDUNCULOPONTINUS.

Latențe scurte ale răspunsurilor la recompense pot fi derivate din mecanisme adaptative, de procesare a caracteristicilor din tulpina creierului. Nucleus pedunculopontinus este un precursor evolutiv al substantia nigra. La vertebrele non-mamifere, conține neuroni dopaminici și proiectează spre paleostriat (Lohman și Van Woerden-Verkley 1978). La mamifere, acest nucleu trimite puternice influențe excitatorii, colinergice și glutamatergice unei fracțiuni mari de neuroni dopaminici cu latențe de ∼7 ms (Bolam și colab. 1991; Clarke și colab. 1987; Futami și colab. 1995; Scarnati și colab. 1986). Activarea proiecțiilor pedunculopontină-dopamină induce un comportament de cerc (Niijima și Yoshida 1988), sugerând o influență funcțională asupra neuronilor dopaminici.

Amigdala.

Un aport masiv, probabil excitator pentru neuronii dopaminici, apare din diferiți nuclei ai amigdalei (Gonzalez și Chesselet 1990; Preț și Amaral 1981). Neuronii amygdala răspund la recompense primare și la stimuli vizuali și auditivi care prezic recompense. Răspunsurile neuronale cunoscute până acum sunt independente de imprevizibilitatea stimulilor și nu fac discriminări între evenimentele apetisante și aversive (Nakamura și colab. 1992; Nishijo și colab. 1988). Majoritatea răspunsurilor prezintă latențe ale 140-310 ms, care sunt mai lungi decât în ​​neuronii dopaminici, deși câteva răspunsuri apar la latențele 60-100 ms.

DORSAL RAPHÉ.

Proiecția monosinaptică din raphé dorsal (Corvaja și colab. 1993; Nedergaard și colab. 1988) are o influență depresivă asupra neuronilor dopaminici (Fibiger și colab. 1977; Trent and Tepper 1991). Neuronii Raphé prezintă activări cu latență scurtă după stimuli de mediu de intensitate mare (Heym și colab. 1982), permițându-le să contribuie la răspunsurile la dopamină după stimuli noi sau deosebit de importanți.

SINTEZĂ.

Câteva structuri de input bine cunoscute sunt cei mai probabili candidați pentru medierea răspunsurilor la dopamină, deși pot exista și alte aporturi. Activarea neuronilor dopaminei prin recompense primare și stimuli de predicție a recompenselor ar putea fi mediată de o dublă intrare inhibatoare de activare netă din matricea striatală (pentru o diagramă simplificată, vezi Fig. 6). De asemenea, activările ar putea apărea din nucleul pedunculopontinic sau, eventual, din activitatea de așteptare a recompenselor la neuronii nucleului subthalamic care se proiectează către neuronii dopaminiciHammond și colab. 1983; Matsumura și colab. 1992; Smith și colab. 1990). Absența activării cu recompense complet prezise ar putea fi rezultatul inhibării monosinaptice din striosomi, anulând simultan activarea matricei. Depresiile la momentul răsplătirii omise ar putea fi mediate de aporturile inhibitoare ale neuronilor din striosomii striatali (Houk și colab. 1995) sau globus pallidus (Haber și colab. 1993; Hattori și colab. 1975; Y. Smith și Bolam 1990, 1991). Convergența dintre diferitele inputuri înainte sau la nivelul neuronilor de dopamină ar putea duce la o codificare destul de complexă a erorilor de predicție a recompenselor și la transferul de răspuns adaptiv de la recompense primare la stimuli de predicție a recompenselor.

Fig. 6. 

Diagrama simplificată a intrărilor la neuronii dopaminei cerebrale mijlocii care mediază potențial răspunsurile dopaminei. Din motive de simplitate, sunt afișate numai intrările de la caudat la substantia nigra (SN) pars compacta și reticulata. Activările pot apărea printr-o dublă influență inhibatoare netă de activare a neuronilor matricilor GABAergici din caudat și putamen prin neuronii GABAergici ai SN pars reticulata la neuronii dopaminici ai SN pars compacta. De asemenea, activările pot fi mediate de proiecții colinergice sau aminoacizi excitante din nucleul pedunculopontinus. Depresiile s-ar putea datora proiecțiilor monosinaptice GABAergic de la striosomi (plasturi) în caudat și putamen la neuroni dopaminici. Proiecții similare există de la striatul ventral la neuronii dopaminei în SNP media compa compaa și grupa A10 în zona tegmentală ventrală și de la striatul dorsal la neuronii A8 dopaminei dorsolaterale la SN (Lynd-Balta și Haber 1994). Cercul greu reprezintă neuronii dopaminici. Aceste proiecții reprezintă cele mai probabile aporturi care stau la baza răspunsurilor dopaminei, fără a exclude aporturile din globus pallidus și nucleul subthalamic.

Dopamina influențează fazic asupra structurilor țintă

NATURA GLOBALĂ A SEMNALULUI DOPAMINEI.

Proiecții divergente. Există neuroni amine8,000 dopamină în fiecare substanță nigra de șobolani (Oorschot 1996) și 80,000 – 116,000 în maimuțele macaque (German și colab. 1988; Percheron și colab. 1989). Fiecare striatum conține ∼2.8 milioane de neuroni la șobolani și 31 milioane la macaci, ceea ce duce la un factor de divergență nigrostriatală a 300-400. Fiecare axon de dopamină se ramifică din abundență într-o zonă terminală limitată în striat și are varicozități ria500,000 striatale din care este eliberată dopaminaAndén și colab. 1966). Aceasta duce la aportul de dopamină la aproape fiecare neuron striatal (Groves și colab. 1995) și o proiecție moderat topografică nigrostriatală (Lynd-Balta și Haber 1994). Inervația corticală a dopaminei la maimuțe este cea mai ridicată în zonele 4 și 6, este încă importantă în lobii frontali, parietali și temporari și este cea mai mică în lobul occipital (Berger și colab. 1988; Williams și Goldman-Rakic ​​1993). Sinapsele de dopamină corticală se găsesc predominant în straturile I și V-VI, care intră în contact cu o proporție mare de neuroni corticali. Împreună cu natura răspunsului destul de omogen, aceste date sugerează că răspunsul la dopamină avansează ca o undă simultană, paralelă de activitate, de la nivelul creierului central până la striat și cortexul frontal (Fig. 7).

Fig. 7. 

Semnal global de dopamină care avansează spre striatum și cortex. Răspunsul relativ relativ omogen al majorității neuronilor dopaminei la stimuli apetitivi și de alertă și progresia acestuia de la substantia nigra la structurile postsinaptice poate fi privit schematic ca o undă de activitate paralelă sincronă care avansează la o viteză de 1-2 m / s (Schultz și Romo 1987) de-a lungul proiecțiilor divergente de la nivelul creierului mijlociu la striatum (caudat și putamen) și cortex. Răspunsurile sunt indistinguibile calitativ între neuronii substanței nigra (SN) pars compacta și zona tegmentală ventrală (VTA). Inervarea dopaminei tuturor neuronilor din striatum și a multor neuroni din cortexul frontal ar permite semnalului de întărire a dopaminei să exercite un efect destul de global. Wave a fost comprimat pentru a sublinia natura paralelă.

Eliberare de dopamină. Impulsurile neuronilor dopaminei la intervale de 20-100 ms duc la o concentrație de dopamină mult mai mare în striat decât același număr de impulsuri la intervale de 200 ms (Garris și Wightman 1994; Gonon 1988). Această neliniaritate se datorează în principal saturației rapide a transportorului de recaptare a dopaminei, care elimină dopamina eliberată din regiunea extrasinaptică (Chergui și colab. 1994). Același efect se observă și în nucleus accumbens (Wightman și Zimmerman 1990) și apare chiar și cu intervale de impuls mai lungi din cauza locurilor de recaptare mai reduse (Garris și colab. 1994b; Marshall și colab. 1990; Stamford și colab. 1988). Eliberarea dopaminei după o explozie de impuls <300 ms este prea scurtă pentru a activa reducerea eliberării mediată de autoreceptor (Chergui și colab. 1994) sau degradarea enzimatică și mai lentă (Michael și colab. 1985). Astfel, un răspuns al dopaminei explozive este deosebit de eficient pentru eliberarea dopaminei.

Estimările bazate pe voltammetrie in vivo sugerează că un singur impuls eliberează molecule de dopamină ∼1,000 la sinapsele din striatum și nucleu accumbens. Aceasta duce la concentrații de dopamină sinaptică imediată de 0.5 – 3.0 μM (Garris și colab. 1994a; Kawagoe și colab. 1992). La 40 μs după debutul eliberării,> 90% din dopamină a părăsit sinapsa, unele din rest fiind ulterior eliminate prin recaptare sinaptică (timpul de debut la jumătate de 30-37 ms). La 3-9 ms după debutul eliberării, concentrațiile de dopamină ating un vârf de ± 250 nM atunci când toate varicozitățile învecinate eliberează simultan dopamină. Concentrațiile sunt omogene într-o sferă de 4 μm diam (Gonon 1997), care este distanța medie între varicozități (Doucet și colab. 1986; Groves și colab. 1995). Difuzia maximă este restricționată la 12 μm de către transportorul de recaptare și este atinsă în 75 ms după debutul eliberării (timpul de declanșare a jumătății transportorului de 30-37 ms). Concentrațiile ar fi ușor mai mici și mai puțin omogene în regiunile cu mai puține varicozități sau atunci când <100% din neuronii dopaminei sunt activate, dar sunt de două până la trei ori mai mari cu explozii de impuls. Astfel, activările explozive ușor sincrone, induse de recompensă, în aproximativ 75% din neuronii dopaminergici pot duce la vârfuri de concentrație destul de omogene în ordinea 150-400 nM. Creșterile totale ale dopaminei extracelulare durează 200 ms după un singur impuls și 500-600 ms după impulsuri multiple cu intervale de 20-100 ms aplicate pe parcursul a 100-200 ms (Chergui și colab. 1994; Dugast și colab. 1994). Transportor extrasinaptic de recaptare (Nirenberg și colab. 1996) readuce ulterior concentrațiile de dopamină la nivelul lor inițial de 5 – 10 nM (Herrera-Marschitz și colab. 1996). Astfel, spre deosebire de neurotransmisia clasică, strict sinaptică, dopamina eliberată sinaptic difuzează rapid în zona juxtasinaptică imediată și atinge vârfuri scurte ale concentrațiilor extracelulare omogene din regiune.

Receptorii. Dintre cele două tipuri principale de receptori de dopamină, receptorii de activare a adenilatului ciclazei, receptorii de tip D1 constituie ∼80% de receptori de dopamină în striat. Dintre acestea 80% se află în starea de afinitate scăzută a 2 – 4 μM și 20% în starea de afinitate înaltă a 9 – 74 nM (Richfield și colab. 1989). Restul de 20% din receptorii striatali de dopamină aparțin tipului D2 inhibitor de adenilază ciclază din care 10-0% sunt în stare de afinitate scăzută și 80-90% în stare de afinitate ridicată, cu afinități similare ca receptorii D1. Astfel, receptorii D1 în general au o afinitate de ∼100 ori mai mică decât receptorii D2. Receptorii Striatali D1 sunt localizați cu precădere pe neuronii proiecți la pallidum intern și substanța nigra pars reticulata, în timp ce receptorii D2 striatali sunt localizați mai ales pe neuroni proiecți la palidum extern (Bergson și colab. 1995; Gerfen și colab. 1990; Hersch și colab. 1995; Levey și colab. 1993). Cu toate acestea, diferențele de sensibilitate ale receptorilor nu pot juca un rol dincolo de transducția semnalului, reducând astfel diferențele de sensibilitate la dopamină între cele două tipuri de neuroni de ieșire striatală.

Dopamina este eliberată în 30-40% din sinaptic și în 60-70% din varicozitățile extrasinaptice (Descarries și colab. 1996). Dopamina eliberată sinaptic acționează asupra receptorilor dopaminei postsinaptice la patru situri anatomice distincte din striatum, și anume în interiorul sinapselor dopaminei, imediat adiacentă sinapselor dopaminei, în interiorul sinapselor cu glutamat corticostriatal și la siturile extrasinaptice îndepărtate de siturile de eliberare (Fig. 8) (Levey și colab. 1993; Sesack și colab. 1994; Yung și colab. 1995). Receptorii D1 sunt localizați în principal în afara sinapselor de dopamină (Caillé și colab. 1996). Concentrațiile tranzitorii mari de dopamină după izbucniri de impulsuri fazice ar activa receptorii D1 în imediata apropiere a locurilor de eliberare activă și ar activa și chiar satura receptorii D2 de pretutindeni. Receptorii D2 ar rămâne parțial activați atunci când concentrația de dopamină ambientală revine la nivelul inițial după creșterea fazică.

Fig. 8. 

Influențe de eliberare de dopamină asupra neuronilor tipici medii spinoși în striatul dorsal și ventral. Dopamina eliberată de impulsuri de la varicozitățile sinaptice activează câțiva receptori sinaptici (probabil de tip D2 în stare de afinitate scăzută) și se difuzează rapid din sinapsă pentru a ajunge la receptorii de tip D1 de afinitate scăzută (D1?), Care se află în apropiere, în cadrul sinapselor corticostriatale , sau la distanță limitată. Dopamina crescută din punct de vedere fazic activează receptorii de tip D2 de înaltă afinitate până la saturație (D2?). Receptorii D2 rămân parțial activați de concentrațiile de dopamină ambientală după eliberarea treptat crescută. Dopamina eliberată extrasinaptic se poate dilua prin difuzie și poate activa receptorii D2 de înaltă afinitate. Trebuie menționat că, în funcție de această diagramă schematică, majoritatea receptorilor D1 și D2 sunt localizați pe diferiți neuroni. Glutamatul eliberat din terminalele corticostriatale ajunge la receptorii postsinaptici localizați pe aceleași coloane dendritice ca varicozitățile dopaminei. Glutamatul atinge, de asemenea, varicozități dopaminice presinaptice unde controlează eliberarea dopaminei. Influențele dopaminei asupra neuronilor spinoși din cortexul frontal sunt comparabile în multe privințe.

Rezumat. Răspunsul observat, moderat, de scurtă durată, aproape sincron, al majorității neuronilor dopaminei duce la eliberarea optimă și simultană a dopaminei din majoritatea varicozelor striatale strâns distanțate. Răspunsul neuronal induce un puf scurt de dopamină care este eliberat din siturile extrasinaptice sau difuzează rapid de sinapsele în zona juxtasinaptică. Dopamina atinge rapid concentrații omogene din punct de vedere regional, care pot influența dendritele probabil tuturor striatilor și multor neuroni corticali. În acest fel, mesajul de recompensă din 60-80% dintre neuronii dopaminici este transmis ca un semnal de armare divergent, mai degrabă global, către striatum, nucleus accumbens și cortexul frontal, asigurând o influență fazică asupra unui număr maxim de sinapse implicate în procesare de stimuli și acțiuni care duc la recompensare (Fig. 7). Dopamina eliberată prin activări neuronale după recompense și stimuli care prevăd recompense ar afecta receptorii juxtasinaptici D1 pe neuronii striatali care se proiectează spre pallidum intern și substania nigra pars reticulata și toți receptorii D2 pe neuronii care se proiectează spre palidum extern. Reducerea eliberării de dopamină indusă de depresii cu recompense omise și stimuli care prevăd recompensă ar reduce stimularea tonică a receptorilor D2 de către dopamina ambientală. Astfel, erorile de predicție pozitivă de recompensă ar influența toate tipurile de neuroni de ieșire striatală, în timp ce eroarea de predicție negativă ar putea influența preponderent neuronii care se proiectează spre palidum extern.

Posibile mecanisme de cocaină. Blocarea transportorului de recaptare a dopaminei prin medicamente precum cocaina sau amfetamina îmbunătățește și prelungește creșterea fazică a concentrațiilor de dopamină (Church și colab. 1987a; Giros și colab. 1996; Suaud-Chagny și colab. 1995). Îmbunătățirea ar fi deosebit de pronunțată atunci când creșterea rapidă, provocată de explozie, a concentrației de dopamină atinge un vârf înainte ca reglarea feedbackului să devină efectivă. Acest mecanism ar duce la un semnal de dopamină sporit masiv după recompense primare și stimuli care prezic recompensă. De asemenea, acesta ar crește semnalul de dopamină oarecum mai slab după stimulii care seamănă cu recompense, stimuli noi și în special stimulenți deosebit de pot fi frecventi în viața de zi cu zi. Îmbunătățirea cu cocaină ar permite ca acești stimuli nerecomandanți să apară la fel de puternici sau chiar mai puternici decât recompensele naturale fără cocaină. Neuronii post-sinaptici ar putea interpreta greșit un astfel de semnal ca un eveniment deosebit de important legat de recompensă și suferă modificări pe termen lung în transmiterea sinaptică.

DOPAMINĂ ACȚIUNI MEMBRANE.

Acțiunile dopaminei asupra neuronilor striatali depind de tipul de receptor activat, sunt legate de stările depolarizate sau hiperpolarizate ale potențialelor membranare și implică adesea receptori de glutamat. Activarea receptorilor de dopamină D1 îmbunătățește excitația evocată prin activarea Nreceptorii de metil-d-aspartat (NMDA) după intrări corticale prin Ca de tip L2+ canalele când potențialul membranei este în stare depolarizată (Cepeda și colab. 1993, 1998; Hernandez-Lopez și colab. 1997; Kawaguchi și colab. 1989). În schimb, activarea D1 pare să reducă excitațiile evocate atunci când potențialul membranei este în stare hiperpolarizată (Hernandez-Lopez și colab. 1997). Ionotoforeza dopaminei in vivo și stimularea axonală induc excitații mediate de D1 care durează 100-500 ms dincolo de eliberarea de dopamină (Gonon 1997; Williams și Millar 1991). Activarea receptorilor de dopamină D2 reduce Na+ și Ca de tip N2+ curenti și atenuează excitațiile evocate prin activarea receptorilor de acid NMDA sau α-amino-3-hidroxi-5-metil-4-izoxazolepropionic (AMPA) la orice stare de membrană (Cepeda și colab. 1995; Yan și colab. 1997). La nivelul sistemelor, dopamina exercită un efect de focalizare prin care doar cele mai puternice intrări trec prin striatum către palidum extern și intern, în timp ce se pierde activitatea mai slabă (Brown și Arbuthnott 1983; Filion și colab. 1988; Toan și Schultz 1985; Yim și Mogenson 1982). Astfel, dopamina eliberată de răspunsul dopaminei poate duce la o reducere generală imediată a activității striatice, deși un efect facilitator asupra excitațiilor evocate cortic poate fi mediat prin intermediul receptorilor D1. Discuția următoare va arăta că efectele neurotransmisiei de dopamină nu pot fi limitate la modificările polarizării membranei.

DOPAMINA-DEPENDENT PLASTICITATE.

Stimularea electrică tetanică a intrărilor corticale sau limbice la striatum și nucleu accumbens induce depresii posttetanice care durează câteva zeci de minute în felii (Calabresi și colab. 1992a; Lovinger și colab. 1993; Pennartz și colab. 1993; Walsh 1993; Wickens și colab. 1996). Această manipulare îmbunătățește, de asemenea, excitabilitatea terminalelor corticostriatale (Garcia-Munoz și colab. 1992). Potențarea post-tetanică a duratelor similare se observă în striatum și nucleul accumbens atunci când depolarizarea post-sinaptică este facilitată prin îndepărtarea magneziului sau aplicarea antagoniștilor de acid γ-aminobutiric (GABA) (Bo Beijinga și colab. 1993; Calabresi și colab. 1992b; Pennartz și colab. 1993). Antagoniști ai receptorilor dopaminei D1 sau D2 sau ai eliminării receptorului D2 elimină depresia corticostriatală posttetanică (Calabresi și colab. 1992a; Calabresi și colab. 1997; Garcia-Munoz și colab. 1992) dar nu afectează potențarea nucleului accumbens (Pennartz și colab. 1993). Aplicarea dopaminei restabilește depresia post-tetanică striatală în felii de la șobolani lezați de dopamină (Calabresi și colab. 1992a) dar nu reușește să modifice potențarea post-tetanică (Pennartz și colab. 1993). Impulsurile scurte de dopamină (5-20 ms) induc o potențare pe termen lung în felii striatale atunci când sunt aplicate simultan cu stimularea tetanică a corticostriatului și depolarizarea postsinaptică, respectând o regulă de învățare a consolidării cu trei factori (Wickens și colab. 1996).

Mai multe dovezi pentru plasticitatea sinaptică legată de dopamină se găsesc în alte structuri ale creierului sau cu metode diferite. În hipocamp, potențarea post-tetanică este crescută prin aplicarea în baie a agoniștilor D1 (Otmakhova și Lisman 1996) și afectată de blocarea receptorilor D1 și D2 (Frey și colab. 1990). Oferire a contingentului, dar nu a explozării, aplicații locale necontingente de dopamină și agoniști ai dopaminei crește explozia neuronală în feliile de hipocamp (Stein și colab. 1994). La retina de pește, activarea receptorilor de dopamină D2 induce mișcări de fotoreceptori în sau în afara epiteliului pigmentar (Rogawski 1987). Injecțiile posttrial de amfetamină și agoniști de dopamină în nucleul caudat de șobolan îmbunătățesc performanța în sarcinile de memorie (Packard și alb 1991). Denervările dopaminei în striatum reduc numărul de coloană vertebrală dendritică (Arbuthnott și Ingham 1993; Anglade și colab. 1996; Ingham și colab. 1993), sugerând că inervația de dopamină are efecte persistente asupra sinapselor corticostriatale.

PROCESAREA ÎN NEURONII STRIATALE.

O cantitate estimată de terminale corticale 10,000 și varicozitățile de dopamină 1,000 contactează coloana vertebrală dendritică a fiecărui neuron striatal (Doucet și colab. 1986; Groves și colab. 1995; Wilson 1995). Inervația densă a dopaminei devine vizibilă pe măsură ce coșurile care conturează pericolele individuale în paleostriatum de porumbei (Wynne și Güntürkün 1995). Varicozitățile dopaminei formează sinapse pe aceiași coloane dendritice ale neuronilor striatali care sunt contactați de aferentele glutamatului cortical (Fig. 8) (Bouyer și colab. 1984; Freund și colab. 1984; Pickel și colab. 1981; Smith și colab. 1994), iar unii receptori de dopamină sunt localizați în sinapsele corticostriatale (Levey și colab. 1993; Yung și colab. 1995). Numărul mare de intrări corticale la neuronii striatali, convergența dintre aporturile de dopamină și glutamat la coloanele vertebrale ale neuronilor striatali și semnalul de dopamină în mare măsură omogen care ajunge probabil la toți neuronii striatali sunt substraturi ideale pentru modificările sinaptice dependente de dopamina la nivelul coloanelor vertebrale ale neuronilor striatali . Acest lucru poate fi valabil și pentru cortexul în care coloanele vertebrale dendritice sunt contactate prin aporturi sinaptice atât de la dopamină cât și de la neuronii corticali (Goldman-Rakic ​​și colab. 1989), deși probabil că dopamina nu influențează fiecare neuron cortical.

Ganglionii bazali sunt conectați prin bucle deschise și închise cu cortexul și cu structuri limbice subcorticale. Striatul primește în diferite grade inputuri din toate zonele corticale. Ieșirile ganglionilor bazali sunt direcționate preponderent spre zonele corticale frontale, dar ajung și la lobul temporal (Middleton și Strick 1996). Multe intrări de la ariile corticale eterogene funcțional la striatum sunt organizate în canale paralele segregate, precum și ieșirile din palidum intern direcționate către diferite zone corticale motorii (Alexander și colab. 1986; Hoover și Strick 1993). Cu toate acestea, aferentele din zonele corticale înrudite funcțional dar anatomic pot converge asupra neuronilor striatali. De exemplu, proiecții din zonele legate de somatotopic ale cortexului somatosenzorial primar și ale cortexului motor se proiectează către regiunile striatice comune (Flaherty și Graybiel 1993, 1994). Proiecțiile corticostriatale se diverge în „matrisomi” striatali separați și se reconverg în pallidum, crescând astfel „suprafața” sinaptică pentru interacțiuni și asociații modulatorii (Graybiel și colab. 1994). Acest aranjament anatomic ar permite semnalului de dopamină să determine eficacitatea intrărilor corticale foarte structurate, specifice sarcinii, către neuronii striatali și să exercite o influență largă asupra centrelor anterioare implicate în controlul acțiunii comportamentale.

UTILIZAREA SEMNALULUI EROARE A PREDICĂRII REPARCĂRII DOPAMINEI

Neuronii Dopamine par să raporteze evenimente apetisante în funcție de o eroare de predicție (SCM. 1 și 2 ). Teoriile actuale de învățare și modelele neuronale demonstrează importanța crucială a erorilor de predicție pentru învățare.

Teorii de învățare

MODEL RESCORLA-WAGNER.

Teoriile de învățare comportamentală formalizează dobândirea de asocieri între stimuli arbitrari și evenimente motivante primare în paradigmele clasice de condiționare. Stimulii câștigă putere asociativă față de încercările consecutive, fiind împerecheți în mod repetat cu un eveniment motivant primar

ΔV=αβ(λ-V)

Ecuația 3 undeva V este puterea asociativă actuală a stimulului, λ este puterea asociativă maximă posibil susținută de evenimentul motivant primar, α și β sunt constante care reflectă sănătatea stimulilor condiționați, respectiv (Dickinson 1980; Mackintosh 1975; Pearce și Hall 1980; Rescorla și Wagner 1972). (Λ-V) termenul indică gradul în care evenimentul motivator primar are loc imprevizibil și reprezintă o eroare în prezicerea întăririi. Determină rata de învățare, deoarece puterea asociativă crește atunci când termenul de eroare este pozitiv, iar stimulul condiționat nu prezice complet întărirea. Cand V = λ, stimulul condiționat prezice complet armatura și V nu va crește în continuare. Astfel, învățarea are loc numai atunci când evenimentul motivant primar nu este prezis pe deplin de un stimul condiționat. Această interpretare este sugerată de fenomenul de blocare, conform căruia un stimul nu reușește să obțină forță asociativă atunci când este prezentat împreună cu un alt stimul care, prin el însuși, prezice complet armatorul (Kamin 1969). (Λ-V) termenul de eroare devine negativ atunci când un armator prevăzut nu reușește, ceea ce duce la pierderea puterii asociative a stimulului condiționat (stingerea). Rețineți că aceste modele folosesc termenul „întărire” în sensul larg al creșterii frecvenței și intensității comportamentului specific și nu se referă la niciun tip particular de învățare.

REGULA DELTA.

Modelul Rescorla-Wagner se referă la principiul general al învățării condus de erori între rezultatul dorit și efectiv, cum ar fi cea mai mică medie a erorii pătrate (Kalman 1960; Widow și Sterns 1985). Acest principiu a fost aplicat modelelor de rețea neuronală în regula Delta, conform cărora greutățile sinaptice (ω) sunt ajustate de

Δω=η(t-a)x

Ecuația 4 undeva t este dorită ieșirea (țintă) a rețelei, a este producția reală, iar η și x activă, respectiv, rata de învățare și activarea (Rumelhart și colab. 1986; Widow și Hoff 1960). Ieșirea dorită (t) este similară cu rezultatul (λ), ieșirea efectivă (a) este analog cu predicția modificată în timpul învățării (V) și termenul de eroare delta (δ = t - a) este echivalent cu termenul de eroare de armare (λ-V) din regula Rescorla-Wagner (Eq. 3) (Sutton și Barto 1981).

Dependența generală de imprevizibilitatea rezultatelor se raportează intuitiv la însăși esența învățării. Dacă învățarea implică dobândirea sau schimbarea predicțiilor rezultatului, nu se va schimba predicția și, prin urmare, nu va apărea nicio învățare atunci când rezultatul este perfect prevăzut. Acest lucru restricționează învățarea la stimuli și reacții comportamentale care duc la rezultate surprinzătoare sau alterate, iar stimulii redundanți precedenți deja previzionați de alte evenimente nu sunt învățați. Pe lângă rolul lor în realizarea învățării, armatoarele au o a doua funcție distinctă. Când învățarea este finalizată, armatoarele prezise complet sunt esențiale pentru menținerea comportamentului învățat și prevenirea dispariției.

Multe forme de învățare pot implica reducerea erorilor de predicție. Într-un sens general, aceste sisteme procesează un eveniment extern, generează predicții ale acestui eveniment, calculează eroarea dintre eveniment și predicția lui și modifică atât performanța, cât și predicția în funcție de eroarea de predicție. Aceasta nu se poate limita la sistemele de învățare care se ocupă de armatoarele biologice, ci se referă la o varietate mult mai mare de operații neuronale, cum ar fi recunoașterea vizuală în cortexul cerebral (Rao și Ballard 1997).

Algoritmi de întărire

REINFORCARE NECONVIZIONALĂ.

Modelele neuronale de rețea pot fi antrenate cu semnalele simple de armare care emit un semnal independent de predicție atunci când o reacție comportamentală este executată corect, dar nici un semnal cu o reacție eronată. Învățarea în aceste modele de învățare în mare măsură instrumentale constă în schimbarea greutăților sinaptice (ω) ale neuronilor model conform

Δω=ɛrxy

Ecuația 5unde unde rate este rata de învățare, r este întărire și x și y sunt activări ale neuronilor pre și post sinaptici, asigurând că sunt modificate doar sinapsele care participă la comportamentul consolidat. Un exemplu popular este modelul asociativ-recompensă-penalizare (Barto și Anandan 1985). Aceste modele achiziționează răspunsuri scheletice sau oculomotorii, învață secvențe și efectuează testul de sortare a cardurilor Wisconsin (Arbib și Dominey 1995; Dehaene și Changeux 1991; Dominey și colab. 1995; Fagg și Arbib 1992). Unitățile de procesare din aceste modele dobândesc proprietăți similare ca neuronii din cortexul de asociere parietală (Mazzoni și colab. 1991).

Cu toate acestea, persistența semnalului de predare după învățare necesită algoritmi suplimentari pentru prevenirea scăderii punctelor forte sinaptice (Montague și Sejnowski 1994) și pentru evitarea achiziției de stimuli redundanți prezentați împreună cu stimuli care prevăd consolidarea. Comportamentul învățat anterior persistă atunci când contingențele se schimbă, întrucât armarea omisă nu reușește să inducă un semnal negativ. Viteza de învățare poate fi crescută prin adăugarea de informații externe de la un profesor (Ballard 1997) și prin încorporarea informațiilor despre performanțele trecute (McCallum 1995).

INVATAREA DIFERINȚEI TEMPORALE

Într-o clasă deosebit de eficientă de algoritmi de armare (Sutton 1988; Sutton și Barto 1981), greutățile sinaptice sunt modificate în funcție de eroarea din predicția de armare calculată în pași de timp consecutivi (t) în fiecare proces

rˆ(t)=r(t)+P(t)-P(t-l)

Ecuația 6 undeva r este întărire și P este previziune de întărire. P (t) este de obicei multiplicat cu un factor de reducere γ cu 0 ≤ γ <1 pentru a ține cont de influența descrescătoare a recompenselor din ce în ce mai îndepărtate. Din motive de simplitate, γ este setat la 1 aici. În cazul unui singur stimul care prezice un singur întăritor, predicția P(t - 1) există înainte de timp t de armare, dar se încheie în momentul armării [P (t) = 0]. Acest lucru duce la un semnal eficient de armare la momentul respectiv (T) de întărire

rˆ (t)=r(t)-P(t-l)

Ecuația 6a r(t) termenul indică diferența dintre întărirea reală și cea prevăzută. În timpul învățării, armarea este prevăzută complet, termenul de eroare este pozitiv atunci când apare întărirea, iar ponderile sinaptice sunt crescute. După învățare, consolidarea este prevăzută complet de un stimul precedent [P(t - 1) = r(t)], termenul de eroare este nul pe un comportament corect, iar greutățile sinaptice rămân neschimbate. Atunci când armarea este omisă din cauza performanței inadecvate sau a contingențelor modificate, eroarea este negativă și greutățile sinaptice sunt reduse. r(t) termenul este analog cu (λ-V) termenul de eroare al modelului Rescorla-Wagner (Eq. 4 ). Cu toate acestea, se referă la etapele individuale (t) în cadrul fiecărui proces, mai degrabă decât predicțiile care evoluează în timpul încercărilor consecutive. Aceste modele temporale de armare valorifică faptul că predicțiile dobândite includ timpul exact al întăririi (Dickinson și colab. 1976; Gallistel 1990; Smith 1968).

Algoritmii diferenței temporale (TD) utilizează, de asemenea, predicții dobândite pentru schimbarea greutăților sinaptice. În cazul unui stimul neprevăzut, unic condiționat, care prezice un singur întăritor, prezicerea P (t) începe la timp (T), nu există nicio predicție precedentă [P(t - 1) = 0], iar armarea nu a avut loc încă [r(t) = 0]. Conform Eq. 6, modelul emite un semnal de întărire efectiv pur predictiv la momentul respectiv (t) a prezicerii

rˆ=P(t)

Ecuația 6b În cazul mai multor stimuli predictivi consecutivi, din nou, cu armare absentă la momentul predicțiilor, semnalul de armare efectiv la momentul respectiv (T) a prezicerii reflectă diferența dintre prezicerea curentă P (t) și predicția precedentă P(t - 1)

rˆ=P(t)-P(t-l)

Ecuația 6cAceasta constituie un termen de eroare de consolidare a ordinelor superioare. Similar cu armatoarele prezise complet, toți stimulii predictivi înșiși sunt anticipați complet [P(t - 1) = P(t)], Rezultând r = 0 la ore (T) dintre acești stimuli. Doar cel mai timpuriu stimul predictiv contribuie la semnalul de întărire eficient, ca și acest stimul P (t) nu este prezis de un alt stimul [P(t - 1) = 0]. Aceasta rezultă la fel r = P (t) atunci (T) a primei predicții ca în cazul unei singure predicții (Eq. 6b).

Fig. 9. 

Arhitecturi de bază ale modelelor de rețele neuronale care implementează algoritmi de diferență temporală în comparație cu conectivitatea ganglionilor bazali. A: în implementarea inițială, semnalul de predare eficient y - ȳ este calculat în modelul neuronului A și trimis la terminalele presinaptice de intrări x la neuron B, influențând astfel xB procesarea și schimbarea greutăților sinaptice la xB sinapsă. Neuron B influențează ieșirea comportamentală prin axon y și în același timp contribuie la proprietățile adaptive ale neuronului A, și anume răspunsul său la stimulii care prevăd consolidarea. Implementări mai recente ale acestei arhitecturi simple folosesc neuron A mai degrabă decât neuron B pentru emiterea unei ieșiri O a modelului (Montague și colab. 1996; Schultz și colab. 1997). Reedit din Sutton și Barto (1981) cu permisiunea Asociației Psihologice Americane. B: implementarea recentă separă componenta de predare A, numit criticul (dreapta), dintr-o componentă de ieșire compusă din mai multe unități de procesare B, l-a numit actorul (stânga). Semnal de armare eficient r(t) se calculează scăzând diferența temporală în predicția γ de armare ponderatăP(t) - P(t - 1) din armătură primară r(t) primite din mediu (γ este factorul de reducere care reduce valoarea armăturilor mai îndepărtate). Predicția armatorului este calculată într-o unitate de predicție separată C, care face parte din critic și formează o buclă închisă cu elementul didactic A, întrucât întărirea primară intră în critică printr-o intrare separată rt. Semnalul de armare eficient influențează greutățile sinaptice la axonii de intrare în actor, care mediază ieșirea și în unitatea de predicție adaptivă a criticului. Reedit din Barto (1995) cu permisiunea MIT Press. C: conectivitatea de bază a ganglionilor bazali relevă asemănări izbitoare cu arhitectura actor-critic. Proiecția de dopamină emite semnalul de armare la striat și este comparabilă cu unitatea A În părți A și B, striatul limbic (sau striosome-patch) ia poziția unității de predicție C în critic, iar senzorimotorul striatum (sau matrice) seamănă cu unitățile actorului B. În modelul inițial (A), abaterea majoră unică de la anatomia ganglionilor bazali consistați constă în influența neuronului A fiind direcționată către terminalele presinaptice, în timp ce sinapsele dopaminice sunt localizate pe dendritele postsinaptice ale neuronilor striatali (Freund și colab. 1984). Reedit din Smith și Bolam (1990) cu permisiunea Elsevier Press.

Luate împreună, semnalul de armare eficient (Eq. 6 ) este compus din armatura primară, care scade odată cu predicțiile emergente (Eq. 6a) și este înlocuit treptat de predicțiile dobândite (SCM. 6b și 6c). Cu stimuli predictivi consecutivi, semnalul efectiv de armare se deplasează înapoi în timp, de la armătura primară la cel mai timpuriu stimul predictor de consolidare. Transferul retrograd are ca rezultat o alocare mai specifică a creditului către sinapsele implicate, deoarece previziunile apar mai aproape în timp de stimulii și reacțiile comportamentale care urmează să fie condiționate, în comparație cu întărirea la sfârșitul încercării (Sutton și Barto 1981).

Implementarea algoritmilor de învățare la armare utilizează eroarea de predicție în două moduri, pentru schimbarea greutăților sinaptice pentru ieșirea comportamentală și pentru însușirea predicțiilor în sine pentru a calcula în mod continuu eroarea de predicție (Fig. 9 A) (McLaren 1989; Sutton și Barto 1981). Aceste două funcții sunt separate în implementări recente, în care eroarea de predicție este calculată în componenta adaptativă critică și schimbă greutățile sinaptice din componența actorului care mediază ieșirea comportamentală (Fig. 9 B) (Barto 1995). O eroare pozitivă crește predicția de întărire a criticului, în timp ce o eroare negativă din armatura omisă reduce predicția. Acest lucru face ca semnalul de armare eficient să fie foarte adaptabil.

Implementări neurobiologice ale învățării diferențelor temporale

COMPARAREA RĂSPUNSULUI DE DOPAMINĂ CU MODELE DE REINFORMAȚIE.

Răspunsul dopaminei care codifică o eroare în predicția recompensei (Eq. 1 ) seamănă îndeaproape cu termenul de eroare efectiv al regulilor de învățare a animalelor (λ-V; Eq. 4 ) și semnalul eficient de armare al algoritmilor TD la acea vreme (t) de armare [r(t) - P(t - 1); Eq. 6a], după cum am menționat anterior (Montague și colab. 1996). În mod similar, eroarea de predicție a evenimentului apetisant de dopamină (Eq. 2 ) seamănă cu cea mai mare eroare de întărire TD de ordin [P(t) - P(t - 1); Eq. 6c]. Natura proiecțiilor răspândite și divergente ale neuronilor dopaminei, probabil, tuturor neuronilor din striatum și a multor neuroni din cortexul frontal este compatibilă cu noțiunea unui semnal de întărire globală TD, care este emis de critic pentru influențarea tuturor neuronilor modelului din actor. (comparați fig. 7 cu Fig. 9 B). Arhitectura actorului critic este deosebit de atractivă pentru neurobiologie datorită modulelor sale de predare și performanță separate. În special, seamănă îndeaproape cu conectivitatea ganglionilor bazali, inclusiv reciprocitatea proiecțiilor striatonigrale (Fig. 9 C), după cum a menționat prima dată de Houk și colab. (1995). Criticul simulează neuronii dopaminici, predicția de recompensă intră din proiecții striatonigrale striosomale, iar actorul seamănă cu neuronii matricei striatali cu plasticitatea dependentă de dopamină. Interesant este că atât răspunsul la dopamină, cât și termenii de eroare teoretică sunt dependenți de semn. Acestea diferă de termenii de eroare cu valori absolute care nu fac discriminare între achiziție și dispariție și ar trebui să aibă efecte predominant atenționale.

APLICĂRI PENTRU PROBLEME NEUROBIOLOGICE.

Deși inițial dezvoltate pe baza modelului Rescorla-Wagner de condiționare clasică, modelele care folosesc algoritmi TD învață o mare varietate de sarcini comportamentale prin forme esențial instrumentale de condiționare. Aceste sarcini pot ajunge de la echilibrarea unui stâlp pe o roată de căruță (Barto și colab. 1983) pentru a juca backgammonul clasei mondiale (Tesauro 1994). Roboții care folosesc algoritmii TD învață să se miște în spațiul bidimensional și să evite obstacolele, să atingă și să înțeleagă (Fagg 1993) sau introduceți o țepă într-o gaură (Gullapalli și colab. 1994). Utilizarea semnalului de armare TD pentru a influența și selecta direct comportamentul (Fig. 9 A), Modelele TD reproduc comportamentul de hrănire a albinelor (Montague și colab. 1995) și simulează luarea deciziilor umane (Montague și colab. 1996). Modelele TD cu o arhitectură explicită a actorului critic constituie modele foarte puternice care învață eficient mișcările ochilor (Friston și colab. 1994; Montague și colab. 1993), mișcări secvențiale (Fig. 10) și orientarea reacțiilor (Contreras-Vidal și Schultz 1996). Un model recent a adăugat semnale de noutate de activare-deprimare pentru îmbunătățirea semnalului de predare, a folosit urme de stimulare și acțiune în critic și actor și a folosit reguli câștigătoare-pentru a îmbunătăți semnalul de predare și pentru selectarea neuronilor actorului cu cea mai mare activare. Aceasta a reprodus în detaliu atât răspunsurile neuronilor dopaminei, cât și comportamentul de învățare a animalelor în sarcinile cu răspuns întârziat (Suri și Schultz 1996). Este deosebit de interesant de observat că semnalele de predare care utilizează erori de predicție au ca rezultat o învățare mai rapidă și mai completă în comparație cu semnalele de întărire necondiționate (Fig. 10) (Friston și colab. 1994).

Fig. 10. 

Avantajul semnalelor de întărire predictivă pentru învățare. Un model de diferență temporală cu arhitectura actorului critic și urmărirea eligibilității în actor a fost instruit într-o sarcină de alegere secvențială 2 pas-3 (introduceți stânga sus). Învățarea a avansat mai repede și a obținut performanțe mai mari atunci când a fost utilizat un semnal de întărire predictivă ca semnal de predare (critic adaptiv, top) în comparație cu utilizarea unui semnal de armare necondiționat la sfârșitul încercării (de jos). Acest efect devine progresiv mai accentuat cu secvențe mai lungi. Performanțele comparabile cu semnalul de armare necondiționată ar necesita o urmă de eligibilitate mult mai lungă. Datele au fost obținute din simulări 10 (R. Suri și W. Schultz, observații nepublicate). O îmbunătățire similară a învățării cu întărire predictivă a fost găsită într-un model de comportament oculomotor (Friston și colab. 1994).

Posibile mecanisme de învățare folosind semnalul de dopamină

Secțiunea precedentă a arătat că semnalul de eroare de predicție formal emis de răspunsul dopaminei poate constitui un semnal de învățare deosebit de potrivit pentru învățarea modelelor. Următoarele secțiuni descriu modul în care răspunsul biologic al dopaminei ar putea fi utilizat pentru învățarea de către structurile ganglionilor bazali și sugerează ipoteze testabile.

PLASTICITATEA POSTSINAPTICĂ MEDIATĂ PRIN SEMNALUL PREDICȚIEI REPARATE.

Învățarea va continua în doi pași. Primul pas implică achiziția unui răspuns de predicție a recompensei dopaminei. În studiile ulterioare, semnalul de dopamină predictivă ar consolida în mod specific greutățile sinaptice (ω) ale sinapselor corticostriatale de tip Hebbian, care sunt active la momentul stimulării de a recompensa, în timp ce sinapsele corticostriatale inactive sunt lăsate neschimbate. Aceasta duce la regula celor trei factori de învățare

Δω=ɛ rˆ i o

Ecuația 8 undeva r este semnal de întărire a dopaminei, i este activitate de intrare, o este activitate de ieșire și ɛ este rata de învățare.

Într-un model simplificat, patru intrări corticale (i1 – i4) intră în contact cu coloanele dendritice ale celor trei neuroni striatici spinoși de mărime medie (o1 – o3; Fig. 11). Intrările corticale converg asupra neuronilor striatali, fiecare intrare contactând o coloană vertebrală diferită. Aceeași coloană vertebrală sunt contactate în mod neselectiv de o intrare comună de dopamină R. Activarea aportului de dopamină R indică faptul că în mediul înconjurător a avut loc un stimulent neprevăzut de a recompensa recompensa, fără a oferi detalii suplimentare (semnal de bunătate). Să presupunem că aportul cortical i2 este activat simultan cu neuronii dopaminici și codifică unul dintre mai mulți parametri specifici aceluiași stimul care prezice recompensă, cum ar fi modalitatea sa senzorială, latura corpului, culoarea, textura și poziția sau un parametru specific al unei mișcări declanșat de stimul. Un set de parametri ai acestui eveniment ar fi codat de un set de intrări corticale i2. Intrările corticale i1, i3 și i4 care nu au legătură cu stimulii și mișcările actuale sunt inactive. Răspunsul dopaminei duce la eliberarea neselectivă a dopaminei la toate varicozitățile, dar ar întări selectiv doar sinapsele corticostriatale active i2 – o1 și i2 – o2, cu condiția ca aporturile corticale să fie suficient de puternice pentru a activa neuronii striatali o1 și o2.

Fig. 11. 

Influențe diferențiale ale unui semnal global de întărire a dopaminei asupra activității selective a corticostriatului. Coloanele vertebrale dendritice ale neuronilor striatali spini de dimensiuni medii 3 o1, o2 și o3 sunt contactate de inputuri corticale 4 i1, i2, i3 și i4 și prin varicozități axonale dintr-o neuronă dopamină neogenă R (sau de la o populație activată) ). Fiecare neuron striatal primește ∼10,000 corticale și 1,000 dopamine. La spine dendritice unice, diferite inputuri corticale converg cu aportul de dopamină. În versiunea 1 a modelului, semnalul de dopamină îmbunătățește transmisia corticostriatală simultană activă în raport cu transmisia nonactivă. De exemplu, aportul de dopamină R este activ în același timp cu intrarea corticală i2, în timp ce i1, i3, i4 sunt inactive. Aceasta duce la o modificare a transmisiei i2 → o1 și i2 → o2, dar lasă transmisiile i1 → o1, i3 → o2, i3 → o3 și i4 → o3. Într-o versiune a modelului care folosește plasticitate, greutățile sinaptice ale sinapselor corticostriatale sunt modificate pe termen lung prin semnalul de dopamină conform aceleiași reguli. Acest lucru poate apărea atunci când răspunsurile dopaminei la un stimul condiționat acționează asupra sinapselor corticostriatale care sunt de asemenea activate de acest stimul. Într-o altă versiune care folosește plasticitate, răspunsurile dopaminei la o recompensă primară pot acționa înapoi în timp asupra sinapselor corticostriatale care au fost anterior active. Aceste sinapsele ar fi eligibile pentru modificare printr-o ipotetică urmă neuronală postsinaptică rămasă din acea activitate. În compararea structurii ganglionilor bazali cu modelul TD recent al Fig. 9 B, aportul de dopamină R reproduce criticul cu neuron A, striatul cu neuroni o1 – o3 replică actorul cu neuron B, intrări corticale i1 – i4 replică intrarea actorului, iar proiecția divergentă a neuronilor dopaminelor R pe spine multiple ale neuronilor striatali multipli o1 – o3 replică influența globală a criticului asupra actorului. O comparație similară a fost făcută de Houk și colab. (1995). Acest desen se bazează pe date anatomice de Freund și colab. (1984), Smith și Bolam (1990), Flaherty și Graybiel (1993), și Smith și colab. (1994).

Acest mecanism de învățare folosește răspunsul dobândit de dopamină la momentul stimulării care prezice recompensele ca un semnal didactic pentru inducerea unor schimbări sinaptice de lungă durată (Fig. 12 A). Învățarea stimulului predictiv sau a mișcării declanșate se bazează pe achiziția demonstrată a răspunsului de dopamină la stimulul care prezice recompensă, împreună cu plasticitatea dependentă de dopamină în striat. Modificările de plasticitate pot apărea în mod alternativ în structurile corticale sau subcorticale în aval de striatum după îmbunătățirea pe termen scurt a mediatiei dopaminei de transmitere sinaptică în striatum. Efectele retroactive ale recompensei asupra stimulilor și mișcărilor anterioare recompensei sunt mediate de transferul de răspuns la cel mai timpuriu stimul prezicător. Răspunsul de dopamină la recompensa primară prevăzută sau omisă nu este utilizat pentru modificările de plasticitate ale striatului, deoarece nu apare simultan cu evenimentele care urmează să fie condiționate, deși ar putea fi implicat în calcularea răspunsului dopaminei la stimulul care prezice recompensa în analogie cu arhitectura și mecanismul modelelor TD.

Fig. 12. 

Influențele semnalului de consolidare a dopaminei asupra posibilelor mecanisme de învățare în striatum. A: răspunsul predictiv al recompensei dopaminei la un stimul condiționat (CS) are un efect direct de îmbunătățire sau de plasticitate asupra neurotransmisiei striatice legate de acel stimul. B: răspunsul dopaminei la recompensă primară are un efect de plasticitate retrogradă asupra neurotransmisiei striatice în legătură cu stimulul condiționat anterior. Acest mecanism este mediat printr-o urmă de eligibilitate care depășește activitatea striatică. Săgețile solide indică efectele directe ale semnalului de dopamină asupra neurotransmisiei striatale (A) sau urmele de eligibilitate (B), săgeată mică înăuntru B indică un efect indirect asupra neurotransmisiei striatale prin urmele de eligibilitate.

PLASTICITATEA POSTSINAPTICĂ ÎMPOTRIVĂ CU PĂRBA DE ELIGIBILITATE SINAPTICĂ.

Învățarea poate avea loc într-o singură etapă dacă semnalul de recompensă a dopaminei are o acțiune retroactivă asupra sinapselor striatale. Acest lucru necesită urme ipotetice ale activității sinaptice care durează până când apare întărirea și face ca acele sinapse să fie eligibile pentru modificare printr-un semnal didactic care erau active înainte de armare (Hull 1943; Klopf 1982; Sutton și Barto 19811). Greutățile sinaptice (ω) sunt modificate în funcție de

Δω=ɛ rˆ h (i,o)

Ecuația 9 undeva r este semnal de întărire a dopaminei, h (i, o) este urmă de eligibilitate a activității conjugate de intrare și ieșire și ɛ este rata de învățare. Substratele fiziologice potențiale ale urmelor de eligibilitate constau în modificări prelungite ale concentrației de calciu (Wickens și Kötter 1995), formarea proteinei kinazei II dependente de calmodulină (Houk și colab. 1995) sau activitate neuronală susținută frecvent întâlnită în striatum (Schultz și colab. 1995a) și cortex.

Plasticitatea dependentă de dopamina care implică urme de eligibilitate constituie un mecanism elegant pentru învățarea secvențelor înapoi în timp (Sutton și Barto 1981). Pentru început, răspunsul la dopamină la recompensa primară neprevăzută mediază învățarea comportamentală a evenimentului precedent prin modificarea eficacității sinaptice corticostriatale (Fig. 11). În același timp, răspunsul la dopamină se transferă la evenimentul care prezice recompensa. O depresie în momentul recompensării omise împiedică învățarea reacțiilor eronate. În pasul următor, răspunsul dopaminei la evenimentul neprevăzut care prezice recompensă mediază învățarea evenimentului predictiv imediat precedent, iar răspunsul la dopamină se transferă în același timp la acel eveniment. Întrucât acest lucru se întâmplă în mod repetat, răspunsul dopaminei se mișcă înapoi în timp, până nu mai precedă alte evenimente, permițând în fiecare etapă evenimentului precedent să obțină predicție de recompensă. Acest mecanism ar fi ideal pentru formarea secvențelor comportamentale care să conducă la o recompensă finală.

Acest mecanism de învățare folosește pe deplin eroarea de dopamină în predicția evenimentelor apetisante ca semnal didactic retroactiv care induce modificări sinaptice de lungă durată (Fig. 12 B). Utilizează plasticitatea dependentă de dopamină împreună cu urmele de eligibilitate striatală a căror adecvare biologică pentru învățare rămâne de investigat. Aceasta are ca rezultat învățarea directă după rezultat, în esență compatibilă cu influența semnalului de predare asupra actorului modelelor TD. Mișcarea retrogradă demonstrată a răspunsului dopaminei este utilizată pentru învățarea stimulilor mai devreme și mai vechi.

UN MECANISM ALTERNATIV: INFLUENȚA FACILITATORĂ A SEMNALULUI DE DOPAMINĂ PREDICATIVĂ.

Ambele mecanisme descrise mai sus folosesc răspunsul dopaminei ca un semnal didactic pentru modificarea neurotransmisiei în striatum. Întrucât contribuția plasticității striatale dependente de dopamină la învățare nu este înțeleasă în totalitate, un alt mecanism ar putea fi bazat pe plasticitatea demonstrată a răspunsului dopaminei fără a necesita plasticitate striatală. Într-o primă etapă, neuronii dopaminici dobândesc răspunsuri la stimulii care prezic recompensele. Într-o etapă ulterioară, răspunsurile predictive ar putea fi utilizate pentru a crește impactul intrărilor corticale care apar simultan la aceeași coloană vertebrală dendritică a neuronilor striatali. Activitatea post-sinaptică s-ar schimba conform

Δactivitate=δrˆ i

Ecuația 10 undeva r este semnal de întărire a dopaminei, i este activitate de intrare și δ este o constantă de amplificare. În loc să constituie un semnal didactic, răspunsul dopaminic predictiv oferă un semnal de îmbunătățire sau de motivare pentru neurotransmisia striată la momentul stimulării care prezice recompensă. Cu stimuli concurenti, inputurile neuronale care apar simultan cu semnalul de dopamină care prezice recompensă ar fi procesate în mod preferențial. Reacțiile comportamentale ar profita din informațiile avansate și ar deveni mai frecvente, mai rapide și mai precise. Influența facilitatoare a informațiilor în avans este demonstrată în experimentele comportamentale prin asocierea unui stimul condiționat cu apăsarea pârghiei (Lovibond 1983).

Un mecanism posibil poate utiliza efectul de focalizare al dopaminei. În modelul simplificat din Fig. 11, dopamina reduce la nivel global toate influențele corticale. Acest lucru permite doar cele mai puternice intrări să treacă la neuronii striatali, în timp ce celelalte intrări mai slabe devin ineficiente. Aceasta necesită un mecanism neliniar, care să crească contrastul, cum ar fi pragul pentru generarea potențialelor de acțiune. O îmbunătățire comparabilă a aporturilor cele mai puternice ar putea apărea la neuronii care ar fi excitat predominant de dopamină.

Acest mecanism folosește răspunsul dobamină dobândit și care prezice recompensă ca un semnal de părtinire sau de selecție pentru influențarea procesării postsinaptice (Fig. 12 A). Performanța îmbunătățită se bazează în totalitate pe plasticitatea demonstrată a răspunsurilor la dopamină și nu necesită plasticitate dependentă de dopamină în neuronii striatali. Răspunsurile la recompensele neprevăzute sau omise apar prea târziu pentru influențarea procesării striatale, dar pot ajuta la calcularea răspunsului dopaminic predictiv în analogie cu modelele TD.

Stimularea electrică a neuronilor dopaminici ca stimul necondiționat

Stimularea electrică a regiunilor circumscrise creierului servește în mod fiabil ca întărire pentru dobândirea și susținerea comportamentului de abordare (Olds și Milner 1954). Unele site-uri de auto-stimulare foarte eficiente coincid cu corpurile de celule dopaminice și mănunchii de axoni din creierul mijlociu (Corbett și Wise 1980), nucleul accumbens (Phillips și colab. 1975), striatum (Phillips și colab. 1976) și cortexul prefrontal (Mora și Myers 1977; Phillips și colab. 1979), dar se găsesc și în structuri care nu au legătură cu sistemele de dopamină (Alb și Milner 1992). Auto-stimularea electrică implică activarea neuronilor dopaminici (Fibiger și Phillips 1986; 1989 Wise and Rompré) și este redus de leziunile induse de 6-hydroxydopamine ale axonilor dopaminei (Fibiger și colab. 1987; Phillips și Fibiger 1978), inhibarea sintezei dopaminei (Edmonds și Gallistel 1977), inactivarea depolarizării neuronilor dopaminici (Rompré și Wise 1989) și antagoniști ai receptorilor dopaminei administrați sistemic (Furiezos și Wise 1976) sau în nucleu accumbens (Mogenson și colab. 1979). Auto-stimularea este facilitată prin creșterea indusă de cocaină sau de amfetamină a dopaminei extracelulare (Colle and Wise 1980; Stein 1964; Wauquier 1976). Auto-stimularea crește în mod direct utilizarea dopaminei în nucleul accumbens, striatum și cortexul frontal (Fibiger și colab. 1987; Mora și Myers 1977).

Este intrigant să ne imaginăm că impulsurile și eliberarea de dopamină evocate electric pot servi ca stimul necondiționat în învățarea asociativă, similar cu stimularea neuronilor octopaminei în albinele care învață reflexul proboscis (Ciocan 1993). Cu toate acestea, auto-stimularea legată de dopamină diferă în cel puțin trei aspecte importante de activarea naturală a neuronilor dopaminici. În loc să activeze doar neuronii dopaminici, recompensele naturale activează de obicei mai multe sisteme neuronale în paralel și permit codificarea distribuită a diferitelor componente de recompensă (vezi textul suplimentar). În al doilea rând, stimularea electrică se aplică ca întărire necondiționată, fără a reflecta o eroare în predicția recompenselor. În al treilea rând, stimularea electrică este livrată doar ca o recompensă după o reacție comportamentală, mai degrabă decât în ​​momentul unui stimul care prezice recompensă. Ar fi interesant să se aplice auto-stimularea electrică în același mod în care neuronii dopamină emit semnalul lor.

Deficiențe de învățare cu neurotransmisie de dopamină afectată

Multe studii au investigat comportamentul animalelor cu neurotransmisie de dopamină afectată după aplicarea locală sau sistemică a antagoniștilor receptorilor de dopamină sau distrugerea axonilor dopaminei în creierul central ventral, nucleus accumbens sau striatum. Pe lângă observarea deficitelor locomotorii și cognitive care amintesc de parkinsonism, aceste studii au relevat deficiențe în procesarea informațiilor despre recompense. Primele studii au argumentat deficite în percepția subiectivă, hedonică a recompenselor (Wise 1982; Wise și colab. 1978). Experimentarea ulterioară a evidențiat utilizarea afectată a recompenselor primare și a stimulilor apetitivi condiționați pentru abordare și comportament consumator (Beninger și colab. 1987; Ettenberg 1989; Miller și colab. 1990; Salamone 1987; Ungerstedt 1971; Wise and Colle 1984; Înțelept și Rompre 1989). Multe studii au descris deficiențe în procesele motivaționale și atenționale care stau la baza învățării apetitive (Beninger 1983, 1989; Beninger și Hahn 1983; Fibiger și Phillips 1986; LeMoal și Simon 1991; Robbins și Everitt 1992, 1996; Alb și Milner 1992; Wise 1982). Majoritatea deficitelor de învățare sunt asociate cu neurotransmisia dopaminei afectate în nucleul accumbens, în timp ce deficiențele de striat dorsal duc la deficite de senzoriAmalric și Koob 1987; Robbins și Everitt 1992; Alb 1989). Cu toate acestea, învățarea sarcinilor instrumentale în general și în special a proprietăților stimulative discriminatorii par a fi deseori scutite, și nu este în totalitate rezolvat dacă unele dintre deficiențele de învățare aparente pot fi confundate cu deficiențe de performanță motorie (Salamone 1992).

Degenerarea neuronilor dopaminergici în boala Parkinson duce, de asemenea, la o serie de deficite de învățare declarative și procedurale, inclusiv învățarea asociativă (Linden și colab. 1990; Sprengelmeyer și colab. 1995). Deficientele sunt prezente în învățarea încercărilor și a erorilor cu întărire imediată (Vriezen și Moscovitch 1990) și când asociați stimuli expliciți cu rezultate diferite (Knowlton și colab. 1996), chiar și în stadiile incipiente ale bolii Parkinson fără atrofie corticală (Canavan și colab. 1989). De asemenea, pacienții parkinsonieni prezintă percepția de timp afectată (Pastor și colab. 1992). Toate aceste deficiențe apar în prezența tratamentului L-Dopa, care restabilește nivelurile tonice de dopamină striatală fără a reinstala semnale de dopamină fazică.

Aceste studii sugerează că neurotransmisia dopaminei joacă un rol important în procesarea recompenselor pentru comportamentul de abordare și în formele de învățare care implică asocieri între stimuli și recompense, în timp ce o implicare în forme mai instrumentale de învățare ar putea fi pusă la îndoială. Nu este clar dacă aceste deficite reflectă o inactivare comportamentală mai generală datorită stimulării reduse tonic a receptorului dopamină, mai degrabă decât absența unui semnal de recompensă cu dopamină fazică. Pentru a rezolva această întrebare, precum și pentru a elucida mai precis rolul dopaminei în diferite forme de învățare, ar fi util să studiem învățarea în acele situații în care apare efectiv răspunsul dopaminic fazic la stimuli apetitivi.

Forme de învățare mediate posibil de semnalul de dopamină

Caracteristicile răspunsurilor la dopamină și influența potențială a dopaminei asupra neuronilor striatici pot ajuta la delimitarea unora dintre formele de învățare în care ar putea fi implicați neuronii dopaminici. Răspunsurile preferențiale la apetisant, spre deosebire de evenimentele aversive, ar favoriza implicarea în învățarea comportamentului de abordare și mediarea efectelor pozitive de întărire, mai degrabă decât retragerea și pedeapsa. Răspunsurile la recompensele primare în afara sarcinilor și contextelor de învățare ar permite neuronilor dopaminei să joace un rol într-un spectru relativ larg de învățare care implică recompense primare, atât în ​​condiționarea clasică, cât și în cea instrumentală. Răspunsurile la stimuli care prezic recompensă reflectă asociații stimul-recompensă și ar fi compatibile cu implicarea în așteptarea recompensei care stă la baza învățării stimulente generale (Bindra 1968). În schimb, răspunsurile la dopamină nu codifică în mod explicit recompensele ca obiecte, deoarece raportează doar erori în predicția recompenselor. De asemenea, par a fi insensibili la stările motivaționale, defavorizând astfel un rol specific în învățarea stimulativă dependentă de stat a actelor direcționate prin obiectiv (Dickinson și Balleine 1994). Lipsa unor relații clare cu mișcările brațului și ale ochilor ar defavoriza un rol în medierea directă a răspunsurilor comportamentale care urmează stimulii de stimulare. Cu toate acestea, comparațiile dintre descărcările de neuroni individuali și învățarea organismelor întregi sunt intrinsec dificile. La nivel sinaptic, dopamina eliberată treptat ajunge la numeroase dendrite pe probabil fiecare neuron striatal și ar putea astfel să exercite un efect de plasticitate asupra multitudinii de componente comportamentale care implică striatul, care poate include învățarea mișcărilor.

Condițiile specifice în care semnalele de dopamină fazică ar putea juca un rol în învățare sunt determinate de tipurile de stimuli care induc eficient un răspuns la dopamină. În laboratorul animalelor, răspunsurile la dopamină necesită apariția fazică a stimulilor apetitivi, noi sau deosebit de salienti, incluzând recompense primare de nutrienți și stimuli predictori de recompense, în timp ce stimulii aversivi nu joacă un rol major. Răspunsurile de dopamină pot apărea în toate situațiile comportamentale controlate de rezultate fazice și explicite, deși stimuli condiționați de ordin superior și armături secundare nu au fost încă testate. Răspunsurile cu dopamină fazică probabil nu ar juca un rol în formele de învățare care nu sunt mediate de rezultatele care apar fazic, iar răspunsul predictiv nu ar putea contribui la învățare în situații în care nu apar stimuli predictivi fazici, cum ar fi schimbări relativ lente ale contextului . Acest lucru duce la întrebarea interesantă dacă reducerea unor forme de învățare prin leziuni de dopamină sau neuroleptice ar putea pur și simplu să reflecte absența răspunsurilor fazice de dopamină în primul rând, deoarece stimulii eficienți care îi determină nu au fost folosiți.

Implicarea semnalelor de dopamină în învățare poate fi ilustrată printr-un exemplu teoretic. Imaginează-ți răspunsurile la dopamină în timpul achiziției unei sarcini de timp în reacție în serie, când o reacție corectă duce brusc la o recompensă de nutrienți. Răspunsul la recompensă este ulterior transferat la stimuli de predicție a recompenselor progresiv mai devreme. Timpii de reacție se îmbunătățesc în continuare cu o practică prelungită, deoarece pozițiile spațiale ale țintelor devin tot mai previzibile. Deși neuronii dopaminici continuă să răspundă la stimulii de predicție a recompenselor, îmbunătățirea ulterioară a comportamentului s-ar putea datora în principal achiziției procesării predictive a pozițiilor spațiale de către alte sisteme neuronale. Astfel, răspunsurile la dopamină ar apărea în timpul părții inițiale de stimulare a învățării în care subiecții ajung să se apropie de obiecte și să obțină recompense primare și, eventual, condiționate. Aceștia ar fi mai puțin implicați în situații în care progresul învățării depășește inducerea comportamentului de abordare. Acest lucru nu ar restricționa rolul dopaminei la etapele inițiale de învățare, deoarece multe situații necesită să învețe inițial din exemple și să implice abia mai târziu învățarea prin rezultate explicite.

COOPERARE ÎNTRE SEMNALELE REPARATE

Eroare de predicție

Semnalul de eroare de predicție al neuronilor dopaminici ar fi un indicator excelent al valorii apetitive a evenimentelor de mediu în raport cu predicția, dar nu reușește să discrimineze între alimente, lichide și stimuli de predicție a recompenselor și printre modalitățile vizuale, auditive și somatosenzoriale. Acest semnal poate constitui un mesaj de alertă prin care neuronii postsinaptici sunt informați despre apariția sau omiterea surprinzătoare a unui eveniment satisfăcător sau potențial răsplătitor, fără a indica în continuare identitatea acestuia. Are toate caracteristicile formale ale unui puternic semnal de armare pentru învățare. Cu toate acestea, informațiile despre natura specifică a recompenselor sunt cruciale pentru a determina care dintre obiecte trebuie abordate și în ce mod. De exemplu, un animal flămând ar trebui să se apropie în primul rând de mâncare, dar nu de lichid. Pentru a discrimina relevanța de recompense irelevante, semnalul de dopamină trebuie completat cu informații suplimentare. Experimentele recente de dializă in vivo au arătat o eliberare mai mare de dopamină indusă de alimente la foame decât la șobolani satiați (Wilson și colab. 1995). Această dependență de eliberare de eliberare de dopamină poate să nu implice răspunsuri de impuls, deoarece nu am reușit să găsim dependența clară de unitate cu răspunsurile de dopamină atunci când am comparat între perioadele precoce și cele târzii ale sesiunilor experimentale individuale în timpul cărora animalele s-au satiat fluid (JL Contreras-Vidal și W. Schultz, date nepublicate).

Specificul recompenselor

Informațiile referitoare la recompense lichide și alimentare sunt, de asemenea, procesate în structuri ale creierului, altele decât neuronii dopaminei, cum ar fi striatul dorsal și ventral, nucleul subthalamic, amigdala, cortexul prefrontal dorsolateral, cortexul orbitofrontal și cortexul cingulat anterior. Cu toate acestea, aceste structuri nu par să emită un semnal global de eroare de predicție a recompensei similare cu neuronii dopaminici. În primate, aceste structuri procesează recompense ca. 1) răspunsuri tranzitorii după livrarea recompensei (Apicella și colab. 1991a,b, 1997; Bowman și colab. 1996; Hikosaka și colab. 1989; Niki și Watanabe 1979; Nishijo și colab. 1988; Tremblay și Schultz 1995; Watanabe 1989), 2) răspunsuri tranzitorii la indicii de predicție a recompenselor (Aosaki și colab. 1994; Apicella și colab. 1991b; 1996; Hollerman și colab. 1994; Nishijo și colab. 1988; Thorpe și colab. 1983; Tremblay și Schultz 1995; Williams și colab. 1993), 3) activări susținute în timpul așteptării unor recompense imediat următoare (Apicella și colab. 1992; Hikosaka și colab. 1989; Matsumura și colab. 1992; Schultz și colab. 1992; Tremblay și Schultz 1995), Şi 4) modulări ale activărilor legate de comportament prin recompensă prevăzută (Hollerman și colab. 1994; Watanabe 1990, 1996). Mulți dintre acești neuroni diferențiază bine între recompense alimentare diferite și între recompense lichide diferite. Astfel, ele procesează natura specifică a evenimentului recompensator și pot servi percepția recompenselor. Unele dintre răspunsurile la recompense depind de imprevizibilitatea recompensei și sunt reduse sau absente atunci când recompensa este prevăzută de un stimul condiționat (Apicella și colab. 1997; Matsumoto și colab. 1995; L. Tremblay și W. Schultz, date nepublicate). Aceștia pot procesa predicții pentru recompense specifice, deși nu este clar dacă semnalează erori de predicție, deoarece răspunsurile lor la recompense omise nu sunt cunoscute.

Menținerea performanțelor stabilite

Trei mecanisme neuronale par a fi importante pentru menținerea performanței comportamentale consacrate, și anume detectarea recompenselor omise, detectarea stimulilor de predicție a recompenselor și detectarea recompenselor prezise. Neuronii Dopamina sunt deprimați atunci când sunt omise recompensele preconizate. Acest semnal ar putea reduce eficacitatea sinaptică legată de răspunsurile comportamentale eronate și de a preveni repetarea acestora. Răspunsul dopaminei la stimuli care prezic recompensă este menținut în timpul comportamentului stabilit și, astfel, continuă să servească drept informație avansată. Deși recompensele pe deplin prevăzute nu sunt detectate de neuronii dopaminici, ele sunt prelucrate de sistemele nondopaminergice corticale și subcorticale menționate mai sus. Acest lucru ar fi important pentru evitarea dispariției comportamentului învățat.

Luate împreună, se pare că prelucrarea unor recompense specifice pentru învățare și menținerea comportamentului abordării ar profita puternic dintr-o cooperare între neuronii dopaminici care semnalează apariția sau omisiunea neprevăzută a recompensei și neuronilor în celelalte structuri simultan, indicând natura specifică a recompensei.

COMPARATE CU ALTE SISTEME DE PROIECȚIE

Neuronii noradrenalinei

Aproape întreaga populație de neuroni noradrenalină din locus coeruleus la șobolani, pisici și maimuțe arată răspunsuri destul de omogene, activatoare-deprimante bifazice la stimuli vizuali, auditivi și somatosenzoriali care provoacă reacții orientative (Aston-Jones și Bloom 1981; Foote și colab. 1980; Rasmussen și colab. 1986). Sunt deosebit de eficiente evenimentele rare la care animalele acordă atenție, cum ar fi stimulii vizuali într-o sarcină de discriminare ciudată (Aston-Jones și colab. 1994). Neuronii noradrenalinei discriminează foarte bine între evenimentele trezitoare sau motivaționale și neutre. Ei dobândesc rapid răspunsuri la noi stimuli țintă în timpul inversării și își pierd răspunsurile la țintele anterioare înainte de inversarea comportamentului (Aston-Jones și colab. 1997). Răspunsurile apar la eliberarea lichidului în afara oricărei sarcini și se transferă la stimulii țintă care prezic recompense în cadrul unei sarcini, precum și la stimuli aversivi primari și condiționați (Aston-Jones și colab. 1994; Foote și colab. 1980; Rasmussen și Jacobs 1986; Sara și Segal 1991). Răspunsurile sunt adesea tranzitorii și par să reflecte modificări ale apariției sau semnificației stimulului. Activările pot apărea numai pentru câteva încercări cu prezentări repetate de obiecte alimentare (Vankov și colab. 1995) sau cu stimuli auditivi condiționați asociați cu recompensă lichidă, puf de aer aversiv sau șoc electric de picior (Rasmussen și Jacobs 1986; Sara și Segal 1991). În timpul condiționării, răspunsurile apar la primele câteva prezentări ale stimulilor noi și reapar tranzitorii ori de câte ori se schimbă contingențele de armare în timpul achiziției, inversării și stingerii (Sara și Segal 1991).

Luate împreună, răspunsurile neuronilor noradrenalină seamănă cu răspunsurile neuronilor dopaminei în mai multe privințe, fiind activate de recompense primare, stimuli care prezic recompensă și stimuli noi și transferă răspunsul de la evenimentele apetitive primare la condiționate. Cu toate acestea, neuronii noradrenalină diferă de neuronii dopaminei, răspunzând la o varietate mult mai mare de stimuli trezitori, reacționând bine la stimuli aversivi primari și condiționați, prin discriminarea bine împotriva stimulilor neutri, prin urmărirea rapidă a inversărilor comportamentale și prin afișarea de răspunsuri decrementante cu stimul repetat prezentare care poate necesita teste 100 pentru răspunsuri apetitive solide (Aston-Jones și colab. 1994). Răspunsurile la noradrenalină sunt strâns legate de proprietățile care stârnesc sau atrag atenția stimulilor care determină reacții orientative, fiind în același timp concentrate mult mai puțin pe proprietățile stimulului apetitiv, precum majoritatea neuronilor dopaminici. Probabil sunt determinate mai mult de atragerea atenției decât de motivele componente ale evenimentelor apetisante.

Neuronii serotoninei

Activitatea în diferitele nuclee raphe facilitează ieșirea motorie prin setarea tonusului muscular și a activității motorii stereotipate (Jacobs și Fornal 1993). Neuronii raphe dorsali la pisici prezintă răspunsuri fazice, neabitente la stimuli vizuali și auditivi, fără o semnificație comportamentală particulară (Heym și colab. 1982; LeMoal și Olds 1979). Aceste răspunsuri seamănă cu răspunsurile neuronilor dopaminei la stimuli noi și deosebit de importanți. Comparațiile ulterioare ar necesita o experimentare mai detaliată.

Nucleus basalis Meynert

Neuronii primari ai antebrainului bazal sunt activați treptat de o mare varietate de evenimente comportamentale incluzând stimuli condiționați, care prezic recompense și recompense primare. Multe activări depind de memorie și asociații cu consolidare în discriminare și sarcini cu răspuns întârziat. Activările reflectă familiaritatea stimulilor (Wilson and Rolls 1990a), deveniți mai importanți, deoarece stimulii și mișcările apar mai aproape de momentul recompensei (Richardson și DeLong 1990), diferențiați bine între stimuli vizuali pe baza asociațiilor apetitive și aversive (Wilson and Rolls 1990b) și schimbați în câteva încercări în timpul inversării (Wilson and Rolls 1990c). De asemenea, neuronele sunt activate de stimuli aversivi, stimuli vizuali și auditivi și mișcări. Ei răspund frecvent la recompensele pe deplin prevăzute în sarcinile comportamentale bine stabilite (Mitchell și colab. 1987; Richardson și DeLong 1986, 1990), deși răspunsurile la recompense neprevăzute sunt mai abundente în unele studii (Richardson și DeLong 1990) dar nu și în altele (Wilson and Rolls 1990a-c). În comparație cu neuronii dopaminici, aceștia sunt activi de un spectru mult mai mare de stimuli și evenimente, inclusiv evenimente aversive, și nu arată răspunsul destul de omogen la recompense neprevăzute și transferul acesteia către stimuli predictori de recompense.

Fibrele de cățărare cerebeloasă

Probabil că primul semnal de învățare determinat de erori în creier a fost postulat pentru a implica proiecția fibrelor care urcă de la măslinul inferior la neuronii Purkinje din cortexul cerebelos (Marr 1969) și multe studii de învățare a cerebelelor se bazează pe acest concept (Houk și colab. 1996; Pentru a 1989; Kawato și Gomi 1992; Llinele și galezul 1993). Intrările de fibre care urcă la neuronii Purkinje își schimbă tranzitoriu activitatea atunci când se schimbă sarcini pentru mișcări sau câștiguri între mișcări și feedback vizual și maimuțele se adaptează la noua situație (Gilbert și Thach 1977; Ojakangas și Ebner 1992). Majoritatea acestor schimbări constau în creșterea activității, mai degrabă decât activarea versus răspunsurile la depresie, observate cu erori în direcții opuse în neuronii dopaminici. Dacă activarea fibrelor de escaladă ar servi ca semnal de predare, activarea concomitentă a fibrei paralele ar trebui să conducă la modificări ale aportului de fibre paralele pentru neuronii Purkinje. Acest lucru se produce într-adevăr ca o depresie pe termen lung a aportului de fibre paralele, în principal în preparatele in vitro (Pentru a 1989). Cu toate acestea, schimbările comparabile ale fibrelor paralele sunt mai greu de găsit în situațiile de învățare comportamentală (Ojakangas și Ebner 1992), lăsând deschise consecințele potențialelor semnale de predare a fibrelor în ascensiune.

Un al doilea argument pentru un rol al ascensiunii fibrelor în învățare implică o condiționare clasică aversivă. O fracțiune de fibre care se înalță este activată de pufuri de aer aversive spre cornee. Aceste răspunsuri se pierd după condiționarea pleoapelor Pavloviene cu ajutorul unui stimul auditiv (Sears și Steinmetz 1991), sugerând o relație cu imprevizibilitatea evenimentelor primare aversive. După condiționare, neuronii din nucleul interpositului cerebelos răspund la stimulul condiționat (Berthier și Moore 1990; McCormick și Thompson 1984). Leziuni ale acestui nucleu sau injecții ale biciclulinei antagoniste GABA în măslinul inferior previne pierderea răspunsurilor inferioare ale aerului de măsline după condiționare, ceea ce sugerează că inhibiția monosinaptică sau polisinaptică de la interpositus la măslinul inferior suprimă răspunsurile după condiționare (Thompson și Gluck 1991). Acest lucru ar putea permite neuronilor inferiori de măsline să fie deprimați în absența stimulilor aversivi prevăzuți și, astfel, să raporteze o eroare negativă în predicția evenimentelor aversive similare cu neuronii dopaminici.

Astfel, fibrele de cățărare pot raporta erori în performanța motorie și erori în predicția evenimentelor aversive, deși acest lucru nu poate implica întotdeauna modificări bidirecționale ca în cazul neuronilor dopaminici. Fibrele care urcă nu par să obțină răspunsuri la stimuli aversivi condiționați, dar astfel de răspunsuri se găsesc în nucleul interpositus. Calculul erorilor de predicție aversivă poate presupune coborârea intrărilor inhibitoare la neuronii inferiori de măsline, în analogie cu proiecțiile striatale la neuronii dopaminici. Astfel, circuitele cerebelare procesează semnale de eroare, deși diferă de neuronii dopaminei și modelele TD, și ar putea implementa reguli de învățare a erorilor precum regula Rescorla-Wagner (Thompson și Gluck 1991) sau regula echivalentă formală Widrow-Hoff (Kawato și Gomi 1992).

DEFICITĂȚI DE SEMNALĂ VERSUS PARKINSONIAN REPRODUCERE DOPAMINE

Afectarea neurotransmisiei dopaminei cu boala Parkinson, leziuni experimentale sau tratament neuroleptic este asociată cu multe deficite comportamentale în mișcare (akinezie, tremor, rigiditate), cognitivă (atenție, bradifrenie, planificare, învățare) și motivație (răspunsuri emoționale reduse, depresie). Gama de deficite pare prea largă pentru a fi explicată pur și simplu printr-un semnal de recompensă cu dopamină care funcționează defectuos. Cele mai multe deficite sunt considerabil ameliorate de terapia sistemică cu precursori dopaminici sau agoniști ai receptorilor, deși acest lucru nu poate restabili într-o manieră simplă transmisia informației fazice prin impulsuri neuronale. Cu toate acestea, multe deficite apetitive nu sunt restabilite prin această terapie, cum ar fi deficitele de discriminare induse farmacologic (Ahlenius 1974) și deficite de învățare parkinsoniană (Canavan și colab. 1989; Knowlton și colab. 1996; Linden și colab. 1990; Sprengelmeyer și colab. 1995; Vriezen și Moscovitch 1990).

Din aceste considerente, se pare că neurotransmisia dopaminei joacă două funcții separate în creier, procesarea fazică a informațiilor apetisante și de alertă și posibilitatea tonică a unei game largi de comportamente fără codificare temporală. Deficitele unei funcții duble de dopamină pot sta la baza fiziopatologiei schizofreniei (Grace 1991). Este interesant de menționat că pot apărea modificări fazice ale activității dopaminei la diferite scări de timp. Întrucât răspunsurile la recompensă urmează o perioadă de timp de ordinul a zeci și sute de milisecunde, studiile de eliberare a dopaminei cu voltammetrie și microdialyse se referă la scări de timp de minute și dezvăluie un spectru mult mai larg de funcții de dopamină, inclusiv prelucrarea recompenselor, alimentarea, băutul, pedepse, stres și comportament social (Abercrombie et al. 1989; Church și colab. 1987b; Doherty și Gratton 1992; Louilot și colab. 1986; Young și colab. 1992, 1993). Se pare că neurotransmisia dopaminei urmărește cel puțin trei scări de timp cu roluri progresiv mai largi în comportament, de la funcția rapidă, destul de restrânsă, de semnalizare a recompenselor și de alertare a stimulilor printr-o funcție mai lentă de procesare a unei game considerabile de evenimente care motivează pozitiv și negativ funcția tonică. de a permite o mare varietate de procese motorii, cognitive și motivaționale.

Funcția tonică de dopamină se bazează pe concentrații de dopamină extracelulare scăzute și susținute în striatum (5 – 10 nM) și în alte zone innervate cu dopamină care sunt suficiente pentru a stimula receptorii de dopamină extrasinaptici, în majoritate D2, în starea lor de afinitate ridicată (9-74 nM; Fig. 8) (Richfield și colab. 1989). Această concentrare este reglată local într-un interval restrâns, prin revărsare sinaptică și eliberare extrasinaptică de dopamină indusă de activitatea tonică spontană de impuls, transportul recaptării, metabolismul, eliberarea mediată de autoreceptor și controlul sintezei și influența presinaptică a glutamatului asupra eliberării dopaminei (Șahet 1984). Importanța concentrațiilor de dopamină ambientală este demonstrată experimental prin efectele dăunătoare ale nivelurilor nefiziologice de stimulare a receptorilor. Stimularea redusă a receptorului de dopamină după leziunile aferentelor dopaminei sau administrarea locală de antagoniști ai dopaminei în cortexul prefrontal duce la o performanță deteriorată a sarcinilor spațiale cu răspuns întârziat la șobolani și maimuțe (Brozoski și colab. 1979; Sawaguchi și Goldman-Rakic ​​1991; Simon și colab. 1980). Interesant este că creșterile cifrei de afaceri pre-frontale a dopaminei induc deteriorări similare (Elliott și colab. 1997; Murphy și colab. 1996). Aparent, stimularea tonică a receptorilor dopaminei nu trebuie să fie nici prea mică, nici prea mare pentru a asigura o funcție optimă a unei anumite regiuni cerebrale. Schimbarea influenței dopaminei ambientale bine reglementate ar compromite funcționarea corectă a neuronilor striatali și corticali. Diferite regiuni ale creierului pot necesita niveluri specifice de dopamină pentru medierea funcțiilor comportamentale specifice. Se poate specula că concentrațiile de dopamină ambientale sunt de asemenea necesare pentru menținerea plasticității sinaptice striatice induse de un semnal de recompensă a dopaminei. Un rol al dopaminei tonice în plasticitatea sinaptică este sugerat de efectele dăunătoare ale blocării receptorilor de dopamină sau eliminarea receptorului D2 asupra depresiei posttetanice (Calabresi și colab. 1992a, 1997).

Numeroase alte neurotransmițătoare există și în concentrații medii scăzute în lichidul extracelular, cum ar fi glutamatul în striatum (0.9 μM) și cortex (0.6 μM) (Herrera-Marschitz și colab. 1996). Aceasta poate fi suficientă pentru a stimula receptorii extrem de sensibili ai NMDA (Nisipuri și Barish 1989) dar nu și alte tipuri de receptori ai glutamatului (Kiskin și colab. 1986). Glutamatul ambiental facilitează acțiunea activității potențiale prin stimularea receptorului NMDA în hipocampus (Sah și colab. 1989) și activează receptorii NMDA în cortexul cerebral (Blanton și Kriegstein 1992). Nivelurile de glutamat tonic sunt reglate prin absorbția cerebelului și cresc în timpul filogenezei, influențând migrația neuronală prin stimularea receptorului NMDA (Rossi și Slater 1993). Alți neurotransmițători există și în concentrații medii scăzute, cum ar fi aspartatul și GABA în striatum și cortexul frontal (0.1 μM și respectiv 20 nM) (Herrera-Marschitz și colab. 1996) și adenozină în hipocamp în care este implicată în inhibarea presinaptică (Manzoni și colab. 1994). Deși incompletă, această listă sugerează că neuronii din multe structuri ale creierului sunt scăldați permanent într-o supă de neurotransmițători care are efecte fiziologice puternice, specifice, asupra excitabilității neuronale.

Având în vedere importanța generală a concentrațiilor tonice extracelulare ale neurotransmițătorilor, se pare că gama largă de simptome parkinsoniane nu s-ar datora transmiterii deficiente a informațiilor despre recompense de către neuronii dopaminici, ci reflectă o defecțiune a neuronilor striatali și corticali, datorită posibilității de deteriorare a dopaminei ambientale reduse . Neuronii Dopamine nu ar fi implicați activ în gama largă de procese deficitare în parkinsonism, ci oferă pur și simplu concentrația de fond a dopaminei necesare pentru a menține funcționarea corectă a neuronilor striatali și corticali implicați în aceste procese.

recunoasteri

Îi mulțumesc domnilor. Dana Ballard, Anthony Dickinson, Francois Gonon, David D. Potter, Traverse Slater, Roland E. Suri, Richard S. Sutton și R. Mark Wightman pentru discuții edificatoare și comentarii, precum și doi arbitri anonimi pentru comentarii ample.

Lucrarea experimentală a fost susținută de Fundația Națională a Științei Elvețiene (în prezent 31.43331.95), Capitalul uman și mobilitatea și programele Biomed 2 ale Comunității Europene prin intermediul Oficiului Elvețian pentru Educație și Știință (CHRX-CT94-0463 via 93.0121 și BMH4-CT95 –0608 prin 95.0313 – 1), James S. McDonnell Foundation, Roche Research Foundation, United Parkinson Foundation (Chicago) și British Council.

REFERINȚE

    1. Abercrombie ED,
    2. Keefe KA,
    3. DiFrischia DS,
    4. Zigmond MJ

    (1989) Efectul diferențial al stresului asupra eliberării in vivo a dopaminei în striatum, nucleus accumbens și cortexul frontal medial. J. Neurochem. 52: 1655-1658.

    1. Ahlenius S.

    (1974) Efectele dozelor mici și mari de L-dopa asupra tetrabenazinei sau a reprimării comportamentului indusă de α-metiltirozină într-o sarcină de discriminare succesivă. Psychopharmacologia 39: 199-212.

    1. Alexander GE,
    2. DeLong MR,
    3. Strick PL

    (1986) Organizarea paralelă a circuitelor segregate funcțional care leagă ganglionii și cortexul bazal. Annu. Rev. Neurosci. 9: 357-381.

    1. Amalric M.,
    2. Koob GF

    (1987) Epuizarea dopaminei în nucleul caudat, dar nu în nucleul accumbens, afectează performanța în timp de reacție. J. Neurosci. 7: 2129-2134.

    1. Andén NE,
    2. Fuxe K.,
    3. Hamberger B.,
    4. Hökfelt T. A

    (1966) studiu cantitativ asupra neuronilor de dopamină nigro-neostriatală. Acta Physiol. Scand. 67: 306-312.

    1. Anglade P.,
    2. Mouatt-Prigent A.,
    3. Agid Y.,
    4. Hirsch EC

    (1996) Plasticitatea sinaptică în nucleul caudat al pacienților cu boala Parkinson. neurodegeneration 5: 121-128.

    1. Aosaki T.,
    2. Tsubokawa H.,
    3. Ishida A.,
    4. Watanabe K.,
    5. Graybiel AM,
    6. Kimura M.

    (1994) Răspunsurile neuronilor activi din punct de vedere tonic din striatul primatului suferă modificări sistematice în timpul condiționării senzorimotorii comportamentale. J. Neurosci. 14: 3969-3984.

    1. Apicella P.,
    2. Legaleta E.,
    3. Trouche E.

    (1996) Răspunsurile de descărcare tonică a neuronilor în striatul maimuței la stimuli vizuali prezentați în condiții pasive și în timpul îndeplinirii sarcinii. Neurosci. Lett. 203: 147-150.

    1. Apicella P.,
    2. Legaleta E.,
    3. Trouche E.

    (1997) Răspunsurile de descărcare tonică de neuroni în striatum maimuță la recompensele primare livrate în diferite stări de comportament. Exp. Brain Res. 116: 456-466.

    1. Apicella P.,
    2. Ljungberg T.,
    3. Scarnati E.,
    4. Schultz W.

    (1991a) Răspunsuri pentru a răsplăti în striatul maimuței dorsale și ventrale. Exp. Brain Res. 85: 491-500.

    1. Apicella P.,
    2. Scarnati E.,
    3. Ljungberg T.,
    4. Schultz W.

    (1992) Activitate neuronală în striatum maimuță legată de așteptarea evenimentelor de mediu previzibile. J. Neurophysiol. 68: 945-960.

    1. Apicella P.,
    2. Scarnati E.,
    3. Schultz W.

    (1991b) Neuronii care se descarcă tonic de striatum maimuță răspund la stimuli pregătitori și plină de satisfacții. Exp. Brain Res. 84: 672-675.

    1. Arbib MA,
    2. Dominey PF

    (1995) Modelarea rolurilor ganglionilor bazali în sincronizarea și secvențierea mișcărilor saccadice ale ochilor. în Modele de prelucrare a informațiilor în Ganglionul bazal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambridge, MA), pp 149 – 162.

    1. Arbuthnott GW,
    2. Ingham CA

    (1993) Problema spinoasă a ceea ce face dopamina în bolile psihiatrice. Prog. Brain Res. 99: 341-350.

    1. Aston-Jones G.,
    2. Înflorește FE

    (1981) Neuronii de locus coeruleus conținând norepinefrină în șobolani comportați prezintă răspunsuri pronunțate la stimuli nepericuloși ai mediului. J. Neurosci. 1: 887-900.

    1. Aston-Jones G.,
    2. Rajkowski J.,
    3. Kubiak P.

    (1997) Răspunsurile condiționate ale neuronilor locus coeruleus neuroni anticipează dobândirea unui comportament discriminatoriu într-o sarcină de vigilență. Neuroştiinţe 80: 697-716.

    1. Aston-Jones G.,
    2. Rajkowski J.,
    3. Kubiak P.,
    4. Alexinsky T.

    (1994) Neuronii de Locus coeruleus la maimuță sunt activați selectiv prin indicii participanți într-o sarcină de vigilență. J. Neurosci. 14: 4467-4480.

    1. Ballard DH

    (1997) O introducere în calculul neuronal. (MIT Press, Cambridge, MA).

    1. Barto AG

    (1995) Critici adaptivi și ganglioni bazali. în Modele de prelucrare a informațiilor în Ganglionul bazal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambridge, MA), pp 215 – 232.

    1. Barto AG,
    2. Anandan P.

    (1985) Automate de învățare stocastică care recunosc modelul. IEEE Trasnact. Syst. Omul Cybern. 15: 360-375.

    1. Barto AG,
    2. Sutton RS,
    3. Anderson CW

    (1983) Elemente adaptive neuronale care pot rezolva probleme dificile de învățare. IEEE Trans Syst. Omul cibernetic. 13: 834-846.

    1. Beninger RJ

    (1983) Rolul dopaminei în activitatea locomotorie și în învățare. Brain Res. Rev. 6: 173-196.

    1. Beninger RJ

    (1989) Disocierea efectelor funcției dopaminergice modificate asupra performanței și învățării. Brain Res. Taur. 23: 365-371.

    1. Beninger RJ,
    2. Cheng M.,
    3. Hahn BL,
    4. Hoffman DC,
    5. Mazurski EJ

    (1987) Efectele extincției, pimozidei, SCH 23390 și metoclopramidei asupra operantului răsplătit de alimente care răspund la șobolani. Psychopharmacology 92: 343-349.

    1. Beninger RJ,
    2. Hahn BL

    (1983) Pimozida blochează stabilirea, dar nu expresia condiționării specifice mediului produs de amfetamină. Ştiinţă 220: 1304-1306.

    1. Berendse HW,
    2. Groenewegen HJ,
    3. Lohman AHM

    (1992) Distribuția compartimentală a neuronilor striatici ventrali care se proiectează către mezencefalon la șobolan. J. Neurosci. 12: 2079-2103.

    1. Berger B.,
    2. Trottier S.,
    3. Verney C.,
    4. Gaspar P.,
    5. Alvarez C.

    (1988) Distribuția regională și laminară a inaminării dopaminei și serotoninei în cortexul cerebral macac: studiu radioautografic. J. Comp. Neural. 273: 99-119.

    1. Bergson C.,
    2. Mrzljak L.,
    3. Smiley JF,
    4. Pappy M.,
    5. Levenson R.,
    6. PS Goldman-Rakic

    (1995) Variații regionale, celulare și subcelulare în distribuția D1 și D5 receptorii dopaminei din creierul primat. J. Neurosci. 15: 7821-7836.

    1. Berthier NE,
    2. Moore JW

    (1990) Activitatea celulelor nucleare cerebeloase profunde în timpul condiționării clasice a extensiei membranei nictitante la iepuri. Exp. Brain Res. 83: 44-54.

    1. Bindra D.

    (1968) Interpretarea neuropsihologică a efectelor motivației și stimulării motivației asupra activității generale și a comportamentului instrumental. Psychol. Rev. 75: 1-22.

    1. Blanton MG,
    2. Kriegstein AR

    (1992) Proprietățile receptorilor neurotransmițătorului aminoacid al neuronilor corticali embrionari atunci când sunt activate de agoniști exogeni și endogeni. J. Neurophysiol. 67: 1185-1200.

    1. Bo Beijinga PH,
    2. Mulder AB,
    3. Pennartz CMA,
    4. Manshanden I.,
    5. Lopes da Silva FH

    (1993) Răspunsurile nucleului accumbens în urma stimulării fornix / fimbria la șobolan. Identificarea și potențarea pe termen lung a căilor mono și polisinaptice. Neuroştiinţe 53: 1049-1058.

    1. Bolam JP,
    2. Francis CM,
    3. Henderson Z.

    (1991) Introducere colinergică la neuronii dopaminici în substanța nigra: un studiu imunocitochimic dublu. Neuroştiinţe 41: 483-494.

    1. Bolles RC

    (1972) Consolidare, speranță și învățare. Psychol. Rev. 79: 394-409.

    1. Bowman EM,
    2. Aigner TG,
    3. Richmond BJ

    (1996) Semnalele neurale în striatumul ventral al maimuței, legate de motivația pentru recompensele de suc și cocaină. J. Neurophysiol. 75: 1061-1073.

    1. Bouyer JJ,
    2. Parc DH,
    3. Joh TH,
    4. Pickel VM

    (1984) Analiza chimică și structurală a relației dintre inputurile corticale și terminalele care conțin hidrosilază de tirozină la neostriatul de șobolan. Brain Res. 302: 267-275.

    1. Brown JR,
    2. Arbuthnott GW

    (1983) Electrofiziologia dopaminei (D2) receptori: un studiu al acțiunilor dopaminei asupra transmiterii corticostriatale. Neuroştiinţe 10: 349-355.

    1. Brozoski TJ,
    2. Brown RM,
    3. Rosvold HE,
    4. Goldman PS

    (1979) Deficit cognitiv cauzat de epuizarea regională a dopaminei în cortexul prefrontal al maimuței rhesus. Ştiinţă 205: 929-932.

    1. Caillé I.,
    2. Dumartin B.,
    3. Bloch B.

    (1996) Localizarea ultrastructurală a imunoreactivității receptorului dopaminei D1 în neuronii striatonigrali de șobolan și relația sa cu inervația dopaminergică. Brain Res. 730: 17-31.

    1. Calabresi P.,
    2. Maj R.,
    3. Pisani A.,
    4. Mercuri NB,
    5. Bernardi G.

    (1992a) Depresie sinaptică pe termen lung în striatum: caracterizare fiziologică și farmacologică. J. Neurosci. 12: 4224-4233.

    1. Calabresi P.,
    2. Pisani A.,
    3. Mercuri NB,
    4. Bernardi G.

    (1992b) Potențializarea pe termen lung în striatum este demascată prin eliminarea blocului de magneziu dependent de tensiune din canalele receptorilor NMDA. EURO. J. Neurosci. 4: 929-935.

    1. Calabresi P.,
    2. Saiardi A.,
    3. Pisani A.,
    4. Baik JH,
    5. Centonze D.,
    6. Mercuri NB,
    7. Bernardi G.,
    8. Borelli E.

    (1997) Plasticitate sinaptică anormală în striatul șoarecilor lipsiți de receptorii D2 de dopamină. J. Neurosci. 17: 4536-4544.

    1. AGA Canavan,
    2. Passingham RE,
    3. CD-ul Marsden,
    4. Quinn N.,
    5. Wyke M.,
    6. Polkey CE

    (1989) Performanța la sarcinile de învățare a pacienților aflați în stadiile incipiente ale bolii Parkinson. Neuropsychologia 27: 141-156.

    1. Cepeda C.,
    2. Buchwald NA,
    3. MS Levine

    (1993) Acțiunile neuromodulatoare ale dopaminei în neostriatum sunt dependente de subtipurile de receptori ai acidului aminao excitativ activate. Proc. Natl. Acad. Sci. Statele Unite ale Americii 90: 9576-9580.

    1. Cepeda C.,
    2. Chandler SH,
    3. Shumate LW,
    4. MS Levine

    (1995) Na persistent+ conductanță în neuronii neostriatali de dimensiuni medii: caracterizare folosind videomicroscopie în infraroșu și înregistrări cu patch-clamp de celule întregi. J. Neurophysiol. 74: 1343-1348.

    1. Cepeda C.,
    2. Colwell CS,
    3. Itri JN,
    4. Chandler SH,
    5. MS Levine

    (1998) Modulația dopaminergică a curenților de celule întregi induse de NMDA în neuronii neostriatali în felii: contribuția conductanților calciului. J. Neurophysiol. 79: 82-94.

    1. Chergui K.,
    2. Suaud-Chagny MF,
    3. Gonon F.

    (1994) Relație neliniară între fluxul de impuls, eliberarea de dopamină și eliminarea dopaminei în creierul de șobolan in vivo. Neurocience 62: 641-645.

    1. Șahulet MF

    (1984) Reglarea presinaptică a eliberării neurotransmițătorului în creier: fapte și ipoteze. Neuroştiinţe 12: 347-375.

    1. Biserica WH,
    2. Justice JB Jr.,
    3. Byrd LD

    (1987) Dopamina extracelulară în striatul de șobolan după inhibarea absorbției de cocaină, nomifensină și benztropină. EURO. J. Pharmacol. 139: 345-348.

    1. Biserica WH,
    2. Justice JB Jr.,
    3. Neill DB

    (1987) Detectarea schimbărilor relevante din punct de vedere comportamental în dopamina extracelulară cu microdialysis. Brain Res. 412: 397-399.

    1. Clarke PBS,
    2. Hommer DW,
    3. Pert A.,
    4. Skirboll LR

    (1987) Inervarea neuronilor substantia nigra de către aferentele colinergice din nucleul pedunculopontin la șobolan: dovezi neuroanatomice și electrofiziologice. Neuroştiinţe 23: 1011-1019.

    1. Colle WM,
    2. Intelept RA

    (1980) Efectele nucleului accumbens amfetamina asupra stimulării cerebrale hipotalamusului lateral recompensează. Brain Res. 459: 356-360.

    1. Contreras-Vidal JL,
    2. Schultz W. A

    (1996) model de rețea neuronală de învățare, motivație și comportament orientat pe recompense. Soc. Neurosci. Abstr. 22: 2029.

    1. Corbett D.,
    2. Intelept RA

    (1980) Auto-stimulare intracraniană în raport cu sistemele dopaminergice ascendente ale creierului mijlociu: studiu microelectrod mobil. Brain Res. 185: 1-15.

    1. Corvaja N.,
    2. Doucet G.,
    3. Bolam JP

    (1993) Ultrastructură și ținte sinaptice ale proiecției raphe-nigrale la șobolan. Neuroştiinţe 55: 417-427.

    1. Dehaene S.,
    2. Changeux J.-P.

    (1991) Testul de sortare a cardurilor din Wisconsin: analiză teoretică și modelare într-o rețea neuronală. Cerebr. cortex 1: 62-79.

    1. Delaney K.,
    2. Gelperina A.

    (1986) Post-ingestiv aversiune alimentară învățarea la dietele deficiente de aminoacizi de către balaurul terestru Limax maximus. J. Comp. Physiol. [A] 159: 281-295.

    1. DeLong MR,
    2. Crutcher MD,
    3. Georgopoulos AP

    (1983) Relațiile dintre mișcare și descărcare de celule unice în substanța nigra a maimuței care se comportă. J. Neurosci. 3: 1599-1606.

    1. Di Chiara G.

    (1995) Rolul dopaminei în abuzul de droguri privit din perspectiva rolului său în motivație. Alcoolul de droguri depinde. 38: 95-137.

    1. Dickinson A.

    (1980) Teoria contemporană a învățării animalelor. (Cambridge Univ. Press, Cambridge, Marea Britanie).

    1. Dickinson A.,
    2. Balleine B.

    (1994) Controlul motivațional al acțiunii orientate spre țel. Anim. Învăța. Behav. 22: 1-18.

    1. Dickinson A.,
    2. Sala G.,
    3. Mackintosh NJ

    (1976) Surpriză și atenuarea blocării. J. Exp. Psychol. Anim. Behav. Proc. 2: 313-322.

    1. Doherty MD,
    2. Gratton A.

    (1992) Măsurători cronoamperometrice de mare viteză ale eliberarii de dopamină mesolimbică și nigrostriatală asociate cu stresul zilnic repetat. Brain Res. 586: 295-302.

    1. Dominey P.,
    2. Arbib M.,
    3. Joseph J.-P. A

    (1995) model de plasticitate corticostriatală pentru învățarea asociațiilor și secvențelor oculomotorii. J. Cognit. Neurosci. 7: 311-336.

    1. Doucet G.,
    2. Descarcă L.,
    3. Garcia S.

    (1986) Cuantificarea inervației dopaminei la neostriatul de șobolan adult. Neuroştiinţe 19: 427-445.

    1. Dugast C.,
    2. Suaud-Chagny MF,
    3. Gonon F.

    (1994) Monitorizarea continuă in vivo a eliberării evocate de dopamină în nucleul obișnuit de șobolan prin amperometrie. Neuroştiinţe 62: 647-654.

    1. Edmonds DE,
    2. Gallistel CR

    (1977) Recompense comparativ cu performanța în auto-stimulare: efectele specifice electrodului α-metil-p-tirozinei pe recompensă la șobolan. J. Comp. Physiol. Psychol. 91: 962-974.

    1. Elliott R.,
    2. BJ Sahakian,
    3. Matthews K.,
    4. Bannerjea A.,
    5. Rimmer J.,
    6. Robbins TW

    (1997) Efectele metilfenidatului asupra memoriei de lucru spațiale și a planificării la adulți tineri sănătoși. Psychopharmacology 131: 196-206.

    1. Ettenberg A.

    (1989) Dopamina, neuroleptice și comportament consolidat. Neurosci. Biobehav. Rev. 13: 105-111.

    1. Fagg AH

    (1993) Învățare de consolidare pentru atingerea și înțelegerea robotică. în New Perspectives in the Control of the Reach to Grasp Move, eds Bennet KMB, Castiello U. (North-Holland, Amsterdam), pp 281 – 308.

    1. Fagg AH,
    2. Arbib MA A

    (1992) modelul învățării condiționate vizual-motor primate. Adapta. Behav. 1: 3-37.

    1. Fibiger HC,
    2. LePiane FG,
    3. Jakubovic A.,
    4. Phillips AG

    (1987) Rolul dopaminei în auto-stimularea intracraniană a zonei tegmentale ventrale. J. Neurosci. 7: 3888-3896.

    1. Fibiger HC,
    2. Miller JJ

    (1977) O investigație anatomică și electrofiziologică a proiecției serotonergice de la nucleul raphé dorsal la substanța nigra la șobolan. Neuroştiinţe 2: 975-987.

    1. Fibiger HC,
    2. Phillips AG

    Recompensă, motivație, cunoaștere: psiobiologie a sistemelor de dopamină mezotelencefice. Manual de fiziologie. Sistemul nervos. Sisteme de reglementare intrinsecă a creierului.1986Am. Physiol. Soc.Bethesda, MA, sect. 1, vol. IV, p. 647-675.

    1. Filion M.,
    2. Tremblay L.,
    3. Bédard PJ

    (1988) Influențe anormale ale mișcării pasive a membrelor asupra activității neuronilor globus pallidus la maimuța parkinsoniană. Brain Res. 444: 165-176.

    1. Flaherty AW,
    2. Graybiel A.

    (1993) Două sisteme de intrare pentru reprezentări ale corpului în matricea striatică primară: dovezi experimentale la maimuța veveriței. J. Neurosci. 13: 1120-1137.

    1. Flaherty AW,
    2. Graybiel A.

    (1994) Organizarea intrare-ieșire a striatumului senzorimotor în maimuța veveriță. J. Neurosci. 14: 599-610.

    1. Flori K.,
    2. Coborâre AC

    (1978) Controlul predictiv al mișcărilor ochilor în boala Parkinson. Ann. Neural. 4: 63-66.

    1. Foote SL,
    2. Aston-Jones G.,
    3. Înflorește FE

    (1980) Activitatea de impuls a neuronilor locus coeruleus la șobolani și maimuțe trează este o funcție de stimulare senzorială și excitare. Proc. Natl. Acad. Sci. Statele Unite ale Americii 77: 3033-3037.

    1. Freund TF,
    2. Powell JF,
    3. Smith AD

    (1984) Tirozină hidroxilază-butoane imunoreactive în contact sinaptic cu neuronii striatonigrali identificați, cu referire specială la coloana vertebrală dendritică. Neuroştiinţe 13: 1189-1215.

    1. Frey U.,
    2. Schroeder H.,
    3. Matthies H.

    (1990) Antagoniștii dopaminergici împiedică menținerea pe termen lung a LTP post-tetanice în regiunea CA1 a feliilor de hipocamp. Brain Res. 522: 69-75.

    1. Friston KJ,
    2. Tononi G.,
    3. Reeke GN Jr.,
    4. Sporns O.,
    5. Edelman GM

    (1994) Selecție dependentă de valoare în creier: simulare într-un model neuronal sintetic. Neuroştiinţe 59: 229-243.

    1. Fujita K.

    (1987) Recunoașterea speciilor de către cinci maimuțe macaque. primate 28: 353-366.

    1. Furiezos G.,
    2. Intelept RA

    (1976) Stingerea indusă de pimozidă a auto-stimulării intracraniene: tiparele de răspuns exclud deficitul motor sau de performanță. Brain Res. 103: 377-380.

    1. Futami T.,
    2. Takakusaki K.,
    3. Kitai ST

    (1995) Intrări glutamatergice și colinergice din nucleul tegmental pedunculopontin la neuronii dopaminici din substanța nigra pars compacta. Neurosci. Res. 21: 331-342.

    1. Gallistel CR

    (1990) Organizarea învățării. (MIT Press, Cambridge, MA).

    1. Garcia CE,
    2. Prett DM,
    3. Morari M.

    (1989) Control model predictiv: teorie și practică - un sondaj. AUTOMATICA 25: 335-348.

    1. Garcia-Munoz M.,
    2. Young SJ,
    3. Groves P.

    (1992) Modificări presinaptice pe termen lung în excitabilitatea căii corticostriatale. Neuroreport 3: 357-360.

    1. Gariano RF,
    2. Groves PM

    (1988) Reclamați focul în neuronii dopaminei cerebrale prin stimularea cortexelor medii prefrontală și anterioară cingulate. Brain Res. 462: 194-198.

    1. Garris PA,
    2. Ciolkowski EL,
    3. Pastore P.,
    4. Wightman RM

    (1994a) Efectul de dopamină din fanta sinaptică din nucleul accumbens al creierului de șobolan. J. Neurosci. 14: 6084-6093.

    1. Garris PA,
    2. Ciolkowski EL,
    3. Wightman RM

    (1994b) Heterogeneitatea revărsării de dopamină evocată în regiunile striatale și striatoamigdaloide. Neuroştiinţe 59: 417-427.

    1. Garris PA,
    2. Wightman RM

    (1994) Diferentele cinetice guvernează transmisia dopaminergică în amigdala, cortexul prefrontal și striatum: un studiu voltammetric in vivo. J. Neurosci. 14: 442-450.

    1. Gerfen CR

    (1984) Mozaicul neostriatal: compartimentarea sistemelor corticostriatale de intrare și a ieșirilor striatonigrale. Natură 311: 461-464.

    1. Gerfen CR,
    2. Engber TM,
    3. Mahan LC,
    4. Susel Z.,
    5. Chase TN,
    6. Monsma FJ Jr.,
    7. Sibley DR

    (1990) D1 și D2 dopamina receptorilor de genă reglați prin expresia neuronilor striatonigrali și striatopallidici. Ştiinţă 250: 1429-1432.

    1. DC german,
    2. Dubach M.,
    3. Askari S.,
    4. Speciale SG,
    5. Bowden DM

    (1988) 1-metil-4-fenil-1,2,3,6-tetrahidropiridină (MPTP) -indus sindrom parkinsonian în macaca fascicularis: care neuroni dopaminergici din creierul mediu se pierd? Neuroştiinţe 24: 161-174.

    1. Gilbert PFC,
    2. Thach WT

    (1977) Activitatea celulei Purkinje în timpul învățării motorii. Brain Res. 128: 309-328.

    1. Giros B.,
    2. Jaber M.,
    3. Jones SR,
    4. Wightman RM,
    5. Caron MG

    (1996) Hiperlocomotie și indiferență față de cocaină și amfetamină la șoarecii lipsiți de transportorul de dopamină. Natură 379: 606-612.

    1. Goldman-Rakic ​​PS,
    2. Leranth C.,
    3. Williams MS,
    4. Mons N.,
    5. Geffard M.

    (1989) Complex sinaptic dopaminic cu neuroni piramidali în cortexul cerebral primat. Proc. Natl. Acad. Sci. Statele Unite ale Americii 86: 9015-9019.

    1. Gonon F.

    (1988) Relație neliniară între fluxul de impuls și dopamina eliberată de neuronii dopaminergici la nivelul creierului mediu, la șobolan, studiată de electrochimia in vivo. Neuroştiinţe 24: 19-28.

    1. Gonon F.

    (1997) Acțiune excitativă prelungită și extrasinaptică a dopaminei mediată de receptorii D1 în striatul de șobolan in vivo. J. Neurosci. 17: 5972-5978.

    1. Gonzales C.,
    2. Șahet M.-F.

    (1990) Calea amigdalonigrală: Un studiu anterograd la șobolan cu Phaseolus vulgaris Leucoagglutinină (PHA-L). J. Comp. Neural. 297: 182-200.

    1. Grace AA

    (1991) Eliberarea de dopamină fațică sau tonică și modularea reacției sistemului dopaminic: o ipoteză pentru etiologia schizofreniei. Neuroştiinţe 41: 1-24.

    1. Grace AA,
    2. Bunney BS

    (1985) Efectele opuse ale căilor de feedback striatonigrale asupra activității celulelor dopaminei cerebrale mijlocii. Brain Res. 333: 271-284.

    1. Graybiel AM,
    2. Aosaki T.,
    3. Flaherty AW,
    4. Kimura M.

    (1994) Ganglionii bazali și controlul motor adaptiv. Ştiinţă 265: 1826-1831.

    1. Groves PM,
    2. Garcia-Munoz M.,
    3. Linder JC,
    4. Manley MS,
    5. Martone ME,
    6. Young SJ

    (1995) Elemente de organizare intrinsecă și prelucrare a informațiilor în neostriat. în Modele de prelucrare a informațiilor în Ganglionul bazal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambridge, MA), pp 51 – 96.

  • Gullapalli, V., Barto, A. G. și Grupen, R. A. Învățarea mapării de admitere pentru asamblare ghidată de forță. În: Lucrările conferinței internaționale 1994 despre robotică și automatizare. Los Alamitos, CA: Computer Society Press, 1994, p. 2633-2638.
    1. Haber SN,
    2. Lynd E.,
    3. Klein C.,
    4. Groenewegen HJ

    (1990) Organizarea topografică a proiecțiilor eferente striatice ventrale la maimuța rhesus: un studiu de urmărire autoradiografică. J. Comp. Neural. 293: 282-298.

    1. Haber S.,
    2. Lynd-Balta E.,
    3. Mitchell SJ

    (1993) Organizarea proiecțiilor palidale ventrale descendente la maimuță. J. Comp. Neural. 329: 111-128.

    1. Ciocan M.

    (1993) Un neuron identificat mediază stimulul necondiționat în învățarea olfactivă asociativă la albinele. Natură 366: 59-63.

    1. Hammond C.,
    2. Shibazaki T.,
    3. Rouzaire-Dubois B.

    (1983) Neuroni de ieșire ramificată a nucleului subtalamic de șobolan: studiu electrofiziologic al efectelor sinaptice asupra celulelor identificate în cele două nuclee țintă principale, nucleul entopeduncular și substanța nigra. Neuroştiinţe 9: 511-520.

    1. Hattori T.,
    2. Fibiger HC,
    3. McGeer PL

    (1975) Demonstrația unei proiecții palido-nigrale inervând neuronii dopaminergici. J. Comp. Neural. 162: 487-504.

    1. Hedreen JC,
    2. Domnule lung

    (1991) Organizarea proiecțiilor striatopalidale, striatonigrale și nigrostriatale în macaque. J. Comp. Neural. 304: 569-595.

    1. Hernandez-Lopez S.,
    2. Bargas J.,
    3. Surmeier DJ,
    4. Reyes A.,
    5. Galarraga E.

    (1997) Activarea receptorului D1 îmbunătățește descărcarea evocată în neuronii neoestriatali spinos prin modularea unei tipuri de tip L2+ conductanța. J. Neurosci. 17: 3334-3342.

    1. Herrera-Marschitz M.,
    2. Tu ZB,
    3. Goiny M.,
    4. Meana JJ,
    5. Silveira R.,
    6. Godukhin OV,
    7. Chen Y.,
    8. Espinoza S.,
    9. Pettersson E.,
    10. Loidl CF,
    11. Lubec G.,
    12. Andersson K.,
    13. Nylander I.,
    14. Terenius L.,
    15. Ungerstedt U.

    (1996) La originea nivelurilor extracelulare de glutamat monitorizate în ganglionii bazali ai șobolanului prin microdializă in vivo. J. Neurochem. 66: 1726-1735.

    1. Hersch SM,
    2. Ciliax BJ,
    3. Gutekunst C.-A.,
    4. Rees HD,
    5. Heilman CJ,
    6. Yung KKL,
    7. Bolam JP,
    8. Ince E.,
    9. Yi H.,
    10. Levey AI

    (1995) Analiza microscopică electronică a proteinelor D1 și D2 ale receptorilor dopaminergici în striatul dorsal și a relațiilor lor sinaptice cu actorii corticostriatali motorici. J. Neurosci. 15: 5222-5237.

    1. Heym J.,
    2. Trulson ME,
    3. Jacobs BL

    (1982) Activitatea rapidă a unității la pisici în mișcare liberă: efecte ale stimulilor auditivi și vizuali fazici. Brain Res. 232: 29-39.

    1. Hikosaka O.,
    2. Sakamoto M.,
    3. Usui S.

    (1989) Proprietăți funcționale ale neuronilor caudat maimuță. III. Activități legate de așteptarea țintei și recompenselor. J. Neurophysiol. 61: 814-832.

    1. Hollerman JR,
    2. Schultz W.

    (1996) Activitatea neuronilor dopaminei în timpul învățării într-un context familiar. Soc. Neurosci. Abstr. 22: 1388.

    1. Hollerman JR,
    2. Tremblay L.,
    3. Schultz W.

    (1994) Dependența de recompensă a mai multor tipuri de activități neuronale în striatul primat. Soc. Neurosci. Abstr. 20: 780.

    1. Holstein GR,
    2. Pasik P.,
    3. Hamori J.

    (1986) Sinapsele dintre elementele axonale GABA-imunoreactive și dendritice în substanța nigra maimuță. Neurosci. Lett. 66: 316-322.

    1. Hoover JE,
    2. Strick PL

    (1993) Mai multe canale de ieșire în ganglionii bazali. Ştiinţă 259: 819-821.

    1. Horvitz JC,
    2. Stewart T.,
    3. Jacobs BL

    (1997) Activitatea izbucnitoare a neuronilor dopaminei tegmentale ventrale este determinată de stimuli senzoriali la pisica trează. Brain Res. 759: 251-258.

    1. Houk JC,
    2. Adams JL,
    3. Barto AG A

    (1995) model al modului în care ganglionii bazali generează și utilizează semnale neuronale care prevăd întărirea. în Modele de prelucrare a informațiilor în Ganglionul bazal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambridge, MA), pp 249 – 270.

    1. Houk JC,
    2. Buckingham JT,
    3. Barto AG

    (1996) Modele de învățare cerebeloasă și motorie. Behav. Brain Sci. 19: 368-383.

    1. Hrupka BJ,
    2. Lin YM,
    3. Gietzen DW,
    4. Rogers QR

    (1997) Modificările mici ale concentrațiilor esențiale de aminoacizi modifică selecția dietei la șobolani cu deficit de aminoacizi J. Nutr. 127: 777-784.

    1. Hull CL

    (1943) Principiile comportamentului. (Appleton-Century-Crofts, New York).

    1. Ingham CA,
    2. Hood SH,
    3. Weenink A.,
    4. Van Maldegem B.,
    5. Arbuthnott GW

    (1993) Modificări morfologice în neostriatul de șobolan după injecții unilaterale de 6-hidroxidopamina în calea nigrostriatală. Exp. Brain Res. 93: 17-27.

    1. Ito M.

    (1989) Depresie pe termen lung. Annu. Rev. Neurosci. 12: 85-102.

    1. Jacobs BL,
    2. Fornal CA

    (1993) 5-HT și controlul motorului: o ipoteză. Tendințe Neurosci. 16: 346-352.

    1. Jimenez-Castellanos J.,
    2. Graybiel AM

    (1989) Dovadă că zonele distincte histochimice ale primatului substantia nigra pars compacta sunt legate de distribuțiile modelate ale neuronilor de proiecție nigrostriatală și ale fibrelor striatonigrale. Exp. Brain Res. 74: 227-238.

    1. Kalman RE A

    (1960) o nouă abordare a problemelor de filtrare și predicție liniară. J. Eng. De bază. Trans. CA MINE 82: 35-45.

  • Kamin, L. J. Asociere și condiționare selectivă. În: Probleme fundamentale în învățarea instrumentală, editat de N. J. Mackintosh și W. K. Honig. Halifax, Canada: Dalhousie University Press, 1969, p. 42-64.
    1. Kawagoe KT,
    2. Garris PA,
    3. Wiedemann DJ,
    4. Wightman RM

    (1992) Reglarea gradienților tranzitorii ai concentrației de dopamină în microambientul din jurul terminalelor nervoase din striatul de șobolan. Neuroştiinţe 51: 55-64.

    1. Kawaguchi Y.,
    2. Wilson CJ,
    3. PC Emson

    (1989) Înregistrarea intracelulară a plasturelor neostriatale identificate și a celulelor spinării matriceale într-un preparat de felie care păstrează intrările corticale. J. Neurophysiol. 62: 1052-1068.

    1. Kawato M.,
    2. Gomi H.

    (1992) Modelele de învățare cerebel și VOR / OKR. Tendințe Neurosci. 15: 445-453.

    1. Kiskin NI,
    2. Krishtal OA,
    3. Tsyndrenko AY

    (1986) Receptorii aminoacizi excitatori din neuronii hipocampali: kainatul nu reușește să-i desensibilizeze. Neurosci. Lett. 63: 225-230.

    1. Klopf AH

    (1982) Neuronul hedonistic: o teorie a memoriei, a învățării și a inteligenței. (Emisfera, Washington, DC).

    1. Knowlton BJ,
    2. Mangels JA,
    3. Squire LR A

    (1996) sistem neostriatal de învățare a obiceiurilor la om. Ştiinţă 273: 1399-1402.

    1. Künzle H.

    (1978) O analiză autoradiografică a conexiunilor eferente de la premotor și regiunile prefrontală adiacente (zonele 6 și 9) în Macaca fascicularis. Creierul Behav. Evol. 15: 185-234.

    1. LeMoal M.,
    2. Batranii ME

    (1979) Intrare auditivă periferică în zona limbică a creierului mijlociu și structurile conexe. Brain Res. 167: 1-17.

    1. LeMoal M.,
    2. Simon H.

    (1991) Rețeaua dopaminergică mesocorticolimbică: roluri funcționale și de reglementare. Physiol. Rev. 71: 155-234.

    1. Levey AI,
    2. Hersch SM,
    3. Secară DB,
    4. Sunahara RK,
    5. Niznik HB,
    6. Kitt CA,
    7. Preț DL,
    8. Maggio R.,
    9. Brann MR,
    10. Ciliax BJ

    (1993) Localizarea receptorilor dopaminei D1 și D2 în creier cu anticorpi specifici subtipului. Proc. Natl. Acad. Sci. Statele Unite ale Americii 90: 8861-8865.

    1. Linden A.,
    2. Bracke-Tolkmitt R.,
    3. Lutzenberger W.,
    4. AGA Canavan,
    5. Scholz E.,
    6. Diener HC,
    7. Birbaumer N.

    (1990) Potențialul cortical lent la pacienții parkinsoniști în timpul unei sarcini de învățare asociativă. J. Psychophysiol. 4: 145-162.

    1. Ljungberg T.,
    2. Apicella P.,
    3. Schultz W.

    (1991) Răspunsurile neuronilor de dopamină ale creierului mijlociu în timpul unei alternanțe întârziate. Brain Res. 586: 337-341.

    1. Ljungberg T.,
    2. Apicella P.,
    3. Schultz W.

    (1992) Răspunsurile neuronilor dopaminei maimuței în timpul învățării reacțiilor comportamentale. J. Neurophysiol. 67: 145-163.

    1. Llinas R.,
    2. JP JP

    (1993) În ceea ce privește învățarea cerebelului și a motorului. Curr. Opin. Neurobiol. 3: 958-965.

    1. Lohman AHM,
    2. Van Woerden-Verkley I.

    (1978) Conexiunile ascendente cu creierul înaintat în șopârlă tegu. J. Comp. Neural. 182: 555-594.

    1. Louilot A.,
    2. LeMoal M.,
    3. Simon H.

    (1986) Reactivitatea diferențială a neuronilor dopaminergici din nucleul obișnuit ca răspuns la diferite situații comportamentale. Un studiu voltammetric in vivo la șobolani în mișcare liberă. Brain Res. 397: 395-400.

    1. Lovibond PF

    (1983) Facilitarea comportamentului instrumental printr-un stimul condiționat apetitiv Pavlovian. J. Exp. Psychol. Anim. Behav. Proc. 9: 225-247.

    1. Lovinger DM,
    2. Tyler EC,
    3. Merritt A.

    (1993) Depresie sinaptică pe termen scurt și lung la neostriatul de șobolan. J. Neurophysiol. 70: 1937-1949.

    1. Lynd-Balta E.,
    2. Haber SN

    (1994) Proiecții striatonigrale primare: o comparație a striatului legat de senzor-motor și striatul ventral. J. Comp. Neural. 345: 562-578.

    1. Mackintosh NJ A

    (1975) teoria atenției: variații în asocierea stimulului cu armarea. Psychol. Rev. 82: 276-298.

    1. Manzoni JO,
    2. Manabe T.,
    3. Nicoll RA

    (1994) Eliberarea adenozinei prin activarea receptorilor NMDA din hipocamp. Ştiinţă 265: 2098-2101.

    1. Marr D. A

    (1969) teoria cortexului cerebelos. J. Physiol. (Lond.) 202: 437-470.

    1. Marshall JF,
    2. O'Dell SJ,
    3. Navarrete R.,
    4. Rosenstein AJ

    (1990) Topamină topografie la locul de transport cu afinitate ridicată la creierul de șobolan: diferențe majore între striat dorsal și ventral. Neuroştiinţe 37: 11-21.

  • Matsumoto, K., Nakamura, K., Mikami, A. și Kubota, K. Răspuns la o livrare imprevizibilă de apă în gură a neuronilor cu sensibilitate vizuală în cortexul orbitofontal al maimuțelor. Abstr. Symp satelit. Reuniunea IBR în onoarea prof. Kubota, Inuyama, Japonia, P-14, 1995.
    1. Matsumura M.,
    2. Kojima J.,
    3. Gardiner TW,
    4. Hikosaka O.

    (1992) Funcții vizuale și oculomotorii ale nucleului subthalamic maimuță. J. Neurophysiol. 67: 1615-1632.

    1. Maunsell JHR,
    2. Gibson JR

    (1992) Latențe de răspuns vizual în cortexul striat al maimuței macaque. J. Neurophysiol. 68: 1332-1344.

    1. Mazzoni P.,
    2. Andersen RA,
    3. Iordania MI A

    (1991) o regulă de învățare mai plauzibilă din punct de vedere biologic decât cea de backpropagation aplicată unui model de rețea a zonei corticale 7. Cereb. cortex 1: 293-307.

  • McCallum, A. K. Învățare de consolidare cu percepție selectivă și stări ascunse (Teză de doctorat). Rochester, NY: Univ. Rochester, 1995.
    1. McCormick DA,
    2. Thompson RF

    (1984) Răspunsuri neuronale ale cerebelului iepurelui în timpul achiziției și peformanței unui răspuns nictitativ clasic membrană-pleoapă. J. Neurosci. 4: 2811-2822.

    1. McLaren I.

    (1989) Unitatea de calcul ca un ansamblu de neuroni: o implementare a unui algoritm de învățare care corectează erorile. în The Computing Neuron, eds Durbin R., Miall C., Mitchison G. (Addison-Wesley, Amsterdam), pp 160 – 178.

    1. Michael AC,
    2. Justice JB Jr.,
    3. Neill DB

    (1985) Determinarea in vivo voltammetrică a cineticii metabolismului dopaminei la șobolan. Neurosci. Lett. 56: 365-369.

    1. Middleton FA,
    2. Strick PL

    (1996) Lobul temporal este o țintă de ieșire din ganglionii bazali. Proc. Natl. Acad. Sci. Statele Unite ale Americii 93: 8683-8687.

    1. EK Miller,
    2. Li L.,
    3. Desimone R.

    (1993) Activitatea neuronilor din cortexul temporal inferior inferior în timpul unei sarcini de memorie pe termen scurt. J. Neurosci. 13: 1460-1478.

    1. Miller JD,
    2. Sanghera MK,
    3. DC germană

    (1981) Activitatea dopaminergică mesencefalică la șobolanul condiționat comportamental. Life Sci. 29: 1255-1263.

    1. Miller R.,
    2. Wickens JR,
    3. Beninger RJ

    (1990) Receptorii Dopamina D-1 și D-2 în raport cu recompensa și performanța: un caz pentru receptorul D-1 ca loc principal de acțiune terapeutică a medicamentelor neuroleptice. Prog. Neurobiol. 34: 143-183.

    1. Mirenowicz J.,
    2. Schultz W.

    (1994) Importanța imprevizibilității pentru răspunsurile la recompensă în neuronii de dopamină primată. J. Neurophysiol. 72: 1024-1027.

    1. Mirenowicz J.,
    2. Schultz W.

    (1996) Activarea preferențială a neuronilor dopamină din creierul mijlociu prin stimuli apetitivi și nu aversivi. Natură 379: 449-451.

    1. Mitchell SJ,
    2. Richardson RT,
    3. Baker FH,
    4. Domnule lung

    (1987) Primat globus pallidus: activitate neuronală legată de direcția de mișcare. Exp. Brain Res. 68: 491-505.

    1. Mogenson GJ,
    2. Takigawa M.,
    3. Robertson A.,
    4. Wu M.

    (1979) Auto-stimularea nucleului accumbens și a zonei tegmentale ventrale a Tsai atenuată de microinjecțiile de spiroperidol în nucleul accumbens. Brain Res. 171: 247-259.

    1. Montague PR,
    2. Dayan P.,
    3. Nowlan SJ,
    4. Pouget A.,
    5. Sejnowski TJ

    (1993) Utilizarea armăturii aperiodice pentru auto-organizare direcționată în timpul dezvoltării. în Neural Information Processing Systems 5, eds Hanson SJ, Cowan JD, Giles CL (Morgan Kaufmann, San Mateo, CA), pp 969 – 976.

    1. Montague PR,
    2. Dayan P.,
    3. Persoana C.,
    4. Sejnowski TJ

    (1995) Furaje de albine în medii incerte folosind învățare predicativă hebbiană. Natură 377: 725-728.

    1. Montague PR,
    2. Dayan P.,
    3. Sejnowski TJ A

    Cadrul (1996) pentru sistemele de dopamină mesencefalice bazate pe învățarea predicativă Hebbian. J. Neurosci. 16: 1936-1947.

    1. Montague PR,
    2. Sejnowski TJ

    (1994) Creierul predictiv: coincidență temporală și ordine temporală în mecanisme de învățare sinaptică. Învăța. Memorie 1: 1-33.

    1. Mora F.,
    2. Myers RD

    (1977) Auto-stimulare cerebrală: dovezi directe pentru implicarea dopaminei în cortexul prefrontal. Ştiinţă 197: 1387-1389.

    1. Murphy BL,
    2. Arnsten AF,
    3. Goldman-Rakic ​​PS,
    4. Roth RH

    (1996) Creșterea cifrei de afaceri a dopaminei în cortexul prefrontal afectează performanța spațială a memoriei de lucru la șobolani și maimuțe. Proc. Natl. Acad. Sci. Statele Unite ale Americii 93: 1325-1329.

    1. Nakamura K.,
    2. Mikami A.,
    3. Kubota K.

    (1992) Activitatea neuronilor singuri în amigdala maimuței în timpul îndeplinirii unei sarcini de discriminare vizuală. J. Neurophysiol. 67: 1447-1463.

    1. Nedergaard S.,
    2. Bolam JP,
    3. Greenfield SA

    (1988) Facilitarea conductanței dendritice a calciului prin 5-hidroxitriptamina în substanța nigra. Natură 333: 174-177.

    1. Niijima K.,
    2. Yoshida M.

    (1988) Activarea neuronilor dopaminei mezenfalice prin stimularea chimică a nucleului tegmenti pedunculopontinus pars compacta. Brain Res. 451: 163-171.

    1. Niki H.,
    2. Watanabe M.

    (1979) Activitatea unității prefrontală și cingulată în timpul comportamentului de sincronizare la maimuță. Brain Res. 171: 213-224.

    1. Nirenberg MJ,
    2. Vaughan RA,
    3. Uhl GR,
    4. Kuhar MJ,
    5. Pickel VM

    (1996) Transportorul de dopamină este localizat în membranele plasmatice dendritice și axonale ale neuronilor dopaminergici nigrostriatali. J. Neurosci. 16: 436-447.

    1. Nishijo H.,
    2. Ono T.,
    3. Nishino H.

    (1988) Distribuția topografică a neuronilor amigdalari specifici modalității în maimuța de alertă. J. Neurosci. 8: 3556-3569.

    1. Nishino H.,
    2. Ono T.,
    3. Muramoto KI,
    4. Fukuda M.,
    5. Sasaki K.

    (1987) Activitate neuronală în zona tegmentală ventrală (VTA) în timpul comportamentului motivat de hrănire a presei în bare la maimuță. Brain Res. 413: 302-313.

    1. Ojakangas CL,
    2. Ebner TJ

    (1992) Complexul celular Purkinje și modificările simple ale vârfului în timpul unei activități de învățare voluntară a mișcării brațului la maimuță. J. Neurophysiol. 68: 2222-2236.

    1. Bătrâni J.,
    2. Milner P.

    (1954) Armare pozitivă produsă prin stimularea electrică a zonei septale și a altor regiuni ale creierului de șobolan. J. Comp. Physiol. Psychol. 47: 419-427.

    1. Otmakhova NA,
    2. Lisman JE

    (1996) D1 / D5 activarea recetorului de dopamină mărește mărimea potențării timpurii pe termen lung la sinapsele hipocampale CA1. J. Neurosci. 16: 7478-7486.

    1. Packard MG,
    2. NM alb

    (1991) Disocierea sistemelor de memorie a hipocampului și nucleului caudat prin injecția intracerebrală post-formare de agoniști de dopamină. Behav. Neurosci. 105: 295-306.

    1. Pastor MA,
    2. Artieda J.,
    3. Jahanshahi M.,
    4. Obeso JA

    (1992) Estimarea timpului și reproducerea sunt anormale în boala Parkinson. Creier 115: 211-225.

    1. Pearce JM,
    2. Sala G. A

    (1980) model pentru condiționarea pavloviană: variații ale eficienței stimulilor condiționați, dar nu și a condiționărilor necondiționate. Psychol. Rev. 87: 532-552.

    1. Pennartz CMA,
    2. Ameerun RF,
    3. Groenewegen HJ,
    4. Lopes da Silva FH

    (1993) Plasticitatea sinaptică într-o preparată in vitro din felie de nucleu accumbens. EURO. J. Neurosci. 5: 107-117.

  • Percheron, G., Francois, C., Yelnik, J. și Fenelon, G. Sistemul primat nigro-striato-pallido-nigral. Nu este o simplă buclă. În: Mecanisme neuronale în tulburări de mișcare, editat de A. R. Crossman și M. A. Sambrook. Londra: John Libbey, 1989, p. 103-109.
    1. Phillips AG,
    2. Brooke SM,
    3. Fibiger HC

    (1975) Efectele izomerilor de amfetamină și neuroleptice asupra auto-stimulării din nucleul accumbens și mănunchiul noradrenergic dorsal. Brain Res. 85: 13-22.

    1. Phillips AG,
    2. Carter DA,
    3. Fibiger HC

    (1976) Substraturi dopaminergice de auto-stimulare intracraniană în nucleul caudat. Brain Res. 104: 221-232.

    1. Phillips AG,
    2. Fibiger HC

    (1978) Rolul dopaminei în medierea auto-stimulării în tegmentumul ventral, nucleul accumbens și cortexul prefrontal medial. Poate sa. J. Psychol. 32: 58-66.

    1. Phillips AG,
    2. Mora F.,
    3. Rolls ET

    (1979) Auto-stimulare intracraniană în cortexul orbitofrontal și nucleul caudat al maimuței rhesus: efecte ale apomorfinei, pimozidei și spiroperidolului. Psychopharmacology 62: 79-82.

    1. Pickel VM,
    2. Beckley SC,
    3. Joh TH,
    4. Reis DJ

    (1981) Localizarea imunocitochimică ultrastructurală a tirozinei hidroxilazei în neostriatum. Brain Res. 225: 373-385.

    1. Pret JL,
    2. Amaral DG

    (1981) Un studiu autoradiografic al proiecțiilor nucleului central al amigdalei maimuței. J. Neurosci. 1: 1242-1259.

    1. Rao RPN,
    2. Ballard DH

    (1997) Modelul dinamic de recunoaștere vizuală prezice proprietățile de răspuns neuronal în cortexul vizual. Neural Computat. 9: 721-763.

    1. Rasmussen K.,
    2. Jacobs BL

    (1986) Activitate unică a neuronilor locus coeruleus la pisica în mișcare liberă. II. Studii de condiționare și farmacologie. Brain Res. 371: 335-344.

    1. Rasmussen K.,
    2. Morilak DA,
    3. Jacobs BL

    (1986) Activitate unică a neuronilor locus coeruleus la pisica în mișcare liberă. I. În timpul comportamentelor naturaliste și ca răspuns la stimuli simpli și complexi. Brain Res. 371: 324-334.

    1. Rescorla RA,
    2. Wagner AR A

    (1972) teoria condiționării pavloviene: variații ale eficienței armăturii și neinforțării. în condiționare clasică II: Cercetări actuale și teorie, eds Black AH, Prokasy WF (Appleton Century Crofts, New York), pp 64 – 99.

    1. Richardson RT,
    2. Domnule lung

    (1986) Nucleu bazalis al activității neuronale Meynert în timpul unei sarcini de răspuns întârziat la maimuță. Brain Res. 399: 364-368.

    1. Richardson RT,
    2. Domnule lung

    (1990) Răspunsurile dependente de context ale neuronilor bazali ai nucleului primat, într-o sarcină „go / no-go”. J. Neurosci. 10: 2528-2540.

    1. Richfield EK,
    2. Pennney JB,
    3. Tânăr AB

    (1989) Comparații de stare anatomică și de afinitate între receptorii dopaminei D1 și D2 în sistemul nervos central al șobolanului. Neuroştiinţe 30: 767-777.

    1. Robbins TW,
    2. Everitt BJ

    (1992) Funcțiile dopaminei în striatul dorsal și ventral. Semin. Neurosci. 4: 119-128.

    1. Robbins TW,
    2. Everitt BJ

    (1996) Mecanismele neuro-psihologice de recompensă și motivație. Curr. Opin. Neurobiol. 6: 228-236.

    1. Robinson TE,
    2. Berridge KC

    (1993) Baza neurală a poftei de droguri: o teorie de stimulare a sensibilizării dependenței. Brain Res. Rev. 18: 247-291.

    1. Rogawski MA

    (1987) Noi direcții în acțiunea neurotransmițătorului: dopamina oferă câteva indicii importante. Tendințe Neurosci. 10: 200-205.

    1. Rogers QR,
    2. Harper AE

    (1970) Selecția unei soluții conținând histidină de către șobolani alimentați o dietă dezechilibrată cu histidină. J. Comp. Physiol. Psychol. 72: 66-71.

    1. Rolls ET,
    2. Critchley HD,
    3. Mason R.,
    4. Wakeman EA

    (1996) Neuronii cortexului orbitofrontal: rol în învățarea olfactivă și asociativă vizuală. J. Neurophysiol. 75: 1970-1981.

    1. Romo R.,
    2. Scarnati E.,
    3. Schultz W.

    (1992) Rolul ganglionilor bazali primari și al cortexului frontal în generarea internă a mișcărilor: comparații la neuronii striatici activați în timpul inițierii și execuției mișcării induse de stimul. Exp. Brain Res. 91: 385-395.

    1. Romo R.,
    2. Schultz W.

    (1990) Neuronii dopaminici ai creierului mijlociu maimuță: contingențele răspunsurilor la atingerea activă în timpul mișcării brațului auto-inițiate. J. Neurophysiol. 63: 592-606.

    1. Rompré P.-P.,
    2. Intelept RA

    (1989) Dovezi comportamentale pentru inactivarea depolarizării dopaminei din creierul mijlociu. Brain Res. 477: 152-156.

    1. Rossi DJ,
    2. Slater NT

    (1993) Debutul dezvoltării activității canalului receptorului NMDA în timpul migrației neuronale. Neuropharmacology 32: 1239-1248.

    1. Rumelhart DE,
    2. Hinton GE,
    3. Williams RJ

    (1986) Învățarea reprezentărilor interne prin propagarea erorilor. în Parallel Distributed Processing I, ediții Rumelhart DE, McClelland JL (MIT Press, Cambridge, MA), pp 318 – 362.

    1. Sah P.,
    2. Hestrin S.,
    3. Nicoll RA

    (1989) Activarea tonică a receptorilor NMDA de către glutamatul ambiental sporește excitabilitatea neuronilor. Ştiinţă 246: 815-818.

    1. Salamone JD

    (1987) Acțiunile medicamentelor neuroleptice asupra comportamentelor instrumentale apetisante. în Manual de psihofarmacologie, eds Iversen LL, Iversen SD, Snyder SH (Plenum, New York), 19: 576 – 608.

    1. Salamone JD

    (1992) Funcții motorii și senzorimotoare complexe ale dopaminei striatale și obișnuite: implicarea în procesele de comportament instrumental. Psychopharmacology 107: 160-174.

    1. Sands SB,
    2. Barish ME A

    (1989) descrierea cantitativă a răspunsurilor neurotransmițătorului de aminoacizi excitatori pe neuronii coloanei vertebrale ambenonice cultivate Yenopus. Brain Res. 502: 375-386.

    1. Sara SJ,
    2. Segal M.

    (1991) Plasticitatea răspunsurilor senzoriale ale neuronilor locus coeruleus la șobolanul comportant: implicații pentru cogniție. Prog. Brain Res. 88: 571-585.

    1. Sawaguchi T.,
    2. PS Goldman-Rakic

    (1991) D1 Receptori de dopamină în cortexul prefrontal: implicarea în memoria de lucru. Ştiinţă 251: 947-950.

    1. Scarnati E.,
    2. Proia A.,
    3. Campana E.,
    4. Pacitti C. A

    Studiu microiontoforetic (1986) privind natura neurotransmițătorului putativ sinaptic implicat în calea excitatorie a șobolanului pedunculopontină-substania nigra pars compacta. Exp. Brain Res. 62: 470-478.

    1. Schultz W.

    (1986) Răspunsurile neuronilor dopaminei cerebrale la stimuli declanșatori comportamentali la maimuță. J. Neurophysiol. 56: 1439-1462.

    1. Schultz W.,
    2. Apicella P.,
    3. Ljungberg T.

    (1993) Răspunsurile neuronilor dopaminei maimuței pentru a recompensa și a stimula condiționate în timpul etapelor succesive de învățare a unei sarcini de răspuns întârziat. J. Neurosci. 13: 900-913.

    1. Schultz W.,
    2. Apicella P.,
    3. Romo R.,
    4. Scarnati E.

    (1995a) Activitate dependentă de context în striatul primat care reflectă evenimentele de comportament din trecut și din viitor. în Modele de prelucrare a informațiilor în Ganglionul bazal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambridge, MA), pp 11 – 28.

    1. Schultz W.,
    2. Apicella P.,
    3. Scarnati E.,
    4. Ljungberg T.

    (1992) Activitate neuronală în striatul ventral maimuță legată de așteptarea recompensei. J. Neurosci. 12: 4595-4610.

    1. Schultz W.,
    2. Dayan P.,
    3. Montague RR A

    (1997) substrat neuronal de predicție și recompensă. Ştiinţă 275: 1593-1599.

    1. Schultz W.,
    2. Romo R.

    (1987) Răspunsurile neuronilor dopaminei nigrostriatale la stimularea somatosenzorială de mare intensitate la maimuța anesteziată. J. Neurophysiol. 57: 201-217.

    1. Schultz W.,
    2. Romo R.

    (1990) Neuronii dopaminici ai creierului maimuței: contingențele răspunsurilor la stimuli care declanșează reacții comportamentale imediate. J. Neurophysiol. 63: 607-624.

    1. Schultz W.,
    2. Romo R.,
    3. Ljungberg T.,
    4. Mirenowicz J.,
    5. Hollerman JR,
    6. Dickinson A.

    (1995b) Semnalele legate de recompense purtate de neuronii dopaminici. în Modele de prelucrare a informațiilor în Ganglionul Basal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambrdige, MA), pp 233 – 248.

    1. Schultz W.,
    2. Ruffieux A.,
    3. Aebischer P.

    (1983) Activitatea neuronilor pars compacta ai maimuței substantia nigra în raport cu activarea motorie. Exp. Brain Res. 51: 377-387.

    1. Sears LL,
    2. Steinmetz JE

    (1991) Activitatea dorsală inferioară a accesoriilor diminuează în timpul achiziției răspunsului pleoapelor clasic condiționat. Brain Res. 545: 114-122.

    1. Selemon LD,
    2. PS Goldman-Rakic

    (1990) Întreruperea topografică a neuronilor striatonigrali și striatopalizi la maimuța rhesus. J. Comp. Neural. 297: 359-376.

    1. Sesack SR,
    2. Aoki C.,
    3. Pickel VM

    (1994) Localizarea ultrastructurală a imunoreactivității asemănătoare receptorului D2 în neuronii dopaminei cerebrale mijlocii și țintele lor striatale. J. Neurosci. 14: 88-106.

    1. Sesack SR,
    2. Pickel VM

    (1992) Eferenti corticali prefrontali in sinapsa de sobolan pe tinte neuronale ne-marcate ale terminalelor de catecolamina din nucleul accumbens septi si pe neuronii dopaminici din zona tegmentala ventrala. J. Comp. Neural. 320: 145-160.

    1. Simon H.,
    2. Scatton B.,
    3. LeMoal M.

    (1980) Neuronii dopaminergici A10 sunt implicați în funcțiile cognitive. Natură 286: 150-151.

    1. Smith AD,
    2. Bolam JP

    (1990) Rețeaua neuronală a ganglionilor bazali, așa cum a fost relevată de studiul conexiunilor sinaptice ale neuronilor identificați. Tendințe Neurosci. 13: 259-265.

    1. Identificator Smith,
    2. Grace AA

    (1992) Rolul nucleului subthalamic în reglarea activității neuronilor dopaminei nigrale. Synapse 12: 287-303.

    1. Smith MC

    (1968) Intervalul CS-SUA și intensitatea SUA în condiționarea clasică a răspunsului membranei nictitante a iepurelui. J. Comp. Physiol. Psychol. 66: 679-687.

    1. Smith Y.,
    2. Bennett BD,
    3. Bolam JP,
    4. Părintele A.,
    5. Sadikot AF

    (1994) Relații sinaptice între aferentele dopaminergice și intrarea corticală sau talamică pe teritoriul senzorimotor al striatului la maimuță. J. Comp. Neural. 344: 1-19.

    1. Smith Y.,
    2. Bolam JP

    (1990) Neuronii de ieșire și neuronii dopaminergici ai substanței nigra primesc un aport GABA din globus pallidus la șobolan. J. Comp. Neural. 296: 47-64.

    1. Smith Y.,
    2. Bolam JP

    (1991) Convergența intrărilor sinaptice din striatum și globus pallidus la celulele nigrocolliculare identificate la șobolan: un studiu dublu de marcare anterograd. Neuroştiinţe 44: 45-73.

    1. Smith Y.,
    2. Hazrati L.-N.,
    3. Părintele A.

    (1990) Proiecții eficiente ale nucleului subthalmaic la maimuța veveriței, așa cum a fost studiat prin metoda de urmărire anterogradă PHA-L. J. Comp. Neural. 294: 306-323.

    1. Somogyi P.,
    2. Bolam JP,
    3. Totterdell S.,
    4. Smith AD

    (1981) Intrare monosinaptică din nucleul accumbens - regiunea striatică ventrală la neuronii nigrostriatali marcați retrograd. Brain Res. 217: 245-263.

    1. Sprengelmeyer R.,
    2. AGA Canavan,
    3. Lange HW,
    4. Hömberg V.

    (1995) Învățarea asociativă în tulburările neostriatale degenerative: contrastează în amintirea explicită și implicită între pacienții cu boala Parkinson și Huntington. Mov. Dizord. 10: 85-91.

    1. Surmeier DJ,
    2. Eberwine J.,
    3. Wilson CJ,
    4. Stefani A.,
    5. Kitai ST

    (1992) subtipurile de receptori Dopamina se colocalizează în neuronii striatonigrali de șobolan. Proc. Natl. Acad. Sci. Statele Unite ale Americii 89: 10178-10182.

    1. Stamford JA,
    2. Kruk ZL,
    3. Palij P.,
    4. Millar J.

    (1988) Difuzia și absorbția dopaminei în caudatul de șobolan și nucleul accumbens în comparație cu voltammetria ciclică rapidă. Brain Res. 448: 381-385.

    1. Stein L.

    (1964) Auto-stimularea creierului și acțiunea stimulantă centrală a amfetaminei. Federația Proc. 23: 836-841.

    1. Stein L.,
    2. Xue BG,
    3. Belluzzi JD

    (1994) Consolidarea in vitro a izbucnirii hipocampului: o căutare a atomilor de comportament ai lui Skinner. J. Exp. Anal. Behav. 61: 155-168.

    1. Steinfels GF,
    2. Heym J.,
    3. Strecker RE,
    4. Jacobs BL

    (1983) Corelații comportamentale ale activității unității dopaminergice la pisici în mișcare liberă. Brain Res. 258: 217-228.

    1. Suaud-Chagny MF,
    2. Dugast C.,
    3. Chergui K.,
    4. Msghina M.,
    5. Gonon F.

    (1995) Absorbția de dopamină eliberată prin fluxul de impulsuri în sistemul mesolimbic și striatal de șobolan in vivo. J. Neurochem. 65: 2603-2611.

    1. Suri RE,
    2. Schultz W. A

    (1996) model de învățare neurală bazat pe activitatea neuronilor de dopamină primată. Soc. Neurosci. Abstr. 22: 1389.

    1. Sutton RS

    (1988) Învățarea de a prezice prin metoda diferenței temporale. Învață mașină 3: 9-44.

    1. Sutton RS,
    2. Barto AG

    (1981) Spre o teorie modernă a rețelelor adaptive: așteptare și predicție. Psychol. Rev. 88: 135-170.

    1. Tepper J. M,
    2. Martin LP,
    3. Anderson DR

    (1995) GABAA inhibarea mediată de receptor a neuronilor dopaminergici de substanță nigra de șobolan prin neuroni de proiecție pars reticulata. J. Neurosci. 15: 3092-3103.

    1. Tesauro G.

    (1994) TD-Gammon, un program de backgammon autodidact, realizează jocul la nivel de master. Comp Neural. 6: 215-219.

    1. Thompson RF,
    2. Gluck MA

    (1991) Substraturile cerebrale ale învățării asociative de bază și ale memoriei. în Perspectives on Cognitive Neuroscience, eds Lister RG, Weingartner HJ (Oxford Univ. Press, New York), pp 25 – 45.

    1. Thorndike EL

    (1911) Inteligența animalelor: studii experimentale. (MacMillan, New York).

    1. Thorpe SJ,
    2. Rolls ET,
    3. Maddison S.

    (1983) Cortexul orbitofrontal: activitate neuronală în maimuța comportantă. Exp. Brain Res. 49: 93-115.

    1. Toan DL,
    2. Schultz W.

    (1985) Răspunsurile celulelor de palidum de șobolan la stimularea cortexului și efectele activității dopaminergice modificate. Neuroştiinţe 15: 683-694.

    1. Tremblay L.,
    2. Schultz W.

    (1995) Procesarea informațiilor legate de recompensă în neuronii orbitofrontali primari. Soc. Neurosci. Abstr. 21: 952.

    1. Trent F.,
    2. Tepper JM

    (1991) Stimularea raphé dorsală modifică invazia antidromă evocată de striatal a neuronilor dopaminei nigrale in vivo. Exp. Brain Res. 84: 620-630.

  • Ungerstedt, U. Adipsia și afagia după 6-hidroxdopamina a indus degenerarea sistemului dopaminei nigro-striatale. Acta Physiol. Scand. Suppl. 367: 95 – 117, 1971.
    1. Vankov A.,
    2. Hervé-Minvielle A.,
    3. Sara SJ

    (1995) Răspuns la noutate și la obișnuirea sa rapidă în neuronii locus coeruleus ai șobolanului care explorează liber. EURO. J. Neurosci. 7: 1180-1187.

    1. Vriezen ER,
    2. Moscovitch M.

    (1990) Memorie pentru ordinea temporală și învățarea asociativă condiționată la pacienții cu boala Parkinson. Neuropsychologia 28: 1283-1293.

    1. Walsh JP

    (1993) Depresia aportului sinaptic excitator în neuronii striatali de șobolan. Brain Res. 608: 123-128.

    1. Wang Y.,
    2. Cummings SL,
    3. Gietzen DW

    (1996) Schema temporal-spațială a expresiei c-fos în creierul de șobolan ca răspuns la deficiență indispensabilă de aminoacizi. I. Faza inițială de recunoaștere. Mol. Rez. Creier 40: 27-34.

    1. Watanabe M.

    (1989) Potrivirea răspunsurilor comportamentale codificate în activitatea post-proces a unităților prefrontal primate. Neurosci. Lett. 101: 113-117.

    1. Watanabe M.

    (1990) Activitate unitate prefrontală în timpul învățării asociative la maimuță. Exp. Brain Res. 80: 296-309.

    1. Watanabe M.

    (1996) Speranța de recompensă în neuronii prefrontal primari. Natură 382: 629-632.

    1. Wauquier A.

    (1976) Influența medicamentelor psihoactive asupra auto-stimulării creierului la șobolani: o revizuire. în Brain Stimulation Reward, eds Wauquier A., ​​Rolls ET (Elsevier, New York), pp 123 – 170.

    1. NM alb

    (1989) Recompensă sau întărire: care este diferența? Neurosci. Biobehav. Rev. 13: 181-186.

    1. NW alb,
    2. Milner premier

    (1992) Psihobiologia armatoarelor. Annu. Rev. Psychol. 43: 443-471.

    1. Wightman RM,
    2. Zimmerman JB

    (1990) Controlul concentrației extracelulare de dopamină în striatul de șobolan prin fluxul și absorbția impulsurilor. Brain Res. Rev. 15: 135-144.

    1. Wickens JR,
    2. Begg AJ,
    3. Arbuthnott GW

    (1996) Dopamina inversează depresia sinapselor corticostriatale de șobolan, care urmează în mod normal stimularea de înaltă frecvență a cortexului in vitro. Neuroştiinţe 70: 1-5.

    1. Wickens J.,
    2. Kötter R.

    (1995) Modele celulare de armare. în Modele de prelucrare a informațiilor în Ganglionul bazal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambridge, MA), pp 187 – 214.

  • Widrow, G. și Hoff, M. E. Circuite de comutare adaptive. IRE Western Show electronic convenabil., Convenabil. Rec. partea 4: 96 – 104, 1960.
  • Widrow, G. și Sterns, S. D. Procesare adaptivă a semnalului. Englewood Cliffs, NJ: Prentice-Hall, 1985.
    1. Williams SM,
    2. PS Goldman-Rakic

    (1993) Caracterizarea inervației dopaminergice a cortexului frontal primat folosind un anticorp specific dopaminei. Cereb. cortex 3: 199-222.

    1. Williams GV,
    2. Millar J.

    (1990) Acțiuni dependente de concentrație de eliberare de dopamină stimulată asupra activității neuronale în striatul de șobolan. Neuroştiinţe 39: 1-16.

    1. Williams GV,
    2. Rolls ET,
    3. Leonard CM,
    4. Stern C.

    (1993) Răspunsuri neuronale în striatul ventral al maimuței care se comportă. Behav. Brain Res. 55: 243-252.

    1. Wilson C.,
    2. Nomikos GG,
    3. Collu M.,
    4. Fibiger HC

    (1995) Corelațiile dopaminergice ale comportamentului motivat: importanța conducerii. J. Neurosci. 15: 5169-5178.

    1. Wilson CJ

    (1995) Contribuția neuronilor corticali la modelul de ardere al neuronilor spinali striatali. în Modele de prelucrare a informațiilor în Ganglionul bazal, eds Houk JC, Davis JL, DG Beiser (MIT Press, Cambridge, MA), pp 29 – 50.

    1. Wilson FAW,
    2. Rolls ET

    (1990a) Răspunsuri neuronale legate de noutatea și familiaritatea stimulilor vizuali în substanța innominata, banda diagonală a Broca și regiunea periventriculară a antebrațului primat. Exp. Brain Res. 80: 104-120.

    1. Wilson FAW,
    2. Rolls ET

    (1990b) Răspunsuri neuronale legate de întărire în antebrațul bazal primar. Brain Res. 509: 213-231.

    1. Wilson FAW,
    2. Rolls ET

    (1990c) Învățarea și memoria se reflectă în răspunsurile neuronilor legați de întărire în antebrațul bazal primar. J. Neurosci. 10: 1254-1267.

    1. Intelept RA

    (1982) Neuroleptice și comportament operant: ipoteza anhedoniei. Behav. Brain Sci. 5: 39-87.

    1. Intelept RA

    (1996) Neurobiologie a dependenței. Curr. Opin. Neurobiol. 6: 243-251.

    1. Înțelept RA,
    2. Colle L.

    (1984) Pimozida atenuează alimentarea gratuită: analiza „cele mai bune scoruri” relevă un deficit motivațional. Psychopharmacologia 84: 446-451.

    1. Înțelept RA,
    2. Hoffman DC

    (1992) Localizarea mecanismelor de recompensare a medicamentelor prin injecții intracraniene. Synapse 10: 247-263.

    1. Înțelept RA,
    2. Rompre P.-P.

    (1989) Dopamina creierului și recompensa. Annu. Rev. Psychol. 40: 191-225.

    1. Înțelept RA,
    2. Spindler J.,
    3. de Wit H.,
    4. Gerber GJ

    (1978) „anhedonia” indusă de neuroleptic la șobolani: blocurile de pimozide recompensează calitatea alimentelor. Ştiinţă 201: 262-264.

    1. Wynne B.,
    2. Güntürkün O.

    (1995) Inervarea dopaminergică a telencefalului porumbelului (Columba liva): un studiu cu anticorpi împotriva tirozinei hidroxilazei și dopaminei. J. Comp. Neural. 357: 446-464.

    1. Yan Z.,
    2. Song WJ,
    3. Surmeier DJ

    (1997) Receptorii dopaminei D2 reduc Ca de tip N2+ curenți în interneuronii colinergici neostriatali de șobolan printr-o cale insensibilă proteină-kinază-C delimitată de membrană. J. Neurophysiol. 77: 1003-1015.

    1. Yim CY,
    2. Mogenson GJ

    (1982) Răspunsul nucleului accumbens neuronilor la stimularea amigdala și modificarea acestuia prin dopamină. Brain Res. 239: 401-415.

    1. Tânăr AMJ,
    2. Joseph MH,
    3. Gri JA

    (1992) Creșterea eliberării dopaminei in vivo în nucleul accumbens și nucleul caudat al șobolanului în timpul băutului: un studiu de microdializă. Neuroştiinţe 48: 871-876.

    1. Tânăr AMJ,
    2. Joseph MH,
    3. Gri JA

    (1993) Inhibarea latentă a eliberării condiționate de dopamină în nucleul accumbens de șobolan. Neuroştiinţe 54: 5-9.

    1. Yung KKL,
    2. Bolam JP,
    3. Smith AD,
    4. Hersch SM,
    5. Ciliax BJ,
    6. Levey AI

    (1995) Localizarea imunocitochimică a receptorilor dopaminei D1 și D2 în ganglionii bazali ai șobolanului: microscopie electronică ușoară și electronică. Neuroştiinţe 65: 709-730.

  •