Prediktiv belöningssignal för dopaminneuroner (1998)

J Neurophysiol. 1998 Jul;80(1):1-27.

Schultz W1.

Abstrakt

Effekterna av lesioner, receptorblockering, elektrisk självstimulering och missbruksmissbruk tyder på att dopaminsystem för midbrain är inblandade i behandling av belöningsinformation och inlärningsbeteende. De flesta dopaminneuroner visar fasaktioner efter primärvätska och matbelöningar och konditionerade, belöningsspecifika visuella och auditiva stimuli. De visar bifasiska, aktiverings-depression svar efter stimuli som liknar belöning-förutsäger stimuli eller är nya eller särskilt framträdande. Emellertid följer endast få fasaktiva avisiva stimuli. Dopaminneuroner märker därmed miljöstimuli med aptitligt värde, förutsäger och upptäcker belöningar och signalvarning och motiverande händelser. Genom att inte diskriminera mellan olika belöningar tycks dopaminneuroner avge ett varningsmeddelande om den överraskande närvaron eller frånvaron av belöningar. Alla svar på belöningar och belöningsprognoser beror på händelsens förutsägbarhet. Dopaminneuroner aktiveras genom att belöna händelser som är bättre än förutspådda, förbli oförändrade av händelser som är lika bra som förutsagda, och är deprimerade av händelser som är sämre än förutspådda. Genom att signalera belöningar enligt ett prediktionsfel har dopaminreaktioner de formella egenskaperna hos en undervisningssignal postulerad av förstärkningslärande teorier. Dopaminreaktioner överföres under inlärning från primära belöningar till belöningsspecifika stimuli. Detta kan bidra till neuronmekanismer som ligger bakom retrograd verkan av belöningar, en av de viktigaste pusselarna i förstärkningsinlärning. Impulssvaret släpper ut en kort puls av dopamin på många dendriter och sänder således en ganska global förstärkningssignal till postsynaptiska neuroner. Denna signal kan förbättra beteendebeteendet genom att tillhandahålla information om förskottsbelöning innan beteendet uppträder och kan bidra till lärande genom att modifiera synaptisk överföring. Dopaminbelöningssignalen kompletteras av aktivitet i neuroner i striatum, frontal cortex och amygdala, vilken processspecifika belöningsinformation, men ger inte en global felsökningssignal. Ett samarbete mellan de olika belöningssignalerna kan säkerställa användningen av specifika belöningar för selektivt förstärkning av beteenden. Bland de andra projektionssystemen tjänar noradrenalin-neuroner övervägande delaktiga mekanismer och kärnan basalis neuroner kodbelöningar heterogent. Cerebellar klättrande fibrer signalfel i motorprestanda eller fel i förutsägelsen av aversiva händelser till cerebellära Purkinje-celler. De flesta underskotten efter dopaminförlustsskador förklaras inte lätt av en felaktig belöningssignal men kan återspegla avsaknaden av en allmän möjlig funktion av toniska nivåer av extracellulär dopamin. Således kan dopaminsystem ha två funktioner, den fasöverföring av belöningsinformation och den toniska aktiveringen av postsynaptiska neuroner.

INLEDNING

När flercelliga organismer uppstod genom utvecklingen av självreproduktionsmolekyler, utvecklade de endogena, autoregulatoriska mekanismer som säkerställde att deras behov av välfärd och överlevnad var uppfyllda. Ämnen deltar i olika former av tillvägagångssätt för att få resurser för att upprätthålla homeostatisk balans och reproducera. En klass av resurser kallas belöningar som framkallar och förstärker tillvägagångssättet. Belöningens funktioner utvecklades ytterligare under utvecklingen av högre däggdjur för att stödja mer sofistikerade former av individuellt och socialt beteende. Således definierar biologiska och kognitiva behov belöningens natur, och tillgången på belöningar bestämmer några av de grundläggande parametrarna för ämnets livsvillkor.

Belöningar kommer i olika fysiska former, är mycket varierbara i tiden och beror på ämnets särskilda miljö. Trots deras betydelse påverkar belöningar inte hjärnan genom dedikerade perifer receptorer inriktade på ett begränsat antal fysiska modaliteter som är fallet för primära sensoriska system. Snarare är belöningsinformation extraherad av hjärnan från en stor mängd polysensoriska, inhomogena och inkonstanta stimuli genom att använda särskilda neuronmekanismer. Den höga variabla naturen av belöningar kräver höga grader av anpassning i neuronala system som behandlar dem.

Ett av de huvudsakliga neuronsystemen som är involverade i behandling av belöningsinformation tycks vara dopaminsystemet. Beteendestudier visar att dopaminprojektioner på striatum och främre cortex spelar en central roll för att förmedla effekterna av belöningar på beteendebeteende och lärande. Dessa resultat är härledda från selektiva lesioner av olika komponenter i dopaminsystem, systemisk och intracerebral administrering av direkta och indirekta dopaminreceptoragonister och antagonistläkemedel, elektrisk självstimulering och självadministrering av stora missbruksmissbruk, såsom kokain, amfetamin, opiater, alkohol och nikotin (Beninger och Hahn 1983; Di Chiara 1995; Fibiger och Phillips 1986; Robbins och Everitt 1992; Robinson och Berridge 1993; Wise 1996; Wise och Hoffman 1992; Wise et al. 1978).

Den föreliggande artikeln sammanfattar nyligen forskning om signaleringen av miljömotiverande stimuli av dopaminneuroner och utvärderar de potentiella funktionerna hos dessa signaler för modifiering av beteendereaktioner med hänvisning till anatomisk organisation, inlärningsteorier, artificiella neuronmodeller, andra neuronala system och underskott efter lesioner. Alla kända responsegenskaper hos dopaminneuroner kommer att beskrivas, men övervägande svaren på belöningsrelaterade stimuli kommer att konceptualiseras eftersom de är de bästa förstås för närvarande. På grund av den stora mängden data som finns tillgänglig i litteraturen kommer det huvudsakliga systemet att diskuteras att vara nigrostriatal dopaminprojektionen, men prognoser från dentala dopaminneuroner till ventralstriatum och frontal cortex kommer också att övervägas så långt som nuvarande kunskaper tillåter.

REWARDS OCH PREDIKTIONER

Funktioner av belöningar

Vissa objekt och händelser i miljön är av särskild motivationell betydelse genom deras effekter på välfärd, överlevnad och reproduktion. Enligt de framkallade beteendereaktionerna kan motivationsvärdet för miljöobjekt vara appetitiva (givande) eller aversiva (straffande). (Observera att "appetitiv" används synonymt med "belöning" men inte för "förberedande".) Appetitiva föremål har tre separerbara grundläggande funktioner. I sin första funktion framkallar belöningar tillvägagångssätt och konsumtionsbeteende. Detta beror på att föremålen är märkta med aptitvärde genom medfödda mekanismer eller i de flesta fall lärande. I sin andra funktion ökar belöningen frekvensen och intensiteten av beteende som leder till sådana objekt (lärande), och de upprätthåller lärt beteende genom att förhindra utrotning. Belöningar tjänar som positiva förstärkare av beteende i klassiska och instrumentella konditioneringsförfaranden. Generellt stimulans lärande, miljö stimuli förvärva appetitivt värde efter klassiskt konditionerade stimulans-belöning föreningar och inducera beteende beteende (Bindra 1968). I instrumentell konditionering belönas "förstärka" beteenden genom att stärka sammanslutningar mellan stimuli och beteendemässiga svar (Effect of Effect: Thorndike 1911). Detta är kärnan i att "komma tillbaka till mer" och är relaterad till det gemensamma begreppet belöningar som erhålls för att ha gjort något bra. I en instrumental form av incitament lärande är belöningar "incitament" och tjänar som mål för beteende efter sammanslutningar mellan beteende svar och resultat (Dickinson och Balleine 1994). I sin tredje funktion ger belöningar subjektiva känslor av nöje (hedonia) och positiva känslomässiga tillstånd. Aversive stimuli funktion i motsatta riktningar. De inducerar uttagssvar och verkar som negativa förstärkare genom att öka och upprätthålla undvikande beteende vid upprepad presentation, vilket reducerar skadan av skadliga händelser. Dessutom inducerar de inre känslomässiga tillstånd av ilska, rädsla och panik.

Funktioner av förutsägelser

Förutsägelser ger förhandsinformation om framtida stimuli, händelser eller systemtillstånd. De ger den grundläggande fördelen att man får tid för beteendemässiga reaktioner. Vissa former av förutsägelser anger motivativa värden för miljömässiga stimuli genom associering med specifika resultat och identifierar därmed objekt av vital betydelse och diskriminerar dem från mindre värdefulla objekt. Andra former kodar fysiska parametrar för förutsagda objekt, såsom rumslig position, hastighet och vikt. Förutsägelser tillåter en organism att utvärdera framtida händelser innan de faktiskt inträffar, tillåta val och förberedelse av beteendemässiga reaktioner och öka sannolikheten för att närma sig eller undvika objekt märkta med motivationsvärden. Till exempel tillåter upprepade rörelser av objekt i samma sekvens att man förutspår kommande positioner och redan förbereder nästa rörelse medan man förföljer det föreliggande objektet. Detta minskar reaktionstiden mellan individuella mål, vilket ökar den totala prestandan och resulterar i ett tidigare resultat. Prediktiva ögonrörelser förbättrar beteendemässig prestanda genom förskottsfokusering (Blommor och Downing 1978).

På en mer avancerad nivå möjliggör förskottsinformationen enligt förutsägelser att man fattar beslut mellan alternativ för att uppnå specifika systemtillstånd, närmar sig sällan förekommande målobjekt eller undviker irreparabla negativa effekter. Industriella applikationer använder Internal Model Control för att förutsäga och reagera på systemtillstånd innan de faktiskt uppstår (Garcia et al. 1989). Till exempel beräknar "fly-by-wire" -tekniken i modern luftfart förutsägbara kommande flygplanstillstånd. Beslut för flygande manövrer tar hänsyn till denna information och hjälper till att undvika överdriven belastning på planetens mekaniska komponenter, vilket minskar vikten och ökar användningsområdet.

Användningen av prediktiv information beror på arten av de representerade framtida händelserna eller systemtillstånden. Enkla representationer berör direkt positionen för kommande mål och den efterföljande beteendereaktionen, vilket reducerar reaktionstiden på ett ganska automatiskt sätt. Högre former av förutsägelser baseras på representationer som tillåter logisk inferens, som kan nås och behandlas med varierande grad av intentionality och val. De bearbetas ofta medvetet hos människor. Innan de förutspådda händelserna eller systemtillstånden uppträder och beteendereaktioner utförs möjliggör sådana förutsägelser att man mentalt kan utvärdera olika strategier genom att integrera kunskap från olika källor, utforma olika sätt att reagera och jämföra vinster och förluster från varje möjlig reaktion.

Behavioral konditionering

Associativt appetitivt lärande involverar upprepad och kontingentparing mellan en godtycklig stimulans och en primär belöning (Fig. 1). Detta resulterar i allt frekventare beteendebeteende som induceras av den nu "konditionerade" stimulansen, som delvis liknar det beteendebeteende som framkallas av primärbelöningen och påverkas också av naturen hos den konditionerade stimulansen. Det verkar som om den konditionerade stimulansen tjänar som en prediktor av belöning och, ofta på grundval av en lämplig enhet, sätter ett internt motiverande tillstånd som leder till beteendereaktionen. Likheten av tillvägagångssreaktioner antyder att några av de allmänna preparatets komponenter i beteenderesponsen överförs från primärbelöningen till den tidigast konditionerade, belöningsspecifika stimulansen. Således fungerar den konditionerade stimulansen delvis som ett motivationsutbyte för primär stimulans, förmodligen genom Pavlovsk lärande (Dickinson 1980).

Fig. 1. 

Behandling av aptitiva stimuli under inlärning. En godtycklig stimulans blir associerad med en primär mat eller flytande belöning genom upprepad, kontingent parning. Denna konditionerade, belöningsspecifika stimulans inducerar ett internt motiverande tillstånd genom att framkalla en förväntan på belöningen, ofta på grundval av en motsvarande hunger- eller törstdrift, och framkallar beteendereaktionen. Detta schema replikerar grundläggande begrepp om incitament motivationsteori utvecklad av Bindra (1968) och Bolles (1972). Det gäller klassisk konditionering, där belöning automatiskt levereras efter den konditionerade stimulansen och till instrumental (operant) konditionering, där belöningsleverans kräver en reaktion av subjektet till den konditionerade stimulansen. Detta system gäller också för aversiv konditionering som inte vidareutvecklas av korthetsskäl.

Många så kallade "okonditionerade" mat och likvida belöningar lär sig troligen genom erfarenhet, som alla besökare i utlandet kan bekräfta. Den primära belöningen kan då bestå av den smak som upplevs när objektet aktiverar gustatoriska receptorer, men det kan återigen läras. Den ultimat givande effekten av näringsämnen består förmodligen av deras specifika påverkan på grundläggande biologiska variabler, såsom elektrolyt-, glukos- eller aminosyrakoncentrationer i plasma och hjärna. Dessa variabler definieras av organismens vegetativa behov och uppstår genom evolutionen. Djur undviker näringsämnen som inte påverkar viktiga vegetativa variabler, till exempel livsmedel som saknar sådana väsentliga aminosyror som histidin (Rogers och Harper 1970), treonin (Hrupka et al. 1997; Wang et al. 1996) eller metionin (Delaney och Gelperin 1986). Några primära belöningar kan bestämmas av medfödda instinkter och stödja initialt beteendebeteende och intag i tidigt liv, medan majoriteten av belöningarna skulle läras under den efterföljande livserfarenheten av ämnet. Det fysiska utseendet av belöningar då kan användas för att förutsäga de mycket långsammare vegetativa effekterna. Detta skulle dramatiskt påskynda upptäckten av belöningar och utgöra en stor fördel för överlevnad. Lärande av belöningar tillåter också att ämnen använder en mycket större mängd näringsämnen som effektiva belöningar och därigenom ökar deras chans att överleva i zoner med knappa resurser.

ADAPTIVA ANSVAR FÖR ATT LÄMNA STIMULIER

Cellceller av dopaminneuroner är främst belägna i midbraingrupper A8 (dorsalt till lateralt substantia nigra), A9 (pars compacta av substantia nigra) och A10 (ventral tegmental area medial till substantia nigra). Dessa neuroner frigör neurotransmittorn dopamin med nervimpulser från axonala varicositeter i striatumen (caudate-kärnan, putamen och ventralstriatum inklusive kärnbärande accumbens) och främre cortex för att nämna de viktigaste platserna. Vi registrerar impulsaktiviteten från cellkroppar av enkla dopaminneuroner under perioder av 20-60 min med rörliga mikroelektroder från extracellulära positioner medan apor lär eller utför beteendemässiga uppgifter. De karakteristiska polyfasiska, relativt långa impulserna som släpps ut vid låga frekvenser gör dopaminneuroner lätt skiljbara från andra midbrainneuroner. De anställda beteendeparamigmerna innefattar reaktionstiduppgifter, direkta och fördröjda gå-no-go-uppgifter, rumsfördröjda svar och växlingsuppgifter, luftpuff och saltlösning aktiva undvikande uppgifter, operant och klassiskt betingade visuella diskrimineringsuppgifter, självinitierade rörelser och oförutsedd leverans av belöning i avsaknad av någon formell uppgift. Om 100-250 dopaminneuroner studeras i varje beteendessituation, och fraktioner av uppgiftsmodulerade neuroner refererar till dessa prover.

Initiala inspelningsstudier sökte efter korrelater av parkinsonsmotoriska och kognitiva underskott i dopaminneuroner men misslyckades med att finna tydliga kovariationer med arm- och ögonrörelser (DeLong et al. 1983; Schultz och Romo 1990; Schultz et al. 1983) eller med magnetiska eller rumsliga komponenter av fördröjda svarsuppgifter (Schultz et al. 1993). Däremot fann man att dopaminneuroner aktiverades på ett mycket distinkt sätt genom de givande egenskaperna hos ett brett spektrum av somatosensoriska, visuella och auditiva stimuli.

Aktivering med primär aptitiva stimuli

Om 75% av dopaminneuroner visar fasaktioner när djur berör en liten bit av dold mat under utforskande rörelser i frånvaro av andra fasastimuli, utan att aktiveras av själva rörelsen (Romo och Schultz 1990). De återstående dopaminneuronerna svarar inte på någon av de testade miljömässiga stimuli. Dopaminneuroner aktiveras också av en droppe vätska som levereras i munnen utanför någon beteendemässig uppgift eller samtidigt som man lär sig sådana olika paradigmer som visuell eller auditiv reaktionstid, rumsfördröjt svar eller växelverkan och visuell diskriminering, ofta i samma djur (Fig . 2 topp) (Hollerman och Schultz 1996; Ljungberg et al. 1991, 1992; Mirenowicz och Schultz 1994; Schultz et al. 1993). Belöningssvaret uppstår oberoende av en inlärningskontext. Dopaminneuroner verkar således inte diskriminera mellan olika matobjekt och flytande belöningar. Men deras svar skiljer belöningar från icke-återvändande objekt (Romo och Schultz 1990). Endast 14% av dopaminneuroner visar fasaktiviseringen när primära aversiva stimuli presenteras, såsom en luftpuff på handen eller hypertonisk saltlösning i munnen, och de flesta aktiverade neuronerna svarar också till belöningar (Mirenowicz och Schultz 1996). Även om de är nonnoxious, är dessa stimuli aversiva eftersom de stör uppförande och inducerar aktiva undvikande reaktioner. Dopaminneuroner är emellertid inte helt okänsliga för aversiva stimuli, vilket framgår av långsamma depression eller tillfälliga långsamma aktiveringar efter smärta nypa stimuli i bedövade apor (Schultz och Romo 1987) och genom ökad striatal dopaminfrisättning efter elektrisk stöt och svansnyp i vakna råttor (Abercrombie et al. 1989; Doherty och Gratton 1992; Louilot et al. 1986; Young et al. 1993). Detta tyder på att de phasiska responserna hos dopaminneuroner företrädesvis rapporterar miljömässiga stimuli med primärt appetitivt värde, medan aversiva händelser kan signaleras med en betydligt långsammare tidskurs.

Fig. 2. 

Dopaminneuroner rapporterar belöningar enligt ett fel i belöningsprognos. ★★★★: droppe vätska inträffar trots att ingen belöning förutspås vid denna tidpunkt. Förekomst av belöning utgör således ett positivt fel i förutsägelsen av belöning. Dopaminneuron aktiveras av oförutsedd förekomst av vätskan. Mitten: Konditionerad stimulans förutsäger en belöning, och belöningen sker enligt förutsägelsen, följaktligen inget fel i förutsägelsen av belöning. Dopaminneuron misslyckas med att aktiveras av det förutspådda belöningen (höger). Det visar också en aktivering efter den belöningsspecifika stimulansen, vilket uppstår oberoende av ett fel i förutsägelsen av den senare belöningen (vänster). Botten: konditionerad stimulans förutsäger en belöning, men belöningen uppstår inte på grund av bristande reaktion från djuret. Aktiviteten hos dopaminneuronen deprimeras exakt vid den tidpunkt då belöningen skulle ha inträffat. Observera depression som inträffar> 1 s efter den konditionerade stimulansen utan några mellanliggande stimuli, vilket avslöjar en intern process av belöningsförväntan. Neuronal aktivitet i de 3 graferna följer ekvationen: dopaminrespons (belöning) = belöning inträffade - belöning förutsagt. CS, konditionerad stimulans; R, primär belöning. Omtryckt från Schultz et al. (1997) med tillstånd av American Association for Advance of Science.

Oförutsägbarhet av belöning

Ett viktigt inslag i dopaminreaktioner är deras beroende av händelse oförutsägbarhet. Aktiveringarna som följer belöningar uppstår inte när mat och flytande belöningar föregås av fasiska stimuli som har varit konditionerade för att förutsäga sådana belöningar (Fig. 2, mitten) (Ljungberg et al. 1992; Mirenowicz och Schultz 1994; Romo och Schultz 1990). En avgörande skillnad mellan lärande och fullt förvärvat beteende är graden av belöning oförutsägbarhet. Dopaminneuroner aktiveras av belöningar under inlärningsfasen men slutar reagera efter fullständigt förvärv av visuella och auditiva reaktionstidsuppgifter (Ljungberg et al. 1992; Mirenowicz och Schultz 1994), rumsliga fördröjda svarsuppgifter (Schultz et al. 1993) och samtidiga visuella diskrimineringar (Hollerman och Schultz 1996). Förlusten av respons beror inte på en generell generell okänslighet för belöningar, eftersom aktiveringar efter belöningar som levereras utanför uppgifterna inte minskar under flera månader av experiment (Mirenowicz och Schultz 1994). Betydelsen av oförutsägbarhet innefattar belöningstid, vilket visas genom övergående aktiveringar efter belöningar som plötsligt levereras tidigare eller senare än förutspådda (Hollerman och Schultz 1996). Tillsammans måste förekomsten av belöning, inklusive dess tid, vara oförutsedd för att aktivera dopaminneuroner.

Depression genom utelämnandet av förutsagt belöning

Dopaminneuroner är deprimerade exakt vid tiden för den vanliga förekomsten av belöning när en fullständigt förutspådd belöning inte uppstår, även i avsaknad av en omedelbart föregående stimulans (Fig. 2, botten). Detta observeras när djur inte får belöning på grund av felaktigt beteende, när vätskeflödet avbryts av experimentet trots korrekt beteende eller när en ventil öppnas hörbart utan att leverera vätska (Hollerman och Schultz 1996; Ljungberg et al. 1991; Schultz et al. 1993). När belöningsavgiften försenas för 0.5 eller 1.0 s sker en depression av neuronaktivitet vid löpande tidpunkt och en aktivering följer belöningen vid den nya tiden (Hollerman och Schultz 1996). Båda svaren uppstår endast under några repetitioner tills den nya tiden för belöningsleverans förutspås igen. Däremot levererar belöning tidigare än vanligt resulterar i en aktivering vid den nya tiden av belöning men misslyckas med att inducera en depression vid den vanliga tiden. Detta föreslår att ovanligt tidig belöningsavgift avbryter belöningsprognosen för den vanliga tiden. Dopaminneuroner övervakar således både förekomsten och tiden för belöning. I avsaknad av stimuli som omedelbart föregår den utelämnade belöningen utgör depressionerna inte ett enkelt neuronalt svar utan återspeglar en förväntningsprocess baserad på en intern klocka som spårar den exakta tiden för förutsagt belöning.

Aktivering genom konditionerad, belönings-förutsägande stimuli

Om 55-70% av dopaminneuroner aktiveras av konditionerade visuella och auditiva stimuli i de olika klassiskt eller instrumentellt konditionerade uppgifter som beskrivits tidigare (Fig. 2, mitten och botten) (Hollerman och Schultz 1996; Ljungberg et al. 1991, 1992; Mirenowicz och Schultz 1994; Schultz 1986; Schultz och Romo 1990; P. Waelti, J. Mirenowicz och W. Schultz, opublicerade data). De första dopaminreaktionerna på konditionerat ljus rapporterades av Miller et al. (1981) hos råttor behandlade med haloperidol, vilket ökade incidensen och spontan aktivitet av dopaminneuroner men resulterade i mer vidhäftande responser än i ej utdragna djur. Även om reaktioner uppstår nära beteendereaktioner (Nishino et al. 1987), de är inte relaterade till arm- och ögonrörelser själva, eftersom de också uppträder ipsilaterala i rörelsearmen och i försök utan arm- eller ögonrörelser (Schultz och Romo 1990). Konditionerade stimuli är något mindre effektiva än primära belöningar när det gäller responsstyrka och fraktioner av neuroner som aktiveras. Dopaminneuroner svarar endast på uppkomsten av konditionerade stimuli och inte till deras kompensation, även om stimulansförskjutningen förutspår belöningen (Schultz och Romo 1990). Dopaminneuroner skiljer inte mellan visuella och auditiva modaliteter av konditionerade aptitiva stimuli. De diskriminerar emellertid mellan aptitiva och neutrala eller aversiva stimuli så länge de är fysiskt tillräckligt olika (Ljungberg et al. 1992; P. Waelti, J. Mirenowicz och W. Schultz, opublicerade data). Endast 11% av dopaminneuroner, de flesta av dem med appetitiva svar, visar de typiska fasaktiviseringen också som svar på konditionerade aversiva visuella eller auditiva stimuli vid aktiva undvikningsuppgifter där djur släpper ut en nyckel för att undvika en luftpuff eller en droppe hypertonisk saltlösning (Mirenowicz och Schultz 1996), även om sådan undvikning kan betraktas som "givande". Dessa få aktiveringar är inte tillräckligt starka för att inducera ett genomsnittligt befolkningssvar. Följaktligen rapporterar de phasiska svaren på dopaminneuroner företrädesvis miljömässiga stimuli med appetitivt motivationsvärde men utan att skilja mellan olika sensoriska modaliteter.

Överföring av aktivering

Under loppet av inlärning blir dopaminneuroner gradvis aktiverade av konditionerade, belöningsspecifika stimuli och gradvis förlorar sina svar på primärmat eller flytande belöningar som förutspås (Hollerman och Schultz 1996; Ljungberg et al. 1992; Mirenowicz och Schultz 1994) (Fig. 2 och 3). Under en övergående inlärningsperiod framkallar både belöningar och konditionerade stimuli dopaminaktiveringar. Denna överföring från primär belöning till den konditionerade stimulansen uppstår omedelbart i enkla dopaminneuroner testade i två vällärdade uppgifter som utnyttjar respektive oförutsedda och förutspådda belöningar (Romo och Schultz 1990).

Fig. 3. 

Dopaminresponsöverföring till tidigast prediktiv stimulans. Svar på oförutsedd primär belöning överföra till progressivt tidigare belöning-förutsägande stimuli. Alla bildskärmar visar populationshistogram erhållna genom medelvärde för normaliserad periektidshistogram av alla dopaminneuroner registrerade i de angivna beteendessituationerna oberoende av närvaron eller frånvaron av ett svar. ★★★★: Utan någon beteendemässig uppgift finns inget befolkningssvar i 44-neuroner testat med ett litet ljus (data från Ljungberg et al. 1992), men ett genomsnittligt svar inträffar i 35 nervceller till en droppe vätska som levereras vid en pip framför djurets mun (Mirenowicz och Schultz 1994). Mitten: Svar på ett belöningsspådom för utlösande stimulans i en XDOM-val av rumslig uppgift, men frånvaro av respons på belöning som levereras under etablerad uppgift i samma 2-neuroner (Schultz et al. 1993). Botten: svar på en instruktion cue som föregår den belöningsspecifika trigger-stimulansen med ett bestämt intervall av 1 s i en instruerad rumslig uppgift (19-neuroner) (Schultz et al. 1993). Tidsbasen är uppdelad på grund av varierande intervall mellan konditionerade stimuli och belöning. Reprinted from Schultz et al. (1995b) med tillstånd från MIT Press.

Oförutsägbarhet för konditionerade stimuli

Aktiveringarna efter konditionerade, belöningsspecifika stimuli uppträder inte när dessa stimuli själva föregås vid ett bestämt intervall med fasakonditionerade stimuli i fullt etablerade beteendessituationer. Sålunda aktiveras med seriekonditionerade stimuli dopaminneuroner med den tidigaste belöningsspecifika stimulansen, medan alla stimuli och belöningar som följer vid förutsägbara stunder efteråt är ineffektiva (Fig. 3) (Schultz et al. 1993). Endast slumpmässigt åtskilda sekventiella stimuli framkallar individuella svar. Vidare dämpar omfattande överträning med starkt stereotyp arbetsuppgift prestationerna på konditionerade stimuli, förmodligen för att stimuli förutspås av händelser i föregående försök (Ljungberg et al. 1992). Detta tyder på att stimulans oförutsägbarhet är ett vanligt krav för alla stimuliaktiverande dopaminneuroner.

Depression genom utelämnande av förutsagda konditionerade stimuli

Preliminära data från ett tidigare experiment (Schultz et al. 1993) föreslår att dopaminneuroner också är deprimerade när en konditionerad, belöningsspecifik stimulans förutses vid en bestämd tid av en föregående stimulans men misslyckas att uppstå på grund av ett fel hos djuret. Precis som med primärt belöningar inträffar depressionerna vid tiden för den vanliga förekomsten av den konditionerade stimulansen utan att direkt framkallas av en föregående stimulans. Sålunda kan den utelämningsinducerade depressionen generaliseras till alla aptitliga händelser.

Aktiveringsdepression med responsgeneralisering

Dopaminneuroner svarar också på stimuli som inte förutsäger belöningar men liknar likartat belöning - förutsäga stimuli som förekommer i samma sammanhang. Dessa svar består huvudsakligen av en aktivering följt av en omedelbar depression men kan ibland bestå av ren aktivering eller ren depression. Aktiveringarna är mindre och mindre frekventa än de som följer belöningsspecifika stimuli, och depressionerna observeras i 30-60% av neuroner. Dopaminneuroner svarar mot visuella stimuli som inte följs av belöning men liknar snarlikt belöningsprognoser, trots korrekt beteendeskriminering (Schultz och Romo 1990). Öppning av en tom låda misslyckas med att aktivera dopaminneuroner men blir effektiv i varje försök så snart som låsen ibland innehåller mat (Ljungberg et al. 1992; Schultz 1986; Schultz och Romo 1990) eller när en närliggande, identisk låda som alltid innehåller mat öppnas i slumpmässig växling (Schultz och Romo 1990). Den tomma rutan framkallar svagare aktiveringar än betet låda. Djur utför oskulära ögonreaktionsreaktioner på varje lådan, men ansluter endast den baited lådan med sin hand. Under inlärningen fortsätter dopaminneuronerna att reagera på tidigare konditionerade stimuli som förlorar deras belöningsspecifikation när belöningsförändringar förändras (Schultz et al. 1993) eller svara på nya stimuli som liknar tidigare konditionerade stimuli (Hollerman och Schultz 1996). Svar förekommer även till aversiva stimuli presenterade i slumpmässig växling med fysiskt liknande, konditionerade aptitiva stimuli av samma sensoriska modalitet, det aversiva svaret är svagare än den aptitativa (Mirenowicz och Schultz 1996). Responsen generaliserar till och med till behavioralt släckta aptitiva stimuli. Uppenbarligen genererar neuronala svar till icke-aptitiva stimuli på grund av deras fysiska likhet med aptitiva stimuli.

Nyhetssvar

Nya stimuli framkallar aktiveringar i dopaminneuroner som ofta följs av depressioner och kvarstår så länge beteendeorienterande reaktioner förekommer (t.ex. okulära sackader). Aktiveringarna avtar tillsammans med orienterande reaktioner efter flera stimulusupprepningar, beroende på stimulans fysiska inverkan. Medan små ljusdioder knappast framkallar nyhetssvar, ljusblinkar och den snabba visuella och hörselöppningen av en liten låda framkallar aktiveringar som sönderfaller gradvis till baslinjen under <100 försök (Ljungberg et al. 1992). Höga klick eller stora bilder direkt framför ett djur framkallar starka nyhetssvar som förfaller men ändå inducerar mätbara aktiveringar med> 1,000 försök (Hollerman och Schultz 1996; Horvitz et al. 1997; Steinfels et al. 1983). Figur 4 visar schematiskt de olika responsnivåerna med nya stimuli av olika fysiska salience. Svaren försvinner gradvis med upprepad exponering men kan kvarstå vid reducerade storheter med mycket framträdande stimuli. Response magnitudes ökar igen när samma stimuli är aptitligt konditionerade. Däremot minskar responsen på nya, till och med stora stimuli snabbt när stimuli används för att konditionera aktivt undvikande beteende (Mirenowicz och Schultz 1996). Mycket få nervceller (<5%) svarar i mer än några få försök på iögonfallande men fysiskt svaga stimuli, som att papper smuler eller grova handrörelser från experimentet.

Fig. 4. 

Tidskurser av aktiveringar av dopaminneuroner till nya, varnande och konditionerade stimuli. Aktiveringar efter nya stimuli minskar med upprepad exponering under pågående försök. Deras storlek beror på stimulans fysiska hälsa, eftersom starkare stimuli inducerar högre aktiveringar som ibland överstiger de efter konditionerade stimuli. Särskilt framträdande stimuli fortsätter att aktivera dopaminneuroner med begränsad storlek även efter att ha förlorat sin nyhet utan att vara parad med primärbelöning. Konsekventa aktiveringar visas igen när stimuli blir associerade med primärbelöningar. Detta system har bidragits av Jose Contreras-Vidal.

Homogen karaktär av svaren

De experiment som utförts hittills har visat att majoriteten av neuroner i dopamincellsgrupperna A8, A9 och A10 i mittenharts visar mycket liknande aktiveringar och depressioner i en given beteendessituation, medan de återstående dopaminneuronerna inte svarar alls. Det finns en tendens för högre fraktioner av neuroner som svarar i mer mediala områden i midbrainen, såsom det ventrala tegmentala området och mediala substantia nigra, jämfört med fler laterala regioner som ibland når statistisk signifikans (Schultz 1986; Schultz et al. 1993). Svarsfördröjningar (50–110 ms) och varaktigheter (<200 ms) är lika bland primära belöningar, konditionerade stimuli och nya stimuli. Sålunda utgör dopaminsvaret en relativt homogen, skalär populationssignal. Det klassificeras i storlek av responsen hos enskilda neuroner och av andelen svarande neuroner inom befolkningen.

Sammanfattning 1: adaptiva svar vid lära episoder

Egenskaperna hos dopaminresponser till belöningsrelaterade stimuli illustreras bäst i lärandepisoderna under det att dessa belöningar är särskilt viktiga för att förvärva beteenderesponser. Dopaminbelöningssignalen genomgår systematiska förändringar under lärandets framsteg och uppträder vid den tidigaste fasbaserade belöningsrelaterade stimulansen, detta är antingen en primär belöning eller en belöningsspådande stimulans (Ljungberg et al. 1992; Mirenowicz och Schultz 1994). Under inlärning inducerar nya, intrinsikt neutrala stimuli transienta reaktioner som försvagar snart och försvinner (Fig. 4). Primärbelöningar uppträder oförutsägbart under initial parning med sådana stimuli och framkallar neuronala aktiveringar. Med upprepad parning förutspås belöningar av konditionerade stimuli. Aktiveringar efter belöningen minskar gradvis och överförs till den konditionerade, belöningsspecifika stimulansen. Om emellertid en förutsedd belöning inte uppstår på grund av ett fel hos djuret, dopaminneuroner deprimeras vid den tid belöningen skulle ha inträffat. Vid upprepat lärande av uppgifter (Schultz et al. 1993) eller uppgiftskomponenter (Hollerman och Schultz 1996) aktiverar de tidigast konditionerade stimuli dopaminneuronerna under alla inlärningsfaser på grund av generalisering till tidigare lärda, liknande stimuli, medan efterföljande konditionerade stimuli och primärbelöningar endast aktiverar dopaminneuroner medan de är osäkra och nya händelser etableras.

Sammanfattning 2: Effektiva stimuli för dopaminneuroner

Dopaminreaktioner framkallas av tre kategorier av stimuli. Den första kategorin består av primära belöningar och stimuli som har blivit giltiga belöningspredictorer genom upprepad och kontingentparning med belöningar. Dessa stimuli bildar en gemensam klass av uttryckliga belöningsspecifika stimuli, eftersom primära belöningar tjänar som prediktorer av vegetativa givande effekter. Effektiva stimuli har uppenbarligen en varningskomponent, eftersom endast stimuli med en klar inverkan är effektiva. Dopaminneuroner visar rena aktiveringar efter uttryckliga belöningsspecifika stimuli och är deprimerade när en förutspådd men utelämd belöning inte uppstår (Fig. 5, topp).

Fig. 5. 

Schematisk visning av svar på dopaminneuroner till 2-typer av konditionerade stimuli. ★★★★: Presentation av en uttrycklig belöningsspecifik stimulans leder till aktivering efter stimulans, inget svar på det förutspådda belöningen och depression när en förutsedd belöning inte uppstår. Botten: Presentation av en stimulans som nära liknar en konditionerad, belöningsspecifik stimulans leder till aktivering följt av depression, aktivering efter belöningen och inget svar när ingen belöning uppstår. Aktivering efter stimulansen återspeglar antagligen generalisering av respons på grund av fysisk likhet. Denna stimulans förutsätter inte uttryckligen en belöning men är relaterad till belöningen via dess likhet med stimulansen som förutsäger belöningen. I jämförelse med uttryckliga belöningsspecifika stimuli är aktiveringarna lägre och följs ofta av fördjupningar, vilket således diskriminerar mellan belönade (CS +) och obelöna (CS-) konditionerade stimuli. Detta schema sammanfattar resultaten från tidigare och nuvarande experiment (Hollerman och Schultz 1996; Ljungberg et al. 1992; Mirenowicz och Schultz 1996; Schultz och Romo 1990; Schultz et al. 1993; P. Waelti och W. Schultz, opublicerade resultat).

Den andra kategorin omfattar stimuli som framkallar generaliserande svar. Dessa stimuli förutspår inte uttryckligen belöningar men är effektiva på grund av deras fysiska likhet med stimuli som har blivit uttryckliga belöningsspecifika medel genom konditionering. Dessa stimuli inducerar aktiveringar som är lägre i storlek och involverar färre neuroner, jämfört med uttryckliga belöningsspecifika stimuli (Fig. 5, botten). De följs ofta av omedelbara depressioner. Den initiala aktiveringen kan utgöra ett generaliserat appetitivt svar som signalerar en eventuell belöning, men den efterföljande depressionen kan spegla förutsägelsen av ingen belöning i ett generellt belöningsspecifikt sammanhang och avbryta felaktigt beloppsantagandet. Bristen på uttrycklig belöningsprognos föreslås ytterligare genom närvaron av aktivering efter primär belöning och frånvaro av depression utan belöning. Tillsammans med svaren på belöningsspecifika stimuli verkar det som om dopaminaktivering rapporterar en appetitiv "tagg" anbringad på stimuli som är relaterade till belöningar.

Den tredje kategorin omfattar nya eller särskilt framträdande stimuli som inte nödvändigtvis är relaterade till specifika fördelar. Genom att framkalla beteendeorienterande reaktioner, larmar dessa stimuli och kommenderar uppmärksamhet. De har emellertid också motiverande funktioner och kan vara givande (Fujita 1987). Nya stimuli är potentiellt aptitliga. Nya eller särskilt framträdande stimuli inducerar aktiveringar som ofta följs av depressioner, liknande reaktioner på generaliserande stimuli.

Således rapporterar de fasiska responserna hos dopaminneuroner händelser med positiva och potentiellt positiva motivativa effekter, såsom primärbelöningar, belöningsspecifika stimuli, belöningsliknande händelser och varnande stimuli. De upptäcker emellertid inte i stor utsträckning händelser med negativa motivativa effekter, såsom aversiva stimuli.

Sammanfattning 3: Dopaminprisförutsägningsfelsignalen

Dopaminresponserna till uttryckliga belöningsrelaterade händelser kan bäst konceptualiseras och förstås i form av formella teorier om lärande. Dopaminneuroner rapporterar belöningar i förhållande till deras förutsägelse snarare än att signalera primärbelöningar ovillkorligt (Fig. 2). Dopaminresponsen är positiv (aktivering) när primärbelöning uppstår utan att förutsäga. Svaret är noll när belöningar uppträder som förutsagt. Svaret är negativt (depression) när förutsagda belöningar utelämnas. Dopaminneuroner rapporterar således primärbelöningar enligt skillnaden mellan förekomsten och förutsägelsen av belöning, vilket kan betecknas som ett fel i förutsägelsen av belöning (Schultz et al. 1995b, 1997) och är preliminärt formaliserad som

DopamineResponse (Belöna)=RewardOccurred-RewardPredicted

Ekvation 1Detta förslag kan utökas till konditionerade aptitliga händelser som också rapporteras av dopaminneuroner i förhållande till prediktionen. Dopaminneuroner kan sålunda rapportera ett fel i förutsägelsen av alla aptitliga händelser, och Eq. 1 kan anges i mer generell form

DopamineResponse (ApEvent)=ApEventOccurred-ApEventPredicted

Ekvation 2Denna generalisering är förenlig med tanken att de flesta belöningar faktiskt är konditionerade stimuli. Med flera på varandra följande, väletablerade belöningsspecifika händelser är endast den första händelsen oförutsägbar och framkallar dopaminaktivering.

ANSLUTNING AV DOPAMINNURONER

Ursprung av dopaminreaktionen

Vilka anatomiska ingångar kan vara ansvariga för selektiviteten och polysensoriska beskaffenheten av dopaminreaktioner? Vilken inmatningsaktivitet kan leda till kodning av förutsägelsesfel, inducera den adaptiva responsöverföringen till den tidigast oförutsedda händelsehändelsen och uppskatta belöningstidpunkten?

DORSAL OCH VENTRAL STRIATUM.

GABAergic neuronerna i striatumerna (streck) av striatumprojektet på ett stort topografiskt och delvis överlappande, interdigitiserande sätt gentemot dopaminneuroner i nästan hela pars compacta av substantia nigra, medan neuroner av den mycket större striatala matrisen i huvudsak kontaktar nondopaminneuronerna av pars reticulata av substantia nigra, förutom deras projektion till globus pallidus (Gerfen 1984; Hedreen och DeLong 1991; Holstein et al. 1986; Jimenez-Castellanos och Graybiel 1989; Selemon och Goldman-Rakic ​​1990; Smith och Bolam 1991). Neuroner i ventralstriatumprojektet på nontopografiskt sätt för både pars compacta och pars reticulata av medial substantia nigra och till ventral tegmentalområdet (Berendse et al. 1992; Haber et al. 1990; Lynd-Balta och Haber 1994; Somogyi et al. 1981). Den GABAergiska striatonigralprojektionen kan utöva två tydligt olika influenser på dopaminneuroner, en direkt inhibering och en indirekt aktivering (Grace and Bunney 1985; Smith och Grace 1992; Tepper et al. 1995). Den senare förmedlas av striatalinhibering av pars retikulatneuroner och efterföljande GABAergisk inhibering från lokala axon-collateraler av pars reticulata-utgångsneuroner på dopaminneuroner. Detta utgör en dubbel hämmande länk och resulterar i netaktivering av dopaminneuroner med striatumet. Således kan inhibosomer och ventralstriatum inhibera monosynaptiskt och matrisen kan indirekt aktivera dopaminneuroner.

Dorsala och ventrala striatala neuroner visar ett antal aktiveringar som kan bidra till dopaminbelöningssvar, nämligen svar på primära belöningar (Apicella et al. 1991a; Williams et al. 1993), svar på belöningsspecifika stimuli (Hollerman et al. 1994; Romo et al. 1992) och fördröjda aktiveringar under förväntan om belöningsprognoser och primära belöningar (Apicella et al. 1992; Schultz et al. 1992). Positionerna hos dessa neuroner i förhållande till striosomer och matris är emellertid okända, och striatalaktivering som återspeglar tiden för förväntad belöning har ännu inte rapporterats.

De polysensoriska belöningssvaren kan vara resultatet av funktionen extraktion i kortikala associeringsområden. Svar latenser av 30-75 ms i primär och associativ visuell cortex (Maunsell och Gibson 1992; Miller et al. 1993) kunde kombineras med snabb ledning till striatum och dubbel hämning av substantia nigra för att inducera de korta dopaminresponslatenserna på <100 ms. Medan belöningsrelaterad aktivitet inte har rapporterats för bakre associerings cortex, svarar neuroner i dorsolateral och orbital prefrontal cortex på primära belöningar och belöningsförutsägande stimuli och visar ihållande aktiveringar under belöningsförväntningen (Rolls et al. 1996; Thorpe et al. 1983; Tremblay och Schultz 1995; Watanabe 1996). Vissa belöningssvar i frontal cortex beror på belopp oförutsägbarhet (Matsumoto et al. 1995; L. Tremblay och W. Schultz, opublicerade resultat) eller reflektera beteendefel eller utelämnade belöningar (Niki och Watanabe 1979; Watanabe 1989). Den kortikala påverkan på dopaminneuroner skulle till och med bli snabbare genom en direkt projicering, som härrör från prefrontal cortex hos råttor (Gariano och Groves 1988; Sesack och Pickel 1992; Tong et al. 1996) men är svag i apor (Künzle 1978).

NUCLEUS PEDUNCULOPONTINUS.

Korta latenser av belöningssvar kan härledas från adaptiva mekanismer för funktionsbehandling i hjärnstammen. Nucleus pedunculopontinus är en evolutionär föregångare av substantia nigra. I nonmammalian vertebrates innehåller den dopaminneuroner och projekt till paleostriatumen (Lohman och Van Woerden-Verkley 1978). I däggdjur sänder denna kärna starka excitatoriska, kolinerga och glutamatergiska influenser till en stor del dopaminneuroner med latenser av ~7 ms (Bolam et al. 1991; Clarke et al. 1987; Futami et al. 1995; Scarnati et al. 1986). Aktivering av pedunculopontin-dopaminprojektioner inducerar cirkelbeteende (Niijima och Yoshida 1988), vilket tyder på ett funktionellt inflytande på dopaminneuroner.

Amygdala.

En massiv, antagligen excitatorisk ingång till dopaminneuroner uppstår från olika kärnor av amygdalaen (Gonzalez och Chesselet 1990; Pris och Amaral 1981). Amygdala neuroner svarar på primärbelöningar och belöningspåvisande visuella och auditiva stimuli. De hittills kända neuronala svaren är oberoende av stimulans oförutsägbarhet och diskriminerar inte väl mellan appetitiva och aversiva händelser (Nakamura et al. 1992; Nishijo et al. 1988). De flesta svaren visar latenser av 140-310 ms, vilka är längre än i dopaminneuroner, även om några svar uppstår vid latenser av 60-100 ms.

DORSAL RAPHÉ.

Den monosynaptiska utsprånget från dorsal raphé (Corvaja et al. 1993; Nedergaard et al. 1988) har ett depressivt inflytande på dopaminneuroner (Fibiger et al. 1977; Trent och Tepper 1991). Raphé-neuroner uppvisar kort latentaktivering efter högintensiva miljöstimuli (Heym et al. 1982), så att de kan bidra till dopaminreaktioner efter nya eller särskilt framträdande stimuli.

SYNTES.

Några, välkända inmatningsstrukturer är de mest sannolika kandidaterna för att mediera dopaminreaktionerna, även om ytterligare ingångar kan existera. Aktiveringar av dopaminneuroner med primärbelöningar och belöningsspecifika stimuli kan medieras av dubbelhämmande, nätaktiverande ingång från striatalmatrisen (för ett förenklat diagram, se fig. 6). Aktiveringar kan också uppstå från pedunculopontin-kärnan eller möjligen från förväntningsrelaterad aktivitet i neuroner i subthalamuskärnan som skjuter ut till dopaminneuroner (Hammond et al. 1983; Matsumura et al. 1992; Smith et al. 1990). Frånvaron av aktivering med fullt förutsagda belöningar kan vara resultatet av monosynaptisk inhibering från striosomer, avbryta samtidigt aktiverande matrisingång. Depressioner vid tidpunkten för utelämnad belöning kan medieras av hämmande ingångar från neuroner i striatala striosomer (Houk et al. 1995) eller globus pallidus (Haber et al. 1993; Hattori et al. 1975; Y. Smith och Bolam 1990, 1991). Konvergens mellan olika ingångar före eller vid nivån av dopaminneuroner kan resultera i den ganska komplexa kodningen av belöningsspecifikationsfel och den adaptiva responsöverföringen från primärbelöningar till belöningsspecifika stimuli.

Fig. 6. 

Förenklat schema över ingångar till dopaminneuron i mitten av hjärnan, vilket potentiellt medierar dopaminreaktioner. Endast ingrepp från caudate till substantia nigra (SN) pars compacta och reticulata visas av enkla skäl. Aktiveringar kan uppstå genom ett dubbelhämmande, nätaktiverande inflytande från GABAergic-matrixneuroner i caudat och putamen via GABAergic neuroner av SN pars reticulata till dopaminneuroner av SN pars compacta. Aktiveringar kan också medieras av excitatoriska kolinerga eller aminosyrainnehållande utsprång från kärnpedunculopontinus. Depressioner kan bero på monosynaptiska GABAerga projektioner från striosomer (lappar) i caudat och putamen till dopaminneuroner. Liknande prognoser existerar från ventralstriatum till dopaminneuroner i medial SN pars compacta och grupp A10 i ventral tegmentalområdet och från dorsalstriatum till grupp A8 dopaminneuroner dorsolaterala till SN (Lynd-Balta och Haber 1994). Tung cirkel representerar dopaminneuroner. Dessa prognoser representerar de mest sannolika insatserna som ligger till grund för dopaminreaktionerna, utan att utesluta ingångar från globus pallidus och subthalamiska kärnor.

Fasisk dopaminpåverkan på målstrukturer

GLOBAL NATUR AV DOPAMIN SIGNAL.

Divergerande utsprång. Det finns ~8,000 dopaminneuroner i varje substantiv nigra av råttor (Oorschot 1996) och 80,000-116,000 i macaque apor (German et al. 1988; Percheron et al. 1989). Varje striatum innehåller ~2.8 miljoner neuroner hos råttor och 31-miljoner i makaques, vilket resulterar i en nigrostriatal divergensfaktor av 300-400. Varje dopaminaxon ramifieras rikligt i ett begränsat terminalområde i striatum och har ~500,000 striatala varicositeter från vilka dopamin frisätts (Anden et al. 1966). Detta resulterar i dopamininmatning till nästan varje striatal neuron (Groves et al. 1995) och en måttlig topografisk nigrostriatalprojektion (Lynd-Balta och Haber 1994). Den kortikala dopamininnervationen hos apor är högst i områdena 4 och 6, är fortfarande stor i frontal, parietal och temporal lobes och är lägst i occipitalloben (Berger et al. 1988; Williams och Goldman-Rakic ​​1993). Cortikala dopaminsynapser finns övervägande i skikten I och V-VI, där en stor del av kortikala nervceller kontaktas där. Tillsammans med den ganska homogena responsen naturen föreslår dessa data att dopaminreaktionen förflyttas som en simultan parallellvåg av aktivitet från mitten till striatum och frontal cortex (Fig. 7).

Fig. 7. 

Global dopamin signal sträcker sig till striatum och cortex. Relativt homogent populationsvar hos majoriteten av dopaminneuroner till appetitiva och varnande stimuli och dess progression från substantia nigra till postsynaptiska strukturer kan ses schematiskt som en våg av synkron parallell aktivitet som utvecklas med en hastighet av 1-2 m / s (Schultz och Romo 1987) längs de divergerande utsprången från midbrain till striatum (caudate och putamen) och cortex. Svaren är kvalitativt oskiljbara mellan neuroner av substantia nigra (SN) pars compacta och ventral tegmental area (VTA). Dopamin innervation av alla neuroner i striatum och många neuroner i frontal cortex skulle göra det möjligt för dopaminförstärkningssignalen att utöva en ganska global effekt. Wave har komprimerats för att betona parallell natur.

Dopaminfrisättning. Impulser av dopaminneuroner med intervall av 20-100 ms leder till en mycket högre dopaminkoncentration i striatum än samma antal impulser med intervall av 200 ms (Garris och Wightman 1994; Gonon 1988). Denna olinjäritet beror huvudsakligen på den snabba mättnaden av dopaminreceptionstransportören, vilken rensar den frigjorda dopaminen från det extrasynaptiska området (Chergui et al. 1994). Samma verkan observeras i nukleär accumbens (Wightman och Zimmerman 1990) och uppträder även med längre impulsintervall på grund av sämre återupptagningsställen (Garris et al. 1994b; Marshall et al. 1990; Stamford et al. 1988). Dopaminfrisättning efter en impulsutbrott på <300 ms är för kort för att aktivera den autoreceptormedierade minskningen av frisättningen (Chergui et al. 1994) eller den ännu långsammare enzymatiska nedbrytningen (Michael et al. 1985). Således är ett sprängande dopaminrespons särskilt effektivt för frisättning av dopamin.

Uppskattningar baserade på in vivo voltammetri antyder att en enda impulsavgivning ~1,000 dopaminmolekyler vid synapser i striatum och kärnan accumbens. Detta leder till omedelbara synaptiska dopaminkoncentrationer av 0.5-3.0 ^ M (Garris et al. 1994a; Kawagoe et al. 1992). Vid 40 μs efter frisättningsdebut har> 90% av dopamin lämnat synapsen, en del av resten elimineras senare genom synaptisk återupptagning (halvstartstid på 30–37 ms). 3–9 ms efter frisättningsdebut når dopaminkoncentrationerna en topp på ~ 250 nM när alla angränsande varicositeter samtidigt frigör dopamin. Koncentrationerna är homogena inom en sfär av 4 μm diam (Gonon 1997), vilket är det genomsnittliga avståndet mellan varicosities (Doucet et al. 1986; Groves et al. 1995). Maximal diffusion är begränsad till 12 μm av återupptagningstransportören och uppnås i 75 ms efter utsläppets början (halva transportörens starttid på 30–37 ms). Koncentrationerna skulle vara något lägre och mindre homogena i regioner med färre varicositeter eller när <100% av dopaminneuroner aktiveras, men de är två till tre gånger högre med impulsutbrott. Således kan de belöningsinducerade, mildt synkrona, sprickande aktiveringarna i ~ 75% av dopaminneuronerna leda till ganska homogena koncentrationstoppar i storleksordningen 150–400 nM. Totala ökningar av extracellulär dopamin varar 200 ms efter en enda impuls och 500–600 ms efter flera impulser med intervaller på 20–100 ms applicerade under 100–200 ms (Chergui et al. 1994; Dugast et al. 1994). Den extrasynaptiska återupptagstransportören (Nirenberg et al. 1996) leder därefter dopaminkoncentrationer tillbaka till deras baslinje av 5-10 nM (Herrera-Marschitz et al. 1996). I motsats till klassisk, strikt synaptisk neurotransmission diffunderar synaptiskt frisatt dopamin snabbt i det närmaste juxtasynaptiska området och når korta toppar av regionalt homogena extracellulära koncentrationer.

Receptorer. Av de två huvudtyperna av dopaminreceptorer utgör adenylatcyklasaktiverande D1-typreceptorer ~80% dopaminreceptorer i striatum. Av dessa 80% finns i lågaffinitetstillståndet för 2-4 ^ M och 20% i högaffinitetstillståndet för 9-74 nM (Richfield et al. 1989). De återstående 20% av striataldopaminreceptorerna hör till den adenylascyklasinhiberande D2-typen, av vilken 10-0% är i lågaffinitetstillståndet och 80-90% i högaffinitetstillståndet med liknande affiniteter som D1-receptorer. Således har D1-receptorer generellt en ~100-gånger lägre affinitet än D2-receptorer. Striatal D1-receptorer lokaliseras huvudsakligen på neuroner som projicerar till intern pallidum och substantia nigra pars reticulata, medan striatala D2-receptorer lokaliseras mestadels på neuroner som projicerar till yttre pallidum (Bergson et al. 1995; Gerfen et al. 1990; Hersch et al. 1995; Levey et al. 1993). Skillnaderna i receptorkänslighet kan emellertid inte spela en roll bortom signaltransduktion, vilket reducerar skillnaderna i dopamin-känslighet mellan de två typerna av striatala utgångsneuroner.

Dopamin frisätts till 30-40% från synaptisk och till 60-70% från extrasynaptiska varicositeter (Descarries et al. 1996). Synaptiskt frisatt dopamin verkar på postsynaptiska dopaminreceptorer vid fyra anatomiskt distinkta platser i striatumet, nämligen inuti dopaminsynapser, omedelbart intill dopaminsynapser, inuti kortikostriatala glutamatsynapser och vid extrasynaptiska ställen som är avlägsna från frisättningsställen (Fig. 8) (Levey et al. 1993; Sesack et al. 1994; Yung et al. 1995). D1-receptorer lokaliseras huvudsakligen utanför dopaminsynapser (Caillé et al. 1996). De höga transienta koncentrationerna av dopamin efter fasisk impulsburst skulle aktivera D1-receptorer i omedelbar närhet av de aktiva frisättningsställena och aktivera och till och med mätta D2-receptorer överallt. D2-receptorer skulle förbli delvis aktiverade när den omgivande dopaminkoncentrationen återgår till baslinjen efter fashöjningar.

Fig. 8. 

Påverkan av dopaminfrisättning på typiska mediumspina neuroner i dorsalt och ventralstriatum. Dopamin frisläppt med impulser från synaptiska varicositeter aktiverar några synaptiska receptorer (förmodligen av D2-typen i lågaffinitetstillståndet) och diffunderar snabbt ut ur synaps för att nå D1-receptorer med låg affinitet (D1?) Som finns i närheten, inom kortikostriatala synapser , eller på ett begränsat avstånd. Fasiskt ökad dopamin aktiverar närliggande högaffinitets D2-typreceptorer till mättnad (D2?). D2-receptorer förblir delvis aktiverade av de omgivande dopaminkoncentrationerna efter den fasiskt ökade frisättningen. Extrasynaptiskt frisatt dopamin kan spädas genom diffusion och aktivera D2-receptorer med hög affinitet. Det bör noteras att i motsats till detta schematiska diagram ligger de flesta D1- och D2-receptorer på olika neuroner. Glutamat frigjort från kortikostriatala terminaler når postsynaptiska receptorer belägna på samma dendritiska spines som dopaminvaricositeter. Glutamat når också presynaptiska dopaminvaricositeter där det kontrollerar dopaminfrisättning. Dopaminpåverkan på spiny neuroner i frontal cortex är jämförbara i många avseenden.

Sammanfattning. Det observerade, måttligt sprungande, kortvariga, nästan synkrona svaret hos majoriteten av dopaminneuroner leder till optimal samtidig dopaminfrisättning från de flesta av de nära avståndna striatalvarikositeterna. Det neuronala svaret inducerar en kort puff dopamin som frigörs från extrasynaptiska ställen eller diffunderar snabbt från synapser till det juxtasynaptiska området. Dopamin når snabbt regionalt homogena koncentrationer som sannolikt kommer att påverka dendriter av förmodligen alla striatala och många kortikala neuroner. På så sätt sänds belöningsmeddelandet i 60-80% av dopaminneuroner som en divergerande, ganska global förstärkningssignal till striatumen, kärnan accumbens och frontal cortex, vilket säkerställer en fasisk påverkan på ett maximalt antal synapser involverade i behandlingen av stimuli och handlingar som leder till belöning (Fig. 7). Dopamin frisläppt genom neuronaktivering efter belöningar och belöningsspecifika stimuli skulle påverka juxtasynaptiska D1-receptorer på striatala neuroner som projicerar till intern pallidum och substantia nigra pars reticulata och alla D2-receptorer på neuroner som projicerar till yttre pallidum. Reduktionen av dopaminfrisättning inducerad av fördjupningar med utelämnade belöningar och belöningsspecifika stimuli skulle minska tonisk stimulering av D2-receptorer med omgivande dopamin. Således skulle positiva felsökningsfel påverka alla typer av striatala utgångsneuroner, medan det negativa prediktionsfelet i huvudsak kan påverka neuroner som projicerar till yttre pallidum.

Potentiella kokainmekanismer. Blockering av dopaminreceptionstransportören med droger som kokain eller amfetamin ökar och förlänger fashöjningar i dopaminkoncentrationer (Church et al. 1987a; Giros et al. 1996; Suaud-Chagny et al. 1995). Förhöjningen skulle vara särskilt uttalad när snabba, burst-inducerade ökar i dopaminkoncentrationen når en topp innan återkopplingsreglering blir effektiv. Denna mekanism skulle leda till en kraftigt förbättrad dopamin-signal efter primärt belöningar och belöningsspecifika stimuli. Det skulle också öka den något svagare dopamin-signalen efter stimuli som liknar belöningar, nya stimuli och särskilt framträdande stimuli som kan vara vanliga i vardagen. Förhöjningen av kokain skulle låta dessa nonrewarding stimuli verkar lika stark eller till och med starkare än naturliga belöningar utan kokain. Postsynaptiska neuroner kan misstolka en sådan signal som en särskilt framstående belöningsrelaterad händelse och genomgå långsiktiga förändringar i synaptisk överföring.

DOPAMIN MEMBRANE ACTIONS.

Dopaminverkan på striatala neuroner beror på typen av receptor aktiverad, är relaterad till de depolariserade mot hyperpolariserade tillstånden av membranpotentialer och involverar ofta glutamatreceptorer. Aktivering av D1 dopaminreceptorer ökar excitationen framkallad genom aktivering av N-metyl-d-aspartat (NMDA) -receptorer efter kortikala ingångar via L-typ Ca2+ kanaler när membranpotentialen är i depolariserat tillstånd (Cepeda et al. 1993, 1998; Hernandez-Lopez et al. 1997; Kawaguchi et al. 1989). D1-aktivering tycks däremot reducera framkallade excitationer när membranpotentialen är i det hyperpolariserade tillståndet (Hernandez-Lopez et al. 1997). In vivo inducerar dopaminjontofores och axonal stimulering D1-medierade excitationer som håller 100-500 ms bortom dopaminfrisättning (Gonon 1997; Williams och Millar 1991). Aktivering av D2 dopaminreceptorer minskar Na+ och N-typ Ca2+ strömmar och dämpar excitationer som framkallas genom aktivering av NMDA- eller a-amino-3-hydroxi-5-metyl-4-isoxazolpropionsyra (AMPA) receptorer i vilket membran som helst (Cepeda et al. 1995; Yan et al. 1997). På systemnivå utövar dopamin en fokuseringseffekt, varigenom endast de starkaste ingångarna passerar genom striatum till externt och internt pallidum, medan svagare aktivitet förloras (Brun och Arbuthnott 1983; Filion et al. 1988; Toan och Schultz 1985; Yim och Mogenson 1982). Således kan dopamin som frisätts av dopaminreaktionen leda till en omedelbar total minskning av striatalaktivitet, även om en facilitatorisk effekt på kortiskt framkallade excitationer kan medieras via D1-receptorer. Följande diskussion kommer att visa att effekterna av dopamin-neurotransmission inte får begränsas till förändringar i membranpolarisation.

DOPAMIN-AFHÅLLANDE PLASTICITET.

Tetan elektrisk stimulering av kortikala eller limbiska ingångar till striatum och kärnan accumbens inducerar posttetan depressioner som varar flera tiotals minuter i skivor (Calabresi et al. 1992a; Lovinger et al. 1993; Pennartz et al. 1993; Walsh 1993; Wickens et al. 1996). Denna manipulation ökar också excitabiliteten hos kortikostriatala terminaler (Garcia-Munoz et al. 1992). Posttetanisk potentiering med liknande varaktighet observeras i striatum och kärnan accumbens när postsynaptisk depolarisering underlättas genom avlägsnande av magnesium eller applicering av y-aminobutyrsyra (GABA) -antagonister (Boeijinga et al. 1993; Calabresi et al. 1992b; Pennartz et al. 1993). D1- eller D2-dopaminreceptorantagonister eller D2-receptor-knockout avskaffar posttetan kortikostriatal depression (Calabresi et al. 1992a; Calabresi et al. 1997; Garcia-Munoz et al. 1992) men påverkar inte förstärkning i nukleobatterier (Pennartz et al. 1993). Tillämpning av dopamin återställer striatal posttetan depression i skivor från dopaminbelastade råttor (Calabresi et al. 1992a) men misslyckas med att modifiera posttetan potentiering (Pennartz et al. 1993). Korta pulser av dopamin (5-20 ms) inducerar långsiktig potentiering i striatalskivor när de appliceras samtidigt med tetanisk kortikostriatal stimulering och postsynaptisk depolarisering, vilket överensstämmer med en trefaktor förstärkning lärande regel (Wickens et al. 1996).

Ytterligare bevis för dopaminrelaterad synaptisk plasticitet finns i andra hjärnstrukturer eller med olika metoder. I hippocampus ökas posttetanförstärkning genom badapplikation av D1-agonister (Otmakhova och Lisman 1996) och nedsatt av D1- och D2-receptorblockad (Frey et al. 1990). Burst kontingent men inte brista icke-bindande lokala tillämpningar av dopamin och dopaminagonister ökar neuronbristning i hippocampala skivor (Stein et al. 1994). I fiskhinna, inducerar aktivering av D2 dopaminreceptorer rörelser av fotoreceptorer in i eller ut ur pigmentepitelet (Rogawski 1987). Posttrialinjektioner av amfetamin- och dopaminagonister i råtta caudatkärnan förbättrar prestanda i minnesuppgifter (Packard och White 1991). Dopamin-deervationer i striatumet minskar antalet dendritiska ryggraden (Arbuthnott och Ingham 1993; Anglade et al. 1996; Ingham et al. 1993), vilket tyder på att dopamininnervationen har långvariga effekter på kortikostriatala synapser.

Bearbetning i STRIATALNURONER.

Uppskattade 10,000-kortikala terminaler och 1,000-dopaminvaricositeter kontaktar dendritiska spines av varje striatal neuron (Doucet et al. 1986; Groves et al. 1995; Wilson 1995). Den täta dopamininnervationen blir synlig som korgar som beskriver individuell perikarya i duva paleostriatum (Wynne och Güntürkün 1995). Dopaminvaricositeter bildar synapser på samma dendritiska ryggrad av striatala neuroner som kontaktas av kortikala glutamatafledare (Fig. 8) (Bouyer et al. 1984; Freund et al. 1984; Pickel et al. 1981; Smith et al. 1994), och vissa dopaminreceptorer är belägna inom kortikostriatala synapser (Levey et al. 1993; Yung et al. 1995). Det höga antalet kortikala ingångar till striatala neuroner, konvergensen mellan dopamin och glutamatingångar vid spinalerna av striatala neuroner och den i stort sett homogena dopamin-signalen som sannolikt uppnår alla striatala neuroner är perfekta substrat för dopaminberoende synaptiska förändringar vid ryggraden hos striatalneuroner . Detta kan också hålla kvar för cortex där dendritiska ryggraden kontaktas av synaptiska ingångar från både dopamin och kortikala nervceller (Goldman-Rakic ​​et al. 1989), fastän dopamin förmodligen inte påverkar varje kortikal neuron.

De basala ganglierna är förbundna med öppna och slutna slingor med cortex och med subkortiska limbiska strukturer. Den striatum mottar i varierande grad ingångar från alla kortikala områden. Basalganglierutgångarna riktas huvudsakligen mot frontala kortikala områden men når också den tidiga lobben (Middleton och Strick 1996). Många ingångar från funktionellt heterogena kortikala områden till striatumen organiseras i segregerade parallella kanaler, liksom utsignalerna från intern pallidum riktad till olika motoriska kortikala områden (Alexander et al. 1986; Hoover and Strick 1993). Emellertid kan afferenter från funktionellt relaterade men anatomiskt olika kortikala områden konvergera på striatala neuroner. Exempelvis projicer från somatotoprelaterade områden av primära somatosensoriska och motoriska cortexprojekt till vanliga striatala regioner (Flaherty och Graybiel 1993, 1994). Kortikostriatala prognoser avviker i separata striatala "matrisomer" och omvandlas i pallidum, vilket ökar synaptisk "yta" för modulerande interaktioner och föreningar (Graybiel et al. 1994). Detta anatomiska arrangemang skulle göra det möjligt för dopamin-signalen att bestämma effekten av högstrukturerad, uppgiftsspecifik kortikala ingångar till striatala neuroner och utöva ett vidsträckt inflytande på förehussentra som är involverade i kontrollen av beteendemässig verkan.

ANVÄNDNING AV DOPAMIN REWARD PREDICTION ERROR SIGNAL

Dopaminneuroner verkar rapportera appetitiva händelser enligt ett prediktionsfel (Miljökvalitetsnormen. 1 och 2 ). Nuvarande inlärningsteorier och neuronmodeller visar den avgörande betydelsen av förutsägelsesfel för inlärning.

Lärande teorier

RESCORLA-WAGNER MODELL.

Behavioral learning teorier formaliserar förvärv av föreningar mellan godtyckliga stimuli och primära motiverande händelser i klassiska konditioneringsparadigmer. Stimuli får associativ styrka över konsekutiva försök genom att de upprepas ihop med en primär motivationshändelse

ΔV=αβ(λ-V)

Ekvation 3where V är den aktuella associativa styrkan hos stimulansen, A är maximal associativ styrka möjligen upprätthållen av den primära motiverande händelsen, a och p är konstanter som reflekterar saligheten av konditionerade och okonditionerade stimuli (Dickinson 1980; Mackintosh 1975; Pearce och Hall 1980; Rescorla och Wagner 1972). (A-V) termen anger graden till vilken den primära motiverande händelsen uppträder oförutsägbart och representerar ett fel i förutsägelsen av förstärkning. Det bestämmer inlärningsgraden, eftersom associativ styrka ökar när felperioden är positiv och den konditionerade stimulansen förutsätter inte fullständigt förstärkningen. När V = A, förutsätter den konditionerade stimulansen förstärkaren, och V kommer inte att öka ytterligare. Sålunda uppstår lärande endast när den primära motiverande händelsen inte är fullständigt förutsagd av en konditionerad stimulans. Denna tolkning föreslås av det blockerande fenomenet, enligt vilket en stimulus misslyckas med att uppnå associativ styrka när den presenteras tillsammans med en annan stimulans som i sin helhet förutspår förstärkaren (Kamin 1969). (A-V) felperioden blir negativ när en förutspådd förstärkare inte uppstår, vilket leder till en förlust av associativ styrka hos den konditionerade stimulansen (utrotning). Observera att dessa modeller använder termen "förstärkning" i bred mening för att öka frekvensen och intensiteten i specifikt beteende och inte hänvisa till någon särskild typ av lärande.

DELTA REGEL.

Rescorla-Wagner-modellen hänför sig till den allmänna principen om inlärning som drivs av fel mellan den önskade och den verkliga utsignalen, såsom det minst medelvärda kvadratfelproceduren (Kalman 1960; Widrow och Sterns 1985). Denna princip har tillämpats på neuronala nätverksmodeller i delregeln, enligt vilken synaptiska vikter (ω) justeras av

Δω=η(t-a)x

Ekvation 4where t är önskad (mål) -utmatning av nätverket, a är den faktiska utgången, och η och x är inlärningsfrekvens och ingångsaktivering (respektiveRumelhart et al. 1986; Widrow och Hoff 1960). Den önskade utsignalen (t) är analog med resultatet (λ), den faktiska utgången (a) är analog med förutsägelsen modifierad under inlärningen (V) och deltafel termen (δ = t - a) motsvarar förstärkningsfelperioden (A-V) i Rescorla-Wagner-regeln (Ekv. 3) (Sutton och Barto 1981).

Det allmänna beroendet av utfallet oförutsägbarhet är intuitivt för lärandets väsen. Om inlärning innebär förvärv eller förändring av förutsägelser av resultatet, kommer ingen förändring av förutsägelser och därmed inget lärande att inträffa när utfallet är perfekt väl förutsagt. Detta begränsar lärande till stimuli och beteendemässiga reaktioner som leder till överraskande eller förändrade resultat, och överflödiga stimuli som föregår resultat som redan förutspådts av andra händelser lärs inte. Förutom deras roll i lärande har förstärkare en andra, distinkt annorlunda funktion. När lärandet är klart är helt förutspådda förstärkare avgörande för att upprätthålla lärt beteende och förhindra utrotning.

Många former av inlärning kan innebära minskning av förutsägelsesfel. I allmänhet bearbetar dessa system en extern händelse, genererar förutsägelser för denna händelse, beräknar felet mellan händelsen och dess förutsägelse och modifierar både prestanda och förutsägelse enligt förutsägelsesfelet. Detta kan inte vara begränsat till inlärningssystem som hanterar biologiska förstärkare men avser en mycket större mängd neurala operationer, såsom visuellt erkännande i hjärnbarken (Rao och Ballard 1997).

Förstärkningsalgoritmer

UNCONDITIONAL REINFORCEMENT.

Neuronala nätverksmodeller kan utbildas med raka förstärkningssignaler som avger en prediksionsoberoende signal när en beteendereaktion utförs korrekt men ingen signal med felaktig reaktion. Att lära sig i dessa till stor del instrumentala lärande modeller består i att ändra synaptiska vikter (ω) av modellneuroner enligt

Δω=ɛRxy

Ekvation xnumxwhere ɛ är lärande kurs, r är förstärkning, och x och y är aktiveringar av före- och postsynaptiska neuroner, vilket säkerställer att endast synapser som deltar i det förstärkta beteendet modifieras. Ett populärt exempel är den associativa belöningstraffmodellen (Barto och Anandan 1985). Dessa modeller förvärvar skelett- eller oculomotoriska svar, lär sekvenser och utför Wisconsin-kortsorteringstestet (Arbib och Dominey 1995; Dehaene och Changeux 1991; Dominey m.fl. 1995; Fagg och Arbib 1992). Behandlingsenheter i dessa modeller förvärvar liknande egenskaper som neuroner i parietal association cortex (Mazzoni et al. 1991).

Emellertid kräver persistensen av undervisningssignalen efter inlärning ytterligare algoritmer för att förhindra att synaptiska styrkor försvinner (Montague och Sejnowski 1994) och för att undvika förvärv av redundanta stimuli presenterade tillsammans med förstärknings-förutsägande stimuli. Tidigare lärda beteende fördröjer när händelser förändras, eftersom utelämnad förstärkning misslyckas med att inducera en negativ signal. Läromshastigheten kan ökas genom att lägga till extern information från en lärare (Ballard 1997) och genom att införliva information om tidigare prestanda (McCallum 1995).

TEMPORAL DIFFERENCE LEARNING.

I en särskilt effektiv klass av förstärkningsalgoritmer (Sutton 1988; Sutton och Barto 1981), synaptiska vikter modifieras enligt felet i förstärkningsprognos beräknad över varandra följande tidssteg (t) i varje försök

rˆ(t)=r(t)+P(t)-P(t-l)

Ekvation 6where r är förstärkning och P är förstärkningsprognos. P (t) multipliceras vanligtvis med en rabattfaktor γ med 0 ≤ γ <1 för att ta hänsyn till det minskande inflytandet av alltmer avlägsna belöningar. Av enkelhetsskäl är γ satt till 1 här. I fallet med en enda stimulans som förutsäger en enda förstärkare, förutsägelsen P(t - 1) existerar före tiden t av förstärkning men slutar vid tiden för förstärkning [P (t) = 0]. Detta leder till en effektiv förstärkningssignal vid den tiden (T) av förstärkning

rˆ (t)=r(t)-P(t-l)

Ekvation 6aSmakämnen r(t) termen indikerar skillnaden mellan faktisk och förutsedd förstärkning. Under inlärning förutses förstärkning ofullständigt, felperioden är positiv när förstärkning sker och synaptiska vikter ökas. Efter inlärning förutses förstärkning fullt ut av en föregående stimulans [P(t - 1) = r(t)] är felperioden noll på korrekt beteende, och synaptiska vikter förblir oförändrade. När förstärkning utelämnas på grund av otillräcklig prestanda eller förändrade händelser är felet negativt och synaptiska vikter reduceras. De r(t) termen är analog med (A-V) Felperioden för Rescorla-Wagner-modellen (Eq. 4 ). Det handlar dock om enskilda tidssteg (t) inom varje försök snarare än förutsägelser som utvecklas under konsekutiva försök. Dessa temporala modeller av förstärkning kapitaliseras på det faktum att de förvärvade förutsägelserna innefattar exakt tiden för förstärkning (Dickinson et al. 1976; Gallistel 1990; Smith 1968).

Tidsmässiga skillnad (TD) -algoritmerna använder också förvärvade förutsägelser för att ändra synaptiska vikter. I fallet med en oförutsedd, enstaka konditionerad stimulans som förutsäger en enda förstärkare, förutsägelsen P (t) börjar vid tidpunkten (T), det finns ingen föregående förutsägelse [P(t - 1) = 0], och förstärkning har ännu inte skett [r(t) = 0]. Enligt Eq. 6, modellen avger en rent prediktiv effektiv förstärkningssignal vid den tiden (t) av förutsägelsen

rˆ=P(t)

Ekvation 6bI fallet med multipla, konsekutiva prediktiva stimuli, återigen med förstärkning frånvarande vid tidpunkten för förutsägelser, den effektiva förstärkningssignalen vid den tiden (T) av förutsägelsen speglar skillnaden mellan nuvarande förutsägelse P (t) och föregående förutsägelse P(t - 1)

rˆ=P(t)-P(t-l)

Ekvation 6cDetta utgör en felperiod för högre orderförstärkning. På samma sätt som helt förutspådda förstärkare avbryts alla prediktiva stimuli som helt förutspås själva [P(t - 1) = P(t)], resulterar i r = 0 vid tiden (T) av dessa stimuli. Endast den tidigaste prediktiva stimulansen bidrar till den effektiva förstärkningssignalen, som denna stimulans P (t) förutspås inte av någon annan stimulans [P(t - 1) = 0]. Detta resulterar i samma r = P (t) just då (T) av den första förutsägelsen som i fallet med en enda förutsägelse (Eq. 6b).

Fig. 9. 

Grundläggande arkitekturer av neurala nätverksmodeller som implementerar tidsskillnadalgoritmer i jämförelse med basal ganglia-anslutning. A: i den ursprungliga genomförandet den effektiva undervisningssignalen y - ȳ beräknas i modellneuron A och skickas till presynaptiska terminaler av ingångar x till neuron B, på så sätt påverka xB bearbetning och förändring av synaptiska vikter vid xB synaps. Nervcell B påverkar beteendeutgång via axon y och bidrar samtidigt till de adaptiva egenskaperna hos neuron A, nämligen dess svar på förstärknings-förutsägande stimuli. Nyare implementeringar av denna enkla arkitektur använder neuron A snarare än neuron B för utgivning av en utgång O av modellen (Montague et al. 1996; Schultz et al. 1997). Reprinted from Sutton och Barto (1981) med tillstånd av American Psychological Association. B: Det senaste genomförandet skiljer undervisningskomponenten A, kallade kritikern (höger), från en utgångskomponent bestående av flera behandlingsenheter B, kallas skådespelaren (vänster). Den effektiva förstärkningssignalen r(t) beräknas genom att subtrahera den temporära skillnaden i viktad förstärkningsprognos γP(t) - P(t - 1) från primär förstärkning r(t) mottagen från miljön (y är rabattfaktorn som minskar värdet på mer avlägsna förstärkare). Förstärkningsprognos beräknas i en separat prediktionsenhet C, som är en del av kritikern och bildar en sluten slinga med undervisningselementet A, medan primär förstärkning kommer in i kritiken genom en separat ingång rt. Effektiv förstärkningssignal påverkar synaptiska vikter vid inkommande axoner i skådespelaren, vilket medierar utmatningen och i kritikens adaptiva prediktionsenhet. Reprinted from Barto (1995) med tillstånd från MIT Press. C: basala gangliernas grundläggande anslutning avslöjar slående likheter med skådespelarkritikerarkitekturen. Dopaminprojektion avger förstärkningssignalen till striatumen och kan jämföras med enheten A i delar A och B, Den limbiska striatumen (eller striosomplåstret) tar positionen för prediktionsenheten C i kritiken, och den sensorimotoriska striatumen (eller matrisen) liknar skådespelarenheterna B. I den ursprungliga modellen (EN), Den enda stora avvikelsen från etablerad basalgangliaanatomi består av neuronets inverkan A riktas mot presynaptiska terminaler, medan dopaminsynapser är placerade på postsynaptiska dendriter av striatalneuroner (Freund et al. 1984). Reprinted from Smith och Bolam (1990) med tillstånd av Elsevier Press.

Tillsammans, den effektiva förstärkningssignalen (Eq. 6 ) består av den primära förstärkningen, som minskar med framväxande förutsägelser (Eq. 6a) och ersätts gradvis med de förvärvade förutsägelserna (Miljökvalitetsnormen. 6b och 6c). Med konsekutiva prediktiva stimuli rör sig den effektiva förstärkningssignalen bakåt i tiden från den primära förstärkaren till den tidigaste förstärkningsförutsägande stimulansen. Den retrograde överföringen resulterar i en mer specifik tilldelning av kredit till de involverade synapserna, eftersom förutsägelser förekommer närmare i tid till de stimuli och beteendereaktioner som skall betingas, jämfört med förstärkning vid försöksänden (Sutton och Barto 1981).

Implementeringar av förstärkningsinlärningsalgoritmer utnyttjar prediksionsfelet på två sätt, för att ändra synaptiska vikter för beteendeutmatning och för att förvärva förutsägelserna för att kontinuerligt beräkna förutsägelsesfelet (Fig. 9 A) (McLaren 1989; Sutton och Barto 1981). Dessa två funktioner separeras i de senaste implementationerna, där prediksionsfelet beräknas i den adaptiva kritikskomponenten och ändrar synaptiska vikter i skådespelarkomponenten medierande beteendeutgång (Fig. 9 B) (Barto 1995). Ett positivt fel ökar kritikens förstärkningsprognos, medan ett negativt fel från utelämnad förstärkning minskar förutsägelsen. Detta gör den effektiva förstärkningssignalen mycket adaptiv.

Neurobiologiska implementeringar av temporärt skillnadslärande

SAMMANSÄTTNING AV DOPAMINSRESPONERING MED FÖRBRÄNNINGSMODELLER.

Dopaminresponset kodar ett fel i förutsägelsen av belöning (Eq. 1 ) liknar i hög grad den effektiva felperioden för djurinlärningsregler (λ-V; Eq. 4 ) och den effektiva förstärkningssignalen för TD-algoritmer vid tiden (t) av förstärkning [r(t) - P(t - 1); Eq. 6a], som noterat tidigare (Montague et al. 1996). På liknande sätt kan prediktionsfelet för dopaminEq. 2 ) liknar det förstärkta UP-förstärkningsfelet [P(t) - P(t - 1); Eq. 6c]. Naturen hos de utbredda, divergerande utsprången av dopaminneuroner till förmodligen alla neuroner i striatumen och många neuroner i frontal cortex är förenlig med tanken på en TD-global förstärkningssignal, vilken emitteras av kritikern för att påverka alla modellneuroner i skådespelaren (jämför fig. 7 med fig. 9 B). Kritikskådespelarkitekturen är särskilt attraktiv för neurobiologi på grund av sin separata undervisning och prestationsmoduler. I synnerhet liknar den noggrant förbindelserna hos de basala ganglierna, inklusive ömsesidigheten av striatonigrala utsprång (fig. 9 C), som först noteras av Houk et al. (1995). Kritikern simulerar dopaminneuroner, belöningsprognosen går in från striosomala striatonigralprojektioner, och skådespelaren liknar striatalmatrisneuroner med dopaminberoende plastisitet. Intressant är att både dopaminrespons och teoretiska felvillkor är teckenberoende. De skiljer sig från felvillkor med absoluta värden som inte diskriminerar mellan förvärv och utrotning och bör ha övervägande anmärkningsvärda effekter.

ANSÖKAN OM NEUROBIOLOGISKA PROBLEMER.

Även om de ursprungligen utvecklades på grundval av Rescorla-Wagner-modellen av klassisk konditionering, lär modeller med TD-algoritmer ett brett spektrum av beteendemässiga uppgifter genom grundläggande instrumentella former av konditionering. Dessa uppgifter når från att balansera en pol på ett vagnhjul (Barto et al. 1983) för att spela backgammon i världsklass (Tesauro 1994). Robotar som använder TD-algoritmer lär sig att flytta runt tvådimensionellt utrymme och undvika hinder, nå och greppa (Fagg 1993) eller sätt in en pinne i ett hål (Gullapalli et al. 1994). Använda TD-förstärkningssignalen för att direkt påverka och välja beteende (Fig. 9 A), TD-modeller replikerar förädlingsbeteende hos honungsbinnar (Montague et al. 1995) och simulera mänskligt beslutsfattande (Montague et al. 1996). TD-modeller med en explicit kritikskådespelarkitektur utgör mycket kraftfulla modeller som effektivt lär sig ögonrörelser (Friston et al. 1994; Montague et al. 1993), sekventiella rörelser (fig. 10) och orienteringsreaktioner (Contreras-Vidal och Schultz 1996). En ny modell lade till aktiviserande deprimerande nyhetssignaler för att förbättra undervisningssignalen, använde stimulans- och aktionsspår i kritiker och skådespelare och anställde vinnande-ta-alla regler för att förbättra undervisningssignalen och för att välja aktörsneuroner med störst aktivering. Detta reproducerade i stor detalj både svaren på dopaminneuroner och djurens lärande beteende i fördröjda svarsuppgifter (Suri och Schultz 1996). Det är särskilt intressant att se att undervisningssignaler som använder prediktionsfel resulterar i snabbare och mer fullständigt lärande jämfört med ovillkorliga förstärkningssignaler (Fig. 10) (Friston et al. 1994).

Fig. 10. 

Fördel av prediktiva förstärkningssignaler för lärande. En tidsskillnadsmodell med kritikskådespelarkitektur och behörighetsspår i skådespelaren utbildades i en sekventiell 2-steg-3-valuppgift (inset övre vänstra). Lärande avancerad snabbare och uppnådde högre prestanda när en prediktiv förstärkningssignal användes som undervisningssignal (adaptiv kritik, topp) jämfört med användning av en ovillkorlig förstärkningssignal vid provänden (botten). Denna effekt blir gradvis mer uttalad med längre sekvenser. Jämförbar prestanda med den ovillkorliga förstärkningssignalen skulle kräva ett mycket längre stödberättigande spår. Data erhölls från 10-simuleringar (R. Suri och W. Schultz, opublicerade observationer). En liknande förbättring av inlärning med prediktiv förstärkning hittades i en modell av oculomotoriskt beteende (Friston et al. 1994).

Möjliga inlärningsmekanismer som använder dopamin-signalen

Den föregående sektionen har visat att den formella prediktionsfelsignalen emitterad av dopaminreaktionen kan utgöra en särskilt lämplig undervisningssignal för modellinlärning. Följande avsnitt beskriver hur det biologiska dopamin-svaret potentiellt kan användas för inlärning av basala ganglianstrukturer och föreslå testbara hypoteser.

POSTSYNAPTISK PLASTICITY MEDIERADE AV REWARD PREDICTION SIGNAL.

Lärandet skulle gå vidare i två steg. Det första steget involverar förvärv av ett dopamin-belöningsspådjande svar. I efterföljande försök skulle den prediktiva dopamin-signalen stärka synaptiska vikter (ω) av kortikostriatala synapser av hebbisk typ som är aktiva vid tiden för den belöningsspecifika stimulansen, medan de inaktiva kortikostriatala synapserna lämnas oförändrade. Detta resulterar i trefaktorns inlärningsregeln

Δω=ɛ rˆ i o

Ekvation 8where r är dopaminförstärkningssignal, i är inmatningsaktivitet, o är utmatningsaktivitet och ɛ är lärandesats.

I en förenklad modell, kontaktar fyra kortikala ingångar (i1-i4) de dendritiska spinesna av tre medelstora strimmiga striatalneuroner (o1-o3; Fig. 11). Kortikala ingångar konvergerar på striatala neuroner, varvid varje ingång kontaktar en annan ryggrad. Samma ryggraden berörs ej av en gemensam dopamininmatning R. Aktivering av dopamininmatning R indikerar att en oförutsedd belöningsspecifik stimulans inträffade i miljön utan att ge ytterligare detaljer (godhetssignal). Låt oss anta att kortikala ingångar i2 aktiveras samtidigt med dopaminneuroner och kodar en av flera specifika parametrar av samma belöningsspecifika stimulans, såsom sin sensoriska modalitet, kroppssida, färg, struktur och position eller en specifik rörelseparameter utlöst av stimulansen. En uppsättning parametrar för denna händelse skulle kodas av en uppsättning kortikala ingångar i2. Kortikala ingångar i1, i3 och i4 utan samband med nuvarande stimuli och rörelser är inaktiva. Dopaminreaktionen leder till oselektivt dopaminfrisättning vid alla varicositeter, men skulle selektivt förstärka endast de aktiva kortikostriatala synapserna i2-o1 och i2-o2, förutsatt att de kortikala ingångarna är starka nog för att aktivera striatala neuroner o1 och o2.

Fig. 11. 

Differentiella influenser av en global dopaminförstärkningssignal på selektiv kortikostriatal aktivitet. Dendritiska spines av 3 medelstora spiny striatalneuroner o1, o2 och o3 kontaktas av 4 kortikala ingångar i1, i2, i3 och i4 och genom axonala varicositeter från en enda dopaminneuron R (eller från en population av homogentaktiverade dopaminneuroner ). Varje striatal neuron mottar ~10,000 corticala och 1,000 dopamin ingångar. Vid enskilda dendritiska ryggraden, sammanfaller olika kortikala ingångar med dopamininmatningen. I 1-versionen av modellen ökar dopamin-signalen samtidigt aktiv kortikostriatal överföring relativt icke-aktiv överföring. Dopamininmatning R är till exempel aktiv samtidigt som kortikaltillgång i2, medan i1, i3, i4 är inaktiva. Detta leder till en modifiering av i2 → o1 och i2 → o2-överföringen, men lämnar i1 → o1, i3 → o2, i3 → o3 och i4 → o3-sändningar oförändrade. I en version av modellen som använder plasticitet, är synaptiska vikter av kortikostriatala synapser långsiktigt modifierade av dopamin-signalen enligt samma regel. Detta kan inträffa när dopaminreaktioner på en konditionerad stimulus verkar på kortikostriatala synapser som också aktiveras av denna stimulans. I en annan version som använder plasticitet kan dopaminreaktioner till en primär belöning verka bakåt i tid på kortikostriatala synapser som tidigare var aktiva. Dessa synapser skulle kunna göras modifierade genom ett hypotetiskt postsynaptiskt neuronspår kvar från den aktiviteten. Vid jämförelse av den basala ganglia-strukturen med den senaste TD-modellen i fig. 9 B, dopamininmatning R replikerar kritikern med neuron A, striatumen med neuroner o1-o3 replikerar skådespelaren med neuron B, kortikala ingångar i1-i4 replikerar skådespelarens inmatning, och den divergerande projiceringen av dopaminneuroner R på flera ryggrader av multipla striatala neuroner o1-O3 replikerar den globala påverkan av kritikern på skådespelaren. En liknande jämförelse gjordes av Houk et al. (1995). Denna ritning är baserad på anatomiska data av Freund et al. (1984), Smith och Bolam (1990), Flaherty och Graybiel (1993)och Smith et al. (1994).

Denna inlärningsmekanism utnyttjar det förvärvade dopamin-svaret vid tiden för den belöningsspecifika stimulansen som en undervisningssignal för att framkalla långvariga synaptiska förändringar (Fig. 12 A). Inlärning av den prediktiva stimulansen eller utlösningen av rörelsen är baserad på det demonstrerade förvärvet av dopaminrespons mot den belöningsspecifika stimulansen, tillsammans med dopaminberoende plasticitet i striatumet. Plastitetsförändringar kan alternativt uppträda i kortikala eller subkortiska strukturer nedströms striatum efter dopaminförmedlad kortvarig förbättring av synaptisk överföring i striatumet. De retroaktiva effekterna av belöning på stimuli och rörelser som föregår belöningen förmedlas av responsöverföringen till den tidigaste belöningsspecifika stimulansen. Dopaminreaktionen mot förutspådd eller utelämnad primärbelöning används inte för plastitetsförändringar i striatumet eftersom det inte uppstår samtidigt med händelserna som skall konditioneras, fastän det kan vara involverat i beräkning av dopaminreaktionen mot den belöningsspecifika stimulansen analogt med TD-modellernas arkitektur och mekanism.

Fig. 12. 

Påverkan av dopaminförstärkningssignal på möjliga inlärningsmekanismer i striatumet. A: Prediktivt dopaminbelöningssvar på en konditionerad stimulus (CS) har en direkt förstärkning eller plasticitetseffekt på striatal neurotransmission relaterad till den stimulansen. B: dopaminreaktion mot primärbelöning har en retrograd plastisk effekt på striatal neurotransmission relaterad till föregående konditionerade stimulans. Denna mekanism är förmedlad av en stödberättigande spåra överlåtande striatal aktivitet. Fasta pilar indikerar direkta effekter av dopamin-signalen på striatal neurotransmission (A) eller berättigande spår (B), liten pil in B indikerar indirekt effekt på striatal neurotransmission via stödberättigande spår.

POSTSYNAPTISK PLASTICITET SAMMANSÄTT MED SYNAPTISK TILLGÅNGSPROCESS.

Inlärning kan inträffa i ett enda steg om dopaminbelöningssignalen har en retroaktiv verkan på striatalsynapser. Detta kräver hypotetiska spår av synaptisk aktivitet som förblir tills förstärkning sker och gör de synapser som är berättigade till modifiering genom en undervisningssignal som var aktiv före förstärkning (Hull 1943; Klopf 1982; Sutton och Barto 19811). Synaptiska vikter (ω) ändras enligt

Δω=ɛ rˆ h (i,o)

Ekvation 9where r är dopaminförstärkningssignal, h (jag, o) är behörighet spår av conjoint ingång och utgång aktivitet, och ɛ är lärande takt. Potentiella fysiologiska substrat av stödberättigande spår består av långvariga förändringar i kalciumkoncentrationen (Wickens och Kötter 1995) bildande av kalmodulinberoende proteinkinas II (Houk et al. 1995) eller upprepad neuronaktivitet som ofta hittades i striatum (Schultz et al. 1995a) och cortex.

Dopaminberoende plasticitet som inbegriper stödberättigande spår utgör en elegant mekanism för att lära sekvenser bakåt i tiden (Sutton och Barto 1981). Till att börja med medierar dopaminreaktionen mot den oförutsedda primära belöningen beteendeinlärning av den omedelbart föregående händelsen genom modifiering av kortikostriatal synaptisk effekt (Fig. 11). Samtidigt överför dopaminreaktionen till belöningsförutsägande händelsen. En depression vid tidpunkten för utelämnad belöning förhindrar inlärning av felaktiga reaktioner. I nästa steg medverkar dopaminreaktionen till den oförutsedda belöningsförutsägande händelsen att lära av den omedelbart föregående prediktiva händelsen, och dopamin-svaret överför också tillbaka till den händelsen. Eftersom detta inträffar upprepade gånger rör sig dopaminsvaret bakåt i tiden tills inga ytterligare händelser föregår, vilket möjliggör vid varje steg föregående händelse att förvärva belöningsförutsägelse. Denna mekanism skulle vara idealisk för att bilda beteendefaktorer som leder till en slutgiltig belöning.

Denna inlärningsmekanism använder fullt ut dopaminfelet i förutsägelsen av appetitiva händelser som retroaktiv undervisningssignal som inducerar långvariga synaptiska förändringar (Fig. 12 B). Det använder dopaminberoende plasticitet tillsammans med striatalelysspår, vars biologiska lämplighet för lärande återstår att undersökas. Detta resulterar i direkt lärande genom resultat, i huvudsak förenligt med inverkan av undervisningssignalen på TD-aktörens skådespelare. Den demonstrerade retrograde rörelsen för dopaminresponset används för att lära tidigare och tidigare stimuli.

EN ALTERNATIV MEKANISM: FACILITATIV INFLUENCE AV PREDICTIV DOPAMIN SIGNAL.

Båda mekanismerna som beskrivits ovan använder dopaminreaktionen som en undervisningssignal för modifiering av neurotransmission i striatumet. Eftersom bidraget av dopaminberoende striatalplasticitet till inlärning inte är fullständigt förstådd, kan en annan mekanism baseras på den demonstrerade plastiteten hos dopaminreaktionen utan att kräva striatal plasticitet. I ett första steg förvärvar dopaminneuroner svar på belöningsspecifika stimuli. I ett efterföljande steg kan de prediktiva svaren användas för att öka effekten av kortikala ingångar som uppträder samtidigt vid samma dendritiska spines av striatala neuroner. Postsynaptisk aktivitet skulle förändras enligt

Δaktivitet=δrˆ i

Ekvation 10where r är dopaminförstärkningssignal, i är ingångsaktivitet och 5 är en förstärkningskonstant. I stället för att utgöra en undervisningssignal, tillhandahåller det prediktiva dopamin-svaret en förstärkande eller motiverande signal för striatal neurotransmission vid tiden för den belöningsspecifika stimulansen. Med konkurrerande stimuli skulle neuronala ingångar som uppträder samtidigt med den belöningsspecifika dopamin-signalen behandlas företrädesvis. Beteende reaktioner skulle dra nytta av förskott information och bli frekventare, snabbare och mer exakt. Det facilitatoriska inflytandet av förvägsinformation uppvisas i beteendexperiment genom parning av en konditionerad stimulans med hävstångspressning (Lovibond 1983).

En möjlig mekanism kan använda fokuseringseffekten av dopamin. I den förenklade modellen i fig. 11dopamin reducerar globalt alla kortikala influenser. Detta låter bara den starkaste inmatningen överföras till striatala neuroner, medan de andra svagare ingångarna blir ineffektiva. Detta kräver en icke-linjär, kontrasthöjande mekanism, såsom tröskeln för att generera åtgärdspotentialer. En jämförbar förstärkning av starkaste ingångar kan inträffa i neuroner som skulle vara övervägande upphetsade av dopamin.

Denna mekanism använder det förvärvade, belöningsspecifika dopaminreaktionen som en förspännings- eller selektionssignal för att påverka postsynaptisk behandling (Fig. 12 A). Förbättrad prestanda baseras helt på den demonstrerade plastiteten hos dopaminreaktioner och kräver inte dopaminberoende plasticitet i striatalneuroner. Svaren på oförutsedd eller utelämd belöning uppträder för sent för att påverka striatal behandling, men kan bidra till att beräkna det prediktiva dopaminresponset i analogi med TD-modeller.

Elektrisk stimulering av dopaminneuroner som okonditionerad stimulans

Elektrisk stimulering av avgränsade hjärnregioner betjänar på ett tillförlitligt sätt som förstärkning för förvärv och upprätthållande av beteendebeteende (Olds och Milner 1954). Några mycket effektiva självstimulationsställen sammanfaller med dopamincellkroppar och axonbuntar i midjen (Corbett och Wise 1980), nucleus accumbens (Phillips et al. 1975), striatum (Phillips et al. 1976) och prefrontal cortex (Mora och Myers 1977; Phillips et al. 1979), men finns även i strukturer som inte är relaterade till dopamin-system (Vit och Milner 1992). Elektrisk självstimulering innefattar aktivering av dopaminneuroner (Fibiger och Phillips 1986; Wise och Rompré 1989) och reduceras med 6-hydroxidopamininducerad lesioner av dopaminaxoner (Fibiger et al. 1987; Phillips och Fibiger 1978), inhibering av dopaminsyntes (Edmonds och Gallistel 1977), depolarisationsinaktivering av dopaminneuroner (Rompré och Wise 1989) och dopaminreceptorantagonister administrerade systemiskt (Furiezos och Wise 1976) eller in i kärnan accumbens (Mogenson et al. 1979). Självstimulering underlättas med kokain- eller amfetamininducerad ökning av extracellulär dopamin (Colle och Wise 1980; Stein 1964; Wauquier 1976). Självstimulering ökar direkt dopaminutnyttjandet i nucleus accumbens, striatum och frontal cortex (Fibiger et al. 1987; Mora och Myers 1977).

Det är spännande att föreställa sig att elektriskt framkallade dopaminimpulser och frisättning kan fungera som okonditionerad stimulans i associativt lärande, liknande stimulering av oktopaminneuroner i honungsbin som lär sig proboscisreflexen (Hammer 1993). Dopaminrelaterad självstimulering skiljer emellertid åtminstone tre viktiga aspekter från den naturliga aktiveringen av dopaminneuroner. I stället för att bara aktivera dopaminneuroner aktiverar naturliga belöningar vanligtvis flera neuronala system parallellt och tillåter distribuerad kodning av olika belöningsdelar (se vidare text). För det andra appliceras elektrisk stimulering som ovillkorlig förstärkning utan att återspegla ett fel i belöningsprognos. För det tredje levereras elektrisk stimulering bara som en belöning efter en beteendereaktion, snarare än vid tidpunkten för en belöningsspecifik stimulans. Det skulle vara intressant att tillämpa elektrisk självstimulering på exakt samma sätt som dopaminneuroner avger sin signal.

Lärande underskott med nedsatt dopamin neurotransmission

Många studier undersökte beteendet hos djur med nedsatt dopamin-neurotransmission efter lokal eller systemisk applicering av dopaminreceptorantagonister eller förstöring av dopaminaxoner i ventral mittbråck, kärnbärare eller striatum. Förutom att observera lokomotoriska och kognitiva underskott som påminner om Parkinsonism, avslöjade dessa studier nedskrivningar i behandlingen av belöningsinformation. De tidigaste studierna hävdade underskott i den subjektiva, hedoniska uppfattningen av belöningar (Wise 1982; Wise et al. 1978). Ytterligare experiment avslöjade nedsatt användning av primära belöningar och konditionerade aptitiva stimuli för tillvägagångssätt och konsumtionellt beteende (Beninger et al. 1987; Ettenberg 1989; Miller et al. 1990; Salamon 1987; Ungerstedt 1971; Wise and Colle 1984; Wise and Rompre 1989). Många studier beskrev försämringar i motivations- och uppmärksamhetsprocesser som ligger till grund för appetitivt lärande (Beninger 1983, 1989; Beninger och Hahn 1983; Fibiger och Phillips 1986; LeMoal och Simon 1991; Robbins och Everitt 1992, 1996; Vit och Milner 1992; Wise 1982). De flesta lärandemässiga underskotten är förknippade med nedsatt dopamin-neurotransmission i nukleär accumbens, medan dorsala striatum-försämringar leder till sensorimotoriska underskott (Amalric och Koob 1987; Robbins och Everitt 1992; vit 1989). Inlärningen av instrumentala uppgifter i allmänhet och diskriminerande stimulansegenskaper verkar emellertid speciellt skonsam, och det är inte helt löst om några av de uppenbara lärandemässiga underskotten kan vara förvirrade av brister i motorernas prestanda (Salamon 1992).

Degeneration av dopaminneuroner i Parkinsons sjukdom leder också till ett antal deklarativa och procedurella inlärningsunderskott, inklusive associativ inlärning (Linden et al. 1990; Sprengelmeyer et al. 1995). Deficits är närvarande i trial-and-error-lärande med omedelbar förstärkning (Vriezen och Moscovitch 1990) och när man associerar explicit stimuli med olika resultat (Knowlton et al. 1996), även i tidiga stadier av Parkinsons sjukdom utan kortikal atrofi (Canavan et al. 1989). Parkinsoniska patienter visar också nedsatt tiduppfattning (Pastor et al. 1992). Alla dessa underskott uppträder i närvaro av L-Dopa-behandling, vilket återställer tonisk striataldopaminnivåer utan att återinföra fasdopamin-signaler.

Dessa studier tyder på att dopamin neurotransmission spelar en viktig roll i behandlingen av belöningar för beteendebeteende och i former av inlärning som involverar föreningar mellan stimuli och belöningar, medan en inblandning i mer instrumentella former av lärande kan ifrågasättas. Det är oklart huruvida dessa underskott återspeglar en mer generell beteendeinaktivering på grund av toniskt reducerad dopaminreceptorstimulering snarare än avsaknaden av en fasisk dopaminbelöningssignal. För att lösa denna fråga, liksom mer specifikt belysa rollen av dopamin i olika inlärningsformer, skulle det vara till hjälp att studera lärande i de situationer där phasic dopamin-svaret på aptitstimuler verkligen uppstår.

Former av lärande som eventuellt medieras av dopamin-signalen

Egenskaperna hos dopaminreaktioner och det potentiella inflytandet av dopamin på striatala neuroner kan bidra till att avgränsa några av de inlärningsformer där dopaminneuroner kan vara involverade. De förmånliga svaren på aptitliga i motsats till aversiva händelser skulle gynna ett engagemang i att lära sig beteendebeteende och förmedla positiva förstärkningseffekter snarare än tillbakadragande och bestraffning. Svaren på primärbelöningar utanför arbetsuppgifter och inlärningssammanhang skulle göra det möjligt för dopaminneuroner att spela en roll i ett relativt brett spektrum av lärande med primärbelöning, både i klassisk och instrumentell konditionering. Svaren på belöningsspecifika stimuli speglar stimulans-belöningsföreningar och skulle vara förenliga med engagemang i belöningsförväntningar som ligger till grund för det allmänna incitamentet lärande (Bindra 1968). Dopaminreaktioner uttrycker däremot inte uttryckligen kodbelöningar som målobjekt, eftersom de endast rapporterar fel i belöningsprognos. De verkar också vara okänsliga mot motivationsstater och därmed missnöja en särskild roll i statligt beroende incitament att lära sig målriktade handlingar (Dickinson och Balleine 1994). Bristen på tydliga relationer till arm och ögonrörelser skulle missnöja en roll för att direkt förmedla de beteenderesponser som följer incitamentstimuli. Men jämförelser mellan utsläpp av enskilda neuroner och lärande av hela organismer är egentligen svåra. På synaptisk nivå når phasiskt frisatt dopamin många dendriter på förmodligen varje striatal neuron och kan således utöva en plasticitetseffekt på den stora variationen av beteendeskomponenter som involverar striatumet, vilket kan innefatta inlärning av rörelser.

De specifika förhållandena i vilka phasic dopaminsignaler kan spela en roll vid inlärning bestäms av de typer av stimuli som effektivt inducerar ett dopaminrespons. I djurlaboratoriet kräver dopaminreaktioner den fasiska förekomsten av aptitiva, nya eller särskilt framträdande stimuli, inklusive primärnäringsbelöningar och belöningsspecifika stimuli, medan aversiva stimuli inte spelar en viktig roll. Dopaminreaktioner kan uppträda i alla beteendessituationer som kontrolleras av fasiska och uttryckliga resultat, även om högre orderkonditionerade stimuli och sekundära förstärkare ännu inte testades. Phasiska dopaminreaktioner skulle antagligen inte spela en roll i former av inlärning som inte medieras av fasiskt förekommande resultat och det prediktiva svaret skulle inte kunna bidra till lärande i situationer där fasiska prediktiva stimuli inte uppträder, såsom relativt långsamma förändringar i sammanhanget . Detta leder till den intressanta frågan om huruvida sparsamheten av vissa former av inlärning av dopaminskador eller neuroleptika helt enkelt skulle återspegla frånvaron av fasisk dopaminreaktioner i första hand eftersom effektiva stimuli som framkallade dem inte användes.

Inblandning av dopaminsignaler vid inlärning kan illustreras med ett teoretiskt exempel. Föreställ dig dopaminreaktioner vid förvärv av en seriell reaktionstiduppgift när en korrekt reaktion plötsligt leder till en näringsbelöning. Belöningsresponsen överförs därefter till progressivt tidigare belöningsspecifika stimuli. Reaktionstiderna förbättras ytterligare med långvarig övning, eftersom de rumsliga ställningarna för mål blir alltmer förutsägbara. Även om dopaminneuroner fortsätter att reagera på belöningsspecifika stimuli, kan den ytterligare beteendeförbättringen huvudsakligen bero på förvärv av prediktiv behandling av rumsliga positioner av andra neuronala system. Dopaminreaktioner skulle således inträffa under den inledande incitamentdelen av lärandet där ämnen kommer att närma sig föremål och erhålla explicit primär och eventuellt betingad belöning. De skulle vara mindre inblandade i situationer där lärandets framsteg går utöver induktion av beteendebeteende. Detta skulle inte begränsa dopaminrollen till de inledande inlärningsstegen, eftersom många situationer kräver att man först lär sig från exempel och först senare involverar inlärning med uttryckliga resultat.

SAMARBETE MELLAN REWARD SIGNALS

Förutsägningsfel

Prediktionsfelsignalen för dopaminneuroner skulle vara en utmärkt indikator på det appetitiva värdet av miljöhändelser i förhållande till prediktionen men misslyckas med att diskriminera bland livsmedel, vätskor och belöningsspecifika stimuli och bland visuella, auditiva och somatosensoriska modaliteter. Denna signal kan utgöra ett belöningsvarslingsmeddelande genom vilket postsynaptiska neuroner informeras om det överraskande utseendet eller utelämnandet av en givande eller potentiellt givande händelse utan att ytterligare indikera dess identitet. Det har alla formella egenskaper hos en kraftfull förstärkningssignal för lärande. Information om belöningens särskilda karaktär är dock avgörande för att avgöra vilken av objekten som ska närmas och på vilket sätt. Till exempel bör ett hungrigt djur främst närma sig mat men inte flytande. För att diskriminera relevant från irrelevanta belöningar måste dopamin-signalen kompletteras med ytterligare information. Nyliga in vivo dialys-experiment visade högre matinducerad dopaminfrisättning i hungrig än hos mättade råttor (Wilson et al. 1995). Denna typ av beroendet av dopaminfrisättning kan inte innebära impulsrespons, eftersom vi inte lyckats hitta ett tydligt körberoende med dopaminreaktioner när vi jämförde mellan tidiga och sena perioder av individuella försökssessioner, under vilka djuren blev vätskemättade (JL Contreras-Vidal och W. Schultz, opublicerad data).

Belöningsdetaljer

Information om flytande och matbelöningar behandlas också i andra hjärnstrukturer än dopaminneuroner, såsom dorsal och ventralstriatum, subthalamuskärna, amygdala, dorsolateral prefrontal cortex, orbitofrontal cortex och främre cingulatcortex. Dessa strukturer verkar emellertid inte avge en global felsökningssignal som liknar dopaminneuroner. I primater, dessa strukturer behandla belöningar som 1) övergående svar efter leverans av belöning (Apicella et al. 1991a,b, 1997; Bowman et al. 1996; Hikosaka et al. 1989; Niki och Watanabe 1979; Nishijo et al. 1988; Tremblay och Schultz 1995; Watanabe 1989), 2) övergående svar på belöningsprognoser (Aosaki et al. 1994; Apicella et al. 1991b; 1996; Hollerman et al. 1994; Nishijo et al. 1988; Thorpe et al. 1983; Tremblay och Schultz 1995; Williams et al. 1993), 3) Hållbara aktiveringar under förväntan om omedelbara kommande belöningar (Apicella et al. 1992; Hikosaka et al. 1989; Matsumura et al. 1992; Schultz et al. 1992; Tremblay och Schultz 1995), Och 4) Moduleringar av beteenderelaterade aktiveringar enligt förutspådd belöning (Hollerman et al. 1994; Watanabe 1990, 1996). Många av dessa neuroner skiljer sig väl mellan olika matfördelar och mellan olika flytande belöningar. Således bearbetar de den givande händelsens specifika natur och kan tjäna uppfattningen av belöningar. Några av belöningsresponserna beror på belöning oförutsägbarhet och är reducerade eller frånvarande när belöningen förutses av en konditionerad stimulans (Apicella et al. 1997; Matsumoto et al. 1995; L. Tremblay och W. Schultz, opublicerade data). De kan bearbeta förutsägelser för specifika fördelar, men det är oklart huruvida de signaliserar prediktionsfel eftersom deras svar på utelämnade belöningar är okända.

Underhålla etablerade prestationer

Tre neuronala mekanismer verkar vara viktiga för att upprätthålla etablerat beteendeförmåga, nämligen detektering av utelämnade belöningar, detektering av belöningsspecifika stimuli och detektering av förutsagda belöningar. Dopaminneuroner är deprimerade när förutsagda belöningar utelämnas. Denna signal kan minska synaptisk effekt relaterad till felaktiga beteendemässiga svar och förhindra upprepning. Dopaminreaktionen mot belöningsspådlande stimuli upprätthålls under etablerat beteende och fortsätter sålunda att fungera som förhandsinformation. Även om helt förutspådda belöningar inte detekteras av dopaminneuroner, behandlas de av de nondopaminerga kortikala och subkortiska systemen som nämnts ovan. Detta skulle vara viktigt för att undvika utrotning av lärt beteende.

Sammantaget framgår det att behandlingen av specifika belöningar för att lära och upprätthålla beteendebeteendet skulle gynnas starkt av ett samarbete mellan dopaminneuroner som signalerar den oförutsedda förekomsten eller utelämnandet av belöning och neuroner i de andra strukturerna samtidigt, vilket indikerar belöningens specifika karaktär.

Jämförelser med andra projiceringssystem

Noradrenalin-neuroner

Nästan hela populationen av noradrenalin-neuroner i lokus coeruleus hos råttor, katter och apor visar ganska homogena bifasiska aktiviserande depressiva reaktioner på visuell, auditiv och somatosensorisk stimuli som framkallar orienteringsreaktioner (Aston-Jones och Bloom 1981; Foote et al. 1980; Rasmussen et al. 1986). Särskilt effektiva är sällsynta händelser som djur uppmärksammar, såsom visuella stimuli i en oddball-diskrimineringsuppgift (Aston-Jones et al. 1994). Noradrenalin neuroner diskriminerar mycket väl mellan väckande eller motiverande och neutrala händelser. De får snabbt svar på nya målstimuli under omkörning och förlorar svar på tidigare mål innan beteendeomvandling är avslutad (Aston-Jones et al. 1997). Svar förekommer för att frigöra vätska utanför någon uppgift och överföra för att belöna-förutsäga målstimuli inom en uppgift såväl som till primär och konditionerad aversiv stimuli (Aston-Jones et al. 1994; Foote et al. 1980; Rasmussen och Jacobs 1986; Sara och Segal 1991). Svaren är ofta övergående och verkar spegla förändringar i stimulans förekomst eller mening. Aktiveringar kan endast inträffa för några försök med upprepade presentationer av livsmedelsobjekt (Vankov et al. 1995) eller med konditionerade auditiva stimuli associerade med flytande belöning, aversiv luftpuff eller elektrisk fotstöt (Rasmussen och Jacobs 1986; Sara och Segal 1991). Under konditionering förekommer svaren till de första presentationerna av nya stimuli och återkommer tillfälligt när förstärkningsförändringar förändras under förvärv, reversering och utrotning (Sara och Segal 1991).

Sammanfattningsvis liknar svaren på noradrenalin-neuroner svaren på dopaminneuroner i flera avseenden, aktiveras av primärbelöningar, belöningsspecifika stimuli och nya stimuli och överför svaret från primär till konditionerade aptitiva händelser. Men noradrenalin-neuroner skiljer sig från dopaminneuroner genom att svara på en mycket större variation av upphetsningsstimuli genom att reagera bra på primär och konditionerad aversiv stimuli genom att diskriminera väl mot neutrala stimuli genom att snabbt följa beteendeomvandlingar och genom att visa minskande responser med upprepad stimulans presentation som kan kräva 100-försök för fasta appetitiva svar (Aston-Jones et al. 1994). Noradrenalinreaktioner är starkt relaterade till väckande eller uppmärksammande egenskaper hos stimuli som framkallar orienteringsreaktioner medan de är mycket mindre fokuserade på aptitiva stimulansegenskaper som de flesta dopaminneuroner. De drivs förmodligen mer av uppmärksamhetsfyllda än motiverande komponenter i aptitliga händelser.

Serotoninneuroner

Aktiviteten i de olika raphe-kärnorna underlättar motorutgången genom att ställa in muskelton och stereotyp motoraktivitet (Jacobs och Fornal 1993). Dorsala raphe-neuroner hos katter visar fasiska, icke-reaktiva svar på visuella och auditiva stimuli utan särskild beteendemässig betydelse (Heym et al. 1982; LeMoal och Olds 1979). Dessa svar liknar svaren på dopaminneuroner till nya och särskilt framträdande stimuli. Ytterligare jämförelser skulle kräva mer detaljerat experiment.

Nucleus basalis Meynert

Primate-basala förhärningsneuroner aktiveras phasically av en stor variation av beteendemässiga händelser inklusive konditionerade, belöningsspecifika stimuli och primära belöningar. Många aktiveringar beror på minne och föreningar med förstärkning i diskriminering och fördröjda svarsuppgifter. Aktiveringarna speglar stimuliets kännedom (Wilson och Rolls 1990a), blir viktigare med stimuli och rörelser som inträffar närmare belöningstiden (Richardson och DeLong 1990), skiljer sig väl mellan visuella stimuli på basis av appetitiva och aversiva föreningar (Wilson och Rolls 1990b) och förändras inom några försök under reversering (Wilson och Rolls 1990c). Neuroner aktiveras också av aversiva stimuli, förutsagda visuella och auditiva stimuli och rörelser. De svarar ofta på fullt utspådda belöningar i väletablerade beteendeuppgifter (Mitchell et al. 1987; Richardson och DeLong 1986, 1990), även om svar på oförutsedda belöningar är mer rikliga i vissa studier (Richardson och DeLong 1990) men inte i andra (Wilson och Rolls 1990a-c). I jämförelse med dopaminneuroner aktiveras de av ett mycket större spektrum av stimuli och händelser, inklusive aversiva händelser, och visar inte det ganska homogena befolkningsreaktionen på oförutsedda belöningar och dess överföring till belöningsspecifika stimuli.

Cerebellar klättrande fibrer

Förmodligen postulerades den första feldrivna undervisningssignalen i hjärnan för att involvera projiceringen av klättrande fibrer från den underlägsna olivin till Purkinje-neuronerna i hjärnbarken (Marr 1969), och många cerebellära inlärningsstudier bygger på detta begrepp (Houk et al. 1996; Ito 1989; Kawato och Gomi 1992; Llinas och Welsh 1993). Klättringsfiberingångar till Purkinje-neuroner förändras tillfälligt när de belastar rörelser eller vinster mellan rörelser och visuell återkoppling ändras och aporna anpassar sig till den nya situationen (Gilbert och Thach 1977; Ojakangas och Ebner 1992). De flesta av dessa förändringar består av ökad aktivitet snarare än aktiveringen jämfört med depression svaren ses med fel i motsatta riktningar i dopaminneuroner. Om klättring av fiberaktivering skulle fungera som undervisningssignal, bör sammanfogning med fiberparallell fiberoptimering leda till förändringar i parallellfiberingång till Purkinje-neuroner. Detta förekommer faktiskt som långsiktig depression av parallellfiberingång, huvudsakligen i in vitro-preparat (Ito 1989). Men jämförbara parallella fiberförändringar är svårare att hitta i beteendeinlärningssituationer (Ojakangas och Ebner 1992), vilket leder till konsekvenserna av potentiella klimatfibrer undervisningssignaler öppna för tillfället.

Ett andra argument för en roll att klättra fibrer i lärande innebär aversiv klassisk konditionering. En fraktion av klättrande fibrer aktiveras av aversiva luftpustar till hornhinnan. Dessa svar går förlorade efter Pavlovian ögonloppskonditionering med hjälp av en auditiv stimulans (Sears och Steinmetz 1991), vilket tyder på ett förhållande till oförutsägbarheten hos primära aversiva händelser. Efter konditionering svarar neuroner i cerebellar interpositus-kärnan på den konditionerade stimulansen (Berthier och Moore 1990; McCormick och Thompson 1984). Lesioner av denna kärna eller injektioner av GABA-antagonisten bicucullin i den underlägsna oljan förhindrar förlusten av sämre olivluftpuffreaktioner efter konditionering, vilket föreslår att monosynaptisk eller polysynaptisk inhibering från interpositus till sämre oliv undertrycker respons efter konditionering (Thompson och Gluck 1991). Detta kan möjliggöra att sämre oliv neuroner deprimeras i avsaknad av förutsagda aversiva stimuli och därmed rapportera ett negativt fel i förutsägelsen av aversiva händelser liknande dopaminneuroner.

Klättrande fibrer kan således rapportera fel i motorprestanda och fel vid förutsägelsen av aversiva händelser, även om detta inte alltid innefattar dubbelriktningsändringar som med dopaminneuroner. Klättringsfibrer verkar inte få svar på konditionerade aversiva stimuli, men sådana svar återfinns i kärnpunktsinterpositus. Beräkningen av aversiva prediktionsfel kan innebära nedåtgående hämmande ingångar till sämre oliv neuroner, analogt med striatalprojektioner mot dopaminneuroner. Sålunda behandlar cerebellära kretsar felsignaler, om än annorlunda än dopaminneuroner och TD-modeller, och de kan implementera felinlärningsregler som Rescorla-Wagner-regeln (Thompson och Gluck 1991) eller den formellt ekvivalenta Widrow-Hoff-regeln (Kawato och Gomi 1992).

DOPAMIN REWARD SIGNAL VERSUS PARKINSONIAN DEFICITS

Nedsatt dopamin-neurotransmission med Parkinsons sjukdom, experimentella skador eller neuroleptisk behandling är associerad med många beteendemässiga underskott i rörelse (akinesi, tremor, styvhet), kognition (uppmärksamhet, bradyphrenia, planering, inlärning) och motivation (minskad emotionell respons, depression). Utbudet av underskott verkar för stort för att helt enkelt förklaras med en felaktig dopaminbelöningssignal. De flesta underskotten förbättras avsevärt genom systemisk dopaminprekursor eller receptoragonistterapi, även om detta inte på ett enkelt sätt kan återupprätta fasinformationsöverföringen genom neuronimpulser. Många aptitstekniska underskott återställs emellertid inte med denna terapi, såsom farmakologiskt inducerade diskrimineringsunderskott (Ahlenius 1974) och parkinsoniska lärandemässiga underskott (Canavan et al. 1989; Knowlton et al. 1996; Linden et al. 1990; Sprengelmeyer et al. 1995; Vriezen och Moscovitch 1990).

Av dessa överväganden verkar det som om dopamin-neurotransmission spelar två separata funktioner i hjärnan, den fasbaserade behandlingen av appetitiv och varningsinformation och tonisk möjliggörande av ett brett spektrum av beteenden utan temporal kodning. Deficits i en liknande dubbel dopaminfunktion kan ligga till grund för patofysiologin hos schizofreni (Grace 1991). Det är intressant att notera att fasförändringar av dopaminaktivitet kan uppträda vid olika tidsskalor. Belöningssvaren följer en tidskurs i tiotals och hundratals millisekunder, studier av dopaminfrisättning med voltammetri och mikrodialys gäller tidsskala av minuter och avslöjar ett mycket bredare spektrum av dopaminfunktioner, inklusive behandling av belöningar, matning, drickning, straff, stress och socialt beteende (Abercrombie et al. 1989; Church et al. 1987b; Doherty och Gratton 1992; Louilot et al. 1986; Young et al. 1992, 1993). Det verkar som om dopamin-neurotransmission följer minst tre tidsskalor med progressivt bredare roller i beteende, från den snabba, ganska begränsade funktionen av signalbelöningar och varningstimuli via en långsammare funktion att behandla ett stort antal positiva och negativt motiverande händelser till tonisk funktion att möjliggöra ett stort antal motoriska, kognitiva och motivationsprocesser.

Tonisk dopaminfunktion är baserad på låga, upprätthållna extracellulära dopaminkoncentrationer i striatumen (5-10 nM) och andra dopamin-innerverade områden som är tillräckliga för att stimulera extrasynaptiska, mest D2-typ dopaminreceptorer i deras höga affinitetstillstånd (9-74 nM; Fig. 8) (Richfield et al. 1989). Denna koncentration regleras lokalt inom ett begränsat område genom synaptisk överflöde och extrasynaptisk dopaminfrisättning inducerad av tonisk spontan impulsaktivitet, återupptagstransport, metabolism, autoreceptormedierad frisättning och synteskontroll och presynaptisk glutamatpåverkan på dopaminfrisättning (Chesselet 1984). Betydelsen av omgivande dopaminkoncentrationer demonstreras experimentellt genom de skadliga effekterna av unfysiologiska nivåer av receptorstimulering. Minskad dopaminreceptorstimulering efter lesioner av dopamin-avferenter eller lokal administrering av dopaminantagonister i prefrontal cortex leder till försämrad prestation av rumsfördröjda responsuppgifter hos råttor och apor (Brozoski et al. 1979; Sawaguchi och Goldman-Rakic ​​1991; Simon et al. 1980). Intressant är att ökningar av prefrontal dopaminomsättning leder till liknande störningar (Elliott et al. 1997; Murphy et al. 1996). Tydligen bör tonisk stimulering av dopaminreceptorer varken vara för låg eller för hög för att säkerställa en optimal funktion hos en given hjärnområde. Att förändra påverkan av välreglerad, omgivande dopamin skulle äventyra den korrekta funktionen av striatala och kortikala nervceller. Olika hjärnregioner kan kräva specifika nivåer av dopamin för att förmedla specifika beteendefunktioner. Det kan spekuleras att omgivande dopaminkoncentrationer är också nödvändiga för att upprätthålla striatal synaptisk plasticitet inducerad av en dopaminbelöningssignal. En roll av tonisk dopamin på synaptisk plasticitet föreslås av de skadliga effekterna av dopaminreceptorblockad eller D2-receptor-knockout vid posttetan depression (Calabresi et al. 1992a, 1997).

Många andra neurotransmittorer finns också i låga omgivande koncentrationer i den extracellulära vätskan, såsom glutamat i striatum (0.9 μM) och cortex (0.6 μM) (Herrera-Marschitz et al. 1996). Detta kan vara tillräckligt för att stimulera högkänsliga NMDA-receptorer (Sands och Barish 1989) men inte andra glutamatreceptortyper (Kiskin et al. 1986). Omgivande glutamat underlättar aktivitetspotentialaktivitet via NMDA-receptorstimulering i hippocampus (Sah et al. 1989) och aktiverar NMDA-receptorer i hjärnbarken (Blanton och Kriegstein 1992). Toniska glutamatnivåer regleras av upptaget i cerebellum och ökar under fylogenes, vilket påverkar neuronal migration via NMDA-receptorstimulering (Rossi och Slater 1993). Andra neurotransmittorer finns också i låga omgivande koncentrationer, såsom aspartat och GABA i striatum och frontal cortex (0.1 μM respektive 20 nM) (Herrera-Marschitz et al. 1996) och adenosin i hippocampus där det är involverat i presynaptisk inhibering (Manzoni et al. 1994). Även om ofullständigt, föreslår denna lista att neuroner i många hjärnstrukturer permanent badas i en soppa av neurotransmittorer som har kraftfulla, specifika, fysiologiska effekter på neuronal excitabilitet.

Med tanke på den allmänna betydelsen av toniska extracellulära koncentrationer av neurotransmittorer, verkar det som att det brett spektrum av parkinsoniska symptom inte skulle bero på bristande överföring av belöningsinformation av dopaminneuroner, men återspeglar en störning av striatal- och kortikala neuroner på grund av nedsatt möjliggörande genom minskad omgivningsdopamin . Dopaminneuroner skulle inte vara aktivt involverade i det brett spektrum av processer som saknar parkinsonism utan ger helt enkelt bakgrundskoncentrationen av dopamin som är nödvändig för att upprätthålla funktionen av striatala och kortikala neuroner som är involverade i dessa processer.

Erkännanden

Jag tackar Drs. Dana Ballard, Anthony Dickinson, Francois Gonon, David D. Potter, Traverse Slater, Roland E. Suri, Richard S. Sutton och R. Mark Wightman för upplysande diskussioner och kommentarer, samt två anonyma domare för omfattande kommentarer.

Det experimentella arbetet stöddes av den schweiziska National Science Foundation (nuvarande 31.43331.95), Human Capital och Mobilitet och Europeiska gemenskapens Biomed 2-program via den schweiziska kontoret för utbildning och vetenskap (CHRX-CT94-0463 via 93.0121 och BMH4-CT95 -0608 via 95.0313-1), James S. McDonnell Foundation, Roche Research Foundation, United Parkinson Foundation (Chicago) och British Council.

REFERENSER

    1. Abercrombie ED,
    2. Keefe KA,
    3. DiFrischia DS,
    4. Zigmond MJ

    (1989) Differentiell effekt av stress på in vivo dopaminfrigöring i striatum, kärnbärare och medial frontal cortex. J. Neurochem. 52: 1655-1658.

    1. Ahlenius S.

    (1974) Effekter av låga och höga doser av L-dopa på tetrabenazin eller a-metyltyrosin-inducerad undertryckande av beteende i en successiv diskrimineringsuppgift. Psychopharmacologia 39: 199-212.

    1. Alexander GE,
    2. DeLong MR,
    3. Strick PL

    (1986) Parallell organisation av funktionellt segregerade kretsar som förbinder basala ganglier och cortex. Annu. Rev. Neurosci. 9: 357-381.

    1. Amalric M.,
    2. Koob GF

    (1987) Deponering av dopamin i kaudatkärnan men inte i kärnan accumbens försämrar reaktionstidens prestanda. J. Neurosci. 7: 2129-2134.

    1. Andén NE,
    2. Fuxe K.,
    3. Hamberger B.,
    4. Hökfelt T. A

    (1966) kvantitativ studie på de nigroneostriatala dopaminneuronerna. Acta Physiol. Scand. 67: 306-312.

    1. Anglade P.,
    2. Mouatt-Prigent A.,
    3. Agid Y.,
    4. Hirsch EC

    (1996) Synaptisk plasticitet i caudatkärnan hos patienter med Parkinsons sjukdom. neurodegeneration 5: 121-128.

    1. Aosaki T.,
    2. Tsubokawa H.,
    3. Ishida A.,
    4. Watanabe K.,
    5. Graybiel AM,
    6. Kimura M.

    (1994) Svar från toniskt aktiva nervceller i primatens striatum genomgår systematiska förändringar under beteende sensormotorisk konditionering. J. Neurosci. 14: 3969-3984.

    1. Apicella P.,
    2. Legallet E.,
    3. Trouche E.

    (1996) Svar från tonalt urladdning av neuroner i apa striatum till visuella stimuli presenterade under passiva förhållanden och under uppgiftens prestanda. Neurosci. Lett. 203: 147-150.

    1. Apicella P.,
    2. Legallet E.,
    3. Trouche E.

    (1997) Svar från tonalt urladdning av neuroner i apenstriatum till primärbelöningar som levereras under olika beteendestillstånd. Exp. Brain Res. 116: 456-466.

    1. Apicella P.,
    2. Ljungberg T.,
    3. Scarnati E.,
    4. Schultz W.

    (1991a) Respons till belöning i apa dorsal och ventral striatum. Exp. Brain Res. 85: 491-500.

    1. Apicella P.,
    2. Scarnati E.,
    3. Ljungberg T.,
    4. Schultz W.

    (1992) Neuronal aktivitet i apa striatum relaterad till förväntan på förutsägbara miljöhändelser. J. Neurophysiol. 68: 945-960.

    1. Apicella P.,
    2. Scarnati E.,
    3. Schultz W.

    (1991b) Toniskt urladdning av neuron av apa-striatum svarar på förberedande och givande stimuli. Exp. Brain Res. 84: 672-675.

    1. Arbib MA,
    2. Dominey PF

    (1995) Modellering av de basala gangliernas roller i timing och sequencing saccadic eye movements. i modeller av informationsbehandling i Basal Ganglia, eds Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 149-162.

    1. Arbuthnott GW,
    2. Ingham CA

    (1993) Det torniga problemet med vad dopamin gör i psykiatrisk sjukdom. Prog. Brain Res. 99: 341-350.

    1. Aston-Jones G.,
    2. Bloom FE

    (1981) Norepinefrininnehållande locus-coeruleusneuroner hos beteende råttor uppvisar uttalade svar på oskadliga miljöstimuli. J. Neurosci. 1: 887-900.

    1. Aston-Jones G.,
    2. Rajkowski J.,
    3. Kubiak P.

    (1997) Konditionerade svar på monkey locus coeruleus neuroner förutsätter förvärv av diskriminerande beteende i en vaksam uppgift. Neuroscience 80: 697-716.

    1. Aston-Jones G.,
    2. Rajkowski J.,
    3. Kubiak P.,
    4. Alexinsky T.

    (1994) Locus coeruleus neuroner i apa aktiveras selektivt av deltagande signaler i en vaksam uppgift. J. Neurosci. 14: 4467-4480.

    1. Ballard DH

    (1997) En introduktion till neurell dator. (MIT Press, Cambridge, MA).

    1. Barto AG

    (1995) Adaptiva kritiker och basala ganglier. i modeller av informationsbehandling i Basal Ganglia, eds Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 215-232.

    1. Barto AG,
    2. Anandan P.

    (1985) Mönsterigenkännande stokastisk inlärningsautomat. IEEE Trasnact. Syst. Man Cybern. 15: 360-375.

    1. Barto AG,
    2. Sutton RS,
    3. Anderson CW

    (1983) Neuronliknande adaptiva element som kan lösa svåra inlärningssvårigheter. IEEE Trans Syst. Man Cybernet. 13: 834-846.

    1. Beninger RJ

    (1983) Dopaminens roll i lokomotorisk aktivitet och lärande. Brain Res. Varv. 6: 173-196.

    1. Beninger RJ

    (1989) Dissociating effekterna av förändrad dopaminerg funktion på prestanda och lärande. Brain Res. Tjur. 23: 365-371.

    1. Beninger RJ,
    2. Cheng M.,
    3. Hahn BL,
    4. Hoffman DC,
    5. Mazurski EJ

    (1987) Effekter av utrotning, pimozid, SCH 23390 och metoklopramid på matbelönad operant svarande på råttor. Psychopharmacology 92: 343-349.

    1. Beninger RJ,
    2. Hahn BL

    (1983) Pimozidblockets etablering men inte uttryck för amfetaminproducerad miljöspecifik konditionering. Vetenskap 220: 1304-1306.

    1. Berendse HW,
    2. Groenewegen HJ,
    3. Lohman AHM

    (1992) Fördelning av ventralstriatal neuroner som sprids till mesencephalon i råttan. J. Neurosci. 12: 2079-2103.

    1. Berger B.,
    2. Trottier S.,
    3. Verney C.,
    4. Gaspar P.,
    5. Alvarez C.

    (1988) Regional och laminär fördelning av dopamin och serotonin innervation i den macaque cerebrala cortexen: en radioautografisk studie. J. Comp. Neurol. 273: 99-119.

    1. Bergson C.,
    2. Mrzljak L.,
    3. Smiley JF,
    4. Pappy M.,
    5. Levenson R.,
    6. Goldman-Rakic ​​PS

    (1995) Regionala, cellulära och subcellulära variationer i fördelningen av D1 och D5 dopaminreceptorer i primathjärnan. J. Neurosci. 15: 7821-7836.

    1. Berthier NE,
    2. Moore JW

    (1990) Aktivitet av djupa cerebellära nukleära celler under klassisk konditionering av nikterande membranförlängning hos kaniner. Exp. Brain Res. 83: 44-54.

    1. Bindra D.

    (1968) Neuropsykologisk tolkning av effekterna av körning och incitament-motivation på allmän aktivitet och instrumentalt beteende. Psychol. Varv. 75: 1-22.

    1. Blanton MG,
    2. Kriegstein AR

    (1992) Egenskaper hos aminosyra-neurotransmittorreceptorer av embryonala kortikala neuroner när de aktiveras av exogena och endogena agonister. J. Neurophysiol. 67: 1185-1200.

    1. Boeijinga PH,
    2. Mulder AB,
    3. Pennartz CMA,
    4. Manshanden I.,
    5. Lopes da Silva FH

    (1993) Svar från kärnan accumbens efter fornix / fimbria stimulering i råttan. Identifiering och långsiktig potentiering av mono- och polysynaptiska vägar. Neuroscience 53: 1049-1058.

    1. Bolam JP,
    2. Francis CM,
    3. Henderson Z.

    (1991) Kolinerg input till dopaminneuroner i substantia nigra: en dubbel immuncytokemisk studie. Neuroscience 41: 483-494.

    1. Bolles RC

    (1972) Förstärkning, förväntan och lärande. Psychol. Varv. 79: 394-409.

    1. Bowman EM,
    2. Aigner TG,
    3. Richmond BJ

    (1996) Neurala signaler i apen ventralstriatum relaterade till motivation för juice och kokainbelöningar. J. Neurophysiol. 75: 1061-1073.

    1. Bouyer JJ,
    2. Park DH,
    3. Joh TH,
    4. Pickel VM

    (1984) Kemisk och strukturell analys av sambandet mellan kortikala ingångar och tyrosinhydroxylasinnehållande terminaler i råttnostriatum. Brain Res. 302: 267-275.

    1. Brown JR,
    2. Arbuthnott GW

    (1983) Dopaminens elektrofysiologi (D2) receptorer: en studie av dopaminens verkan på kortikostriatal överföring. Neuroscience 10: 349-355.

    1. Brozoski TJ,
    2. Brown RM,
    3. Rosvold HE,
    4. Goldman PS

    (1979) Kognitivt underskott som orsakas av regional utarmning av dopamin i prefrontal cortex av rhesusapa. Vetenskap 205: 929-932.

    1. Caillé I.,
    2. Dumartin B.,
    3. Bloch B.

    (1996) Ultrastrukturell lokalisering av D1 dopaminreceptorimmunreaktivitet i råttor striatonigrala neuroner och dess samband med dopaminerg innervation. Brain Res. 730: 17-31.

    1. Calabresi P.,
    2. Maj R.,
    3. Pisani A.,
    4. Mercuri NB,
    5. Bernardi G.

    (1992a) Långsynt synaptisk depression i striatum: fysiologisk och farmakologisk karakterisering. J. Neurosci. 12: 4224-4233.

    1. Calabresi P.,
    2. Pisani A.,
    3. Mercuri NB,
    4. Bernardi G.

    (1992b) Långtidsförstärkning i striatumet ommaskeras genom att avlägsna det spänningsberoende magnesiumblocket av NMDA-receptorkanaler. Eur. J. Neurosci. 4: 929-935.

    1. Calabresi P.,
    2. Saiardi A.,
    3. Pisani A.,
    4. Baik JH,
    5. Centonze D.,
    6. Mercuri NB,
    7. Bernardi G.,
    8. Borelli E.

    (1997) Onormal synaptisk plasticitet i striatum hos möss som saknar dopamin D2-receptorer. J. Neurosci. 17: 4536-4544.

    1. Canavan AGM,
    2. Passingham RE,
    3. Marsden CD,
    4. Quinn N.,
    5. Wyke M.,
    6. Polkey CE

    (1989) Prestanda för inlärningsuppgifter för patienter i de tidiga stadierna av Parkinsons sjukdom. Neuropsychologia 27: 141-156.

    1. Cepeda C.,
    2. Buchwald NA,
    3. Levine MS

    (1993) Neuromodulatoriska verkningar av dopamin i neostriatumet är beroende av de excitatoriska aminosyrareceptor-subtyperna som är aktiverade. Proc. Natl. Acad. Sci. usa 90: 9576-9580.

    1. Cepeda C.,
    2. Chandler SH,
    3. Shumate LW,
    4. Levine MS

    (1995) Persistent Na+ konduktans i medelstora neostriatala nervceller: karakterisering med infraröd videomikroskopi och hela cell-patch-clampinspelningar. J. Neurophysiol. 74: 1343-1348.

    1. Cepeda C.,
    2. Colwell CS,
    3. Itri JN,
    4. Chandler SH,
    5. Levine MS

    (1998) Dopaminerg modulering av NMDA-inducerad helcellsström i neostriatala neuroner i skivor: bidrag av kalciumledningar. J. Neurophysiol. 79: 82-94.

    1. Chergui K.,
    2. Suaud-Chagny MF,
    3. Gonon F.

    (1994) Icke-linjärt förhållande mellan impulsflöde, dopaminfrisättning och dopamineliminering i råtthjärnet in vivo. Neurocience 62: 641-645.

    1. Chesselet MF

    (1984) Presynaptisk reglering av neurotransmittorutsläpp i hjärnan: fakta och hypotes. Neuroscience 12: 347-375.

    1. Kyrka WH,
    2. Rättvisa JB Jr.,
    3. Byrd LD

    (1987) Extracellulär dopamin i råtta striatum efter upptagshämning av kokain, nomifensin och benstropin. Eur. J. Pharmacol. 139: 345-348.

    1. Kyrka WH,
    2. Rättvisa JB Jr.,
    3. Neill DB

    (1987) Detekterar beteendemässigt relevanta förändringar i extracellulär dopamin med mikrodialys. Brain Res. 412: 397-399.

    1. Clarke PBS,
    2. Hommer DW,
    3. Pert A.,
    4. Skirboll LR

    (1987) Innervation av substantia nigra neuroner av kolinerga afferenter från pedunculopontin-kärnan i råtta: neuroanatomiska och elektrofysiologiska bevis. Neuroscience 23: 1011-1019.

    1. Colle WM,
    2. Wise RA

    (1980) Effekter av kärnan accumbens amfetamin på hjärnstimuleringsbelöning för lateral hypotalamus. Brain Res. 459: 356-360.

    1. Contreras-Vidal JL,
    2. Schultz W. A

    (1996) neurala nätverksmodell av belöningsrelaterad inlärning, motivation och orienteringsbeteende. Soc. Neurosci. Abstr. 22: 2029.

    1. Corbett D.,
    2. Wise RA

    (1980) Intrakranial självstimulering i förhållande till de uppåtgående dopaminerga systemen i midbrainen: En rörlig mikroelektrodstudie. Brain Res. 185: 1-15.

    1. Corvaja N.,
    2. Doucet G.,
    3. Bolam JP

    (1993) Ultrastruktur och synaptiska mål för raphe-nigralprojektionen i råttan. Neuroscience 55: 417-427.

    1. Dehaene S.,
    2. Changeux J.-P.

    (1991) Wisconsin-kort sorteringstest: teoretisk analys och modellering i ett neuronalt nätverk. Cerebr. Bark 1: 62-79.

    1. Delaney K.,
    2. Gelperin A.

    (1986) Eftermätning av mataversion som lär sig aminosyrabristande dieter av den jordbundna slugen Limax maximus. J. Comp. Physiol. [EN] 159: 281-295.

    1. DeLong MR,
    2. Crutcher MD,
    3. Georgopoulos AP

    (1983) Förhållandet mellan rörelse och enkelcellsavladdning i substantiv nigra hos den uppförande apan. J. Neurosci. 3: 1599-1606.

    1. Di Chiara G.

    (1995) Dopaminens roll vid drogmissbruk ses ur perspektivet av sin roll i motivation. Drogalkohol Beroende. 38: 95-137.

    1. Dickinson A.

    (1980) Contemporary Animal Learning Theory. (Cambridge Univ. Press, Cambridge, Storbritannien).

    1. Dickinson A.,
    2. Balleine B.

    (1994) Motivational kontroll av målriktad åtgärd. Anim. Lära sig. Behav. 22: 1-18.

    1. Dickinson A.,
    2. Hall G.,
    3. Mackintosh NJ

    (1976) Överraskning och dämpning av blockering. J. Exp. Psychol. Anim. Behav. Proc. 2: 313-322.

    1. Doherty MD,
    2. Gratton A.

    (1992) Höghastighetskronoamperometriska mätningar av mesolimbisk och nigrostriatal dopaminfrisättning i samband med upprepad daglig stress. Brain Res. 586: 295-302.

    1. Dominey P.,
    2. Arbib M.,
    3. Joseph J.-P. en

    (1995) modell av kortikostriatal plasticitet för inlärning av oculomotoriska föreningar och sekvenser. J. Cognit. Neurosci. 7: 311-336.

    1. Doucet G.,
    2. Descarries L.,
    3. Garcia S.

    (1986) Kvantifiering av dopamininnervation i vuxen råtta neostriatum. Neuroscience 19: 427-445.

    1. Dugast C.,
    2. Suaud-Chagny MF,
    3. Gonon F.

    (1994) Kontinuerlig in vivo övervakning av framkallad dopaminfrisättning i råttkärnan accumbens genom amperometri. Neuroscience 62: 647-654.

    1. Edmonds DE,
    2. Gallistel CR

    (1977) Belöning kontra prestanda i självstimulering: elektrodspecifika effekter av a-metyl-p-tyrosin på belöning i råttan. J. Comp. Physiol. Psychol. 91: 962-974.

    1. Elliott R.,
    2. Sahakian BJ,
    3. Matthews K.,
    4. Bannerjea A.,
    5. Rimmer J.,
    6. Robbins TW

    (1997) Effekter av metylfenidat på rumsligt arbetsminne och planering hos friska unga vuxna. Psychopharmacology 131: 196-206.

    1. Ettenberg A.

    (1989) Dopamin, neuroleptika och förstärkt beteende. Neurosci. Biobehav. Varv. 13: 105-111.

    1. Fagg AH

    (1993) Förstärkningslärande för att nå och gripa robot. i nya perspektiv i kontrollen av att nå fram till rörelsen, eds Bennet KMB, Castiello U. (Nord-Holland, Amsterdam), pp 281-308.

    1. Fagg AH,
    2. Arbib MA A

    (1992) modell av primat visuellt-motor villkorligt lärande. Anpassa. Behav. 1: 3-37.

    1. Fibiger HC,
    2. LePiane FG,
    3. Jakubovic A.,
    4. Phillips AG

    (1987) Dopaminens roll vid intrakranial självstimulering av det ventrala tegmentala området. J. Neurosci. 7: 3888-3896.

    1. Fibiger HC,
    2. Miller JJ

    (1977) En anatomisk och elektrofysiologisk undersökning av det serotonerga projektionen från dorsal raphé-kärnan till substantia nigra i råttan. Neuroscience 2: 975-987.

    1. Fibiger HC,
    2. Phillips AG

    Belöning, motivation, kognition: psykobiologi av mesotelencefala dopaminsystem. Handbok för fysiologi. Nervsystemet Intrinsic Regulatory Systems of Brain.1986Am. Physiol. Soc.Bethesda, MA, sek. 1, vol. IV, sid. 647-675.

    1. Filion M.,
    2. Tremblay L.,
    3. Bédard PJ

    (1988) Onormala influenser av passiv lemmar rörelse på aktiviteten hos globus pallidus neuroner i parkinsoniska apa. Brain Res. 444: 165-176.

    1. Flaherty AW,
    2. Graybiel A.

    (1993) Två inmatningssystem för kroppsrepresentationer i primat-striatalmatrisen: experimentella bevis i ekorreapen. J. Neurosci. 13: 1120-1137.

    1. Flaherty AW,
    2. Graybiel A.

    (1994) Input-output organisation av sensorimotorisk striatum i ekorre apa. J. Neurosci. 14: 599-610.

    1. Blommor K.,
    2. Downing AC

    (1978) Prediktiv kontroll av ögonrörelser i Parkinsons sjukdom. Ann. Neurol. 4: 63-66.

    1. Foote SL,
    2. Aston-Jones G.,
    3. Bloom FE

    (1980) Impulsaktivitet hos locus coeruleus neuroner i vakna råttor och apor är en funktion av sensorisk stimulering och upphetsning. Proc. Natl. Acad. Sci. usa 77: 3033-3037.

    1. Freund TF,
    2. Powell JF,
    3. Smith AD

    (1984) tyrosinhydroxylas-immunoreaktiva boutoner i synaptisk kontakt med identifierade striatonigrale neuroner, med särskild hänvisning till dendritiska ryggrad. Neuroscience 13: 1189-1215.

    1. Frey U.,
    2. Schroeder H.,
    3. Matthies H.

    (1990) Dopaminerga antagonister förhindrar långvarigt underhåll av posttetan LTP i CA1-regionen i hippocampala skivor. Brain Res. 522: 69-75.

    1. Friston KJ,
    2. Tononi G.,
    3. Reeke GN Jr.,
    4. Sporns O.,
    5. Edelman GM

    (1994) Värdeberoende urval i hjärnan: simulering i en syntetisk neuralmodell. Neuroscience 59: 229-243.

    1. Fujita K.

    (1987) Artigenkänning av fem makaque apor. primater 28: 353-366.

    1. Furiezos G.,
    2. Wise RA

    (1976) Pimozidinducerad utrotning av intrakranial självstimulering: Svarmönstren utesluter motor- eller prestandafel. Brain Res. 103: 377-380.

    1. Futami T.,
    2. Takakusaki K.,
    3. Kitai ST

    (1995) Glutamatergiska och kolinerga ingångar från pedunculopontin-tegmentalkärnan till dopaminneuroner i substantia nigra pars compacta. Neurosci. Res. 21: 331-342.

    1. Gallistel CR

    (1990) Organisationen för lärande. (MIT Press, Cambridge, MA).

    1. Garcia CE,
    2. Prett DM,
    3. Morari M.

    (1989) Modell prediktiv kontroll: teori och övning-en undersökning. Automatica 25: 335-348.

    1. Garcia-Munoz M.,
    2. Young SJ,
    3. Groves P.

    (1992) Presynaptiska långsiktiga förändringar i excitabiliteten hos den kortikostriatala vägen. Neuroreport 3: 357-360.

    1. Gariano RF,
    2. Groves PM

    (1988) Burst avfyra i dopaminneuron i midhjärnan genom stimulering av mediala prefrontala och främre cingulära kortikaler. Brain Res. 462: 194-198.

    1. Garris PA,
    2. Ciolkowski EL,
    3. Pastore P.,
    4. Wightman RM

    (1994a) Efflux av dopamin från den synaptiska klyftan i kärnans accumbens av råtthjärnan. J. Neurosci. 14: 6084-6093.

    1. Garris PA,
    2. Ciolkowski EL,
    3. Wightman RM

    (1994b) Heterogenitet för framkallat dopaminflöde inom striatal- och striatoamygdaloidområdena. Neuroscience 59: 417-427.

    1. Garris PA,
    2. Wightman RM

    (1994) Olika kinetik reglerar dopaminerg överföring i amygdala, prefrontal cortex och striatum: en in vivo voltammetrisk studie. J. Neurosci. 14: 442-450.

    1. Gerfen CR

    (1984) Neostriatal mosaik: avdelning av kortikostriatal ingång och striatonigral utgångssystem. Natur 311: 461-464.

    1. Gerfen CR,
    2. Engber TM,
    3. Mahan LC,
    4. Susel Z.,
    5. Chase TN,
    6. Monsma FJ Jr.,
    7. Sibley DR

    (1990) D1 och D2 dopaminreceptorreglerade genuttryck av striatonigral och striatopallidala neuroner. Vetenskap 250: 1429-1432.

    1. Tyska DC,
    2. Dubach M.,
    3. Askari S.,
    4. Speciale SG,
    5. Bowden DM

    (1988) 1-metyl-4-fenyl-1,2,3,6-tetrahydropyridin (MPTP) -inducerat parkinsonsyndrom i macaca fascicularis: vilka dopaminerga neuroner i mittenhåra är förlorade? Neuroscience 24: 161-174.

    1. Gilbert PFC,
    2. Thach WT

    (1977) Purkinje-cellaktivitet under motorinlärning. Brain Res. 128: 309-328.

    1. Giros B.,
    2. Jaber M.,
    3. Jones SR,
    4. Wightman RM,
    5. Caron MG

    (1996) Hyperlocomotion och likgiltighet mot kokain och amfetamin hos möss som saknar dopamintransportören. Natur 379: 606-612.

    1. Goldman-Rakic ​​PS,
    2. Leranth C.,
    3. Williams MS,
    4. Mons N.,
    5. Geffard M.

    (1989) Synaptisk komplex med dopamin med pyramidala neuroner i primär cerebral cortex. Proc. Natl. Acad. Sci. usa 86: 9015-9019.

    1. Gonon F.

    (1988) Icke-linjärt förhållande mellan impulsflöde och dopamin som frigörs av dopaminerga neuroner från råtta mellan hjärnan som studerats av in vivo elektrokemi. Neuroscience 24: 19-28.

    1. Gonon F.

    (1997) Långvarig och extrasynaptisk excitatorisk verkan av dopamin medierad av D1-receptorer i råtta striatum in vivo. J. Neurosci. 17: 5972-5978.

    1. Gonzales C.,
    2. Chesselet M.-F.

    (1990) Amygdalonigralväg: En anterogradestudie i råttan med Phaseolus vulgaris Leucoagglutinin (PHA-L). J. Comp. Neurol. 297: 182-200.

    1. Grace AA

    (1991) Phasic kontra tonisk dopaminfrisättning och modulation av dopamin-systemresponsivitet: en hypotes för etsologin av schizofreni. Neuroscience 41: 1-24.

    1. Grace AA,
    2. Bunney BS

    (1985) Motsatta effekter av striatonigrala återkopplingsvägar på midhjärndopamincellaktivitet. Brain Res. 333: 271-284.

    1. Graybiel AM,
    2. Aosaki T.,
    3. Flaherty AW,
    4. Kimura M.

    (1994) Den basala ganglia och adaptiv motorstyrning. Vetenskap 265: 1826-1831.

    1. Groves PM,
    2. Garcia-Munoz M.,
    3. Linder JC,
    4. Manley MS,
    5. Martone ME,
    6. Young SJ

    (1995) Element av den egna organisationen och informationsbehandling i neostriatum. i modeller av informationsbehandling i Basal Ganglia, eds Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 51-96.

  • Gullapalli, V., Barto, A. G. och Grupen, R. A. Lärarintegrationskartläggning för kraftstyrd montering. I: Fortsättningar av 1994 International Conference on Robotics and Automation. Los Alamitos, CA: Computer Society Press, 1994, s. 2633-2638.
    1. Haber SN,
    2. Lynd E.,
    3. Klein C.,
    4. Groenewegen HJ

    (1990) Topografisk organisation av de ventrala striatala effekta utsprången i rhesusapen: en autoradiografisk spårningsstudie. J. Comp. Neurol. 293: 282-298.

    1. Haber S.,
    2. Lynd-Balta E.,
    3. Mitchell SJ

    (1993) Organiseringen av de fallande ventrala pallidal framskrivningarna i apan. J. Comp. Neurol. 329: 111-128.

    1. Hammer M.

    (1993) En identifierad neuron medierar den okonditionerade stimulansen i associativt olfaktoriskt lärande i honungsbin. Natur 366: 59-63.

    1. Hammond C.,
    2. Shibazaki T.,
    3. Rouzaire-Dubois B.

    (1983) Grenade utgående neuroner av råtta subthalamisk kärna: elektrofysiologisk studie av synaptiska effekter på identifierade celler i de två huvudmålet kärnor, den entopeduncular kärnan och substantia nigra. Neuroscience 9: 511-520.

    1. Hattori T.,
    2. Fibiger HC,
    3. McGeer PL

    (1975) Demonstration av en pallido-nigralprojektion som inverterar dopaminerga neuroner. J. Comp. Neurol. 162: 487-504.

    1. Hedreen JC,
    2. DeLong MR

    (1991) Organisation av striatopallidala, striatonigrala och nigrostriatalprojektioner i makaken. J. Comp. Neurol. 304: 569-595.

    1. Hernandez-Lopez S.,
    2. Bargas J.,
    3. Surmeier DJ,
    4. Reyes A.,
    5. Galarraga E.

    (1997) D1-receptoraktivering ökar framkallad urladdning i neostriatala medium-spina neuroner genom att modulera en L-typ Ca2+ ledningsförmåga. J. Neurosci. 17: 3334-3342.

    1. Herrera-Marschitz M.,
    2. Du ZB,
    3. Goiny M.,
    4. Meana JJ,
    5. Silveira R.,
    6. Godukhin OV,
    7. Chen Y.,
    8. Espinoza S.,
    9. Pettersson E.,
    10. Loidl CF,
    11. Lubec G.,
    12. Andersson K.,
    13. Nylander I.,
    14. Terenius L.,
    15. Ungerstedt U.

    (1996) Om ursprunget till extracellulära glutamatnivåer som övervakades i råttens basala ganglier genom in vivo-mikrodialys. J. Neurochem. 66: 1726-1735.

    1. Hersch SM,
    2. Ciliax BJ,
    3. Gutekunst C.-A.,
    4. Rees HD,
    5. Heilman CJ,
    6. Yung KKL,
    7. Bolam JP,
    8. Ince E.,
    9. Yi H.,
    10. Levey AI

    (1995) Elektronmikroskopisk analys av D1- och D2-dopaminreceptorproteiner i dorsalstriatumen och deras synaptiska relationer med motortortikostriatala afferenter. J. Neurosci. 15: 5222-5237.

    1. Heym J.,
    2. Trulson ME,
    3. Jacobs BL

    (1982) Raphe-enhetens aktivitet i frittflyttade katter: effekter av fashörande och visuell stimuli. Brain Res. 232: 29-39.

    1. Hikosaka O.,
    2. Sakamoto M.,
    3. Usui S.

    (1989) Funktionella egenskaper hos apa caudate neuroner. III. Aktiviteter relaterade till förväntan på mål och belöning. J. Neurophysiol. 61: 814-832.

    1. Hollerman JR,
    2. Schultz W.

    (1996) Aktivitet för dopaminneuroner under inlärning i en välbekant uppgiftskontext. Soc. Neurosci. Abstr. 22: 1388.

    1. Hollerman JR,
    2. Tremblay L.,
    3. Schultz W.

    (1994) Belöningsberoende av flera typer av neuronaktivitet i primatstriatum. Soc. Neurosci. Abstr. 20: 780.

    1. Holstein GR,
    2. Pasik P.,
    3. Hamori J.

    (1986) Synapser mellan GABA-immunoreaktiva axonala och dendritiska element i monkey substantia nigra. Neurosci. Lett. 66: 316-322.

    1. Hoover JE,
    2. Strick PL

    (1993) Flera utgångskanaler i basalganglierna. Vetenskap 259: 819-821.

    1. Horvitz JC,
    2. Stewart T.,
    3. Jacobs BL

    (1997) Burst-aktivitet hos ventrala tegmentala dopaminneuroner framkallas av sensoriska stimuli i den vakna katten. Brain Res. 759: 251-258.

    1. Houk JC,
    2. Adams JL,
    3. Barto AG A

    (1995) modell av hur de basala ganglierna genererar och använder neurala signaler som förutsäger förstärkning. i modeller av informationsbehandling i Basal Ganglia, eds Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 249-270.

    1. Houk JC,
    2. Buckingham JT,
    3. Barto AG

    (1996) Modeller av cerebellum och motorinlärning. Behav. Brain Sci. 19: 368-383.

    1. Hrupka BJ,
    2. Lin YM,
    3. Gietzen DW,
    4. Rogers QR

    (1997) Små förändringar i väsentliga aminosyrakoncentrationer förändrar kostvalet i aminosyrabristande råttor. J. Nutr. 127: 777-784.

    1. Hull CL

    (1943) Principer om beteende. (Appleton-Century-Crofts, New York).

    1. Ingham CA,
    2. Hood SH,
    3. Weenink A.,
    4. Van Maldegem B.,
    5. Arbuthnott GW

    (1993) Morfologiska förändringar i råtta neostriatum efter ensidiga 6-hydroxydopamininjektioner i nigrostriatala vägen. Exp. Brain Res. 93: 17-27.

    1. Ito M.

    (1989) Långtidsdepression. Annu. Rev. Neurosci. 12: 85-102.

    1. Jacobs BL,
    2. Fornal CA

    (1993) 5-HT och motorstyrning: en hypotes. Trender Neurosci. 16: 346-352.

    1. Jimenez-Castellanos J.,
    2. Graybiel AM

    (1989) Bevis för att histokemiskt distinkta zoner av primat substantia nigra pars compacta är relaterade till mönstrade fördelningar av nigrostriatalprojektionsneuroner och striatonigralfibrer. Exp. Brain Res. 74: 227-238.

    1. Kalman RE A

    (1960) nytt tillvägagångssätt för linjär filtrering och prediktionsproblem. J. Basic Eng. Trans. SOM JAG 82: 35-45.

  • Kamin, L. J. Selective association och konditionering. I: Grundläggande frågor i instrumentlärande, redigerad av N. J. Mackintosh och W. K. Honig. Halifax, Kanada: Dalhousie University Press, 1969, sid. 42-64.
    1. Kawagoe KT,
    2. Garris PA,
    3. Wiedemann DJ,
    4. Wightman RM

    (1992) Reglering av transienta dopaminkoncentrationsgradienter i mikromiljöomgivande nervterminaler i råttstriatum. Neuroscience 51: 55-64.

    1. Kawaguchi Y.,
    2. Wilson CJ,
    3. Emson PC

    (1989) Intracellulär inspelning av identifierad neostriatal patch och matrisspina celler i en skivberedning som bevarar kortikala ingångar. J. Neurophysiol. 62: 1052-1068.

    1. Kawato M.,
    2. Gomi H.

    (1992) Cerebellum och VOR / OKR inlärningsmodeller. Trender Neurosci. 15: 445-453.

    1. Kiskin NI,
    2. Krishtal OA,
    3. Tsyndrenko AY

    (1986) Excitatoriska aminosyrareceptorer i hippocampala nervceller: kainat misslyckas att desensibilisera dem. Neurosci. Lett. 63: 225-230.

    1. Klopf AH

    (1982) Den hedonistiska neuronen: En teori om minne, lärande och intelligens. (Halvklotet, Washington, DC).

    1. Knowlton BJ,
    2. Mangels JA,
    3. Squire LR A

    (1996) neostriatal vana inlärningssystem hos människor. Vetenskap 273: 1399-1402.

    1. Künzle H.

    (1978) En autoradiografisk analys av efferentanslutningarna från premotoriska och intilliggande prefrontala regioner (områden 6 och 9) i Macaca fascicularis. Brain Behav. Evol. 15: 185-234.

    1. LeMoal M.,
    2. Olds ME

    (1979) Peripheral auditiv inmatning till midbrain limbic-området och relaterade strukturer. Brain Res. 167: 1-17.

    1. LeMoal M.,
    2. Simon H.

    (1991) Mesokortikolimbiskt dopaminergt nätverk: funktionella och regulatoriska roller. Physiol. Varv. 71: 155-234.

    1. Levey AI,
    2. Hersch SM,
    3. Rye DB,
    4. Sunahara RK,
    5. Niznik HB,
    6. Kitt CA,
    7. Pris DL,
    8. Maggio R.,
    9. Brann MR,
    10. Ciliax BJ

    (1993) Lokalisering av D1- och D2-dopaminreceptorer i hjärnan med subtypspecifika antikroppar. Proc. Natl. Acad. Sci. usa 90: 8861-8865.

    1. Linden A.,
    2. Bracke-Tolkmitt R.,
    3. Lutzenberger W.,
    4. Canavan AGM,
    5. Scholz E.,
    6. Diener HC,
    7. Birbaumer N.

    (1990) Långa kortikala potentialer hos parkinsoniska patienter under en associerad inlärningsuppgift. J. Psychophysiol. 4: 145-162.

    1. Ljungberg T.,
    2. Apicella P.,
    3. Schultz W.

    (1991) Svar från monkey midbrain dopaminneuroner under fördröjd växelverkan. Brain Res. 586: 337-341.

    1. Ljungberg T.,
    2. Apicella P.,
    3. Schultz W.

    (1992) Svar av apa-dopaminneuroner under inlärning av beteendemässiga reaktioner. J. Neurophysiol. 67: 145-163.

    1. Llinas R.,
    2. Welsh JP

    (1993) På cerebellum och motorinlärning. Curr. Opin. Neurobiol. 3: 958-965.

    1. Lohman AHM,
    2. Van Woerden-Verkley I.

    (1978) Stigande förbindelser med forkanten i tegu ödlan. J. Comp. Neurol. 182: 555-594.

    1. Louilot A.,
    2. LeMoal M.,
    3. Simon H.

    (1986) Differentiell reaktivitet hos dopaminerga neuroner i kärnan accumbens som svar på olika beteende situationer. En in vivo voltammetrisk studie i fria rörliga råttor. Brain Res. 397: 395-400.

    1. Lovibond PF

    (1983) Underlättande av instrumental beteende av en Pavlovian-appetitiv konditionerad stimulans. J. Exp. Psychol. Anim. Behav. Proc. 9: 225-247.

    1. Lovinger DM,
    2. Tyler EC,
    3. Merritt A.

    (1993) Kort och långvarig synaptisk depression i råttnostriatum. J. Neurophysiol. 70: 1937-1949.

    1. Lynd-Balta E.,
    2. Haber SN

    (1994) Primate striatonigralprojektioner: en jämförelse av den sensorimotorrelaterade striatumen och ventralstriatumen. J. Comp. Neurol. 345: 562-578.

    1. Mackintosh NJ A

    (1975) teori om uppmärksamhet: variationer i associerbarhet av stimulans med förstärkning. Psychol. Varv. 82: 276-298.

    1. Manzoni OJ,
    2. Manabe T.,
    3. Nicoll RA

    (1994) Frisättning av adenosin genom aktivering av NMDA-receptorer i hippocampus. Vetenskap 265: 2098-2101.

    1. Marr D. A

    (1969) teorin om cerebellär cortex. J. Physiol. (Lond.) 202: 437-470.

    1. Marshall JF,
    2. O'Dell SJ,
    3. Navarrete R.,
    4. Rosenstein AJ

    (1990) Dopamin högaffinitetstranspositionstopografi i råtthjärna: stora skillnader mellan dorsal och ventralstriatum. Neuroscience 37: 11-21.

  • Matsumoto, K., Nakamura, K., Mikami, A. och Kubota, K. Svar på oförutsägbar vattentillförsel i munnen av visuellt mottagliga neuroner i orbitofontala cortex av apor. Abstr. Satellit Symp. IBR-möte i ära av professor Kubota, Inuyama, Japan, P-14, 1995.
    1. Matsumura M.,
    2. Kojima J.,
    3. Gardiner TW,
    4. Hikosaka O.

    (1992) Visuella och oculomotoriska funktioner av monkey subthalamic kärna. J. Neurophysiol. 67: 1615-1632.

    1. Maunsell JHR,
    2. Gibson JR

    (1992) Visuella respons latenser i striat cortex av macaque apa. J. Neurophysiol. 68: 1332-1344.

    1. Mazzoni P.,
    2. Andersen RA,
    3. Jordanien MI A

    (1991) mer biologiskt trovärdig inlärningsregel än backpropagation applicerad på en nätverksmodell av kortikal area 7. Cereb. Bark 1: 293-307.

  • McCallum, A. K. Förstärkning lärande med selektiv uppfattning och dolda stater (Doktorsavhandling). Rochester, NY: Univ. Rochester, 1995.
    1. McCormick DA,
    2. Thompson RF

    (1984) Neuronala reaktioner hos kanin-cerebellum under förvärv och efterbildning av ett klassiskt betingat niktitationsmembran-ögonlocksvar. J. Neurosci. 4: 2811-2822.

    1. McLaren I.

    (1989) Beräkningsenheten som en sammansättning av neuroner: En implementering av en felkorrigerande inlärningsalgoritm. i Computing Neuron, eds Durbin R., Miall C., Mitchison G. (Addison-Wesley, Amsterdam), pp 160-178.

    1. Michael AC,
    2. Rättvisa JB Jr.,
    3. Neill DB

    (1985) In vivo voltammetrisk bestämning av kinetiken för dopaminmetabolism i råttan. Neurosci. Lett. 56: 365-369.

    1. Middleton FA,
    2. Strick PL

    (1996) Den temporala lobben är ett mål för utgången från basala ganglierna. Proc. Natl. Acad. Sci. usa 93: 8683-8687.

    1. Miller EK,
    2. Li L.,
    3. Desimone R.

    (1993) Aktivitet av neuroner i främre underlägsen temporal cortex under en kortvarig minnesuppgift. J. Neurosci. 13: 1460-1478.

    1. Miller JD,
    2. Sanghera MK,
    3. Tysk likström

    (1981) mesencefalisk dopamineraktiv enhetaktivitet i beteendehaltig konditionerad råtta. Life Sci. 29: 1255-1263.

    1. Miller R.,
    2. Wickens JR,
    3. Beninger RJ

    (1990) Dopamin D-1- och D-2-receptorer i relation till belöning och prestanda: Ett fall för D-1-receptorn som en primär plats för terapeutisk verkan av neuroleptiska läkemedel. Prog. Neurobiol. 34: 143-183.

    1. Mirenowicz J.,
    2. Schultz W.

    (1994) Betydelsen av oförutsägbarhet för belöningssvar i primatdopaminneuroner. J. Neurophysiol. 72: 1024-1027.

    1. Mirenowicz J.,
    2. Schultz W.

    (1996) Preferential aktivering av mid-brain dopamin neuroner av aptitiv snarare än aversive stimuli. Natur 379: 449-451.

    1. Mitchell SJ,
    2. Richardson RT,
    3. Baker FH,
    4. DeLong MR

    (1987) Primate globus pallidus: neuronaktivitet relaterad till rörelseriktning. Exp. Brain Res. 68: 491-505.

    1. Mogenson GJ,
    2. Takigawa M.,
    3. Robertson A.,
    4. Wu M.

    (1979) Självstimulering av kärnans accumbens och ventral tegmental area av Tsai dämpad av mikroinjektioner av spiroperidol i kärnan accumbens. Brain Res. 171: 247-259.

    1. Montague PR,
    2. Dayan P.,
    3. Nowlan SJ,
    4. Pouget A.,
    5. Sejnowski TJ

    (1993) Användning av aperiodisk förstärkning för riktad självorganisation under utveckling. i neurala informationsbehandlingssystemen 5, eds Hanson SJ, Cowan JD, Giles CL (Morgan Kaufmann, San Mateo, CA), pp 969-976.

    1. Montague PR,
    2. Dayan P.,
    3. Person C.,
    4. Sejnowski TJ

    (1995) Bee foraging i osäkra miljöer med hjälp av predictive hebbian learning. Natur 377: 725-728.

    1. Montague PR,
    2. Dayan P.,
    3. Sejnowski TJ A

    (1996) ram för mesencefala dopaminsystem baserat på prediktivt hebbiskt lärande. J. Neurosci. 16: 1936-1947.

    1. Montague PR,
    2. Sejnowski TJ

    (1994) Den prediktiva hjärnan: temporal sammanträffande och temporal ordning i synaptiska inlärningsmekanismer. Lära sig. Minne 1: 1-33.

    1. Mora F.,
    2. Myers RD

    (1977) Hjärnstimulering: Direkt bevis för involvering av dopamin i prefrontal cortex. Vetenskap 197: 1387-1389.

    1. Murphy BL,
    2. Arnsten AF,
    3. Goldman-Rakic ​​PS,
    4. Roth RH

    (1996) Ökad dopaminomsättning i prefrontal cortex försämrar rumsligt fungerande minnesprestanda hos råttor och apor. Proc. Natl. Acad. Sci. usa 93: 1325-1329.

    1. Nakamura K.,
    2. Mikami A.,
    3. Kubota K.

    (1992) Aktivitet av enkla neuroner i apa amygdala under utförandet av en visuell diskrimineringsuppgift. J. Neurophysiol. 67: 1447-1463.

    1. Nedergaard S.,
    2. Bolam JP,
    3. Greenfield SA

    (1988) Underlättande av dendritiskt kalciumkonduktans med 5-hydroxytryptamin i substantia nigra. Natur 333: 174-177.

    1. Niijima K.,
    2. Yoshida M.

    (1988) Aktivering av mesencefaliska dopaminneuroner genom kemisk stimulering av kärn-tegmenti pedunculopontinus pars compacta. Brain Res. 451: 163-171.

    1. Niki H.,
    2. Watanabe M.

    (1979) Prefrontal och cingulate enhetaktivitet under timing beteende i apan. Brain Res. 171: 213-224.

    1. Nirenberg MJ,
    2. Vaughan RA,
    3. Uhl GR,
    4. Kuhar MJ,
    5. Pickel VM

    (1996) Dopamintransportören är lokaliserad för dendritiska och axonala plasmamembran av nigrostriatal dopaminerga neuroner. J. Neurosci. 16: 436-447.

    1. Nishijo H.,
    2. Ono T.,
    3. Nishino H.

    (1988) Topografisk fördelning av moditetsspecifika amygdalarneuroner i alert monkey. J. Neurosci. 8: 3556-3569.

    1. Nishino H.,
    2. Ono T.,
    3. Muramoto KI,
    4. Fukuda M.,
    5. Sasaki K.

    (1987) Neuronal aktivitet i det ventrala tegmentala området (VTA) under motiverad bar pressmatningsbeteende i apan. Brain Res. 413: 302-313.

    1. Ojakangas CL,
    2. Ebner TJ

    (1992) Purkinje-cellkomplexet och enkla spetsförändringar under en frivillig armrörelseupplärningsuppgift i apan. J. Neurophysiol. 68: 2222-2236.

    1. Olds J.,
    2. Milner P.

    (1954) Positiv förstärkning producerad genom elektrisk stimulering av septal-området och andra områden av råtthjärna. J. Comp. Physiol. Psychol. 47: 419-427.

    1. Otmakhova NA,
    2. Lisman JE

    (1996) D1 / D5 dopaminrecetoraktivering ökar storleken på tidig långsiktig potentiering vid CA1 hippocampala synapser. J. Neurosci. 16: 7478-7486.

    1. Packard MG,
    2. Vit NM

    (1991) Dissociation av hippocampus- och caudat-kärnminne system genom posttraining intracerebral injektion av dopaminagonister. Behav. Neurosci. 105: 295-306.

    1. Pastor MA,
    2. Artieda J.,
    3. Jahanshahi M.,
    4. Obeso JA

    (1992) Tidsberäkning och reproduktion är onormal vid Parkinsons sjukdom. Hjärna 115: 211-225.

    1. Pearce JM,
    2. Hall G. A

    (1980) modell för Pavlovian-konditionering: variationer i effektiviteten hos konditionerade men inte av okonditionerade stimuli. Psychol. Varv. 87: 532-552.

    1. Pennartz CMA,
    2. Ameerun RF,
    3. Groenewegen HJ,
    4. Lopes da Silva FH

    (1993) Synaptisk plasticitet i en in vitro-skivberedning av råttkärnans accumbens. Eur. J. Neurosci. 5: 107-117.

  • Percheron, G., Francois, C., Yelnik, J., och Fenelon, G. Primatisk nigro-striato-pallido-nigral-systemet. Inte enbart slinga. I: Neurala mekanismer i rörelsestörningar, redigerad av A. R. Crossman och M. A. Sambrook. London: John Libbey, 1989, sid. 103-109.
    1. Phillips AG,
    2. Brooke SM,
    3. Fibiger HC

    (1975) Effekter av amfetaminisomerer och neuroleptika på självstimulering från kärnans accumbens och dorsalt noradrenerga bunt. Brain Res. 85: 13-22.

    1. Phillips AG,
    2. Carter DA,
    3. Fibiger HC

    (1976) Dopaminerga substrat av intrakranial självstimulering i caudatkärnan. Brain Res. 104: 221-232.

    1. Phillips AG,
    2. Fibiger HC

    (1978) Dopaminens roll vid mediation av självstimulering i ventral tegmentum, kärnbärare och medial prefrontal cortex. Kan. J. Psychol. 32: 58-66.

    1. Phillips AG,
    2. Mora F.,
    3. Rolls ET

    (1979) Intrakranial självstimulering i orbitofrontal cortex och caudatkärnan av rhesusapa: effekter av apomorfin, pimozid och spiroperidol. Psychopharmacology 62: 79-82.

    1. Pickel VM,
    2. Beckley SC,
    3. Joh TH,
    4. Reis DJ

    (1981) Ultrastrukturell immunocytokemisk lokalisering av tyrosinhydroxylas i neostriatumet. Brain Res. 225: 373-385.

    1. Pris JL,
    2. Amaral GD

    (1981) En autoradiografisk studie av prognoserna av amygdalaens centrala kärna. J. Neurosci. 1: 1242-1259.

    1. Rao RPN,
    2. Ballard DH

    (1997) Dynamisk modell för visuellt erkännande förutspår neurala responsegenskaper i den visuella cortexen. Neural Computat. 9: 721-763.

    1. Rasmussen K.,
    2. Jacobs BL

    (1986) Enhetsaktivitet av locus coeruleus neuroner i den fritt rörliga katten. II. Konditionerings- och farmakologiska studier. Brain Res. 371: 335-344.

    1. Rasmussen K.,
    2. Morilak DA,
    3. Jacobs BL

    (1986) Enhetsaktivitet av locus coeruleus neuroner i den fritt rörliga katten. I. Under naturalistiska beteenden och som svar på enkla och komplexa stimuli. Brain Res. 371: 324-334.

    1. Rescorla RA,
    2. Wagner AR A

    (1972) teori om Pavlovian-konditionering: variationer i effektiviteten av förstärkning och icke-styrning. i klassisk konditionering II: Aktuell forskning och teori, eds svart AH, Prokasy WF (Appleton Century Crofts, New York), pp 64-99.

    1. Richardson RT,
    2. DeLong MR

    (1986) Nucleus basalis av Meynert neuronal aktivitet under en fördröjd responsuppgift i apa. Brain Res. 399: 364-368.

    1. Richardson RT,
    2. DeLong MR

    (1990) Kontextberoende svar på primatkärnan basalisneuroner i en go / no-go-uppgift. J. Neurosci. 10: 2528-2540.

    1. Richfield EK,
    2. Pennney JB,
    3. Young AB

    (1989) Anatomiska och affinitetsstat jämförelser mellan dopamin D1 och D2 receptorer i råtta centrala nervsystemet. Neuroscience 30: 767-777.

    1. Robbins TW,
    2. Everitt BJ

    (1992) Funktioner av dopamin i dorsal och ventral striatum. Semin. Neurosci. 4: 119-128.

    1. Robbins TW,
    2. Everitt BJ

    (1996) Neurobehavioural mekanismer av belöning och motivation. Curr. Opin. Neurobiol. 6: 228-236.

    1. Robinson TE,
    2. Berridge KC

    (1993) Den neurala grunden för läkemedelsbehov: En incitament-sensibiliseringsteori av beroende. Brain Res. Varv. 18: 247-291.

    1. Rogawski MA

    (1987) Nya riktningar i neurotransmittorverkan: dopamin ger några viktiga ledtrådar. Trender Neurosci. 10: 200-205.

    1. Rogers QR,
    2. Harper AE

    (1970) Val av en lösning innehållande histidin av råttor matade en histidin-obalanserad diet. J. Comp. Physiol. Psychol. 72: 66-71.

    1. Rolls ET,
    2. Critchley HD,
    3. Mason R.,
    4. Wakeman EA

    (1996) Orbitofrontala cortexneuroner: roll i olfaktoriskt och visuellt föreningslärande. J. Neurophysiol. 75: 1970-1981.

    1. Romo R.,
    2. Scarnati E.,
    3. Schultz W.

    (1992) Roll av primatbasala ganglia och frontal cortex i den inre generationen av rörelser: jämförelser i striatal neuroner aktiverade under stimulansinducerad rörelseinitiering och utförande. Exp. Brain Res. 91: 385-395.

    1. Romo R.,
    2. Schultz W.

    (1990) Dopaminneuroner i apa-midjen: Beredskapen till svar på aktiv beröring under självinriktade armrörelser. J. Neurophysiol. 63: 592-606.

    1. Rompré P.-P.,
    2. Wise RA

    (1989) Beteendebevis för inaktivering av dopamin depolarisation i midjen. Brain Res. 477: 152-156.

    1. Rossi DJ,
    2. Slater NT

    (1993) Den utvecklingsstart av NMDA-receptorkanalaktivitet under neuronal migration. Neuro 32: 1239-1248.

    1. Rumelhart DE,
    2. Hinton GE,
    3. Williams RJ

    (1986) Lära interna representationer genom felförökning. i parallellfördelad bearbetning I, eds Rumelhart DE, McClelland JL (MIT Press, Cambridge, MA), pp 318-362.

    1. Sah P.,
    2. Hestrin S.,
    3. Nicoll RA

    (1989) Tonisk aktivering av NMDA-receptorer genom omgivande glutamat ökar excitabiliteten hos neuroner. Vetenskap 246: 815-818.

    1. Salamon JD

    (1987) Åtgärder av neuroleptiska läkemedel på appetitiva instrumentella beteenden. i Handboken för psykofarmakologi, eds Iversen LL, Iversen SD, Snyder SH (Plenum, New York), 19: 576-608.

    1. Salamon JD

    (1992) Komplexa motor- och sensorimotoriska funktioner av striatal och accumbens dopamin: involvering i instrumentella beteendeprocesser. Psychopharmacology 107: 160-174.

    1. Sands SB,
    2. Barish ME A

    (1989) kvantitativ beskrivning av excitatoriska aminosyra-neurotransmittorresponser på odlade, ambryoniska ryggmärgsneuroner. Brain Res. 502: 375-386.

    1. Sara SJ,
    2. Segal M.

    (1991) Plastiskhet av sensoriska reaktioner hos locus coeruleus neuroner i den uppträdande råttan: konsekvenser för kognition. Prog. Brain Res. 88: 571-585.

    1. Sawaguchi T.,
    2. Goldman-Rakic ​​PS

    (1991) D1-dopaminreceptorer i prefrontal cortex: involvering i arbetsminne. Vetenskap 251: 947-950.

    1. Scarnati E.,
    2. Proia A.,
    3. Campana E.,
    4. Pacitti C. A

    (1986) mikroiontoforetisk studie om typen av den förmodade synaptiska neurotransmittorn som är involverad i ratens pedunculopontin-substantia nigra pars compacta excitatoriska väg. Exp. Brain Res. 62: 470-478.

    1. Schultz W.

    (1986) Svar från midbrain dopaminneuroner till beteendeutlösande stimuli i apan. J. Neurophysiol. 56: 1439-1462.

    1. Schultz W.,
    2. Apicella P.,
    3. Ljungberg T.

    (1993) Svar av apa dopaminneuroner för att belöna och konditioneras stimuli under successiva steg att lära sig en fördröjd responsuppgift. J. Neurosci. 13: 900-913.

    1. Schultz W.,
    2. Apicella P.,
    3. Romo R.,
    4. Scarnati E.

    (1995a) Kontextberoende aktivitet i primatstriatum som reflekterar förflutna och framtida beteendehändelser. i modeller av informationsbehandling i Basal Ganglia, eds Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 11-28.

    1. Schultz W.,
    2. Apicella P.,
    3. Scarnati E.,
    4. Ljungberg T.

    (1992) Neuronal aktivitet i apa ventral striatum relaterad till förväntan om belöning. J. Neurosci. 12: 4595-4610.

    1. Schultz W.,
    2. Dayan P.,
    3. Montague RR A

    (1997) neuralt substrat av förutsägelse och belöning. Vetenskap 275: 1593-1599.

    1. Schultz W.,
    2. Romo R.

    (1987) Svar av nigrostriatal dopaminneuroner till högintensiv somatosensorisk stimulering i den bedövade apen. J. Neurophysiol. 57: 201-217.

    1. Schultz W.,
    2. Romo R.

    (1990) Dopaminneuroner hos apa-midjen: Beredskapen till reaktioner på stimuli som framkallar omedelbara beteendereaktioner. J. Neurophysiol. 63: 607-624.

    1. Schultz W.,
    2. Romo R.,
    3. Ljungberg T.,
    4. Mirenowicz J.,
    5. Hollerman JR,
    6. Dickinson A.

    (1995b) Belöningsrelaterade signaler som bärs av dopaminneuroner. i modeller av informationsbehandling i Basal Ganglia, eds Houk JC, Davis JL, Beiser DG (MIT Press, Cambrdige, MA), pp 233-248.

    1. Schultz W.,
    2. Ruffieux A.,
    3. Aebischer P.

    (1983) Aktiviteten av pars compacta neuroner av apa substantia nigra i relation till motoraktivering. Exp. Brain Res. 51: 377-387.

    1. Sears LL,
    2. Steinmetz JE

    (1991) Dorsaltillbehör sämre olivaktivitet minskar vid förvärv av kanin klassiskt konditionerat ögonlocksvar. Brain Res. 545: 114-122.

    1. Selemon LD,
    2. Goldman-Rakic ​​PS

    (1990) Topografisk intermingling av striatonigral och striatopallidala neuroner i rhesusapa. J. Comp. Neurol. 297: 359-376.

    1. Sesack SR,
    2. Aoki C.,
    3. Pickel VM

    (1994) Ultrastrukturell lokalisering av D2-receptorliknande immunreaktivitet i midhjärndopaminneuroner och deras striatala mål. J. Neurosci. 14: 88-106.

    1. Sesack SR,
    2. Pickel VM

    (1992) Prefrontala kortikala efferenter i råttsynaps på obelagda neuronmål av katekolaminterminaler i kärnan accumbens septi och på dopaminneuroner i den ventrala tegmentalområdet. J. Comp. Neurol. 320: 145-160.

    1. Simon H.,
    2. Scatton B.,
    3. LeMoal M.

    (1980) Dopaminerga A10-neuroner är inblandade i kognitiva funktioner. Natur 286: 150-151.

    1. Smith AD,
    2. Bolam JP

    (1990) Den neurala nätverket av de basala ganglierna som avslöjades genom studien av synaptiska anslutningar av identifierade neuroner. Trender Neurosci. 13: 259-265.

    1. Smith ID,
    2. Grace AA

    (1992) Roll för den subthalamiska kärnan vid regleringen av nigral dopaminneuronaktivitet. Synapsen 12: 287-303.

    1. Smith MC

    (1968) CS-US-intervall och USA-intensitet vid klassisk konditionering av kanins nikterande membransvar. J. Comp. Physiol. Psychol. 66: 679-687.

    1. Smith Y.,
    2. Bennett BD,
    3. Bolam JP,
    4. Förälder A.,
    5. Sadikot AF

    (1994) Synaptiska förhållanden mellan dopaminerga afferenter och kortikalt eller thalamisk ingång i sensorimotorens territorium hos striatum i apa. J. Comp. Neurol. 344: 1-19.

    1. Smith Y.,
    2. Bolam JP

    (1990) Utmatningsneuronerna och de dopaminerge neuronerna från substantia nigra får en GABA-innehållande inmatning från globus pallidus i råtta. J. Comp. Neurol. 296: 47-64.

    1. Smith Y.,
    2. Bolam JP

    (1991) Konvergens av synaptiska ingångar från striatum och globus pallidus till identifierade nigrokollikulära celler i råtta: en dubbel anterograde-märkningsstudie. Neuroscience 44: 45-73.

    1. Smith Y.,
    2. Hazrati L.-N.,
    3. Förälder A.

    (1990) Efferenta projektioner av den subthalmaiska kärnan i ekorre-apan som studerats med PHA-L-anterograde-spårningsmetoden. J. Comp. Neurol. 294: 306-323.

    1. Somogyi P.,
    2. Bolam JP,
    3. Totterdell S.,
    4. Smith AD

    (1981) Monosynaptisk inmatning från nucleus accumbens — ventral striatumregion till retrogradiskt märkta nigrostriatala neuroner. Brain Res. 217: 245-263.

    1. Sprengelmeyer R.,
    2. Canavan AGM,
    3. Lange HW,
    4. Hömberg V.

    (1995) Associativ inlärning vid degenerativa neostriatala sjukdomar: kontraster i uttryckligt och implicit minne mellan patienter med Parkinsons och Huntingtons sjukdom. Mov. Disord. 10: 85-91.

    1. Surmeier DJ,
    2. Eberwine J.,
    3. Wilson CJ,
    4. Stefani A.,
    5. Kitai ST

    (1992) Dopaminreceptorsubtyper kolokaliseras i råttor striatonigrala neuroner. Proc. Natl. Acad. Sci. usa 89: 10178-10182.

    1. Stamford JA,
    2. Kruk ZL,
    3. Palij P.,
    4. Millar J.

    (1988) Diffusion och upptag av dopamin i råtta caudate och nucleus accumbens jämfört med snabb cyklisk voltammetri. Brain Res. 448: 381-385.

    1. Stein L.

    (1964) Självstimulering av hjärnan och den centrala stimulantverkan av amfetamin. Federation Proc. 23: 836-841.

    1. Stein L.,
    2. Xue BG,
    3. Belluzzi JD

    (1994) In vitro förstärkning av hippocampus sprängning: en sökning efter Skinners beteendeatomer. J. Exp. Anal. Behav. 61: 155-168.

    1. Steinfels GF,
    2. Heym J.,
    3. Strecker RE,
    4. Jacobs BL

    (1983) Beteende korrelerar dopaminerg enhetsaktivitet hos katter som rör sig fritt. Brain Res. 258: 217-228.

    1. Suaud-Chagny MF,
    2. Dugast C.,
    3. Chergui K.,
    4. Msghina M.,
    5. Gonon F.

    (1995) Upptag av dopamin frisatt genom impulsflöde i råttens mesolimbiska och striatala system in vivo. J. Neurochem. 65: 2603-2611.

    1. Suri RE,
    2. Schultz W. A

    (1996) neural inlärningsmodell baserad på aktiviteten hos primatdopaminneuroner Soc. Neurosci. Abstr. 22: 1389.

    1. Sutton RS

    (1988) Lära sig att förutsäga med metoden för temporär skillnad. Maskinlära. 3: 9-44.

    1. Sutton RS,
    2. Barto AG

    (1981) Mot en modern teori om adaptiva nätverk: förväntan och förutsägelse. Psychol. Varv. 88: 135-170.

    1. Tepper J. M,
    2. Martin LP,
    3. Anderson DR

    (1995) GABAA receptormedierad hämning av rått substantia nigra dopaminerga nervceller genom pars reticulata-projektionsneuroner. J. Neurosci. 15: 3092-3103.

    1. Tesauro G.

    (1994) TD-Gammon, ett självlärande backgammonprogram, uppnår spel på masternivå. Neural Comp. 6: 215-219.

    1. Thompson RF,
    2. Gluck MA

    (1991) Hjärnsubstrat av grundläggande associerande lärande och minne. i Perspectives on Cognitive Neuroscience, red. Lister RG, Weingartner HJ (Oxford Univ. Press, New York), sid. 25 – 45.

    1. Thorndike EL

    (1911) Animal Intelligence: Experimental Studies. (MacMillan, New York).

    1. Thorpe SJ,
    2. Rolls ET,
    3. Maddison S.

    (1983) Orbitofrontal cortex: neuronal aktivitet i den beteende apan. Exp. Brain Res. 49: 93-115.

    1. Visa DL,
    2. Schultz W.

    (1985) Svar från råttpallidumceller på cortexstimulering och effekter av förändrad dopaminerg aktivitet. Neuroscience 15: 683-694.

    1. Tremblay L.,
    2. Schultz W.

    (1995) Behandling av belöningsrelaterad information i primära orbitofrontala neuroner. Soc. Neurosci. Abstr. 21: 952.

    1. Trent F.,
    2. Tepper JM

    (1991) Dorsal raphé-stimulering modifierar striatal-framkallad antidromisk invasion av nigrala dopaminneuroner in vivo. Exp. Brain Res. 84: 620-630.

  • Ungerstedt, U. Adipsia och afagi efter 6-hydroxydopamin inducerade degeneration av det nigro-striatala dopaminsystemet. Acta Physiol. Scand. Suppl. 367: 95 – 117, 1971.
    1. Vankov A.,
    2. Hervé-Minvielle A.,
    3. Sara SJ

    (1995) Svar på nyhet och dess snabba tillstånd i locus coeruleus-neuroner hos de fritt utforska råtta. Eur. J. Neurosci. 7: 1180-1187.

    1. Vriezen ER,
    2. Moscovitch M.

    (1990) Minne för tidsbeställning och villkorligt associativt lärande hos patienter med Parkinsons sjukdom. Neuropsychologia 28: 1283-1293.

    1. Walsh JP

    (1993) Depression av excitatorisk synaptisk inmatning i råttala striatal neuroner. Brain Res. 608: 123-128.

    1. Wang Y.,
    2. Cummings SL,
    3. Gietzen DW

    (1996) Temporellt-rumsligt mönster för c-fos-uttryck i råttahjärnan som svar på oundgänglig aminosyrabrist. I. Den första erkännandefasen. Mol. Brain Res. 40: 27-34.

    1. Watanabe M.

    (1989) Lämpigheten av beteendespons som är kodade i efterprövningsaktivitet hos primära prefrontala enheter. Neurosci. Lett. 101: 113-117.

    1. Watanabe M.

    (1990) Prefrontal enhetsaktivitet under associativt lärande i apan. Exp. Brain Res. 80: 296-309.

    1. Watanabe M.

    (1996) Belöningsförväntning i primära prefrontala nervceller. Natur 382: 629-632.

    1. Wauquier A.

    (1976) Påverkan av psykoaktiva läkemedel på hjärnans självstimulering hos råttor: en översyn. i Brain Stimulation Reward, eds Wauquier A., ​​Rolls ET (Elsevier, New York), sid 123 – 170.

    1. Vit NM

    (1989) Belöning eller förstärkning: vad är skillnaden? Neurosci. Biobehav. Varv. 13: 181-186.

    1. White NW,
    2. Milner PM

    (1992) Förstärkares psykobiologi. Annu. Rev. Psychol. 43: 443-471.

    1. Wightman RM,
    2. Zimmerman JB

    (1990) Kontroll av extracellulär dopaminkoncentration i råttstriatum genom impulsflöde och upptag. Brain Res. Varv. 15: 135-144.

    1. Wickens JR,
    2. Begg AJ,
    3. Arbuthnott GW

    (1996) Dopamin vänder depressionen av kortikostriatala synapser från råttor som normalt följer högfrekvensstimulering av cortex in vitro. Neuroscience 70: 1-5.

    1. Wickens J.,
    2. Kötter R.

    (1995) Cellulära modeller av förstärkning. i modeller för informationsbehandling i Basal Ganglia, red. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), sid. 187 – 214.

  • Widrow, G. och Hoff, M. E. Anpassningsbara kopplingskretsar. IRE Western Electronic Show Conven., Conven. Rec. del 4: 96 – 104, 1960.
  • Widrow, G. och Sterns, S. D. Adaptiv signalbehandling. Englewood Cliffs, NJ: Prentice-Hall, 1985.
    1. Williams SM,
    2. Goldman-Rakic ​​PS

    (1993) Karaktärisering av dopaminerg innervering av primär främre cortex med användning av en dopaminspecifik antikropp. Cereb. Bark 3: 199-222.

    1. Williams GV,
    2. Millar J.

    (1990) Koncentrationsberoende verkningar av stimulerad dopaminfrisättning på neuronal aktivitet i råttstriatum. Neuroscience 39: 1-16.

    1. Williams GV,
    2. Rolls ET,
    3. Leonard CM,
    4. Stern C.

    (1993) Neuronala svar i det ventrala striatumet för den beteende apan. Behav. Brain Res. 55: 243-252.

    1. Wilson C.,
    2. Nomikos GG,
    3. Collu M.,
    4. Fibiger HC

    (1995) Dopaminerga korrelationer av motiverat beteende: betydelse av körning. J. Neurosci. 15: 5169-5178.

    1. Wilson CJ

    (1995) Kortikala neurons bidrag till skottmönstret hos striatala, spiny neuroner. i modeller för informationsbehandling i Basal Ganglia, red. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), sid. 29 – 50.

    1. Wilson FAW,
    2. Rolls ET

    (1990a) Neuronala svar relaterade till nyheten och kännedom om visuella stimuli i substantia innominata, diagonalt band i Broca och periventrikulär region i primatförhjärnan. Exp. Brain Res. 80: 104-120.

    1. Wilson FAW,
    2. Rolls ET

    (1990b) Neuronala svar relaterade till förstärkning i primär basala förhjärna. Brain Res. 509: 213-231.

    1. Wilson FAW,
    2. Rolls ET

    (1990c) Lärande och minne återspeglas i svaren från förstärkningsrelaterade nervceller i primärbasens framhjärn. J. Neurosci. 10: 1254-1267.

    1. Wise RA

    (1982) Neuroleptika och operant beteende: anhedonihypotesen. Behav. Brain Sci. 5: 39-87.

    1. Wise RA

    (1996) Beroende av neurobiologi. Curr. Opin. Neurobiol. 6: 243-251.

    1. Klok RA,
    2. Colle L.

    (1984) Pimozide dämpar fri matning: "bästa poäng" -analys avslöjar ett motivationsunderskott. Psychopharmacologia 84: 446-451.

    1. Klok RA,
    2. Hoffman DC

    (1992) Lokalisering av belöningsmekanismer för läkemedel genom intrakraniella injektioner. Synapsen 10: 247-263.

    1. Klok RA,
    2. Rompre P.-P.

    (1989) Hjärndopamin och belöning. Annu. Rev. Psychol. 40: 191-225.

    1. Klok RA,
    2. Spindler J.,
    3. de Wit H.,
    4. Gerber GJ

    (1978) Neuroleptisk-inducerad “anhedonia” hos råttor: pimozidblock belönar matens kvalitet. Vetenskap 201: 262-264.

    1. Wynne B.,
    2. Güntürkün O.

    (1995) Dopaminerge innervation av duvaens telencephalon (Columba liva): en studie med antikroppar mot tyrosinhydroxylas och dopamin. J. Comp. Neurol. 357: 446-464.

    1. Yan Z.,
    2. Song WJ,
    3. Surmeier DJ

    (1997) D2 dopaminreceptorer minskar Ca-typen av N-typ2+ strömmar i rostade neostriatala kolinergiska internuroner genom en membranavgränsad, proteinkinas-C-okänslig väg. J. Neurophysiol. 77: 1003-1015.

    1. Yim CY,
    2. Mogenson GJ

    (1982) Reaktion från kärnan förvärvar neuroner på amygdala-stimulering och dess modifiering med dopamin. Brain Res. 239: 401-415.

    1. Unga AMJ,
    2. Joseph MH,
    3. Grå JA

    (1992) Ökad frisättning av dopamin in vivo i nucleus accumbens och caudatkärnan hos råttan under dricksvatten: en mikrodialysstudie. Neuroscience 48: 871-876.

    1. Unga AMJ,
    2. Joseph MH,
    3. Grå JA

    (1993) Latent hämning av konditionerad dopaminfrisättning i råttkärnan. Neuroscience 54: 5-9.

    1. Yung KKL,
    2. Bolam JP,
    3. Smith AD,
    4. Hersch SM,
    5. Ciliax BJ,
    6. Levey AI

    (1995) Immunocytokemisk lokalisering av D1- och D2-dopaminreceptorer i råttens basala ganglier: ljus- och elektronmikroskopi. Neuroscience 65: 709-730.

  •