Voorspellend beloningssignaal van dopamine-neuronen (1998)

J Neurophysiol. 1998 Jul;80(1):1-27.

Schultz W1.

Abstract

De effecten van laesies, receptorblokkering, elektrische zelfstimulatie en misbruiksmisbruik suggereren dat dopaminesystemen met midhersenen betrokken zijn bij het verwerken van beloningsinformatie en leeraanpakgedrag. De meeste dopamine-neuronen vertonen fasische activeringen na primaire vloeistof- en voedselbeloningen en geconditioneerde beloningsvoorspellende visuele en auditieve stimuli. Ze vertonen bifasische, activatie-depressieve responsen na stimuli die lijken op beloning-voorspellende stimuli of nieuw of bijzonder opvallend zijn. Er volgen echter slechts enkele fasische activeringen aversieve stimuli. Zo duiden dopamine-neuronen omgevingsstimuli aan met een aantrekkelijke waarde, voorspellen en detecteren ze beloningen en signaleren ze signalen en motiveren ze gebeurtenissen. Door niet te discrimineren tussen verschillende beloningen lijken dopamine-neuronen een waarschuwend bericht uit te zenden over de verrassende aanwezigheid of afwezigheid van beloningen. Alle reacties op beloningen en beloningsvoorspellende stimuli hangen af ​​van de voorspelbaarheid van gebeurtenissen. Dopamine-neuronen worden geactiveerd door beloning van gebeurtenissen die beter zijn dan voorspeld, niet beïnvloed door gebeurtenissen die zo goed zijn als voorspeld en die depressief zijn door gebeurtenissen die slechter zijn dan voorspeld. Door beloningen te signaleren volgens een voorspellingsfout, hebben dopaminereacties de formele kenmerken van een onderwijssignaal dat wordt gepostuleerd door theorieën voor het leren van versterkingen. Overdracht van dopamine-reacties tijdens het leren van primaire beloningen naar beloningsprikkelende stimuli. Dit kan bijdragen aan neuronale mechanismen die ten grondslag liggen aan de retrograde actie van beloningen, een van de belangrijkste puzzels bij het leren van versterkingen. De impulsrespons geeft een korte dopamine-impuls af op veel dendrieten, waardoor een nogal globaal versterkingssignaal naar postsynaptische neuronen wordt uitgezonden. Dit signaal kan het naderingsgedrag verbeteren door vooraf beloningsinformatie te verstrekken voordat het gedrag optreedt en kan bijdragen aan leren door de synaptische transmissie aan te passen. Het dopamine-beloningssignaal wordt aangevuld door activiteit in neuronen in striatum, frontale cortex en amygdala, die specifieke beloningsinformatie verwerken maar geen globaal beloningsvoorspellingsfoutsignaal uitzenden. Een samenwerking tussen de verschillende beloningssignalen kan het gebruik van specifieke beloningen voor selectief versterkend gedrag verzekeren. Van de andere projectiesystemen dienen noradrenaline-neuronen overwegend aandachtmechanismen en nucleus basalis-neuronen coderen heterogeniteiten. Cerebellaire klimvezels signaleren fouten in de motorprestaties of fouten in de voorspelling van aversieve gebeurtenissen voor Purkinje-cellen in het cerebellum. De meeste tekorten na dopamine-afnemende laesies worden niet gemakkelijk verklaard door een defect beloningssignaal, maar kunnen de afwezigheid van een algemene activerende functie van tonische niveaus van extracellulair dopamine weerspiegelen. Dus dopamine-systemen kunnen twee functies hebben, de fasische transmissie van beloningsinformatie en de tonische activering van postsynaptische neuronen.

INLEIDING

Toen meercellige organismen ontstonden door de evolutie van zelfreproductie-moleculen, ontwikkelden ze endogene, autoregulerende mechanismen die ervoor zorgden dat aan hun behoeften aan welzijn en overleving werd voldaan. De proefpersonen voeren verschillende vormen van benaderingsgedrag uit om middelen te verkrijgen om het homeostatische evenwicht te behouden en zich voort te planten. Een categorie middelen wordt beloningen genoemd, die benaderingsgedrag uitlokken en versterken. De functies van beloningen werden verder ontwikkeld tijdens de evolutie van hogere zoogdieren om meer geavanceerde vormen van individueel en sociaal gedrag te ondersteunen. Biologische en cognitieve behoeften bepalen dus de aard van beloningen, en de beschikbaarheid van beloningen bepaalt enkele van de basisparameters van de levensomstandigheden van het subject.

Beloningen komen in verschillende fysieke vormen, zijn sterk variabel in de tijd en zijn afhankelijk van de specifieke omgeving van het onderwerp. Ondanks hun belang beïnvloeden beloningen de hersenen niet via speciale perifere receptoren die zijn afgestemd op een beperkt aantal fysieke modaliteiten, zoals het geval is voor primaire sensorische systemen. In plaats daarvan wordt beloningsinformatie door de hersenen geëxtraheerd uit een grote verscheidenheid aan polysensorische, inhomogene en inconstante stimuli door bepaalde neuronale mechanismen te gebruiken. Het zeer variabele karakter van beloningen vereist een hoge mate van aanpassing in neuronale systemen die ze verwerken.

Een van de belangrijkste neurale systemen die betrokken zijn bij het verwerken van beloningsinformatie lijkt het dopaminesysteem te zijn. Gedragsstudies tonen aan dat dopamineprojecties naar het striatum en de frontale cortex een centrale rol spelen bij het bemiddelen van de effecten van beloningen op naderingsgedrag en leren. Deze resultaten zijn afgeleid van selectieve laesies van verschillende componenten van dopamine-systemen, systemische en intracerebrale toediening van directe en indirecte dopaminereceptoragonisten en -antagonisten, elektrische zelfstimulatie en zelftoediening van belangrijke drugsmisbruik, zoals cocaïne, amfetamine, opiaten, alcohol en nicotine (Beninger en Hahn 1983; Di Chiara 1995; Fibiger en Phillips 1986; Robbins en Everitt 1992; Robinson en Berridge 1993; Wise 1996; Wise en Hoffman 1992; Wise et al. 1978).

Het huidige artikel vat recent onderzoek over de signalering van omgevingsmotiverende stimuli door dopamine-neuronen samen en evalueert de potentiële functies van deze signalen voor het aanpassen van gedragsreacties aan de hand van anatomische organisatie, leertheorieën, kunstmatige neuronale modellen, andere neurale systemen en tekorten na laesies. Alle bekende responskarakteristieken van dopamine-neuronen zullen worden beschreven, maar overwegend zullen de reacties op beloningsgerelateerde stimuli worden geconceptualiseerd omdat ze momenteel het best worden begrepen. Vanwege de grote hoeveelheid gegevens die beschikbaar zijn in de literatuur, zal het belangrijkste besproken systeem de nigrostriatale dopamine-projectie zijn, maar projecties van dopamine-neuronen in de middenhersenen naar ventrale striatum en frontale cortex zullen ook worden beschouwd voor zover de huidige kennis dit toelaat.

BELONINGEN EN VOORSPELLINGEN

Functies van beloningen

Bepaalde objecten en gebeurtenissen in de omgeving zijn van bijzonder motivationele betekenis door hun effecten op welzijn, overleving en voortplanting. Volgens de uitgelokte gedragsreacties kan de motivationele waarde van omgevingsobjecten appetitief (belonend) of aversief (bestraffend) zijn. (Merk op dat "appetitief" wordt gebruikt als synoniem voor "belonen" maar niet voor "voorbereidend".) Doelgerichte objecten hebben drie afzonderlijke basisfuncties. In hun eerste functie lokken beloningen aanpak en consumerend gedrag uit. Dit komt doordat de objecten met eetlust worden gelabeld door aangeboren mechanismen of, in de meeste gevallen, door leren. In hun tweede functie verhogen beloningen de frequentie en intensiteit van gedrag dat naar dergelijke objecten leidt (leren), en behouden ze het aangeleerde gedrag door uitroeiing te voorkomen. Beloningen dienen als positieve gedragsversterkers in klassieke en instrumentale conditioneringsprocedures. In het algemeen leren prikkels, stimuli in de omgeving krijgen een hogere waarde als gevolg van klassiek geconditioneerde stimulusbeloningsassociaties en leiden tot naderend gedrag (Bindra 1968). In instrumentele conditionering beloont "versterken" gedrag door het versterken van associaties tussen stimuli en gedragsreacties (Law of Effect: Thorndike 1911). Dit is de essentie van 'terugkomen voor meer' en houdt verband met het algemene idee van beloningen die worden verkregen voor het hebben van iets goeds. In een instrumentele vorm van incentive learning zijn beloningen "prikkels" en dienen als doelen van gedrag na associaties tussen gedragsreacties en uitkomsten (Dickinson en Balleine 1994). In hun derde functie leiden beloningen tot subjectieve gevoelens van plezier (hedonie) en positieve emotionele toestanden. Aversieve stimuli functioneren in tegengestelde richtingen. Ze induceren ontwenningsverschijnselen en werken als negatieve versterkers door vermijdingsgedrag bij herhaalde presentatie te verhogen en te handhaven, waardoor de impact van schadelijke gebeurtenissen wordt verminderd. Bovendien veroorzaken ze interne emotionele toestanden van woede, angst en paniek.

Functies van voorspellingen

Voorspellingen bieden vooraf informatie over toekomstige stimuli, gebeurtenissen of systeemstaten. Ze bieden het basisvoordeel van het verkrijgen van tijd voor gedragsreacties. Sommige voorspellingen schrijven motivationele waarden toe aan omgevingsprikkels door ze te associëren met bepaalde uitkomsten, waardoor objecten van vitaal belang worden geïdentificeerd en ze worden onderscheiden van minder waardevolle objecten. Andere vormen coderen fysieke parameters van voorspelde objecten, zoals ruimtelijke positie, snelheid en gewicht. Voorspellingen stellen een organisme in staat om toekomstige gebeurtenissen te evalueren voordat ze daadwerkelijk plaatsvinden, de selectie en voorbereiding van gedragsreacties mogelijk te maken en de kans te vergroten dat objecten met motivationele waarden worden benaderd of vermeden. Herhaalde bewegingen van objecten in dezelfde volgorde laten bijvoorbeeld toe om toekomstige posities te voorspellen en bereiden al de volgende beweging voor terwijl ze het huidige object nastreven. Dit vermindert de reactietijd tussen individuele doelen, versnelt de algehele prestaties en resulteert in een eerdere uitkomst. Voorspellende oogbewegingen verbeteren de gedragsprestaties door vooraf scherpstellen (Bloemen en Downing 1978).

Op een meer gevorderd niveau, maakt de door voorspellingen verschafte vooruitgangsinformatie het mogelijk om beslissingen te nemen tussen alternatieven om bepaalde systeemtoestanden te bereiken, om zelden voorkomende doelobjecten te benaderen of om onherstelbare nadelige effecten te vermijden. Industriële toepassingen gebruiken interne modelcontrole om systeemstaten te voorspellen en erop te reageren voordat ze daadwerkelijk optreden (Garcia et al. 1989). De 'fly-by-wire'-techniek in de moderne luchtvaart berekent bijvoorbeeld voorspelbare komende staten van vliegtuigen. Beslissingen voor vliegmanoeuvres houden rekening met deze informatie en helpen overmatige belasting van de mechanische componenten van het vliegtuig te voorkomen, waardoor het gewicht wordt verminderd en het werkbereik wordt vergroot.

Het gebruik van voorspellende informatie is afhankelijk van de aard van de vertegenwoordigde toekomstige gebeurtenissen of systeemtoestanden. Eenvoudige representaties hebben rechtstreeks betrekking op de positie van aankomende doelen en de daaruit voortvloeiende gedragsreactie, waardoor de reactietijd op een nogal automatische manier wordt verkort. Hogere vormen van voorspellingen zijn gebaseerd op representaties die logische gevolgtrekkingen mogelijk maken, die toegankelijk en behandeld kunnen worden met verschillende mate van intentionaliteit en keuze. Ze worden vaak bewust verwerkt bij mensen. Voordat de voorspelde gebeurtenissen of systeemtoestanden plaatsvinden en gedragsreacties worden uitgevoerd, maken dergelijke voorspellingen het mogelijk om verschillende strategieën mentaal te evalueren door kennis uit verschillende bronnen te integreren, verschillende manieren van reactie te ontwerpen en de winsten en verliezen van elke mogelijke reactie te vergelijken.

Gedragsmatige conditionering

Associatief appetitief leren omvat het herhaald en contingent koppelen tussen een willekeurige stimulus en een primaire beloning (Fig. 1). Dit resulteert in steeds frequentere naderingsgedragingen die worden geïnduceerd door de nu "geconditioneerde" stimulus, die gedeeltelijk lijkt op het naderingsgedrag dat door de primaire beloning wordt opgewekt en die ook wordt beïnvloed door de aard van de geconditioneerde stimulus. Het lijkt erop dat de geconditioneerde stimulus als een voorspeller van beloning dient en, vaak op basis van een gepaste drive, een interne motivationele toestand instelt die leidt tot de gedragsreactie. De gelijkenis van benaderingsreacties suggereert dat sommige van de algemene, voorbereidende componenten van de gedragsrespons worden overgedragen van de primaire beloning naar de vroegst geconditioneerde, beloningsvoorspellende stimulus. Dus de geconditioneerde stimulus fungeert gedeeltelijk als een motiverende substituut voor de primaire stimulus, waarschijnlijk door Pavloviaans leren (Dickinson 1980).

Fig. 1. 

Verwerking van appetijtstimuli tijdens het leren. Een willekeurige stimulus wordt geassocieerd met een primaire voedsel- of vloeibare beloning door herhaalde, voorwaardelijke koppeling. Deze geconditioneerde beloningsvoorspellende stimulus induceert een interne motiverende toestand door een verwachting van de beloning op te roepen, vaak op basis van een overeenkomstige honger of dorst, en de gedragsreactie op te wekken. Dit schema repliceert de basisbegrippen van de motiv motivatie theorie ontwikkeld door Bindra (1968) en Bolles (1972). Het is van toepassing op klassieke conditionering, waarbij beloning automatisch wordt afgegeven na de geconditioneerde stimulus, en op instrumentele (operante) conditionering, waarbij beloningaflevering een reactie van het subject op de geconditioneerde stimulus vereist. Deze regeling is ook van toepassing op aversieve conditionering die om redenen van beknoptheid niet verder is uitgewerkt.

Veel zogenaamde 'ongeconditioneerde' voedsel- en vloeibare beloningen worden waarschijnlijk door ervaring geleerd, zoals elke bezoeker van het buitenland kan bevestigen. De primaire beloning zou dan kunnen bestaan ​​uit de smaak die wordt ervaren wanneer het object de smaakreceptoren activeert, maar dat kan opnieuw worden geleerd. Het uiteindelijke belonende effect van voedingsstofobjecten bestaat waarschijnlijk uit hun specifieke invloeden op biologische basisvariabelen, zoals elektrolyt-, glucose- of aminozuurconcentraties in plasma en hersenen. Deze variabelen worden bepaald door de vegetatieve behoeften van het organisme en ontstaan ​​door evolutie. Dieren vermijden voedingsstoffen die geen invloed hebben op belangrijke vegetatieve variabelen, bijvoorbeeld voedingsmiddelen zonder essentiële aminozuren als histidine (Rogers en Harper 1970), threonine (Hrupka et al. 1997; Wang et al. 1996), of methionine (Delaney en Gelperin 1986). Een paar primaire beloningen kunnen worden bepaald door aangeboren instincten en ondersteunen aanvankelijk benaderingsgedrag en opname in het vroege leven, terwijl de meerderheid van de beloningen zou worden geleerd tijdens de daaropvolgende levenservaring van het onderwerp. Het fysieke uiterlijk van beloningen kan dan worden gebruikt voor het voorspellen van de veel langzamere vegetatieve effecten. Dit zou de detectie van beloningen drastisch versnellen en een groot voordeel voor overleving vormen. Door het leren van beloningen kunnen proefpersonen ook een veel grotere verscheidenheid aan voedingsstoffen gebruiken als effectieve beloningen en zo hun overlevingskansen vergroten in zones met schaarse bronnen.

ADAPTIEVE REACTIES OP APPETITIVE STIMULI

Cellichamen van dopamine-neuronen bevinden zich meestal in de middenhersenen groepen A8 (dorsale tot laterale substantia nigra), A9 (pars compacta van substantia nigra) en A10 (ventrale tegmentale mediale tot substantia nigra). Deze neuronen geven de neurotransmitter dopamine af met zenuwimpulsen van axonale varicositeiten in het striatum (caudate nucleus, putamen en ventraal striatum inclusief nucleus accumbens) en frontale cortex, om de belangrijkste sites te noemen. We registreren de impulsactiviteit van cellichamen van enkele dopamine-neuronen tijdens perioden van 20-60 min met verplaatsbare micro-elektroden vanuit extracellulaire posities, terwijl apen leren of gedragstaken uitvoeren. De karakteristieke polyfasische, relatief lange impulsen die worden afgegeven bij lage frequenties, maken dopamine-neuronen gemakkelijk te onderscheiden van andere neuronen uit de middenhersenen. De gebruikte gedragsparadigma's omvatten reactietijdtaken, directe en vertraagde go-no go-taken, ruimtelijk vertraagde respons- en afwisselingstaken, luchtdruk en zoutoplossing actieve vermijdingstaken, operante en klassiek geconditioneerde visuele onderscheidtaken, zelf-geïnitieerde bewegingen en onvoorziene levering van beloning in de afwezigheid van een formele taak. Over 100-250 dopamine-neuronen worden bestudeerd in elke gedragssituatie en fracties van taakgemoduleerde neuronen verwijzen naar deze monsters.

Initiële registratiestudies zochten naar correlaten van motorische en cognitieve stoornissen in dopamine neuronen, maar slaagden er niet in om duidelijke covariaties te vinden met arm- en oogbewegingen (DeLong et al. 1983; Schultz en Romo 1990; Schultz et al. 1983) of met mnemonische of ruimtelijke componenten van vertraagde responstaken (Schultz et al. 1993). Daarentegen bleek dat dopamine-neuronen op een zeer onderscheidende manier werden geactiveerd door de lonende kenmerken van een breed scala aan somatosensorische, visuele en auditieve stimuli.

Activering door primaire appetitieve stimuli

Over 75% dopamine-neuronen vertonen fasische activeringen wanneer dieren een klein stukje verborgen voedsel aanraken tijdens verkenningsbewegingen in afwezigheid van andere fasische stimuli, zonder te worden geactiveerd door de beweging zelf (Romo en Schultz 1990). De resterende dopamine-neuronen reageren niet op een van de geteste omgevingsstimuli. Dopamine-neuronen worden ook geactiveerd door een druppel vloeistof die aan de mond wordt afgegeven buiten een gedragstaak of door het leren van zulke verschillende paradigma's als visuele of auditieve reactietijdtaken, ruimtelijke vertraagde reactie of afwisseling, en visuele discriminatie, vaak in hetzelfde dier (Fig. . 2 top) (Hollerman en Schultz 1996; Ljungberg et al. 1991, 1992; Mirenowicz en Schultz 1994; Schultz et al. 1993). De respons op beloning gebeurt onafhankelijk van een leercontext. Dus lijken dopamine-neuronen geen onderscheid te maken tussen verschillende voedselobjecten en vloeibare beloningen. In hun antwoorden worden beloningen echter onderscheiden van niet-renderende objecten (Romo en Schultz 1990). Alleen 14% dopamine-neuronen vertonen de fasische activeringen wanneer primaire aversieve stimuli worden gepresenteerd, zoals een luchtdruk in de hand of hypertone zoutoplossing in de mond, en de meeste geactiveerde neuronen reageren ook op beloningen (Mirenowicz en Schultz 1996). Hoewel ze niet irriterend zijn, zijn deze stimuli aversief omdat ze het gedrag verstoren en actieve vermijdingsreacties veroorzaken. Dopamine-neuronen zijn echter niet volledig ongevoelig voor aversieve stimuli, zoals wordt aangetoond door langzame depressies of af en toe langzame activeringen na pijnknijpprikkels bij anesthesiemonnen (Schultz en Romo 1987) en door verhoogde striatale dopamine-afgifte na elektrische schok en staartknijpen bij wakkere ratten (Abercrombie et al. 1989; Doherty en Gratton 1992; Louilot et al. 1986; Young et al. 1993). Dit suggereert dat de faserische reacties van dopamine-neuronen bij voorkeur omgevingsstimuli met primaire eetlustwaarde rapporteren, terwijl aversieve gebeurtenissen kunnen worden gesignaleerd met een aanzienlijk langzamer tijdsverloop.

Fig. 2. 

Dopamine-neuronen rapporteren beloningen volgens een fout in beloningsvoorspelling. Top: druppel vloeistof treedt op, hoewel er op dit moment geen beloning wordt voorspeld. Het optreden van beloning vormt dus een positieve fout in de voorspelling van beloning. Dopamine-neuron wordt geactiveerd door het onvoorspelbare voorkomen van de vloeistof. Midden: geconditioneerde stimulus voorspelt een beloning en de beloning vindt plaats volgens de voorspelling, dus geen fout in de voorspelling van beloning. Dopamine-neuron wordt niet geactiveerd door de voorspelde beloning (rechts). Het toont ook een activering na de beloningsvoorspellende stimulus, die optreedt ongeacht een fout in de voorspelling van de latere beloning (links). Onder: geconditioneerde stimulus voorspelt een beloning, maar de beloning vindt niet plaats omdat het dier niet reageert. De activiteit van het dopamine-neuron wordt onderdrukt precies op het moment dat de beloning zou hebben plaatsgevonden. Let op de depressie die optreedt> 1 s na de geconditioneerde stimulus zonder enige tussenliggende stimuli, waardoor een intern proces van beloningsverwachting wordt onthuld. Neuronale activiteit in de 3 grafieken volgt de vergelijking: dopamine-respons (beloning) = beloning opgetreden - beloning voorspeld. CS, geconditioneerde stimulus; R, primaire beloning. Herdrukt van Schultz et al. (1997) met toestemming van de American Association for the Advancement of Science.

Onvoorspelbaarheid van beloning

Een belangrijk kenmerk van dopamine-reacties is hun afhankelijkheid van de onvoorspelbaarheid van gebeurtenissen. De activeringen na beloningen vinden niet plaats wanneer voedsel- en vloeistofbeloningen worden voorafgegaan door fasische stimuli die zijn geconditioneerd om dergelijke beloningen te voorspellen (Fig. 2, midden) (Ljungberg et al. 1992; Mirenowicz en Schultz 1994; Romo en Schultz 1990). Een cruciaal verschil tussen leren en volledig verworven gedrag is de mate van onvoorspelbaarheid van beloningen. Dopamine-neuronen worden geactiveerd door beloningen tijdens de leerfase, maar stoppen met reageren na volledige verwerving van visuele en auditieve reactietijdtaken (Ljungberg et al. 1992; Mirenowicz en Schultz 1994), ruimtelijk vertraagde responsietaken (Schultz et al. 1993), en gelijktijdige visuele discriminatie (Hollerman en Schultz 1996). Het verlies van respons is niet het gevolg van een zich ontwikkelende algemene ongevoeligheid voor beloningen, omdat activeringen na beloningen die buiten de taken worden gegeven niet afnemen gedurende meerdere maanden van experimenten (Mirenowicz en Schultz 1994). Het belang van onvoorspelbaarheid omvat de tijd van beloning, zoals blijkt uit voorbijgaande activeringen na beloningen die plotseling eerder of later worden geleverd dan voorspeld (Hollerman en Schultz 1996). Alles bij elkaar genomen, moet het voorkomen van beloning, inclusief de tijd, onvoorspelbaar zijn om dopamine-neuronen te activeren.

Depressie door weglating van voorspelde beloning

Dopamine-neuronen worden depressief precies op het moment van het gebruikelijke optreden van beloning wanneer een volledig voorspelde beloning niet optreedt, zelfs in afwezigheid van een onmiddellijk voorafgaande stimulus (Fig. 2, bodem). Dit wordt waargenomen wanneer dieren geen beloning krijgen vanwege foutief gedrag, wanneer de vloeistofstroom ondanks correct gedrag door de onderzoeker wordt gestopt of wanneer een klep hoorbaar opent zonder dat er vloeistof wordt afgegeven (Hollerman en Schultz 1996; Ljungberg et al. 1991; Schultz et al. 1993). Wanneer beloningslevering wordt vertraagd voor 0.5 of 1.0 s, vindt er een depressie van neuronale activiteit plaats op het normale tijdstip van de beloning en volgt een activering de beloning op het nieuwe tijdstip (Hollerman en Schultz 1996). Beide antwoorden komen slechts gedurende een paar herhalingen voor totdat de nieuwe tijd van beloning opnieuw wordt voorspeld. Daarentegen levert beloning eerder dan de gebruikelijke resultaten op bij een activering op het nieuwe tijdstip van beloning, maar slaagt er niet in om een ​​depressie op de gebruikelijke tijd te veroorzaken. Dit suggereert dat ongewoon vroege beloningslevering de beloningsvoorspelling voor de gebruikelijke tijd annuleert. Dus dopamine-neuronen bewaken zowel het voorkomen als het tijdstip van beloning. Bij afwezigheid van stimuli die onmiddellijk voorafgaan aan de weggelaten beloning, vormen de depressies geen eenvoudige neurale respons, maar weerspiegelen ze een verwachtingsproces dat is gebaseerd op een interne klok die de precieze tijd van de voorspelde beloning volgt.

Activering door geconditioneerde, beloningsvoorspellende stimuli

Over 55-70% van dopamine-neuronen wordt geactiveerd door geconditioneerde visuele en auditieve stimuli in de verschillende klassiek of instrumenteel geconditioneerde taken die eerder zijn beschreven (Fig. 2, midden en bodem) (Hollerman en Schultz 1996; Ljungberg et al. 1991, 1992; Mirenowicz en Schultz 1994; Schultz 1986; Schultz en Romo 1990; P. Waelti, J. Mirenowicz en W. Schultz, ongepubliceerde gegevens). De eerste dopaminereacties op geconditioneerd licht werden gerapporteerd door Miller et al. (1981) bij ratten behandeld met haloperidol, die de incidentie en de spontane activiteit van dopamineneuronen verhoogden maar resulteerden in meer aanhoudende reacties dan bij niet-gegradueerde dieren. Hoewel de reacties dichtbij gedragsreacties voorkomen (Nishino et al. 1987), ze zijn niet gerelateerd aan arm- en oogbewegingen zelf, omdat ze ook ipsilateraal zijn voor de bewegende arm en bij onderzoeken zonder arm- of oogbewegingen (Schultz en Romo 1990). Geconditioneerde stimuli zijn enigszins minder effectief dan primaire beloningen in termen van responsomvang en fracties van geactiveerde neuronen. Dopamine-neuronen reageren alleen op het begin van geconditioneerde stimuli en niet op hun offset, zelfs als stimuluscompensatie de beloning voorspelt (Schultz en Romo 1990). Dopamine-neuronen maken geen onderscheid tussen visuele en auditieve modaliteiten van geconditioneerde appetitieve stimuli. Ze discrimineren echter tussen appetijtelijke en neutrale of aversieve stimuli, zolang ze fysiek voldoende ongelijk zijn (Ljungberg et al. 1992; P. Waelti, J. Mirenowicz en W. Schultz, ongepubliceerde gegevens). Alleen 11% dopamine-neuronen, de meesten met appetijtrespons, vertonen de typische fasische activeringen ook als reactie op geconditioneerde aversieve visuele of auditieve stimuli bij actieve vermijdingsactiviteiten waarbij dieren een sleutel vrijgeven om een ​​luchtrookje of een druppel hypertonische zoutoplossing te vermijden (Mirenowicz en Schultz 1996), hoewel een dergelijke vermijding als "lonend" kan worden beschouwd. Deze paar activeringen zijn niet sterk genoeg om een ​​gemiddelde respons van de bevolking te induceren. Aldus rapporteren de fasische reacties van dopamine-neuronen bij voorkeur omgevingsstimuli met een appetijtelijke motivatiewaarde maar zonder onderscheid te maken tussen verschillende sensorische modaliteiten.

Overdracht van activering

In de loop van het leren worden dopamine-neuronen geleidelijk geactiveerd door geconditioneerde, beloningsvoorspellende stimuli en verliezen ze geleidelijk hun respons op primaire voedsel- of vloeistofbeloningen die worden voorspeld (Hollerman en Schultz 1996; Ljungberg et al. 1992; Mirenowicz en Schultz 1994) (Fig. 2 en 3). Tijdens een voorbijgaande leerperiode veroorzaken zowel beloningen als geconditioneerde stimuli dopamine-activeringen. Deze overdracht van primaire beloning naar de geconditioneerde stimulus gebeurt onmiddellijk in enkele dopamine-neuronen, getest in twee goed geleerde taken met respectievelijk onverwachte en voorspelde beloningen (Romo en Schultz 1990).

Fig. 3. 

Dopamine-responsoverdracht naar de vroegste voorspellende stimulus. Antwoorden op onvoorspelbare primaire beloningsoverdracht naar progressief eerdere stimulus voorspellende stimuli. Alle displays tonen populatiehistogrammen verkregen door het middelen van genormaliseerde histogrammen van perieve histogrammen van alle dopamine-neuronen die zijn geregistreerd in de aangegeven gedragssituaties, onafhankelijk van de aanwezigheid of afwezigheid van een respons. Top: buiten elke gedragstaak, is er geen respons van de bevolking in 44-neuronen getest met een klein lichtje (gegevens van Ljungberg et al. 1992), maar een gemiddelde reactie treedt op bij 35 neuronen op een druppel vloeistof die wordt afgegeven aan een tuit voor de mond van het dier (Mirenowicz en Schultz 1994). Midden: reactie op een beloningstimulerende triggerstimulus in een 2-keuze ruimtelijk bereikende taak, maar afwezigheid van respons op beloning geleverd tijdens vastgestelde taakprestaties in dezelfde 23-neuronen (Schultz et al. 1993). Onder: reactie op een instructiecue voorafgaand aan de beloningsprikkelende trigger-stimulus door een vast interval van 1 s in een geïnstrueerde ruimtelijke reiktaak (19-neuronen) (Schultz et al. 1993). Tijdbasis wordt gesplitst vanwege variërende intervallen tussen geconditioneerde stimuli en beloning. Overgenomen van Schultz et al. (1995b) met toestemming van MIT Press.

Onvoorspelbaarheid van geconditioneerde stimuli

De activeringen na geconditioneerde, beloningsvoorspellende stimuli komen niet voor wanneer deze stimuli zelf worden voorafgegaan met een gefixeerd interval door fasisch geconditioneerde stimuli in volledig vastgestelde gedragssituaties. Dus met seriële geconditioneerde stimuli worden dopamine-neuronen geactiveerd door de vroegste beloningsvoorspellende stimulus, terwijl alle prikkels en beloningen die volgen op voorspelbare momenten daarna niet effectief zijn (Fig. 3) (Schultz et al. 1993). Alleen willekeurig verdeelde sequentiële stimuli lokken individuele responsen uit. Ook vermindert uitgebreide overtraining met sterk stereotiepe taakprestaties de reacties op geconditioneerde stimuli, waarschijnlijk omdat stimuli worden voorspeld door gebeurtenissen in de vorige test (Ljungberg et al. 1992). Dit suggereert dat stimulus onvoorspelbaarheid een algemene vereiste is voor alle stimuli die dopamine-neuronen activeren.

Depressie door weglating van voorspelde geconditioneerde stimuli

Voorlopige gegevens van een eerder experiment (Schultz et al. 1993) suggereren dat dopamine-neuronen ook depressief zijn wanneer een geconditioneerde, beloningsvoorspellende stimulus zelf wordt voorspeld op een vast tijdstip door een voorgaande stimulus maar niet optreedt vanwege een fout van het dier. Net als bij primaire beloningen treden de depressies op ten tijde van het gebruikelijke optreden van de geconditioneerde stimulus, zonder direct te worden uitgelokt door een voorgaande stimulus. Aldus kan de weglating-geïnduceerde depressie worden gegeneraliseerd naar alle appetijtgebeurtenissen.

Activatie-depressie met responsgeneralisatie

Dopamine-neuronen reageren ook op stimuli die geen beloningen voorspellen, maar sterk lijken op beloningsprikkelende stimuli die in dezelfde context voorkomen. Deze reacties bestaan ​​voornamelijk uit een activering gevolgd door een onmiddellijke depressie, maar kunnen af ​​en toe bestaan ​​uit pure activering of pure depressie. De activeringen zijn kleiner en minder frequent dan die na beloning-voorspellende stimuli, en de depressies worden waargenomen in 30-60% van de neuronen. Dopamine-neuronen reageren op visuele stimuli die niet worden gevolgd door beloning, maar lijken sterk op beloningsprikkelende stimuli, ondanks correcte gedragsdiscriminatie (Schultz en Romo 1990). Het openen van een lege doos slaagt er niet in om dopamine-neuronen te activeren, maar wordt bij elke proef effectief zodra het vak af en toe voedsel bevat (Ljungberg et al. 1992; Schultz 1986; Schultz en Romo 1990) of wanneer een naburige, identieke doos die altijd voedsel bevat, in willekeurige afwisseling opengaat (Schultz en Romo 1990). De lege doos roept zwakkere activeringen op dan de box met aas. Dieren voeren willekeurige oogoriëntereacties uit op elke doos, maar benaderen alleen de box met aas met hun hand. Tijdens het leren blijven dopamine-neuronen reageren op eerder geconditioneerde stimuli die hun beloningsvoorspelling verliezen wanneer onvoorziene omstandigheden veranderen (Schultz et al. 1993) of reageren op nieuwe stimuli die lijken op eerder geconditioneerde stimuli (Hollerman en Schultz 1996). Antwoorden komen zelfs voor bij aversieve stimuli die worden gepresenteerd in willekeurige afwisseling met fysiek vergelijkbare, geconditioneerde aanzuigende stimuli van dezelfde sensorische modaliteit, waarbij de aversieve respons zwakker is dan de appetijtelijke (Mirenowicz en Schultz 1996). Antwoorden generaliseren zelfs tot gedragsgedoofde appetitieve stimuli. Blijkbaar generaliseren neuronale reacties op nonappetitive stimuli vanwege hun fysieke gelijkenis met appetitieve stimuli.

Nieuwheidsreacties

Nieuwe stimuli wekken activeringen op in dopamine-neuronen die vaak worden gevolgd door depressies en blijven bestaan ​​zolang gedragsoriënterende reacties optreden (bijv. Oculaire saccades). Activeringen nemen samen met oriënterende reacties af na verschillende stimulusherhalingen, afhankelijk van de fysieke impact van stimuli. Terwijl kleine lichtgevende diodes nauwelijks nieuwheidsreacties uitlokken, lokken lichtflitsen en de snelle visuele en auditieve opening van een kleine doos activeringen uit die geleidelijk vervallen tot de basislijn tijdens <100 proeven (Ljungberg et al. 1992). Luide klikken of grote afbeeldingen direct voor een dier lokken sterke nieuwheidsreacties uit die vervallen maar toch meetbare activeringen veroorzaken met> 1,000 proeven (Hollerman en Schultz 1996; Horvitz et al. 1997; Steinfels et al. 1983). Figuur 4 toont schematisch de verschillende responsgroottes met nieuwe stimuli van verschillende fysieke saillantie. Reacties vervallen geleidelijk met herhaalde blootstelling, maar ze kunnen zich voortzetten met verminderde grootheden met zeer opvallende stimuli. Responsgroottes nemen opnieuw toe wanneer dezelfde stimuli op een prettige manier worden geconditioneerd. Daarentegen verdwijnen reacties op nieuwe, zelfs grote, stimuli snel wanneer de stimuli worden gebruikt voor het conditioneren van actief vermijdingsgedrag (Mirenowicz en Schultz 1996). Zeer weinig neuronen (<5%) reageren meer dan een paar proeven op opvallende maar fysiek zwakke stimuli, zoals afbrokkelen van papier of grove handbewegingen van de onderzoeker.

Fig. 4. 

Tijdcursussen van activaties van dopamine-neuronen tot nieuwe, alerte en geconditioneerde stimuli. Activaties na nieuwe stimuli nemen af ​​bij herhaalde blootstelling tijdens opeenvolgende onderzoeken. Hun omvang is afhankelijk van de fysieke saillantie van stimuli, omdat sterkere stimuli hogere activeringen induceren die soms hoger zijn dan die na geconditioneerde stimuli. Vooral saillante stimuli blijven dopamine-neuronen activeren met een beperkte omvang, zelfs nadat ze hun nieuwigheid hebben verloren zonder gepaard te zijn met primaire beloningen. Consistente activeringen verschijnen opnieuw wanneer stimuli worden geassocieerd met primaire beloningen. Dit schema werd bijgedragen door Jose Contreras-Vidal.

Homogeen karakter van de antwoorden

De experimenten die tot nu toe zijn uitgevoerd, hebben aangetoond dat de meerderheid van de neuronen in dopamine-celgroepen A8, A9 en A10 bij dopatie zeer vergelijkbare activeringen en depressies vertonen in een bepaalde gedragssituatie, terwijl de resterende dopamine-neuronen helemaal niet reageren. Er is een tendens tot hogere fracties van neuronen die reageren in meer mediale regio's van de middenhersenen, zoals het ventrale tegmentale gebied en mediale substantia nigra, in vergelijking met meer laterale regio's, die af en toe statistische significantie bereiken (Schultz 1986; Schultz et al. 1993). Responslatenties (50-110 ms) en duur (<200 ms) zijn vergelijkbaar tussen primaire beloningen, geconditioneerde stimuli en nieuwe stimuli. De dopamine-respons vormt dus een relatief homogeen, scalair populatiesignaal. Het wordt in omvang beoordeeld door de responsiviteit van individuele neuronen en door de fractie van reagerende neuronen binnen de populatie.

Samenvatting 1: adaptieve responsen tijdens het leren van afleveringen

De kenmerken van dopamine-reacties op beloningsgerelateerde stimuli worden het best geïllustreerd in het leren van afleveringen, terwijl beloningen vooral belangrijk zijn voor het verkrijgen van gedragsreacties. Het dopamine-beloningssignaal ondergaat systematische veranderingen tijdens de voortgang van het leren en vindt plaats tot de vroegste fasische beloningsgerelateerde stimulus, waarbij dit ofwel een primaire beloning of een beloning-voorspellende stimulus is (Ljungberg et al. 1992; Mirenowicz en Schultz 1994). Tijdens het leren induceren nieuwe, intrinsiek neutrale stimuli tijdelijk responsen die snel verzwakken en verdwijnen (Fig. 4). Primaire beloningen vinden onvoorspelbaar plaats tijdens initiële paring met dergelijke stimuli en lokken neuronale activeringen uit. Met herhaald paren, worden beloningen voorspeld door geconditioneerde stimuli. Activaties na de beloning nemen geleidelijk af en worden overgebracht naar de geconditioneerde, beloningsvoorspellende stimulus. Als echter een voorspelde beloning niet optreedt vanwege een fout van het dier, worden dopamine-neuronen depressief op het moment dat de beloning zou zijn opgetreden. Tijdens herhaald leren van taken (Schultz et al. 1993) of taakcomponenten (Hollerman en Schultz 1996), activeren de vroegst geconditioneerde stimuli dopamine-neuronen tijdens alle leerfasen vanwege generalisatie naar eerder geleerde, vergelijkbare stimuli, terwijl daaropvolgende geconditioneerde stimuli en primaire beloningen dopamine-neuronen slechts tijdelijk activeren terwijl ze onzeker zijn en nieuwe onvoorziene gebeurtenissen worden vastgesteld.

Samenvatting 2: effectieve stimuli voor dopamine-neuronen

Dopamine-reacties worden opgewekt door drie categorieën stimuli. De eerste categorie omvat primaire beloningen en stimuli die geldige beloningsvoorspellers zijn geworden door herhaalde en toevallige koppeling met beloningen. Deze stimuli vormen een gemeenschappelijke klasse van expliciete beloningsvoorspellende stimuli, aangezien primaire beloningen dienen als voorspellers van vegetatieve belonende effecten. Effectieve stimuli hebben blijkbaar een waarschuwende component, omdat alleen stimuli met een duidelijk begin effectief zijn. Dopamine-neuronen vertonen zuivere activeringen na expliciete beloningsvoorspellende stimuli en zijn depressief wanneer een voorspelde maar weggelaten beloning niet optreedt (Fig. 5, top).

Fig. 5. 

Schematische weergave van reacties van dopamine-neuronen op 2-typen geconditioneerde stimuli. Top: presentatie van een expliciete beloning-voorspellende stimulus leidt tot activering na de stimulus, geen reactie op de voorspelde beloning en depressie wanneer een voorspelde beloning niet optreedt. Onder: presentatie van een stimulus die veel lijkt op een geconditioneerde stimulus voorspellende stimulus leidt tot activering gevolgd door depressie, activering na de beloning en geen respons wanneer er geen beloning plaatsvindt. Activering na de stimulus weerspiegelt waarschijnlijk de generalisatie van de respons vanwege fysieke gelijkenis. Deze stimulus voorspelt niet expliciet een beloning maar is gerelateerd aan de beloning via de gelijkenis met de stimulus die de beloning voorspelt. In vergelijking met expliciete beloningsvoorspellende stimuli, zijn activeringen lager en worden vaak gevolgd door depressies, waardoor onderscheid wordt gemaakt tussen beloonde (CS +) en niet-beloonde (CS-) geconditioneerde stimuli. Dit schema vat de resultaten van eerdere en huidige experimenten samen (Hollerman en Schultz 1996; Ljungberg et al. 1992; Mirenowicz en Schultz 1996; Schultz en Romo 1990; Schultz et al. 1993; P. Waelti en W. Schultz, ongepubliceerde resultaten).

De tweede categorie omvat stimuli die generaliserende responsen opwekken. Deze stimuli voorspellen niet expliciet beloningen maar zijn effectief vanwege hun fysieke gelijkenis met stimuli die expliciete beloningsvoorspellers zijn geworden door conditionering. Deze stimuli induceren activeringen die kleiner zijn en minder neuronen aangaan, in vergelijking met expliciete beloningsvoorspellende stimuli (Fig. 5, bodem). Ze worden vaak gevolgd door onmiddellijke depressies. Terwijl de initiële activering een gegenereerde appetijtrespons kan vormen die een mogelijke beloning signaleert, kan de daaropvolgende depressie de voorspelling van geen beloning weerspiegelen in een algemene beloningsvoorspellende context en de foutieve beloningsvermoeden annuleren. Het ontbreken van expliciete beloningsvoorspelling wordt verder gesuggereerd door de aanwezigheid van activering na primaire beloning en de afwezigheid van depressie zonder beloning. Samen met de antwoorden op beloningsvoorspellende stimuli lijkt het erop dat dopamine-activeringen een appetijtelijk "label" bevatten dat is aangebracht op stimuli die gerelateerd zijn aan beloningen.

De derde categorie omvat nieuwe of bijzonder opvallende stimuli die niet noodzakelijkerwijs gerelateerd zijn aan specifieke beloningen. Door het uitlokken van gedragsgerichte reacties, zijn deze stimuli alert en vragen ze aandacht. Ze hebben echter ook motiverende functies en kunnen lonend zijn (Fujita 1987). Nieuwe stimuli zijn potentieel smakelijk. Nieuwe of bijzonder opvallende stimuli induceren activaties die vaak worden gevolgd door depressies, vergelijkbaar met reacties op generaliserende stimuli.

Zo rapporteren de faserische reacties van dopamine-neuronen gebeurtenissen met positieve en potentieel positieve motiverende effecten, zoals primaire beloningen, beloningsvoorspellende stimuli, belonings-lijkende gebeurtenissen en waarschuwende stimuli. Ze detecteren echter niet in grote mate gebeurtenissen met negatieve, motiverende effecten, zoals aversieve stimuli.

Samenvatting 3: het dopamine-beloningsvoorspellingsfoutsignaal

De dopaminereacties op expliciete beloningsgerelateerde gebeurtenissen kunnen het beste worden geconceptualiseerd en begrepen in termen van formele theorieën over leren. Dopamine-neuronen rapporteren beloningen met betrekking tot hun voorspelling in plaats van onvoorwaardelijke primaire beloningen te signaleren (Fig. 2). De dopamine-respons is positief (activering) wanneer primaire beloningen plaatsvinden zonder te worden voorspeld. Het antwoord is nihil wanneer beloningen plaatsvinden zoals voorspeld. De respons is negatief (depressie) wanneer voorspelde beloningen worden weggelaten. Dus dopamine-neuronen rapporteren primaire beloningen volgens het verschil tussen het voorkomen en de voorspelling van beloning, wat een fout kan worden genoemd in de voorspelling van beloning (Schultz et al. 1995b, 1997) en is voorlopig geformaliseerd als

DopamineResponse (Belonen)=RewardOccurred-RewardPredicted

Vergelijking 1Deze suggestie kan worden uitgebreid tot geconditioneerde appetitieve gebeurtenissen die ook door dopamine-neuronen worden gerapporteerd ten opzichte van voorspelling. Dus dopamine-neuronen kunnen een fout melden in de voorspelling van alle appetitieve gebeurtenissen, en Eq. 1 kan in de meer algemene vorm worden vermeld

DopamineResponse (ApEvent)=ApEventOccurred-ApEventPredicted

Vergelijking 2Deze generalisatie is compatibel met het idee dat de meeste beloningen daadwerkelijk geconditioneerde stimuli zijn. Met verschillende opeenvolgende, goed gevestigde gebeurtenissen die de voorspelling voorspellen, is alleen de eerste gebeurtenis onvoorspelbaar en veroorzaakt deze de dopamine-activering.

CONNECTIVITEIT VAN DOPAMINE NEURONS

Oorsprong van de dopamine-respons

Welke anatomische input zou verantwoordelijk kunnen zijn voor de selectiviteit en polysensorische aard van dopamine-reacties? Welke input-activiteit kan leiden tot het coderen van voorspellingsfouten, de adaptieve responsoverdracht naar de vroegste onvoorspelbare appetijtgebeurtenis induceren en de beloningstijd schatten?

DORSAAL EN VENTRALE STRIATUM.

De GABAergic-neuronen in de striosomen (patches) van het striatumproject op een brede topografische en deels overlappende, interdigiterende manier naar dopamine-neuronen in bijna de gehele pars-compacta van substantia nigra, terwijl neuronen van de veel grotere striatale matrix overwegend de niet-dopaminische neuronen van pars reticulata van substantia nigra, naast hun projectie voor globus pallidus (Gerfen 1984; Hedreen en DeLong 1991; Holstein et al. 1986; Jimenez-Castellanos en Graybiel 1989; Selemon en Goldman-Rakic ​​1990; Smith en Bolam 1991). Neuronen in het ventrale striatum project op een niet-klinische manier naar zowel pars compacta als pars reticulata van mediale substantia nigra en naar het ventrale tegmentale gebied (Berendse et al. 1992; Haber et al. 1990; Lynd-Balta en Haber 1994; Somogyi et al. 1981). De GABAergic striatonigrale projectie kan twee duidelijk verschillende invloeden uitoefenen op dopamine-neuronen, een directe remming en een indirecte activering (Grace en Bunney 1985; Smith en Grace 1992; Tepper et al. 1995). Dit laatste wordt gemedieerd door striatale remming van pars reticulata-neuronen en daaropvolgende GABAergische remming van lokale axon-collateralen van pars-reticulata-uitvoerneuronen op dopamineneuronen. Dit vormt een dubbele remmende link en resulteert in netto activering van dopamine neuronen door het striatum. Dus striosomen en ventraal striatum kunnen monosynaptisch remmen en de matrix kan indirect dopamineneuronen activeren.

Dorsale en ventrale striatale neuronen vertonen een aantal activeringen die kunnen bijdragen aan dopamine-beloningsreacties, namelijk reacties op primaire beloningen (Apicella et al. 1991a; Williams et al. 1993), reacties op beloningsvoorspellende stimuli (Hollerman et al. 1994; Romo et al. 1992) en aanhoudende activeringen tijdens de verwachting van beloningsvoorspellende stimuli en primaire beloningen (Apicella et al. 1992; Schultz et al. 1992). De posities van deze neuronen ten opzichte van striosomen en matrix zijn echter onbekend en striatale activeringen die de tijd van verwachte beloning weerspiegelen zijn nog niet gerapporteerd.

De polysensorische beloningsreacties kunnen het resultaat zijn van functie-extractie in corticale associatiegebieden. Responslatenties van 30-75-ms in primaire en associatieve visuele cortex (Maunsell en Gibson 1992; Miller et al. 1993) zou kunnen worden gecombineerd met snelle geleiding naar striatum en dubbele remming van substantia nigra om de korte dopamine-responslatenties van <100 ms te induceren. Terwijl beloningsgerelateerde activiteit niet is gemeld voor de posterieure associatiecortex, reageren neuronen in de dorsolaterale en orbitale prefrontale cortex op primaire beloningen en beloningsvoorspellende stimuli en vertonen ze aanhoudende activaties tijdens de beloningsverwachting (Rolls et al. 1996; Thorpe et al. 1983; Tremblay en Schultz 1995; Watanabe 1996). Sommige beloningsreacties in de frontale cortex hangen af ​​van de onvoorspelbaarheid van de beloning (Matsumoto et al. 1995; L. Tremblay en W. Schultz, ongepubliceerde resultaten) of weerspiegelen gedragsfouten of weglating van beloningen (Niki en Watanabe 1979; Watanabe 1989). De corticale invloed op dopamine-neuronen zou zelfs sneller zijn door een directe projectie, afkomstig van de prefrontale cortex bij ratten (Gariano en Groves 1988; Sesack en Pickel 1992; Tong et al. 1996) maar zwak zijn bij apen (Künzle 1978).

NUCLEUS PEDUNCULOPONTINUS.

Korte latenties van beloningsreacties kunnen worden afgeleid van adaptieve mechanismen voor het verwerken van functies in de hersenstam. Nucleus pedunculopontinus is een evolutionaire voorloper van substantia nigra. Bij niet-laminaire gewervelde dieren bevat het dopamine-neuronen en projecteert het paleostriatum (Lohman en Van Woerden-Verkley 1978). Bij zoogdieren stuurt deze kern sterke exciterende, cholinerge en glutamaterge invloeden naar een hoge fractie van dopamine-neuronen met latenties van ~7 ms (Bolam et al. 1991; Clarke et al. 1987; Futami et al. 1995; Scarnati et al. 1986). Activering van pedunculopontine-dopamine-projecties induceert circulatiegedrag (Niijima en Yoshida 1988), wat duidt op een functionele invloed op dopamine-neuronen.

AMYGDALA.

Een massale, waarschijnlijk opwindende input voor dopamine-neuronen komt voort uit verschillende kernen van de amygdala (Gonzalez en Chesselet 1990; Prijs en Amaral 1981). Amygdala-neuronen reageren op primaire beloningen en beloningsvoorspellende visuele en auditieve stimuli. De tot nu toe bekende neuronale reacties zijn onafhankelijk van de onvoorspelbaarheid van de stimulus en discrimineren niet goed tussen appetijtelijke en aversieve gebeurtenissen (Nakamura et al. 1992; Nishijo et al. 1988). De meeste antwoorden tonen latenties van 140-310-ms, die langer zijn dan in dopamine-neuronen, hoewel een paar reacties optreden bij latencies van 60-100-ms.

DORSAL RAPHÉ.

De monosynaptische projectie van dorsal raphé (Corvaja et al. 1993; Nedergaard et al. 1988) heeft een depressieve invloed op dopamine-neuronen (Fibiger et al. 1977; Trent en Tepper 1991). Raphé-neuronen vertonen activaties met een korte latentie na hoge intensiteit van de omgevingsstimuli (Heym et al. 1982), waardoor ze kunnen bijdragen aan dopamine-reacties na nieuwe of in het bijzonder opvallende stimuli.

SYNTHESE.

Een paar bekende invoerstructuren zijn de meest waarschijnlijke kandidaten voor het bemiddelen tussen de dopamine-responsen, hoewel er ook extra ingangen kunnen zijn. Activaties van dopamine neuronen door primaire beloningen en beloningsvoorspellende stimuli zouden kunnen worden gemedieerd door dubbel remmende, netto activerende input van de striatale matrix (voor een vereenvoudigd diagram, zie Fig. 6). Activaties kunnen ook ontstaan ​​uit de pedunculopontinekern of mogelijk uit aan de beloning gerelateerde activiteit in neuronen van de subthalamische kern die naar dopamine-neuronen projecteren (Hammond et al. 1983; Matsumura et al. 1992; Smith et al. 1990). De afwezigheid van activering met volledig voorspelde beloningen kan het gevolg zijn van monosynaptische remming van striosomen, waarbij tegelijkertijd matrixinvoer wordt uitgeschakeld. Depressies ten tijde van weglating van de beloning konden worden gemedieerd door remmende inputs van neuronen in striatale striosomen (Houk et al. 1995) of globus pallidus (Haber et al. 1993; Hattori et al. 1975; Y. Smith en Bolam 1990, 1991). Convergentie tussen verschillende inputs vóór of op het niveau van dopamine-neuronen zou kunnen resulteren in de vrij complexe codering van beloningspredictiefouten en de adaptieve responsoverdracht van primaire beloningen naar beloningsvoorspellende stimuli.

Fig. 6. 

Vereenvoudigd diagram van inputs voor dopamine-neuronen van de middenhersenen die mogelijk dopamine-responsen mediëren. Alleen invoer van caudate naar substantia nigra (SN) pars compacta en reticulata wordt getoond omwille van de eenvoud. Activaties kunnen ontstaan ​​door een dubbel remmende, netto activerende invloed van GABAergic matrixneuronen in caudate en putamen via GABAergic neuronen van SN pars reticulata op dopamine neuronen van SN pars compacta. Activaties kunnen ook worden gemedieerd door excitatoire cholinerge of aminozuurbevattende projecties van nucleus pedunculopontinus. Depressies kunnen te wijten zijn aan monosynaptische GABAergische projecties van striosomen (pleisters) in caudate en putamen naar dopamineneuronen. Vergelijkbare projecties bestaan ​​uit ventraal striatum tot dopamine neuronen in mediale SN pars compacta en groep A10 in het ventrale tegmentale gebied en van dorsale striatum tot groep A8 dopamine neuronen dorsolateraal tot SN (Lynd-Balta en Haber 1994). Zware cirkel staat voor dopamine-neuronen. Deze projecties vertegenwoordigen de meest waarschijnlijke inputs die ten grondslag liggen aan de dopamine-respons, zonder input van globus pallidus en subthalamic nucleus uit te sluiten.

Fasische dopamine-invloeden op doelstructuren

GLOBALE AARD VAN HET DOPAMINE SIGNAAL.

Uiteenlopende projecties. Er zijn ~8,000 dopamine-neuronen in elke substantia nigra van ratten (Oorschot 1996) en 80,000-116,000 bij makaken (German et al. 1988; Percheron et al. 1989). Elk striatum bevat ~2.8 miljoen neuronen in ratten en 31 miljoen in makaken, resulterend in een nigrostriatale divergentie factor van 300-400. Elk dopamine-axon vertakt zich rijkelijk in een beperkt eindgebied in striatum en heeft ~500,000 striatale varicositeiten waaruit dopamine vrijkomt (Andén et al. 1966). Dit resulteert in dopamine-invoer voor bijna elk striataal neuron (Groves et al. 1995) en een matig topografische nigrostriatale projectie (Lynd-Balta en Haber 1994). De corticale dopamine-innervatie bij apen is het hoogst in de gebieden 4 en 6, is nog steeds aanzienlijk in de frontale, pariëtale en temporale lobben en is het laagst in de occipitale lob (Berger et al. 1988; Williams en Goldman-Rakic ​​1993). Corticale dopamine synapsen worden voornamelijk aangetroffen in lagen I en V-VI en maken daar contact met een groot deel van de corticale neuronen. Samen met de nogal homogene responsaard suggereren deze gegevens dat de dopamine-respons voortschrijdt als een gelijktijdige, parallelle golf van activiteit van de middenhersenen naar het striatum en de frontale cortex (Fig. 7).

Fig. 7. 

Globaal dopamine-signaal dat doorgaat naar striatum en cortex. Relatief homogene populatie-respons van de meerderheid van de dopamine-neuronen op stimulerende en waarschuwende stimuli en de progressie van substantia nigra naar postsynaptische structuren kan schematisch worden gezien als een golf van synchrone parallelle activiteit die voortschrijdt met een snelheid van 1-2 m / s (Schultz en Romo 1987) langs de divergerende projecties van de middenhersenen naar striatum (caudate en putamen) en cortex. Antwoorden zijn kwalitatief niet te onderscheiden tussen neuronen van substantia nigra (SN) pars compacta en ventraal tegmentaal gebied (VTA). Dopamine-innervatie van alle neuronen in striatum en vele neuronen in de frontale cortex zouden het dopamine-versterkingssignaal een tamelijk globaal effect kunnen geven. Golf is gecomprimeerd om de parallelle aard te benadrukken.

Dopamine-afgifte. Impulsen van dopamine-neuronen met intervallen van 20-100 ms leiden tot een veel hogere dopamineconcentratie in striatum dan hetzelfde aantal impulsen met intervallen van 200 ms (Garris en Wightman 1994; Gonon 1988). Deze niet-lineariteit is voornamelijk te wijten aan de snelle verzadiging van de dopamine-heropname-transporter, die het afgegeven dopamine uit het extrasynaptische gebied opruimt (Chergui et al. 1994). Hetzelfde effect wordt waargenomen in nucleus accumbens (Wightman en Zimmerman 1990) en treedt zelfs met langere impulsintervallen op vanwege herhalingsplaatsen van sparsers (Garris et al. 1994b; Marshall et al. 1990; Stamford et al. 1988). Dopamine-afgifte na een impulssalvo van <300 ms is te kort om de autoreceptor-gemedieerde reductie van afgifte te activeren (Chergui et al. 1994) of de nog langzamere enzymatische afbraak (Michael et al. 1985). Een barstende dopamine-reactie is dus bijzonder efficiënt voor het vrijmaken van dopamine.

Schattingen op basis van in vivo voltammetrie suggereren dat een enkele impuls ~1,000 dopaminemoleculen bij synapsen in striatum en nucleus accumbens vrijgeeft. Dit leidt tot onmiddellijke synaptische dopamineconcentraties van 0.5-3.0 μM (Garris et al. 1994a; Kawagoe et al. 1992). Bij 40 μs na het begin van de afgifte heeft> 90% van de dopamine de synaps verlaten, en een deel van de rest wordt later geëlimineerd door synaptische heropname (halveringstijd van 30-37 ms). Op 3-9 ms na het begin van de afgifte bereiken dopamineconcentraties een piek van -250 nM wanneer alle naburige varicositeiten gelijktijdig dopamine afgeven. Concentraties zijn homogeen binnen een bol van 4 μm diam (Gonon 1997), de gemiddelde afstand tussen varicositeiten (Doucet et al. 1986; Groves et al. 1995). Maximale diffusie wordt beperkt tot 12 μm door de heropname transporter en wordt bereikt in 75 ms na het begin van de release (aanvangstijd van de halve transporter van 30-37 ms). Concentraties zouden iets lager en minder homogeen zijn in regio's met minder varicositeiten of wanneer <100% van de dopamine-neuronen geactiveerd zijn, maar ze zijn twee tot drie keer hoger bij impulsuitbarstingen. De door beloning geïnduceerde, licht synchrone, burst-activeringen in ∼75% van de dopamine-neuronen kunnen dus leiden tot vrij homogene concentratiepieken in de orde van 150-400 nM. De totale toename van extracellulaire dopamine duurt 200 ms na een enkele impuls en 500-600 ms na meerdere impulsen van 20-100 ms intervallen toegepast gedurende 100-200 ms (Chergui et al. 1994; Dugast et al. 1994). De extrasynaptische reuptake transporter (Nirenberg et al. 1996) brengt vervolgens de dopamineconcentraties terug naar hun basislijn van 5-10 nM (Herrera-Marschitz et al. 1996). Dus in tegenstelling tot klassieke, strikt synaptische neurotransmissie diffundeert synaptisch afgegeven dopamine snel in het onmiddellijke juxtasynaptische gebied en bereikt het korte pieken van regionaal homogene extracellulaire concentraties.

Receptoren. Van de twee belangrijkste typen dopaminereceptoren vormen de adenylaatcyclase-activerende, D1-type receptoren ~80% dopaminereceptoren in striatum. Van deze 80% bevinden zich in de laag-affiniteitstoestand van 2-4 μM en 20% in de hoge affiniteitstoestand van 9-74 nM (Richfield et al. 1989). Het resterende 20% van de striatale dopaminereceptoren behoort tot het adenylasecyclaaseremmende D2-type waarvan 10-0% zich in de lage affiniteitstoestand en 80-90% bevindt in de hoge affiniteitstoestand, met vergelijkbare affiniteiten als D1-receptoren. Aldus hebben D1-receptoren in het algemeen een ~ 100 maal lagere affiniteit dan D2-receptoren. Striatale D1-receptoren bevinden zich voornamelijk op neuronen die naar interne pallidum en substantia nigra pars reticulata projecteren, terwijl striatale D2-receptoren zich meestal op neuronen bevinden die naar externe pallidum projecteren (Bergson et al. 1995; Gerfen et al. 1990; Hersch et al. 1995; Levey et al. 1993). De verschillen in receptorgevoeligheid spelen mogelijk echter geen rol buiten de signaaltransductie, waardoor de verschillen in dopaminegevoeligheid tussen de twee soorten striatale outputneuronen worden verminderd.

Dopamine wordt vrijgegeven naar 30-40% van synaptische en naar 60-70% van extrasynaptische varicositeiten (Descarries et al. 1996). Synaptisch afgegeven dopamine werkt op postsynaptische dopaminereceptoren op vier anatomisch verschillende plaatsen in het striatum, namelijk in dopaminesynapsen, onmiddellijk grenzend aan dopaminesynapsen, in corticostriatale glutamaatsynapsen en op extrasynaptische locaties op afstand van afgifteplaatsen (Fig. 8) (Levey et al. 1993; Sesack et al. 1994; Yung et al. 1995). D1-receptoren zijn voornamelijk gelokaliseerd buiten dopamine-synapsen (Caillé et al. 1996). De hoge transiënte concentraties van dopamine na fasische impulssalvo's zouden D1-receptoren activeren in de onmiddellijke nabijheid van de actieve afgifteplaatsen en D2-receptoren overal activeren en zelfs verzadigen. D2-receptoren zouden gedeeltelijk geactiveerd blijven wanneer de omgevings-dopamineconcentratie terugkeert naar de basislijn na fasische toenames.

Fig. 8. 

Invloeden van dopamineafgifte op typische middelgrote stekelige neuronen in het dorsale en ventrale striatum. Dopamine vrijgemaakt door impulsen van synaptische varicositeiten activeert enkele synaptische receptoren (waarschijnlijk van het D2-type in de toestand met lage affiniteit) en diffundeert snel uit de synaps om D1-type receptoren met lage affiniteit (D1?) Te bereiken die zich in de buurt van corticostriatale synapsen bevinden , of op een beperkte afstand. Fasisch verhoogde dopamine activeert nabijgelegen receptoren van het hoge affiniteits D2-type tot verzadiging (D2?). D2-receptoren blijven gedeeltelijk geactiveerd door de omgevingsconcentraties van dopamine na de fasisch verhoogde afgifte. Extra-synaptisch afgegeven dopamine kan verdund raken door diffusie en D2-receptoren met hoge affiniteit activeren. Opgemerkt moet worden dat, in afwijking van dit schema, de meeste D1- en D2-receptoren zich op verschillende neuronen bevinden. Glutamaat dat vrijkomt uit corticostriatale terminalen bereikt postsynaptische receptoren die zich op dezelfde dendritische ruggengraat bevinden als dopaminevariaties. Glutamaat bereikt ook presynaptische dopaminevisserij waar het de dopamine-afgifte regelt. Dopamine-invloeden op stekelneuronen in de frontale cortex zijn in veel opzichten vergelijkbaar.

Samenvatting. De waargenomen, matig barstende, kortstondige, bijna synchrone respons van de meerderheid van dopamine-neuronen leidt tot een optimale, gelijktijdige afgifte van dopamine uit de meerderheid van dicht op elkaar liggende striatale varicositeiten. De neuronale respons induceert een korte wolk dopamine die vrijkomt van extrasynaptische plaatsen of snel diffundeert van synapsen naar het juxtasynaptische gebied. Dopamine bereikt snel regionaal homogene concentraties die waarschijnlijk de dendrieten van waarschijnlijk alle striatale en veel corticale neuronen zullen beïnvloeden. Op deze manier wordt het beloningsbericht in 60-80% van dopamine-neuronen uitgezonden als een divergerend, nogal globaal versterkingssignaal naar het striatum, nucleus accumbens en de frontale cortex, waardoor een fasische invloed op een maximumaantal synapsen bij de verwerking wordt verzekerd van stimuli en acties die leiden tot beloning (Fig. 7). Dopamine vrijgemaakt door neuronale activeringen na beloningen en belonings-voorspellende stimuli zou juxtasynaptische D1-receptoren op striatale neuronen die naar interne pallidum en substantia nigra pars reticulata projecteren en alle D2-receptoren op neuronen die naar externe pallidum projecteren, beïnvloeden. De reductie van dopamine-afgifte geïnduceerd door depressies met weglating van beloningen en beloningsvoorspellende stimuli zou de tonische stimulatie van D2-receptoren door omgevingsdopamine verminderen. Positieve beloningsvoorspellingsfouten zouden dus alle soorten striatale outputneuronen beïnvloeden, terwijl de negatieve voorspellingsfout voornamelijk neuronen kan beïnvloeden die naar externe pallidum projecteren.

Potentiële cocaïnemechanismen. Blokkade van de dopamine-heropname-transporter door drugs zoals cocaïne of amfetamine verhoogt en verlengt fasische verhogingen van de dopamineconcentraties (Church et al. 1987a; Giros et al. 1996; Suaud-Chagny et al. 1995). De verbetering zou met name uitgesproken zijn wanneer snelle, door burst geïnduceerde toenames van de dopamineconcentratie een piek bereiken voordat feedbackregulering effectief wordt. Dit mechanisme zou leiden tot een massaal versterkt dopaminesignaal na primaire beloningen en beloningsvoorspellende stimuli. Het zou ook het ietwat zwakkere dopaminesignaal verhogen na stimuli die op beloningen lijken, nieuwe stimuli en vooral opvallende stimuli die in het dagelijks leven vaak voorkomen. De versterking door cocaïne zou deze niet-lonende stimuli als sterk of zelfs sterker laten lijken dan natuurlijke beloningen zonder cocaïne. Postsynaptische neuronen zouden een dergelijk signaal verkeerd kunnen interpreteren als een bijzonder prominente beloningsgerelateerde gebeurtenis en langetermijnveranderingen in synaptische transmissie ondergaan.

ACTIE VAN DOPAMINE-MEMBRAAN.

Dopamine-acties op striatale neuronen hangen af ​​van het type receptor dat is geactiveerd, zijn gerelateerd aan de gedepolariseerde versus gehyperpolariseerde toestanden van membraanpotentialen en omvatten vaak glutamaatreceptoren. Activering van D1-dopaminereceptoren verhoogt de excitatie die wordt opgeroepen door activering van N-methyl-d-aspartaat (NMDA) -receptoren na corticale ingangen via L-type Ca2+ kanalen wanneer de membraanpotentiaal zich in de gedepolariseerde toestand bevindt (Cepeda et al. 1993, 1998; Hernandez-Lopez et al. 1997; Kawaguchi et al. 1989). D1-activering lijkt daarentegen opgewekte excitaties te verminderen wanneer het membraanpotentieel zich in de hypergepolariseerde toestand bevindt (Hernandez-Lopez et al. 1997). In vivo dopamine-iontoforese en axonale stimulatie induceren D1-gemedieerde excitaties die 100-500 ms na de dopamine-afgifte aanhouden (Gonon 1997; Williams en Millar 1991). Activering van D2-dopaminereceptoren vermindert Na+ en N-type Ca2+ stromen en vermindert excitaties opgewekt door activatie van NMDA of α-amino-3-hydroxy-5-methyl-4-isoxazol-propionzuur (AMPA) -receptoren in elke membraantoestand (Cepeda et al. 1995; Yan et al. 1997). Op systeemniveau oefent dopamine een focusseffect uit waarbij alleen de sterkste inputs striatum doorlaten naar externe en interne pallidum, terwijl zwakkere activiteit verloren gaat (Brown en Arbuthnott 1983; Filion et al. 1988; Toan en Schultz 1985; Yim en Mogenson 1982). Aldus kan het dopamine afgegeven door de dopaminerespons leiden tot een onmiddellijke algehele vermindering van striatale activiteit, hoewel een faciliterend effect op cortex opgewekte excitaties kan worden gemedieerd via D1-receptoren. De volgende discussie zal aantonen dat de effecten van dopamine-neurotransmissie niet beperkt mogen zijn tot veranderingen in membraanpolarisatie.

VOOR DOPAMINE AFHANKELIJKE PLASTICITEIT.

Tetanische elektrische stimulatie van corticale of limbische inputs naar striatum en nucleus accumbens induceert posttetanische depressies die enkele tientallen minuten in plakjes duren (Calabresi et al. 1992a; Lovinger et al. 1993; Pennartz et al. 1993; Walsh 1993; Wickens et al. 1996). Deze manipulatie verhoogt ook de prikkelbaarheid van corticostriatale terminals (Garcia-Munoz et al. 1992). Posttetanische versterking van vergelijkbare duur wordt waargenomen in striatum en nucleus accumbens wanneer postsynaptische depolarisatie wordt vergemakkelijkt door verwijdering van magnesium of toepassing van γ-aminoboterzuur (GABA) -antagonisten (Boeijinga et al. 1993; Calabresi et al. 1992b; Pennartz et al. 1993). D1- of D2-dopaminereceptorantagonisten of D2-receptor knock-out schrappen posttetanische corticostriatale depressie (Calabresi et al. 1992a; Calabresi et al. 1997; Garcia-Munoz et al. 1992) maar hebben geen invloed op de potentiatie in nucleus accumbens (Pennartz et al. 1993). Toepassing van dopamine herstelt striatale posttetanische depressie in plakken van dopamine-beschadigde ratten (Calabresi et al. 1992a) maar slaagt er niet in posttetanische potentiëring aan te passen (Pennartz et al. 1993). Korte dopamepulsiepulpen (5-20 ms) induceren potentiatie op de lange termijn in striatale plakjes wanneer ze gelijktijdig worden toegepast met tetanische corticostriatale stimulatie en postsynaptische depolarisatie, in overeenstemming met een drievector-versterkende leerregel (Wickens et al. 1996).

Verder bewijs voor dopamine-gerelateerde synaptische plasticiteit wordt gevonden in andere hersenstructuren of met verschillende methoden. In de hippocampus wordt de posttetanische potentiatie verhoogd door badtoepassing van D1-agonisten (Otmakhova en Lisman 1996) en aangetast door D1- en D2-receptorblokkade (Frey et al. 1990). Burst-contingente, maar niet-burst, niet-convergerende lokale toepassingen van dopamine- en dopamine-agonisten verhogen neuronaal barsten in plakjes hippocampus (Stein et al. 1994). In visnetvlies induceert activering van D2-dopaminereceptoren bewegingen van fotoreceptoren in of uit het pigmentepitheel (Rogawski 1987). Posttriale injecties van amfetamine- en dopamine-agonisten in de caudate nucleus van de rat verbeteren de prestaties bij geheugentaken (Packard en White 1991). Dopamine-denervaties in het striatum verminderen het aantal dendritische stekels (Arbuthnott en Ingham 1993; Anglade et al. 1996; Ingham et al. 1993), wat suggereert dat de innervatie van dopamine aanhoudende effecten heeft op corticostriatale synapsen.

VERWERKING IN STRIATALE NEURONS.

Een geschatte 10,000 corticale uiteinden en 1,000 dopamine varicositeiten komen in contact met de dendritische stekels van elk striataal neuron (Doucet et al. 1986; Groves et al. 1995; Wilson 1995). De dichte innervatie van dopamine wordt zichtbaar als manden die individuele perikarya in duif paleostriatum beschrijven (Wynne en Güntürkün 1995). Dopamine-varicositeiten vormen synapsen op dezelfde dendritische uitsteeksels van striatale neuronen die in contact worden gebracht met corticale glutamaatafferentiemiddelen (Fig. 8) (Bouyer et al. 1984; Freund et al. 1984; Pickel et al. 1981; Smith et al. 1994), en sommige dopamine-receptoren bevinden zich in corticostriatale synapsen (Levey et al. 1993; Yung et al. 1995). Het hoge aantal corticale inputs voor striatale neuronen, de convergentie tussen dopamine en glutamaatinputs aan de stekels van striatale neuronen, en het grotendeels homogene dopaminesignaal dat waarschijnlijk alle striatale neuronen bereikt, zijn ideale substraten voor dopamine-afhankelijke synaptische veranderingen bij de stekels van striatale neuronen. . Dit geldt ook voor de cortex waar dendritische stekels worden gecontacteerd door synaptische inputs van zowel dopamine als corticale neuronen (Goldman-Rakic ​​et al. 1989), hoewel dopamine waarschijnlijk niet elke corticale neuron beïnvloedt.

De basale ganglia zijn verbonden door open en gesloten lussen met de cortex en met subcorticale limbische structuren. Het striatum ontvangt in verschillende mate inputs uit alle corticale gebieden. Uitgangen van basale ganglia zijn voornamelijk gericht op frontale corticale gebieden, maar bereiken ook de temporale kwab (Middleton en Strick 1996). Veel inputs van functioneel heterogene corticale gebieden naar het striatum zijn georganiseerd in gescheiden, parallelle kanalen, evenals de outputs van intern pallidum gericht op verschillende motorische corticale gebieden (Alexander et al. 1986; Hoover en Strick 1993). Echter, afferenten van functioneel gerelateerde maar anatomisch verschillende corticale gebieden kunnen convergeren op striatale neuronen. Projecties van somatotopisch gerelateerde gebieden van primair somatosensorisch en motorisch cortexproject naar gemeenschappelijke striatale regio's (Flaherty en Graybiel 1993, 1994). Corticostriatale projecties divergeren in afzonderlijke striatale "matrisomen" en komen terug in het pallidum, waardoor het synaptische "oppervlak" voor modulerende interacties en associaties wordt verhoogd (Graybiel et al. 1994). Deze anatomische opstelling zou het mogelijk maken dat het dopaminesignaal de werkzaamheid van zeer gestructureerde, taakspecifieke corticale inputs voor striatale neuronen bepaalt en een wijdverspreide invloed uitoefent op voorhersenen die betrokken zijn bij de controle van gedragsmatige actie.

GEBRUIK VAN DE DOPAMINE BELONING VOORSPELLING FOUT SIGNAAL

Dopamine-neuronen lijken aansprekende gebeurtenissen te melden volgens een voorspellingsfout (Vergelijkingen. 1 en 2 ). Huidige leertheorieën en neuronale modellen demonstreren het cruciale belang van voorspellingsfouten voor leren.

Leren theorieën

RESCORLA-WAGNER MODEL.

Gedragstheorieën formaliseren de verwerving van associaties tussen willekeurige stimuli en primaire motiverende gebeurtenissen in klassieke conditioneringsparadigma's. Stimuli winnen associatieve kracht bij opeenvolgende proeven door herhaaldelijk gepaard te worden met een primaire motiverende gebeurtenis

ΔV=αβ(λ-V)

Vergelijking 3where V is de huidige associatieve sterkte van de stimulus, λ is maximale associatieve sterkte mogelijk ondersteund door de primaire motiverende gebeurtenis, α en β zijn constanten die respectievelijk de saillantie van geconditioneerde en ongeconditioneerde stimuli weerspiegelen (Dickinson 1980; Mackintosh 1975; Pearce en Hall 1980; Rescorla en Wagner 1972). De (λ-V) term geeft de mate aan waarin de primaire motiverende gebeurtenis onvoorspelbaar plaatsvindt en vertegenwoordigt een fout in de voorspelling van de wapening. Het bepaalt de snelheid van leren, omdat de associatieve kracht toeneemt wanneer de foutterm positief is en de geconditioneerde stimulus de wapening niet volledig voorspelt. Wanneer V = λ, de geconditioneerde stimulus voorspelt volledig de bekrachtiger, en V zal niet verder toenemen. Aldus vindt leren alleen plaats wanneer de primaire motiverende gebeurtenis niet volledig wordt voorspeld door een geconditioneerde stimulus. Deze interpretatie wordt gesuggereerd door het blokkeringsverschijnsel, volgens welke een stimulus geen associatieve sterkte krijgt wanneer deze samen met een andere stimulus wordt gepresenteerd die op zichzelf de versterker volledig voorspelt (Kamin 1969). De (λ-V) De foutterm wordt negatief wanneer een voorspelde versterker niet optreedt, wat leidt tot een verlies van associatieve sterkte van de geconditioneerde stimulus (extinctie). Merk op dat deze modellen de term 'versterking' in de brede betekenis van het verhogen van de frequentie en intensiteit van specifiek gedrag gebruiken en niet verwijzen naar een bepaald type van leren.

DELTA-REGEL.

Het Rescorla-Wagner-model heeft betrekking op het algemene leerprincipe dat wordt aangestuurd door fouten tussen de gewenste en de feitelijke output, zoals de procedure met de kleinste gemiddelde kwadratische fout (Kalman 1960; Widrow en Sterns 1985). Dit principe is toegepast op neuronale netwerkmodellen in de Delta-regel, volgens welke synaptische gewichten (ω) worden aangepast door

Δω=η(t-a)x

Vergelijking 4where t is de gewenste (doel) output van het netwerk, a is de werkelijke uitvoer en η en x zijn leersnelheid en invoeractivering, respectievelijk (Rumelhart et al. 1986; Widrow en Hoff 1960). De gewenste output (t) is analoog aan de uitkomst (λ), de feitelijke output (a) is analoog aan de voorspelling die tijdens het leren is gewijzigd (V) en de delta-foutterm (δ = t - a) is gelijk aan de wapeningsfoutterm (λ-V) van de Rescorla-Wagner-regel (Vgl. 3) (Sutton en Barto 1981).

De algemene afhankelijkheid van uitkomst onvoorspelbaarheid heeft intuïtief betrekking op de essentie van leren. Als leren de verwerving of verandering van voorspelling van uitkomst inhoudt, zal geen verandering in voorspellingen en dus geen leren plaatsvinden wanneer de uitkomst perfect voorspeld is. Dit beperkt het leren tot stimuli en gedragsreacties die tot verrassende of veranderde uitkomsten leiden, en overbodige stimuli voorafgaand aan uitkomsten die al door andere gebeurtenissen zijn voorspeld, worden niet geleerd. Naast hun rol in het tot stand brengen van leren, hebben versterkers een tweede, duidelijk verschillende functie. Wanneer het leren is voltooid, zijn volledig voorspelde versterkers van cruciaal belang voor het behouden van aangeleerd gedrag en het voorkomen van extinctie.

Veel vormen van leren kunnen betrekking hebben op het verminderen van voorspellingsfouten. In algemene zin verwerken deze systemen een externe gebeurtenis, genereren voorspellingen van deze gebeurtenis, berekenen de fout tussen de gebeurtenis en de voorspelling ervan en passen zowel de prestaties als de voorspelling aan volgens de voorspellingsfout. Dit hoeft niet beperkt te blijven tot leersystemen die te maken hebben met biologische versterkers, maar heeft betrekking op een veel grotere verscheidenheid van neurale operaties, zoals visuele herkenning in de hersenschors (Rao en Ballard 1997).

Versterkingsalgoritmen

ONVOORWAARDELIJKE VERSTERKING.

Neuronale netwerkmodellen kunnen worden getraind met eenvoudige versterkingssignalen die een voorspellingsonafhankelijk signaal uitzenden wanneer een gedragsreactie correct wordt uitgevoerd, maar geen signaal met een foutieve reactie. Leren in deze grotendeels instrumentele leermodellen bestaat uit het veranderen van de synaptische gewichten (ω) van modelneuronen volgens

Δω=ɛrxy

Vergelijking 5where ɛ is leerrate, r is versterking, en x en y zijn activaties van pre- en postsynaptische neuronen, respectievelijk, ervoor zorgend dat alleen synapsen die deelnemen aan het versterkte gedrag worden gemodificeerd. Een populair voorbeeld is het associatieve model voor beloning en straf (Barto en Anandan 1985). Deze modellen krijgen skelet- of oculomotorische responsen, leren sequenties en voeren de Wisconsin Card Sorting Test uit (Arbib en Dominey 1995; Dehaene en Changeux 1991; Dominey et al. 1995; Fagg en Arbib 1992). Verwerkingseenheden in deze modellen krijgen vergelijkbare eigenschappen als neuronen in pariëtale associatiecortex (Mazzoni et al. 1991).

Echter, de persistentie van het onderwijssignaal na het leren vereist extra algoritmen voor het voorkomen van weggelopen synaptische sterktes (Montague en Sejnowski 1994) en om de verwerving van overtollige stimuli te vermijden die samen met versterkingsvoorspellende stimuli worden gepresenteerd. Eerder geleerd gedrag houdt stand wanneer onvoorziene omstandigheden veranderen, omdat weggelaten versterking geen negatief signaal kan uitlokken. Leersnelheid kan verhoogd worden door externe informatie van een leraar toe te voegen (Ballard 1997) en door informatie over de prestaties in het verleden op te nemen (McCallum 1995).

TIJDELIJK VERSCHIL LEREN.

In een bijzonder efficiënte klasse van versterkingsalgoritmen (Sutton 1988; Sutton en Barto 1981), worden synaptische gewichten aangepast volgens de fout in de wapeningsvoorspelling berekend over opeenvolgende tijdstappen (t) in elke proef

rˆ(t)=r(t)+P(t)-P(t-l)

Vergelijking 6where r is versterking en P is versterkingsvoorspelling. P (t) wordt gewoonlijk vermenigvuldigd met een disconteringsfactor γ met 0 ≤ γ <1 om rekening te houden met de afnemende invloed van beloningen die steeds verder weg gaan. Eenvoudigheidshalve wordt γ hier op 1 gezet. In het geval van een enkele stimulus die een enkele bekrachtiger voorspelt, de voorspelling P(t - 1) bestaat vóór de tijd t van wapening maar eindigt op het moment van wapening [P (t) = 0]. Dit leidt op dat moment tot een effectief versterkingssignaal (T) van versterking

rˆ (t)=r(t)-P(t-l)

Vergelijking 6aDe r(t) term geeft het verschil aan tussen werkelijke en voorspelde wapening. Tijdens het leren wordt de wapening onvolledig voorspeld, de foutterm is positief wanneer er wapening optreedt en de synaptische gewichten worden verhoogd. Na het leren wordt de wapening volledig voorspeld door een voorafgaande prikkel [P(t - 1) = r(t)], is de foutterm nul op correct gedrag en blijven de synaptische gewichten ongewijzigd. Wanneer versterking wordt weggelaten vanwege onvoldoende prestaties of gewijzigde onvoorziene omstandigheden, is de fout negatief en worden synaptische gewichten verminderd. De r(t) term is analoog aan de (λ-V) fouttermijn van het Rescorla-Wagner-model (Eq. 4 ). Het betreft echter individuele tijdstappen (t) binnen elke test in plaats van voorspellingen die evolueren in opeenvolgende trials. Deze temporele modellen van versterking maken gebruik van het feit dat de verkregen voorspellingen het exacte tijdstip van wapening bevatten (Dickinson et al. 1976; Gallistel 1990; Smith 1968).

De temporele verschil (TD) algoritmen maken ook gebruik van verworven voorspellingen voor het veranderen van synaptische gewichten. In het geval van een onvoorspelbare, enkel geconditioneerde stimulus die een enkele versterker voorspelt, de voorspelling P (t) begint op tijd (T), er is geen voorgaande voorspelling [P(t - 1) = 0] en er is nog geen wapening [r(t) = 0]. Volgens Eq. 6, het model geeft op dat moment een zuiver voorspellend effectief versterkingssignaal af (t) van de voorspelling

rˆ=P(t)

Vergelijking 6bIn het geval van meerdere, opeenvolgende voorspellende stimuli, opnieuw met versteviging afwezig op het moment van voorspellingen, het effectieve versterkingssignaal op dat moment (T) van de voorspelling weerspiegelt het verschil tussen de huidige voorspelling P (t) en de voorgaande voorspelling P(t - 1)

rˆ=P(t)-P(t-l)

Vergelijking 6cDit vormt een foutterm van hogere orde versterking. Net als bij volledig voorspelde versterkers worden alle voorspellende stimuli die volledig voorspeld zijn zelf geannuleerd [P(t - 1) = P(t)], met als resultaat r = 0 op de tijden (T) van deze stimuli. Alleen de vroegste voorspellende stimulus draagt ​​bij aan het effectieve versterkingssignaal, als deze stimulus P (t) wordt niet voorspeld door een andere stimulus [P(t - 1) = 0]. Dit resulteert hetzelfde r = P (t) destijds (T) van de eerste voorspelling zoals in het geval van een enkele voorspelling (Eq. 6b).

Fig. 9. 

Basisarchitecturen van neurale netwerkmodellen die temporele verschilalgoritmen implementeren in vergelijking met basale ganglia-connectiviteit. A: in de originele uitvoering het effectieve onderwijssignaal y - ȳ wordt berekend in modelneuron A en verzonden naar presynaptische terminals van ingangen x naar neuron B, dus beïnvloedend xB verwerken en veranderen van synaptische gewichten op de xB synaps. neuron B beïnvloedt gedragsoutput via axon y en draagt ​​tegelijkertijd bij aan de adaptieve eigenschappen van neuronen A, namelijk de reactie op versterkingsvoorspellende stimuli. Meer recente implementaties van deze eenvoudige architectuur gebruiken neuron A in plaats van neuron B voor het uitstoten van een uitgang O van het model (Montague et al. 1996; Schultz et al. 1997). Overgenomen van Sutton en Barto (1981) met toestemming van American Psychological Association. B: recente implementatie scheidt de onderwijscomponent A, riep de criticus (Rechts), van een uitvoercomponent bestaande uit verschillende verwerkingseenheden B, de acteur genoemd (links). Het effectieve versterkingssignaal r(t) wordt berekend door het tijdelijke verschil in gewogen versterkingsvoorspelling γ af te trekkenP(t) - P(t - 1) van primaire wapening r(t) ontvangen van de omgeving (γ is de kortingsfactor die de waarde van meer verre versterkers vermindert). Reinforcer-voorspelling wordt berekend in een afzonderlijke voorspellingseenheid C, die deel uitmaakt van de criticus en een gesloten lus vormt met het leerelement A, terwijl primaire versterking de criticus binnenkomt via een afzonderlijke input rt. Effectief versterkingssignaal beïnvloedt synaptische gewichten bij binnenkomende axons in de actor, die de uitvoer medieert en in de adaptieve voorspellingseenheid van de criticus. Overgenomen van Barto (1995) met toestemming van MIT Press. C: basisconnectiviteit van de basale ganglia onthult opvallende overeenkomsten met de acteur-criticusarchitectuur. Dopamine-projectie zendt het versterkingssignaal uit naar het striatum en is vergelijkbaar met de eenheid A in stukken A en B, het limbische striatum (of striosome-patch) neemt de positie van de voorspellingseenheid in C in de criticus, en het sensorimotorische striatum (of de matrix) lijkt op de actoreenheden B. In het originele model (EEN), de enkele grote afwijking van de gevestigde basale ganglia-anatomie bestaat uit de invloed van neuronen A gericht op presynaptische terminals, terwijl dopamine-synapsen zich bevinden op postsynaptische dendrieten van striatale neuronen (Freund et al. 1984). Overgenomen van Smith en Bolam (1990) met toestemming van Elsevier Press.

Alles bij elkaar genomen, het effectieve versterkingssignaal (Eq. 6 ) is samengesteld uit de primaire versterking, die afneemt met opkomende voorspellingen (Eq. 6a) en wordt geleidelijk vervangen door de verworven voorspellingen (Vergelijkingen. 6b en 6c). Met opeenvolgende voorspellende stimuli beweegt het effectieve versterkingssignaal achteruit in de tijd vanaf de primaire bekrachtiging tot de vroegste stimulator-voorspellende stimulus. De retrograde overdracht resulteert in een meer specifieke toewijzing van krediet aan de betrokken synapsen, omdat voorspellingen dichter bij de stimuli en gedragsreacties voorkomen die geconditioneerd moeten worden, in vergelijking met versterking aan het einde van het onderzoek (Sutton en Barto 1981).

Implementaties van versterkingslerende algoritmen gebruiken de voorspellingsfout op twee manieren, voor het veranderen van synaptische gewichten voor gedragsoutput en voor het verkrijgen van de voorspellingen zelf om de voorspellingsfout (Fig. 9 A) (McLaren 1989; Sutton en Barto 1981). Deze twee functies zijn gescheiden in recente implementaties, waarin de voorspellingsfout wordt berekend in de adaptieve criticuscomponent en de synaptische gewichten in de actorcomponent die gedragsuitvoer medieert wijzigt (Fig. 9 B) (Barto 1995). Een positieve fout verhoogt de voorspelling van de bekrachtiging van de criticus, terwijl een negatieve fout van weglating uit de weglating de voorspelling vermindert. Dit maakt het effectieve versterkingssignaal zeer adaptief.

Neurobiologische implementaties van temporeel verschil-leren

VERGELIJKING VAN DOPAMINE RESPONS MET WAPENINGSMODELLEN.

Het dopamine-antwoord codeert een fout in de voorspelling van beloning (Eq. 1 ) lijkt sterk op de effectieve fouttermijn van regels voor het leren van dieren (λ-V; Eq. 4 ) en het effectieve versterkingssignaal van TD-algoritmen op dat moment (t) van wapening [r(t) - P(t - 1); Eq. 6a], zoals eerder opgemerkt (Montague et al. 1996). Evenzo voorspelt de dopamine appetitive event-voorspellingsfout (Eq. 2 ) lijkt op de TD-wapeningsfout van hogere orde [P(t) - P(t - 1); Eq. 6c]. De aard van de wijdverspreide, uiteenlopende projecties van dopamine-neuronen naar waarschijnlijk alle neuronen in het striatum en veel neuronen in de frontale cortex is compatibel met het idee van een TD-mondiaal versterkingssignaal, dat door de criticus wordt uitgezonden voor het beïnvloeden van alle modelneuronen in de actor (vergelijk Fig. 7 met Fig. 9 B). De kritiek-actorenarchitectuur is bijzonder aantrekkelijk voor neurobiologie vanwege de afzonderlijke onderwijs- en prestatiemodules. In het bijzonder lijkt het op de connectiviteit van de basale ganglia, inclusief de reciprociteit van striatonigrale projecties (Fig. 9 C), zoals eerst opgemerkt door Houk et al. (1995). De criticus simuleert dopamine-neuronen, de beloningsvoorspelling komt van striosomale striatonigrale projecties en de actor lijkt op striatale matrixneuronen met dopamine-afhankelijke plasticiteit. Interessant is dat zowel dopamine-respons als theoretische fouttermen tekenafhankelijk zijn. Ze verschillen van foutmeldingen met absolute waarden die geen onderscheid maken tussen acquisitie en extinctie en zouden voornamelijk aandachtseffecten moeten hebben.

TOEPASSINGEN VOOR NEUROBIOLOGISCHE PROBLEMEN.

Hoewel oorspronkelijk ontwikkeld op basis van het Rescorla-Wagner-model van klassieke conditionering, leren modellen die TD-algoritmen gebruiken een breed scala aan gedragstaken door middel van instrumentele vormen van conditionering. Deze taken reiken van het balanceren van een paal op een karwiel (Barto et al. 1983) om backgammon van wereldklasse te spelen (Tesauro 1994). Robots die TD-algoritmen gebruiken, leren bewegen over tweedimensionale ruimte en vermijden obstakels, reiken en grijpen (Fagg 1993) of steek een pen in een gat (Gullapalli et al. 1994). Het gebruik van het TD-versterkingssignaal om het gedrag direct te beïnvloeden en te selecteren (Afb. 9 A), Repliceren TD-modellen foeragegedrag van honingbijen (Montague et al. 1995) en simuleer menselijke besluitvorming (Montague et al. 1996). TD-modellen met een expliciete architectuur van criticus-acteurs vormen zeer krachtige modellen die oogbewegingen efficiënt leren (Friston et al. 1994; Montague et al. 1993), opeenvolgende bewegingen (Fig. 10) en oriëntatiereacties (Contreras-Vidal en Schultz 1996). Een recent model voegde activerende deprimerende nieuwheidssignalen toe voor het verbeteren van het onderwijssignaal, gebruikte stimulus- en actie-sporen in de criticus en actor, en gebruikte regels voor het nemen van winsten voor het verbeteren van het onderwijssignaal en voor het selecteren van acteurneuronen met de grootste activering. Dit reproduceerde tot in detail zowel de respons van dopamine-neuronen als het leergedrag van dieren in vertraagde responsietaken (Suri en Schultz 1996). Het is bijzonder interessant om te zien dat het onderwijzen van signalen met behulp van voorspellingsfouten resulteert in sneller en vollediger leren in vergelijking met onvoorwaardelijke versterkingssignalen (Fig. 10) (Friston et al. 1994).

Fig. 10. 

Voordeel van voorspellende versterkingssignalen voor leren. Een temporeel verschilmodel met criticus-actorarchitectuur en geschiktheidstracering bij de acteur werd getraind in een sequentiële 2 step-3 keuzetaak (inzet linksboven). Leren ging sneller vooruit en bereikte hogere prestaties wanneer een voorspellend versterkingssignaal werd gebruikt als onderwijssignaal (adaptieve criticus, top) in vergelijking met het gebruik van een onvoorwaardelijk versterkingssignaal aan het einde van het onderzoek (bodem). Dit effect wordt steeds duidelijker met langere reeksen. Vergelijkbare prestaties met het onvoorwaardelijke versterkingssignaal zouden een veel langere traceerbaarheid vereisen. Gegevens werden verkregen uit 10-simulaties (R. Suri en W. Schultz, ongepubliceerde waarnemingen). Een vergelijkbare verbetering in leren met voorspellende versterking werd gevonden in een model van oculomotorisch gedrag (Friston et al. 1994).

Mogelijke leermechanismen met behulp van het dopamine-signaal

De voorgaande sectie heeft aangetoond dat het formele voorspellingsfoutsignaal dat wordt geëmitteerd door de dopamineactie een bijzonder geschikt onderwijssignaal kan vormen voor het leren van een model. In de volgende secties wordt beschreven hoe de biologische dopamine-respons mogelijk kan worden gebruikt voor het leren van basale ganglia-structuren en het suggereren van toetsbare hypotheses.

POSTSYNAPTISCHE PLASTIC GEMENGD DOOR VOORREDICTIE SIGNAAL BELONING.

Leren zou in twee stappen verlopen. De eerste stap omvat de verwerving van een dopamine-beloning-voorspellende respons. In vervolgproeven zou het voorspellende dopaminesignaal specifiek de synaptische gewichten (ω) van corticostriatale synapsen van het Hebbian-type versterken die actief zijn op het moment van de beloningssporende stimulus, terwijl de inactieve corticostriatale synapsen ongewijzigd blijven. Dit resulteert in de drie factoren leerregel

Δω=ɛ rˆ i o

Vergelijking 8where r is dopamine versterkingssignaal, i is invoeractiviteit, o is uitvoeractiviteit en learning is leersnelheid.

In een vereenvoudigd model komen vier corticale inputs (i1-i4) in contact met de dendritische uitsteeksels van drie stekelige striatale neuronen van gemiddelde grootte (o1-o3; Fig. 11). Corticale inputs komen samen op striatale neuronen, waarbij elke input contact maakt met een andere wervelkolom. Dezelfde stekels worden niet selectief in contact gebracht door een gemeenschappelijke dopamineringang R. Activering van dopamine-invoer R geeft aan dat een niet-voorspelde beloningsvoorspellende stimulus plaatsvond in de omgeving, zonder verdere details te verschaffen (goedheidssignaal). Laten we aannemen dat corticale input i2 gelijktijdig wordt geactiveerd met dopamine-neuronen en een van de verschillende specifieke parameters van dezelfde beloningsvoorspellende stimulus codeert, zoals de sensorische modaliteit, lichaamszijde, kleur, textuur en positie, of een specifieke parameter van een beweging getriggerd door de stimulus. Een set parameters van deze gebeurtenis zou worden gecodeerd door een set corticale inputs i2. Corticale invoer i1, i3 en i4 die geen verband houden met de huidige stimuli en bewegingen zijn inactief. De dopamine-respons leidt tot niet-selectieve dopamine-afgifte bij alle varicositeiten, maar zou selectief alleen de actieve corticostriatale synapsen i2-o1 en i2-o2 versterken, op voorwaarde dat de corticale inputs sterk genoeg zijn om de striatale neuronen o1 en o2 te activeren.

Fig. 11. 

Differentiële invloeden van een globaal dopamine versterkingssignaal op selectieve corticostriatale activiteit. Dendritische stekels van 3 middelgrote stekelige striatale neuronen o1, o2 en o3 worden benaderd door 4 corticale ingangen i1, i2, i3 en i4 en door axonale varicositeiten van een enkele dopamine-neuron R (of van een populatie van homogeen geactiveerde dopamine neuronen ). Elk striataal neuron ontvangt ~10,000 corticale en 1,000 dopamine-ingangen. Bij enkele dendritische stekels convergeren verschillende corticale inputs met de dopamine-input. In de 1-versie van het model verbetert het dopaminesignaal tegelijk de actieve corticostriatale transmissie ten opzichte van niet-actieve transmissie. De dopamineringang R is bijvoorbeeld tegelijkertijd actief als corticale invoer i2, terwijl i1, i3, i4 niet actief zijn. Dit leidt tot een wijziging van de i2 → o1- en i2 → o2-transmissie, maar laat i1 → o1, i3 → o2, i3 → o3 en i4 → o3-uitzendingen ongewijzigd. In een versie van het model met plasticiteit worden synaptische gewichten van corticostriatale synapsen op lange termijn gemodificeerd door het dopaminesignaal volgens dezelfde regel. Dit kan voorkomen wanneer dopamine-reacties op een geconditioneerde stimulus werken op corticostriatale synapsen die ook door deze stimulus worden geactiveerd. In een andere versie die plasticiteit gebruikt, kunnen dopamine-reacties op een primaire beloning achteruitgaan in de tijd op corticostriatale synapsen die eerder actief waren. Deze synapsen zouden in aanmerking komen voor aanpassing door een hypothetisch postsynaptisch neuronaal spoor dat overblijft na die activiteit. Bij het vergelijken van de basale ganglia-structuur met het recente TD-model van Fig. 9 B, dopamine-input R repliceert de criticus met neuron A, het striatum met neuronen o1-o3 repliceert de actor met neuron B, corticale inputs i1-i4 repliceren de actorinvoer en de divergerende projectie van dopamine-neuronen R op meerdere spines van meerdere striatale neuronen o1-o3 repliceert de globale invloed van de criticus op de actor. Een vergelijkbare vergelijking werd gemaakt door Houk et al. (1995). Deze tekening is gebaseerd op anatomische gegevens van Freund et al. (1984), Smith en Bolam (1990), Flaherty en Graybiel (1993) en Smith et al. (1994).

Dit leermechanisme gebruikt de verworven dopamine-respons op het moment van de beloningspredictiestimulus als een onderwijssignaal voor het induceren van langdurige synaptische veranderingen (fig. 12 A). Het leren van de voorspellende stimulus of getriggerde beweging is gebaseerd op de aangetoonde verwerving van dopamine-respons op de beloningsvoorspellende stimulus, samen met dopamine-afhankelijke plasticiteit in het striatum. Plasticiteitsveranderingen kunnen ook voorkomen in corticale of subcorticale structuren stroomafwaarts van striatum na dopamine-gemedieerde kortetermijnverbetering van synaptische transmissie in het striatum. De retroactieve effecten van beloning op stimuli en bewegingen voorafgaand aan de beloning worden gemedieerd door de responsoverdracht naar de vroegste beloningsvoorspellende stimulus. De dopamine-respons op voorspelde of weggelaten primaire beloning wordt niet gebruikt voor veranderingen in de plasticiteit in het striatum, omdat het niet tegelijkertijd met de te conditioneren gebeurtenissen optreedt, hoewel het mogelijk betrokken zou kunnen zijn bij het berekenen van de dopaminerespons op de beloningssporende stimulus in analogie met de architectuur en het mechanisme van TD-modellen.

Fig. 12. 

Invloeden van dopamine versterkingssignaal op mogelijke leermechanismen in het striatum. A: voorspellende dopamine-beloningsreactie op een geconditioneerde stimulus (CS) heeft een direct versterkend of plasticiteitseffect op striatale neurotransmissie gerelateerd aan die stimulus. B: dopamine-respons op primaire beloning heeft een retrograde plasticiteitseffect op striatale neurotransmissie gerelateerd aan de voorafgaande geconditioneerde stimulus. Dit mechanisme wordt gemedieerd door een in aanmerking komend spoor dat striatale activiteit overleeft. Vaste pijlen geven directe effecten van dopamine-signaal op striatale neurotransmissie aan (A) of het kwalificatietrack (B) kleine pijl erin B geeft indirect effect aan op striatale neurotransmissie via het ontvankelijkheidsspoor.

POSTSYNAPTISCHE KUNSTSTOF SAMEN MET SYNAPTISCHE SUBSIDIABILITEITSPOOR.

Leren kan in een enkele stap plaatsvinden als het dopamine-beloningssignaal een retroactieve werking heeft op striatale synapsen. Dit vereist hypothetische sporen van synaptische activiteit die blijven bestaan ​​tot versterking optreedt en deze synapsen in aanmerking komen voor wijziging door een onderwijssignaal dat actief was vóór versterking (Hull 1943; Klopf 1982; Sutton en Barto 19811). Synaptische gewichten (ω) zijn veranderd volgens

Δω=ɛ rˆ h (i,o)

Vergelijking 9where r is dopamine versterkingssignaal, h (i, o) is in aanmerking komend spoor van gezamenlijke invoer- en uitvoeractiviteit en ɛ is leerrate. Potentiële fysiologische substraten van geschiktheidsproeven bestaan ​​uit langdurige veranderingen in calciumconcentratie (Wickens en Kötter 1995), de vorming van calmoduline-afhankelijk eiwitkinase II (Houk et al. 1995), of aanhoudende neuronale activiteit die vaak in striatum wordt aangetroffen (Schultz et al. 1995a) en cortex.

Dopamine-afhankelijke plasticiteit met in aanmerking komende sporen vormt een elegant mechanisme om sequenties achterwaarts in de tijd te leren (Sutton en Barto 1981). Om te beginnen bemiddelt de dopamine-respons op de onvoorspelde primaire beloning met gedragsmatig leren van de onmiddellijk voorafgaande gebeurtenis door de corticostriatale synaptische werkzaamheid te wijzigen (fig. 11). Tegelijkertijd wordt de dopamine-respons overgedragen naar de beloningsvoorspellingsgebeurtenis. Een depressie op het moment van weglating van beloning verhindert het leren van foutieve reacties. In de volgende stap bemiddelt de dopamine-respons op de onvoorspelbare beloningsvoorspellingsgebeurtenis met het leren van de onmiddellijk voorafgaande voorspellende gebeurtenis, en de dopaminerespons gaat eveneens terug naar die gebeurtenis. Omdat dit herhaaldelijk gebeurt, beweegt de dopamine-respons achterwaarts in de tijd totdat er geen verdere gebeurtenissen voorafgaan, waardoor bij elke stap de voorgaande gebeurtenis beloningsvoorspelling kan verkrijgen. Dit mechanisme zou bij uitstek geschikt zijn voor het vormen van gedragssequenties die leiden tot een uiteindelijke beloning.

Dit leermechanisme maakt volledig gebruik van de dopaminefout in de voorspelling van appetitieve gebeurtenissen als retroactief lerend signaal dat langdurige synaptische veranderingen induceert (Fig. 12 B). Het maakt gebruik van dopamine-afhankelijke plasticiteit samen met striatale elibiliteitsporen waarvan de biologische geschiktheid voor leren nog moet worden onderzocht. Dit resulteert in direct leren door uitkomst, in essentie verenigbaar met de invloed van het onderwijssignaal op de acteur van TD-modellen. De aangetoonde retrograde beweging van de dopamine-respons wordt gebruikt voor het leren van eerdere en eerdere stimuli.

EEN ALTERNATIEF MECHANISME: FACILITERENDE INVLOED VAN VOORSPELEND DOPAMINE SIGNAAL.

Beide mechanismen die hierboven zijn beschreven, gebruiken de dopamine-respons als een onderwijssignaal voor het modificeren van neurotransmissie in het striatum. Aangezien de bijdrage van dopamine-afhankelijke striatale plasticiteit aan het leren niet volledig wordt begrepen, zou een ander mechanisme kunnen worden gebaseerd op de aangetoonde plasticiteit van de dopaminerespons zonder striatale plasticiteit te vereisen. In een eerste stap krijgen dopamine-neuronen respons op stimulus-voorspellende stimuli. In een volgende stap zouden de voorspellende responsen kunnen worden gebruikt om de impact te vergroten van corticale inputs die gelijktijdig optreden op dezelfde dendritische stekels van striatale neuronen. De postsynaptische activiteit zou veranderen volgens

Δactiviteit=δrˆ i

Vergelijking 10where r is dopamine versterkingssignaal, i is invoeractiviteit en 8 is een versterkingsconstante. In plaats van een onderwijssignaal te vormen, verschaft de voorspellende dopaminerespons een versterkend of motiverend signaal voor striatale neurotransmissie op het tijdstip van de beloningsvoorspellende stimulus. Met concurrerende stimuli zouden neuronale inputs die tegelijkertijd met het beloningsprederende dopaminesignaal optreden bij voorkeur worden verwerkt. Gedragsreacties zouden profiteren van de voorafgaande informatie en frequenter, sneller en nauwkeuriger worden. De faciliterende invloed van voorinformatie wordt gedemonstreerd in gedragsexperimenten door een geconditioneerde stimulus te paren met hendelpersen (Lovibond 1983).

Een mogelijk mechanisme kan het focusserende effect van dopamine gebruiken. In het vereenvoudigde model van Fig. 11, dopamine vermindert globaal alle corticale invloeden. Dit laat alleen de sterkste input door naar striatale neuronen, terwijl de andere, zwakkere inputs ineffectief worden. Dit vereist een niet-lineair, contrastverhogend mechanisme, zoals de drempel voor het genereren van actiepotentialen. Een vergelijkbare versterking van de sterkste inputs zou kunnen optreden in neuronen die voornamelijk zouden worden geëxciteerd door dopamine.

Dit mechanisme maakt gebruik van de verworven, belonings voorspellende dopamine respons als een voorspannings- of selectiesignaal voor het beïnvloeden van postsynaptische verwerking (Fig. 12 A). Verbeterde prestaties zijn volledig gebaseerd op de aangetoonde plasticiteit van dopamine-reacties en vereisen geen dopamine-afhankelijke plasticiteit in striatale neuronen. De antwoorden op onvoorziene of weggelaten beloning komen te laat voor het beïnvloeden van de striatale verwerking, maar kunnen helpen om de voorspellende dopaminerespons in analogie met TD-modellen te berekenen.

Elektrische stimulatie van dopamine-neuronen als ongeconditioneerde stimulus

Elektrische stimulatie van omgeschreven hersengebieden dient op betrouwbare wijze als versterking voor het verkrijgen en behouden van naderheidsgedrag (Olds en Milner 1954). Sommige zeer effectieve zelfstimulatiesites vallen samen met dopamine-cellichamen en axonbundels in de middenhersenen (Corbett en Wise 1980), nucleus accumbens (Phillips et al. 1975), striatum (Phillips et al. 1976) en prefrontale cortex (Mora en Myers 1977; Phillips et al. 1979), maar ook in structuren die geen verband houden met dopamine-systemen (Wit en Milner 1992). Elektrische zelfstimulatie omvat de activering van dopamine-neuronen (Fibiger en Phillips 1986; Wise en Rompré 1989) en wordt gereduceerd door 6-hydroxydopamine-geïnduceerde laesies van dopamine-axons (Fibiger et al. 1987; Phillips en Fibiger 1978), remming van dopamine-synthese (Edmonds en Gallistel 1977), depolarisatie-inactivatie van dopamine-neuronen (Rompré en Wise 1989) en dopamine-receptorantagonisten systemisch toegediend (Furiezos en Wise 1976) of in nucleus accumbens (Mogenson et al. 1979). Zelfstimulering wordt vergemakkelijkt door door cocaïne of amfetamine geïnduceerde verhogingen van extracellulair dopamine (Colle en Wise 1980; Stein 1964; Wauquier 1976). Zelfstimulatie verhoogt direct het gebruik van dopamine in nucleus accumbens, striatum en frontale cortex (Fibiger et al. 1987; Mora en Myers 1977).

Het is intrigerend om je voor te stellen dat elektrisch opgewekte dopamine-impulsen en -afgifte kunnen dienen als ongeconditioneerde stimulans in associatief leren, vergelijkbaar met de stimulatie van octopamine-neuronen in honingbijen die de proboscis-reflex leren (Hammer 1993). Echter, dopamine-gerelateerde zelfstimulatie verschilt in ten minste drie belangrijke aspecten van de natuurlijke activering van dopamine-neuronen. In plaats van alleen dopamine-neuronen te activeren, activeren natuurlijke beloningen meestal meerdere neuronale systemen parallel en maken ze de gedistribueerde codering van verschillende beloningscomponenten mogelijk (zie verdere tekst). Ten tweede wordt elektrische stimulatie toegepast als onvoorwaardelijke versterking zonder een fout in beloningsvoorspelling te weerspiegelen. Ten derde wordt elektrische stimulatie alleen als beloning geleverd na een gedragsreactie, in plaats van op het moment van een beloningssporende stimulus. Het zou interessant zijn om elektrische zelfstimulatie op precies dezelfde manier toe te passen als dopamine-neuronen hun signaal uitzenden.

Leerstoornissen met verminderde dopamine neurotransmissie

Veel studies onderzochten het gedrag van dieren met verminderde dopamine-neurotransmissie na lokale of systemische toediening van dopamine-receptorantagonisten of vernietiging van dopamine-axonen in ventrale middenhersenen, nucleus accumbens of striatum. Naast het observeren van locomotorische en cognitieve gebreken die doen denken aan Parkinsonisme, onthulden deze onderzoeken stoornissen in de verwerking van beloningsinformatie. De vroegste studies pleitten voor tekorten in de subjectieve, hedonische perceptie van beloningen (Wise 1982; Wise et al. 1978). Verdere experimenten onthulden een verminderd gebruik van primaire beloningen en geconditioneerde appetitieve stimuli voor aanpak en consumerend gedrag (Beninger et al. 1987; Ettenberg 1989; Miller et al. 1990; Salamone 1987; Ungerstedt 1971; Wise en Colle 1984; Wise en Rompre 1989). Veel studies beschreven stoornissen in motivationele en aandachtsprocessen die ten grondslag liggen aan appetitief leren (Beninger 1983, 1989; Beninger en Hahn 1983; Fibiger en Phillips 1986; LeMoal en Simon 1991; Robbins en Everitt 1992, 1996; Wit en Milner 1992; Wise 1982). De meeste leerachterstanden worden geassocieerd met verminderde dopamine-neurotransmissie in nucleus accumbens, terwijl dorsale striatumstoornissen leiden tot sensomotorische tekorten (Amalric en Koob 1987; Robbins en Everitt 1992; Witte 1989). Het leren van instrumentele taken in het algemeen en van discriminerende stimuluseigenschappen in het bijzonder lijkt echter vaak te worden bespaard en het is niet helemaal opgelost of sommige van de schijnbare leerachterstanden kunnen worden vertroebeld door motorische prestatiestoornissen (Salamone 1992).

Degeneratie van dopamine-neuronen bij de ziekte van Parkinson leidt ook tot een aantal declaratieve en procedurele leerachterstanden, waaronder associatief leren (Linden et al. 1990; Sprengelmeyer et al. 1995). Tekorten zijn aanwezig bij trial-and-error leren met onmiddellijke versterking (Vriezen en Moscovitch 1990) en wanneer expliciete stimuli worden geassocieerd met verschillende uitkomsten (Knowlton et al. 1996), zelfs in vroege stadia van de ziekte van Parkinson zonder corticale atrofie (Canavan et al. 1989). Parkinsonpatiënten vertonen ook een verminderde tijdperceptie (Pastor et al. 1992). Al deze tekorten komen voor in de aanwezigheid van L-Dopa-behandeling, die tonische striatale dopaminegehalten herstelt zonder fasische dopaminesignalen te herstellen.

Deze studies suggereren dat dopamine-neurotransmissie een belangrijke rol speelt bij de verwerking van beloningen voor naderingsgedrag en bij vormen van leren waarbij associaties tussen stimuli en beloningen worden gecombineerd, terwijl een betrokkenheid bij meer instrumentele vormen van leren in twijfel kan worden getrokken. Het is onduidelijk of deze tekorten een meer algemene gedragsinactivatie weerspiegelen als gevolg van tonisch verminderde dopamine-receptorstimulatie in plaats van de afwezigheid van een fasisch dopamine-beloningsignaal. Om deze vraag op te lossen, en meer specifiek de rol van dopamine in verschillende leervormen op te helderen, zou het nuttig zijn om het leren te bestuderen in die situaties waarin de fasische dopamine-respons op appetitieve stimuli daadwerkelijk optreedt.

Vormen van leren mogelijk gemedieerd door het dopamine-signaal

De kenmerken van dopamine-responsen en de mogelijke invloed van dopamine op striatale neuronen kunnen helpen bij het afbakenen van enkele leervormen waarin dopamine-neuronen kunnen worden betrokken. De voorkeursreacties op appetitief in tegenstelling tot aversieve gebeurtenissen zouden een voorkeur hebben voor betrokkenheid bij het leren van naderingsgedrag en het mediëren van positieve versterkingseffecten, eerder dan terugtrekking en bestraffing. De antwoorden op primaire beloningen buiten de taken en leercontexten zouden dopamineneuronen in staat stellen een rol te spelen in een relatief breed spectrum van leren met primaire beloningen, zowel in klassieke als instrumentele conditionering. De antwoorden op beloningsvoorspellende stimuli weerspiegelen stimulus-beloningsassociaties en zouden verenigbaar zijn met een betrokkenheid bij beloningsverwachtingen die ten grondslag liggen aan algemeen incentive-leren (Bindra 1968). Daarentegen coderen dopamine-responsen niet expliciet beloningen als doelobjecten, omdat ze alleen fouten in beloningsvoorspelling rapporteren. Ze lijken ook ongevoelig te zijn voor motiverende staten, waardoor ze een specifieke rol in het van staten afhankelijk stimuleren van doelgerichte handelingen (Dickinson en Balleine 1994). Het ontbreken van duidelijke relaties met arm- en oogbewegingen zou een rol wegnemen in het direct bemiddelen van de gedragsreacties die volgen op stimuleringsstimuli. Vergelijkingen tussen ontladingen van individuele neuronen en het leren van hele organismen zijn echter intrinsiek moeilijk. Op het synaptische niveau bereikt fasisch afgegeven dopamine vele dendrieten op waarschijnlijk elk striataal neuron en kan dus een plasticiteitseffect uitoefenen op de grote verscheidenheid aan gedragscomponenten waarbij het striatum is betrokken, waaronder het leren van bewegingen.

De specifieke omstandigheden waarin fasische dopamine signalen een rol kunnen spelen bij het leren, worden bepaald door de soorten stimuli die effectief een dopamine-respons induceren. In het dierlaboratorium vereisen dopamine-reacties het fasisch voorkomen van appetijtelijke, nieuwe of bijzonder saillante stimuli, waaronder beloningen voor primaire voedingsstoffen en beloningsvoorspellende stimuli, terwijl aversieve stimuli geen grote rol spelen. Dopamine-reacties kunnen voorkomen in alle gedragssituaties die worden beheerst door fasische en expliciete resultaten, hoewel geconditioneerde stimuli van hogere orde en secundaire versterkers nog niet waren getest. Fasische dopamine-reacties zouden waarschijnlijk geen rol spelen bij vormen van leren die niet worden gemedieerd door fasisch voorkomende uitkomsten, en de voorspellende respons zou niet kunnen bijdragen aan leren in situaties waarin fasische voorspellende stimuli niet voorkomen, zoals relatief trage veranderingen in de context . Dit leidt tot de interessante vraag of het sparen van sommige vormen van leren door dopamine-laesies of neuroleptica eenvoudigweg de afwezigheid van fasische dopaminereacties zou kunnen weerspiegelen omdat de effectieve stimuli die ze opwekten niet werden gebruikt.

De betrokkenheid van dopamine-signalen bij het leren kan worden geïllustreerd aan de hand van een theoretisch voorbeeld. Stel je dopamine-reacties voor tijdens het verwerven van een seriële reactietijdstaak, wanneer een correcte reactie plotseling tot een voedingsbeloning leidt. De beloningsrespons wordt vervolgens overgedragen naar progressief eerdere beloningsvoorspellende stimuli. Reactietijden verbeteren verder door langdurig oefenen omdat de ruimtelijke posities van doelen steeds voorspelbaarder worden. Hoewel dopamine-neuronen blijven reageren op de beloning-voorspellende stimuli, kan de verdere gedragsverbetering voornamelijk te wijten zijn aan de verwerving van voorspellende verwerking van ruimtelijke posities door andere neuronale systemen. Aldus zouden dopamine-responsen optreden tijdens het initiële, stimulerende deel van leren waarin onderwerpen voorwerpen naderen en expliciete primaire, en mogelijk geconditioneerde, beloningen verkrijgen. Ze zouden minder betrokken zijn in situaties waarin de voortgang van het leren verder gaat dan het induceren van naderingsgedrag. Dit zou de dopaminerol niet beperken tot de eerste leerstappen, omdat veel situaties vereisen dat ze in eerste instantie van voorbeelden leren en pas later leren door expliciete resultaten.

SAMENWERKING TUSSEN BELONINGSSIGNALEN

Voorspellingsfout

Het voorspellingsfoutsignaal van dopamine-neuronen zou een uitstekende indicator zijn van de appetijtelijke waarde van omgevingsgebeurtenissen ten opzichte van voorspelling maar faalt om onderscheid te maken tussen voedingsmiddelen, vloeistoffen en beloningsvoorspellende stimuli en tussen visuele, auditieve en somatosensorische modaliteiten. Dit signaal kan een beloningsbericht vormen waarmee postsynaptische neuronen worden geïnformeerd over het verrassende uiterlijk of weglaten van een lonende of potentieel lonende gebeurtenis zonder de identiteit ervan aan te geven. Het heeft alle formele kenmerken van een krachtig versterkingssignaal voor leren. Informatie over de specifieke aard van beloningen is echter cruciaal om te bepalen welke objecten moeten worden benaderd en op welke manier. Een hongerig dier moet bijvoorbeeld in de eerste plaats voedsel benaderen, maar niet vloeibaar. Om relevante irrelevante beloningen te onderscheiden, moet het dopaminesignaal worden aangevuld met aanvullende informatie. Recente in vivo dialyse-experimenten toonden hogere voedselgeïnduceerde dopamine-afgifte bij hongerigen dan bij verzadigde ratten (Wilson et al. 1995). Deze drangafhankelijkheid van dopamine-afgifte impliceert mogelijk geen impulsrespons, omdat we er niet in slaagden om een ​​duidelijke drangafhankelijkheid te vinden met dopamine-responsen bij het vergelijken van vroege en late perioden van individuele experimentele sessies waarbij dieren vloeibaar verzadigd werden (JL Contreras-Vidal en W. Schultz, niet-gepubliceerde gegevens).

Beloningsspecificaties

Informatie met betrekking tot vloeibare en voedselbeloningen wordt ook verwerkt in hersenstructuren anders dan dopamine-neuronen, zoals dorsaal en ventraal striatum, subthalamische kern, amygdala, dorsolaterale prefrontale cortex, orbitofrontale cortex en anterior cingulate cortex. Deze structuren lijken echter geen globaal beloningspredictiefoutsignaal uit te stralen dat vergelijkbaar is met dopamine-neuronen. In primaten verwerken deze structuren beloningen als 1) voorbijgaande reacties na de levering van de beloning (Apicella et al. 1991a,b, 1997; Bowman et al. 1996; Hikosaka et al. 1989; Niki en Watanabe 1979; Nishijo et al. 1988; Tremblay en Schultz 1995; Watanabe 1989), 2) voorbijgaande reacties op beloningsvoorspellende signalen (Aosaki et al. 1994; Apicella et al. 1991b; 1996; Hollerman et al. 1994; Nishijo et al. 1988; Thorpe et al. 1983; Tremblay en Schultz 1995; Williams et al. 1993), 3) aanhoudende activeringen tijdens de verwachting van direct aankomende beloningen (Apicella et al. 1992; Hikosaka et al. 1989; Matsumura et al. 1992; Schultz et al. 1992; Tremblay en Schultz 1995), En 4) modulaties van gedragsgerelateerde activaties door voorspelde beloning (Hollerman et al. 1994; Watanabe 1990, 1996). Veel van deze neuronen differentiëren goed tussen verschillende voedselbeloningen en tussen verschillende vloeistofbeloningen. Zo verwerken ze de specifieke aard van de lonende gebeurtenis en kunnen ze de beloningsbeleving dienen. Sommige van de beloningsreacties zijn afhankelijk van onvoorspelbaarheid van beloningen en zijn verminderd of afwezig wanneer de beloning wordt voorspeld door een geconditioneerde stimulus (Apicella et al. 1997; Matsumoto et al. 1995; L. Tremblay en W. Schultz, ongepubliceerde gegevens). Ze kunnen voorspellingen voor specifieke beloningen verwerken, hoewel het onduidelijk is of ze voorspellingsfouten signaleren, omdat hun antwoorden op weggelaten beloningen onbekend zijn.

De gevestigde prestaties handhaven

Drie neuronale mechanismen lijken belangrijk te zijn voor het handhaven van gevestigde gedragsprestaties, namelijk de detectie van weggelaten beloningen, de detectie van stimulus voorspellende stimuli en de detectie van voorspelde beloningen. Dopamine-neuronen zijn depressief wanneer voorspelde beloningen worden weggelaten. Dit signaal zou de synaptische werkzaamheid in verband met foutieve gedragsreacties kunnen verminderen en hun herhaling kunnen voorkomen. De dopamine-respons op stimulus-voorspellende stimuli wordt gehandhaafd tijdens vastgesteld gedrag en blijft dus dienst doen als voorafgaande informatie. Hoewel de volledig voorspelde beloningen niet worden gedetecteerd door dopamine-neuronen, worden ze verwerkt door de niet-dopaminergische corticale en subcorticale systemen die hierboven zijn genoemd. Dit zou belangrijk zijn om het uitsterven van aangeleerd gedrag te voorkomen.

Bij elkaar genomen, lijkt het erop dat de verwerking van specifieke beloningen voor het leren en onderhouden van naderheidsgedrag sterk zou profiteren van een samenwerking tussen dopamine-neuronen die het onvoorziene optreden of weglaten van beloning en neuronen in de andere structuren simultaan signaleren, hetgeen de specifieke aard van de beloning aangeeft.

VERGELIJKINGEN MET ANDERE PROJECTIESYSTEMEN

Noradrenaline neuronen

Bijna de gehele populatie van noradrenaline neuronen in locus coeruleus bij ratten, katten en apen vertoont vrij homogene, bifasische activerende / depressieve reacties op visuele, auditieve en somatosensorische stimuli die oriëntatiereacties opwekken (Aston-Jones en Bloom 1981; Foote et al. 1980; Rasmussen et al. 1986). Met name effectief zijn zeldzame gebeurtenissen waar dieren aandacht aan besteden, zoals visuele stimuli in een vreemde taak (Aston-Jones et al. 1994). Noradrenaline-neuronen maken een onderscheid tussen stimulerende of motiverende en neutrale gebeurtenissen. Ze krijgen snel reacties op nieuwe doelstimuli tijdens omkering en verliezen reacties op eerdere doelwitten voordat gedragsomkering is voltooid (Aston-Jones et al. 1997). Antwoorden komen naar buiten om vloeistof te bevrijden van elke taak en worden overgezet naar beloningsvoorspellende doelstimuli binnen een taak, evenals naar primaire en geconditioneerde aversieve stimuli (Aston-Jones et al. 1994; Foote et al. 1980; Rasmussen en Jacobs 1986; Sara en Segal 1991). Antwoorden zijn vaak van voorbijgaande aard en lijken de veranderingen in het optreden of de betekenis van een prikkel te weerspiegelen. Activaties kunnen slechts optreden bij een paar proeven met herhaalde presentaties van voedselobjecten (Vankov et al. 1995) of met geconditioneerde auditieve stimuli geassocieerd met vloeibare beloning, aversieve luchtdruk of elektrische voetschok (Rasmussen en Jacobs 1986; Sara en Segal 1991). Tijdens conditionering komen de reacties terug op de eerste paar presentaties van nieuwe stimuli en komen ze tijdelijk terug wanneer versterkingscondities tijdens acquisitie, omkering en extinctie veranderen (Sara en Segal 1991).

Samen genomen lijken de responsen van noradrenaline-neuronen op de responsen van dopamine-neuronen in verschillende opzichten, geactiveerd door primaire beloningen, beloningsvoorspellende stimuli en nieuwe stimuli en overdracht van de respons van primaire naar geconditioneerde appetitieve gebeurtenissen. Noradrenaline-neuronen verschillen echter van dopamine-neuronen door te reageren op een veel grotere variëteit van opwekkende stimuli, door goed te reageren op primaire en geconditioneerde aversieve stimuli, door goed te discrimineren tegen neutrale stimuli, door gedrags-omkeringen snel te volgen en door decrementele responsen te vertonen met herhaalde stimulus presentatie die 100-proeven kan vereisen voor solide appetijtgevoelens (Aston-Jones et al. 1994). Noradrenaline-reacties zijn sterk gerelateerd aan de opwindende of aandacht trekkende eigenschappen van stimuli die oriëntatiereacties uitlokken, terwijl ze veel minder gericht zijn op stimulerende eigenschappen zoals de meeste dopamineneuronen. Ze worden waarschijnlijk meer gedreven door aandacht trekkende dan motiverende componenten van appetijtelijke gebeurtenissen.

Serotonine neuronen

Activiteit in de verschillende raphe-kernen bevordert de motorische output door de spiertonus en stereotype motoractiviteit in te stellen (Jacobs en Fornal 1993). Dorsale raphe-neuronen bij katten vertonen fasische, niet-evacuerende reacties op visuele en auditieve stimuli van geen bepaalde gedragsmatige betekenis (Heym et al. 1982; LeMoal and Olds 1979). Deze responsen lijken op reacties van dopamine-neuronen op nieuwe en vooral opvallende stimuli. Verdere vergelijkingen vereisen meer gedetailleerde experimenten.

Nucleus basalis Meynert

Fundamentele neuronen van primaten van primaten worden op fasische wijze geactiveerd door een grote verscheidenheid aan gedragsgebeurtenissen, waaronder geconditioneerde, beloningsvoorspellende stimuli en primaire beloningen. Veel activeringen zijn afhankelijk van geheugen en associaties met versterking van discriminatie en vertraagde reactietaken. Activaties weerspiegelen de bekendheid van stimuli (Wilson en Rolls 1990a), belangrijker worden met stimuli en bewegingen die dichter bij de beloningstijd komen (Richardson en DeLong 1990), differentiëren goed tussen visuele stimuli op basis van appetitieve en aversieve associaties (Wilson en Rolls 1990b) en veranderen binnen een paar onderzoeken tijdens omkering (Wilson en Rolls 1990c). Neuronen worden ook geactiveerd door aversieve stimuli, voorspelde visuele en auditieve stimuli en bewegingen. Ze reageren vaak op volledig voorspelde beloningen in gevestigde gedragstaken (Mitchell et al. 1987; Richardson en DeLong 1986, 1990), hoewel antwoorden op onvoorziene beloningen in sommige studies overvloediger zijn (Richardson en DeLong 1990) maar niet in andere (Wilson en Rolls 1990a-c). In vergelijking met dopamine-neuronen worden ze geactiveerd door een veel groter spectrum van stimuli en gebeurtenissen, waaronder aversieve gebeurtenissen, en vertonen ze niet de tamelijk homogene populatie-respons op onvoorspelbare beloningen en de overdracht ervan naar beloningsvoorspellende stimuli.

Cerebellaire klimvezels

Waarschijnlijk werd verondersteld dat het eerste foutgestuurd onderwijsleersignaal in de hersenen de projectie inhield van het beklimmen van vezels van de inferieure olifant tot Purkinje-neuronen in de cerebellaire cortex (Marr 1969), en veel cerebellaire leerstudies zijn gebaseerd op dit concept (Houk et al. 1996; Ito 1989; Kawato en Gomi 1992; Llinas en Welsh 1993). Het beklimmen van vezelinvoer naar Purkinje-neuronen verandert tijdelijk hun activiteit wanneer ladingen voor bewegingen of winst tussen bewegingen en visuele feedback worden veranderd en apen zich aanpassen aan de nieuwe situatie (Gilbert en Thach 1977; Ojakangas en Ebner 1992). De meeste van deze veranderingen bestaan ​​uit verhoogde activiteit in plaats van de activering versus depressiereacties die worden gezien met fouten in tegenovergestelde richtingen in dopamine-neuronen. Als het beklimmen van vezelactivatie zou dienen als onderwijssignaal, zou conjoint climbing fiber-parallel fiber activation moeten leiden tot veranderingen in de parallelle vezelinvoer naar Purkinje-neuronen. Dit komt inderdaad voor als langdurige depressie van parallelle vezelinvoer, hoofdzakelijk in in vitro preparaten (Ito 1989). Vergelijkbare veranderingen in parallelle vezels zijn echter moeilijker te vinden in gedragssituaties (Ojakangas en Ebner 1992), waardoor de consequenties van potentiële leertracering voor het beklimmen van vezels op dit moment open blijven.

Een tweede argument voor een rol van het beklimmen van vezels bij het leren, betreft aversieve klassieke conditionering. Een fractie van de klimvezels wordt geactiveerd door aversieve luchtwervelingen naar het hoornvlies. Deze reacties gaan verloren na Pavlovian ooglidcorrectie met behulp van een auditieve prikkel (Sears en Steinmetz 1991), wat duidt op een relatie met de onvoorspelbaarheid van primaire aversieve gebeurtenissen. Na conditionering reageren neuronen in de cerebrale interpositus nucleus op de geconditioneerde stimulus (Berthier en Moore 1990; McCormick en Thompson 1984). Laesies van deze kern of injecties van de GABA-antagonist bicuculline in de inferieure olijven voorkomen het verlies van inferieure olieluchtrookrespons na conditionering, wat suggereert dat monosynaptische of polysynaptische remming van interpositus naar inferieure olijf de reacties na conditionering onderdrukt (Thompson en Gluck 1991). Dit zou het mogelijk kunnen maken dat inferieure olijfneuronen depressief zijn in de afwezigheid van voorspelde aversieve stimuli en aldus een negatieve fout rapporteren in de voorspelling van aversieve gebeurtenissen vergelijkbaar met dopamine neuronen.

Klimvezels kunnen dus fouten in de motorprestaties en fouten in de voorspelling van aversieve gebeurtenissen melden, hoewel dit niet altijd bidirectionele veranderingen met zich meebrengt zoals dopamine-neuronen. Klimvezels lijken geen reacties te krijgen op geconditioneerde aversieve stimuli, maar dergelijke responses worden gevonden in nucleus interpositus. De berekening van aversieve voorspellingsfouten kan betrekking hebben op dalende remmende inputs voor inferieure olijfneuronen, analoog aan striatale projecties voor dopamine-neuronen. Aldus verwerken cerebellaire circuits foutsignalen, zij het op een andere manier dan dopamine-neuronen en TD-modellen, en ze kunnen regels voor foutleren implementeren, zoals de Rescorla-Wagner-regel (Thompson en Gluck 1991) of de formeel equivalente Widrow-Hoff-regel (Kawato en Gomi 1992).

DOPAMINE BELONINGS SIGNAAL VERSUS PARKINSONISCHE DEFICITS

Verminderde dopamine-neurotransmissie bij de ziekte van Parkinson, experimentele laesies of neuroleptische behandeling wordt geassocieerd met veel gedragsstoornissen bij beweging (akinesie, tremor, rigiditeit), cognitie (aandacht, bradyfrenie, planning, leren) en motivatie (verminderde emotionele reacties, depressie). Het bereik van tekorten lijkt te breed om eenvoudigweg te worden verklaard door een slecht functionerend dopamine-beloningssignaal. De meeste tekorten worden aanzienlijk verbeterd door systemische dopamine-precursor- of receptoragonisttherapie, hoewel dit niet op eenvoudige wijze de fasische informatieoverdracht door neuronale impulsen kan herstellen. Veel eetluststoornissen worden echter niet hersteld door deze therapie, zoals farmacologisch geïnduceerde onderscheidingsstoornissen (Ahlenius 1974) en leerstoornissen in het parkinsonisme (Canavan et al. 1989; Knowlton et al. 1996; Linden et al. 1990; Sprengelmeyer et al. 1995; Vriezen en Moscovitch 1990).

Uit deze overwegingen blijkt dat dopamine-neurotransmissie twee afzonderlijke functies in de hersenen speelt, de fasische verwerking van appetitieve en alarmerende informatie en het tonische mogelijk maken van een breed scala van gedrag zonder temporele codering. Tekorten in een vergelijkbare dubbele dopaminefunctie kunnen ten grondslag liggen aan de pathofysiologie van schizofrenie (Grace 1991). Het is interessant om op te merken dat fasische veranderingen van dopamine-activiteit op verschillende tijdschalen kunnen optreden. Terwijl de beloningsreacties een tijdsverloop in de orde van tientallen en honderden milliseconden volgen, hebben dopamine-afgiftestudies met voltammetrie en microdialyse betrekking op tijdschalen van minuten en onthullen een veel breder spectrum van dopaminefuncties, inclusief de verwerking van beloningen, voeding, drinken, straffen, stress en sociaal gedrag (Abercrombie et al. 1989; Church et al. 1987b; Doherty en Gratton 1992; Louilot et al. 1986; Young et al. 1992, 1993). Het lijkt erop dat dopamine-neurotransmissie volgt op ten minste drie tijdschalen met steeds bredere rollen in gedrag, van de snelle, vrij beperkte functie van signaalbeloningen en waarschuwende stimuli via een tragere functie van het verwerken van een aanzienlijk aantal positief en negatief motiverende gebeurtenissen tot de tonische functie om een ​​grote verscheidenheid aan motorische, cognitieve en motivationele processen mogelijk te maken.

De tonische dopaminefunctie is gebaseerd op lage, aanhoudende, extracellulaire dopamineconcentraties in het striatum (5-10 nM) en andere met dopamine geïnnerveerde gebieden die voldoende zijn om extrasynaptische, meestal D2-type dopaminereceptoren te stimuleren in hun hoge affiniteitstoestand (9-74 nM; Fig. 8) (Richfield et al. 1989). Deze concentratie wordt lokaal gereguleerd binnen een nauw bereik door synaptische overloop en extrasynaptische dopamineafgifte geïnduceerd door tonische spontane impulsactiviteit, heropname transport, metabolisme, autoreceptor-gemedieerde afgifte en synthesecontrole, en presynaptische glutamaat invloed op dopamine-afgifte (Chesselet 1984). Het belang van omgevingsconcentraties van dopamine wordt experimenteel aangetoond door de schadelijke effecten van onfysiologische niveaus van receptorstimulatie. Verminderde dopamine-receptorstimulatie na laesies van dopamine-afferenten of lokale toediening van dopamine-antagonisten in de prefrontale cortex leiden tot verminderde prestaties van spatiale vertraagde reactietaken bij ratten en apen (Brozoski et al. 1979; Sawaguchi en Goldman-Rakic ​​1991; Simon et al. 1980). Interessant is dat verhogingen van de dopamineomzet van prefrontale cellen vergelijkbare stoornissen veroorzaken (Elliott et al. 1997; Murphy et al. 1996). Blijkbaar zou de tonische stimulatie van dopaminereceptoren niet te laag noch te hoog moeten zijn om een ​​optimale functie van een bepaald hersengebied te verzekeren. Het veranderen van de invloed van goed gereguleerde dopamine in de omgeving zou de correcte werking van striatale en corticale neuronen in gevaar brengen. Verschillende hersenregio's kunnen specifieke niveaus van dopamine vereisen voor het mediëren van specifieke gedragsfuncties. Er kan gespeculeerd worden dat omgevings-dopamineconcentraties ook nodig zijn om de striatale synaptische plasticiteit te handhaven die wordt geïnduceerd door een dopamine-beloningssignaal. Een rol van tonisch dopamine op synaptische plasticiteit wordt gesuggereerd door de schadelijke effecten van dopamine-receptorblokkade of D2-receptor knockout op posttetanische depressie (Calabresi et al. 1992a, 1997).

Talrijke andere neurotransmitters bestaan ​​ook in lage omgevingsconcentraties in de extracellulaire vloeistof, zoals glutamaat in striatum (0.9 μM) en cortex (0.6 μM) (Herrera-Marschitz et al. 1996). Dit kan voldoende zijn om hooggevoelige NMDA-receptoren te stimuleren (Sands en Barish 1989) maar niet andere typen glutamaatreceptoren (Kiskin et al. 1986). Ambient glutamaat faciliteert actiepotentiaalactiviteit via NMDA-receptorstimulatie in hippocampus (Sah et al. 1989) en activeert NMDA-receptoren in de hersenschors (Blanton en Kriegstein 1992). Tonische glutamaatniveaus worden gereguleerd door opname in de kleine hersenen en stijgen tijdens de fylogenese, waardoor neuronale migratie via NMDA-receptorstimulatie wordt beïnvloed (Rossi en Slater 1993). Andere neurotransmitters bestaan ​​ook in lage concentraties in de lucht, zoals aspartaat en GABA in striatum en frontale cortex (0.1 μM en 20 nM, respectievelijk) (Herrera-Marschitz et al. 1996), en adenosine in de hippocampus waar het betrokken is bij presynaptische remming (Manzoni et al. 1994). Hoewel onvolledig, suggereert deze lijst dat neuronen in veel hersenstructuren permanent worden gebaad in een soep van neurotransmitters die krachtige, specifieke, fysiologische effecten hebben op neuronale prikkelbaarheid.

Gezien het algemene belang van tonische extracellulaire concentraties van neurotransmitters, lijkt het erop dat het brede scala van symptomen van de ziekte van Parkinson niet te wijten zou zijn aan gebrekkige overdracht van beloningsinformatie door dopamineneuronen, maar een defect van striatale en corticale neuronen weerspiegelt als gevolg van verminderde werking door verminderde omgevingsdarmamine . Dopamine-neuronen zouden niet actief betrokken zijn bij het brede scala van processen die deficiënt zijn in parkinsonisme, maar eenvoudig de achtergrondconcentratie van dopamine verschaffen die noodzakelijk is om de goede werking van striatale en corticale neuronen die bij deze processen betrokken zijn, te handhaven.

Dankwoord

Ik dank Drs. Dana Ballard, Anthony Dickinson, Francois Gonon, David D. Potter, Traverse Slater, Roland E. Suri, Richard S. Sutton en R. Mark Wightman voor het verlichten van discussies en opmerkingen, en ook twee anonieme scheidsrechters voor uitgebreide opmerkingen.

Het experimentele werk werd ondersteund door de Zwitserse National Science Foundation (momenteel 31.43331.95), de Human Capital en Mobility en de Biomed 2-programma's van de Europese Gemeenschap via het Zwitserse Bureau voor Onderwijs en Wetenschap (CHRX-CT94-0463 via 93.0121 en BMH4-CT95 -0608 via 95.0313-1), de James S. McDonnell Foundation, de Roche Research Foundation, de United Parkinson Foundation (Chicago) en de British Council.

REFERENTIES

    1. Abercrombie ED,
    2. Keefe KA,
    3. DiFrischia DS,
    4. Zigmond MJ

    (1989) Differentiaaleffect van stress op in vivo dopamine-afgifte in striatum, nucleus accumbens en mediale frontale cortex. J. Neurochem. 52: 1655-1658.

    1. Ahlenius S.

    (1974) Effecten van lage en hoge doses L-dopa op de door tetrabenazine of a-methyltyrosine geïnduceerde onderdrukking van gedrag in een opeenvolgende discriminatietaak. Psychopharmacologia 39: 199-212.

    1. Alexander GE,
    2. DeLong MR,
    3. Strick PL

    (1986) Parallelle organisatie van functioneel gescheiden circuits die basale ganglia en cortex met elkaar verbinden. Annu. Rev Neurosci. 9: 357-381.

    1. Amalric M.,
    2. Koob GF

    (1987) Uitputting van dopamine in de caudate nucleus maar niet in nucleus accumbens schaadt de reactietijdprestaties. J. Neurosci. 7: 2129-2134.

    1. Andén NE,
    2. Fuxe K.,
    3. Hamberger B.,
    4. Hökfelt T. A

    (1966) kwantitatief onderzoek naar de nigro-neostriatale dopamine-neuronen. Acta Physiol. Scand. 67: 306-312.

    1. Anglade P.,
    2. Mouatt-Prigent A.,
    3. Agid Y.,
    4. Hirsch EC

    (1996) Synaptische plasticiteit in de caudate nucleus van patiënten met de ziekte van Parkinson. neurodegeneratie 5: 121-128.

    1. Aosaki T.,
    2. Tsubokawa H.,
    3. Ishida A.,
    4. Watanabe K.,
    5. Graybiel AM,
    6. Kimura M.

    (1994) Reacties van tonisch actieve neuronen in het striatum van de primaat ondergaan systematische veranderingen tijdens gedragsgevoelige sensorimotorische conditionering. J. Neurosci. 14: 3969-3984.

    1. Apicella P.,
    2. Legallet E.,
    3. Trouche E.

    (1996) Antwoorden van tonisch ontladen neuronen in striatum van de aap tot visuele stimuli gepresenteerd onder passieve omstandigheden en tijdens taakuitvoering. Neurosci. Lett. 203: 147-150.

    1. Apicella P.,
    2. Legallet E.,
    3. Trouche E.

    (1997) Antwoorden van tonisch ontladen neuronen in het striatum van de aap tot primaire beloningen die tijdens verschillende gedragstoestanden worden afgegeven. Exp. Brain Res. 116: 456-466.

    1. Apicella P.,
    2. Ljungberg T.,
    3. Scarnati E.,
    4. Schultz W.

    (1991a) Reacties op beloning in dorsale en ventrale striatum van de aap. Exp. Brain Res. 85: 491-500.

    1. Apicella P.,
    2. Scarnati E.,
    3. Ljungberg T.,
    4. Schultz W.

    (1992) Neuronale activiteit in striatum van de aap in verband met de verwachting van voorspelbare milieu-incidenten. J. Neurophysiol. 68: 945-960.

    1. Apicella P.,
    2. Scarnati E.,
    3. Schultz W.

    (1991b) Tonisch ontladende neuronen van het striatum van de aap reageren op voorbereidende en belonende stimuli. Exp. Brain Res. 84: 672-675.

    1. Arbib MA,
    2. Dominey PF

    (1995) Modellering van de rollen van de basale ganglia bij de timing en sequencing van saccadische oogbewegingen. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 149-162.

    1. Arbuthnott GW,
    2. Ingham CA

    (1993) Het netelige probleem van wat dopamine doet bij psychiatrische aandoeningen. Prog. Brain Res. 99: 341-350.

    1. Aston-Jones G.,
    2. Bloom FE

    (1981) Norepinephrine-bevattende locus coeruleus-neuronen in gedragende ratten vertonen uitgesproken responsen op niet-irritante omgevingsstimuli. J. Neurosci. 1: 887-900.

    1. Aston-Jones G.,
    2. Rajkowski J.,
    3. Kubiak P.

    (1997) Geconditioneerde reacties van apen locus coeruleus neuronen anticiperen op de verwerving van onderscheidend gedrag in een waakzaamheidstaak. Neurowetenschap leerprogramma 80: 697-716.

    1. Aston-Jones G.,
    2. Rajkowski J.,
    3. Kubiak P.,
    4. Alexinsky T.

    (1994) Locus coeruleus neuronen in een aap worden selectief geactiveerd door bijgewoonde aanwijzingen in een waaktaak. J. Neurosci. 14: 4467-4480.

    1. Ballard DH

    (1997) Een inleiding tot neuraal computergebruik. (MIT Press, Cambridge, MA).

    1. Barto AG

    (1995) Adaptieve critici en de basale ganglia. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 215-232.

    1. Barto AG,
    2. Anandan P.

    (1985) Patroonherkenning van stochastische leerautomaten. IEEE Trasnact. Syst. Man Cybern. 15: 360-375.

    1. Barto AG,
    2. Sutton RS,
    3. Anderson CW

    (1983) Neuron-achtige adaptieve elementen die moeilijke leerproblemen kunnen oplossen. IEEE Trans Syst. Man Cybernet. 13: 834-846.

    1. Beninger RJ

    (1983) De rol van dopamine in locomotorische activiteit en leren. Brain Res. Rev. 6: 173-196.

    1. Beninger RJ

    (1989) Dissociëren van de effecten van veranderde dopaminerge functie op prestaties en leren. Brain Res. Bull. 23: 365-371.

    1. Beninger RJ,
    2. Cheng M.,
    3. Hahn BL,
    4. Hoffman DC,
    5. Mazurski EJ

    (1987) Effecten van extinctie, pimozide, SCH 23390 en metoclopramide op voedsel-beloonde operante reactie van ratten. Psychopharmacology 92: 343-349.

    1. Beninger RJ,
    2. Hahn BL

    (1983) Pimozide blokkeert vestiging, maar geen expressie van door amfetamine geproduceerde omgevingsspecifieke conditionering. Wetenschap 220: 1304-1306.

    1. Berendse HW,
    2. Groenewegen HJ,
    3. Lohman AHM

    (1992) Compartimentele verdeling van ventrale striatale neuronen die naar het mesencefalon in de rat projecteren. J. Neurosci. 12: 2079-2103.

    1. Berger B.,
    2. Trottier S.,
    3. Verney C.,
    4. Gaspar P.,
    5. Alvarez C.

    (1988) Regionale en laminaire verdeling van de innervatie van dopamine en serotonine in de makaken cerebrale cortex: een radioautografisch onderzoek. J. Comp. Neurol. 273: 99-119.

    1. Bergson C.,
    2. Mrzljak L.,
    3. Smiley JF,
    4. Pappy M.,
    5. Levenson R.,
    6. Goldman-Rakic ​​PS

    (1995) Regionale, cellulaire en subcellulaire variaties in de distributie van D1 en D5 dopaminereceptoren in het brein van de primaat. J. Neurosci. 15: 7821-7836.

    1. Berthier NE,
    2. Moore JW

    (1990) Activiteit van diepe cerebellaire nucleaire cellen tijdens klassieke conditionering van nictiterende membraanexpansie bij konijnen. Exp. Brain Res. 83: 44-54.

    1. Bindra D.

    (1968) Neuropsychologische interpretatie van de effecten van drive en motivatie-motivatie op algemene activiteit en instrumenteel gedrag. Psychol. Rev. 75: 1-22.

    1. Blanton MG,
    2. Kriegstein AR

    (1992) Eigenschappen van aminozuur neurotransmitterreceptoren van embryonale corticale neuronen indien geactiveerd door exogene en endogene agonisten. J. Neurophysiol. 67: 1185-1200.

    1. Boeijinga PH,
    2. Mulder AB,
    3. Pennartz CMA,
    4. Manshanden I.,
    5. Lopes da Silva FH

    (1993) Antwoorden van de nucleus accumbens na fornix / fimbria-stimulatie bij de rat. Identificatie en langetermijnpotentiatie van mono- en polysynaptische routes. Neurowetenschap leerprogramma 53: 1049-1058.

    1. Bolam JP,
    2. Francis CM,
    3. Henderson Z.

    (1991) Cholinerge input voor dopamine-neuronen in de substantia nigra: een dubbel immunocytochemisch onderzoek. Neurowetenschap leerprogramma 41: 483-494.

    1. Bolles RC

    (1972) Versterking, verwachting en leren. Psychol. Rev. 79: 394-409.

    1. Bowman EM,
    2. Aigner TG,
    3. Richmond BJ

    (1996) Neurale signalen in het apenventrale striatum met betrekking tot motivatie voor sap- en cocaïneroningen. J. Neurophysiol. 75: 1061-1073.

    1. Bouyer JJ,
    2. Park DH,
    3. Joh TH,
    4. Pickel VM

    (1984) Chemische en structurele analyse van de relatie tussen corticale inputs en tyrosine hydroxylase-bevattende terminals in rattenneostriatum. Brain Res. 302: 267-275.

    1. Brown JR,
    2. Arbuthnott GW

    (1983) De elektrofysiologie van dopamine (D.2) receptoren: een onderzoek naar de werking van dopamine op corticostriatale transmissie. Neurowetenschap leerprogramma 10: 349-355.

    1. Brozoski TJ,
    2. Bruine RM,
    3. Rosvold HE,
    4. Goldman PS

    (1979) Cognitief tekort veroorzaakt door regionale uitputting van dopamine in de prefrontale cortex van rhesusaap. Wetenschap 205: 929-932.

    1. Caillé I.,
    2. Dumartin B.,
    3. Bloch B.

    (1996) Ultrastructurele lokalisatie van D1 dopamine receptor immunoreactiviteit in ratten striatonigrale neuronen en de relatie ervan met dopaminerge innervatie. Brain Res. 730: 17-31.

    1. Calabresi P.,
    2. Maj R.,
    3. Pisani A.,
    4. Mercuri NB,
    5. Bernardi G.

    (1992a) Lange termijn synaptische depressie in het striatum: fysiologische en farmacologische karakterisatie. J. Neurosci. 12: 4224-4233.

    1. Calabresi P.,
    2. Pisani A.,
    3. Mercuri NB,
    4. Bernardi G.

    (1992b) Langetermijnpotentiatie in het striatum wordt ontmaskerd door het spanningsafhankelijke magnesiumblok van NMDA-receptorkanalen te verwijderen. EUR. J. Neurosci. 4: 929-935.

    1. Calabresi P.,
    2. Saiardi A.,
    3. Pisani A.,
    4. Baik JH,
    5. Centonze D.,
    6. Mercuri NB,
    7. Bernardi G.,
    8. Borelli E.

    (1997) Abnormale synaptische plasticiteit in het striatum van muizen zonder dopamine D2-receptoren. J. Neurosci. 17: 4536-4544.

    1. Canavan AGM,
    2. Passingham RE,
    3. Marsden CD,
    4. Quinn N.,
    5. Wyke M.,
    6. Polkey CE

    (1989) De prestaties op leertaken van patiënten in de vroege stadia van de ziekte van Parkinson. Neuropsychologia 27: 141-156.

    1. Cepeda C.,
    2. Buchwald NA,
    3. Levine MS

    (1993) Neuromodulerende werkingen van dopamine in het neostriatum zijn afhankelijk van de geactiveerde stimulerende aminaozuurreceptorsubtypen. Proc. Natl. Acad. Sci. Verenigde Staten van Amerika 90: 9576-9580.

    1. Cepeda C.,
    2. Chandler SH,
    3. Shumate LW,
    4. Levine MS

    (1995) Persistent Na+ geleiding in middelgrote neostriatale neuronen: karakterisatie met behulp van infrarood-videomicroscopie en patch-clamp-opnamen van hele cellen. J. Neurophysiol. 74: 1343-1348.

    1. Cepeda C.,
    2. Colwell CS,
    3. Itri JN,
    4. Chandler SH,
    5. Levine MS

    (1998) Dopaminergische modulatie van NMDA-geïnduceerde volumestromen in neostriatale neuronen in plakjes: bijdrage van calciumgeleidingsvermogen. J. Neurophysiol. 79: 82-94.

    1. Chergui K.,
    2. Suaud-Chagny MF,
    3. Gonon F.

    (1994) Niet-lineaire relatie tussen impulsstroom, dopamineafgifte en dopamine-eliminatie in de hersenen van de rat in vivo. Neurowetenschappen 62: 641-645.

    1. Chesselet MF

    (1984) Presynaptische regulatie van afgifte van neurotransmitters in de hersenen: feiten en hypothese. Neurowetenschap leerprogramma 12: 347-375.

    1. Kerk WH,
    2. Justitie JB Jr.,
    3. Byrd LD

    (1987) Extracellulair dopamine in het striatum van de rat na remming van de opname door cocaïne, nomifensine en benztropine. EUR. J. Pharmacol. 139: 345-348.

    1. Kerk WH,
    2. Justitie JB Jr.,
    3. Neill DB

    (1987) Detecteren van gedragsrelevante veranderingen in extracellulair dopamine met microdialyse. Brain Res. 412: 397-399.

    1. Clarke PBS,
    2. Hommer DW,
    3. Pert A.,
    4. Skirboll LR

    (1987) Innervatie van substantia nigra-neuronen door cholinerge afferenten van de pedunculopontinekern in de rat: neuro-anatomisch en elektrofysiologisch bewijs. Neurowetenschap leerprogramma 23: 1011-1019.

    1. Colle WM,
    2. Verstandige RA

    (1980) Effecten van nucleus accumbens amfetamine op laterale hypothalamus hersenstimulatiebeloning. Brain Res. 459: 356-360.

    1. Contreras-Vidal JL,
    2. Schultz W. A

    (1996) neuraal netwerkmodel van beloningsgerelateerd leer-, motivatie- en oriëntatiegedrag. Soc. Neurosci. Abstr. 22: 2029.

    1. Corbett D.,
    2. Verstandige RA

    (1980) Intracraniale zelfstimulatie in relatie tot de stijgende dopaminerge systemen van de middenhersenen: een onderzoek met beweegbare micro-elektroden. Brain Res. 185: 1-15.

    1. Corvaja N.,
    2. Doucet G.,
    3. Bolam JP

    (1993) Ultrastructuur en synaptische doelen van de raphe-nigrale projectie bij de rat. Neurowetenschap leerprogramma 55: 417-427.

    1. Dehaene S.,
    2. Changeux J.-P.

    (1991) De Wisconsin Card Sorting Test: theoretische analyse en modellering in een neuronaal netwerk. Cerebr. schors 1: 62-79.

    1. Delaney K.,
    2. Gelperin A.

    (1986) Post-inname van voedsel-afkeer leren tot aminozuren deficiënte diëten door de terrestrische slak Limax maximus. J. Comp. Physiol. [EEN] 159: 281-295.

    1. DeLong MR,
    2. Crutcher MD,
    3. Georgopoulos AP

    (1983) Relaties tussen beweging en ontlasting van een enkele cel in de substantia nigra van de gedragen aap. J. Neurosci. 3: 1599-1606.

    1. Di Chiara G.

    (1995) De rol van dopamine bij drugsmisbruik vanuit het perspectief van zijn rol in motivatie. Drug Alcohol Depend. 38: 95-137.

    1. Dickinson A.

    (1980) Hedendaagse dierleren theorie. (Cambridge Univ. Press, Cambridge, VK).

    1. Dickinson A.,
    2. Balleine B.

    (1994) Motiverende controle van doelgerichte actie. Anim. Leren. Behav. 22: 1-18.

    1. Dickinson A.,
    2. Hal G.,
    3. Mackintosh NJ

    (1976) Verrassing en de verzwakking van het blokkeren. J. Exp. Psychol. Anim. Behav. Proc. 2: 313-322.

    1. Doherty MD,
    2. Gratton A.

    (1992) Hoge snelheid chronoamperometrische metingen van mesolimbische en nigrostriatale dopamine-afgifte geassocieerd met herhaalde dagelijkse stress. Brain Res. 586: 295-302.

    1. Dominey P.,
    2. Arbib M.,
    3. Joseph J.-P. EEN

    (1995) model van corticostriatale plasticiteit voor het leren van oculomotorische associaties en sequenties. J. Cognit. Neurosci. 7: 311-336.

    1. Doucet G.,
    2. Descarries L.,
    3. Garcia S.

    (1986) Kwantificering van de innervatie van dopamine bij neostriatum bij volwassen ratten. Neurowetenschap leerprogramma 19: 427-445.

    1. Dugast C.,
    2. Suaud-Chagny MF,
    3. Gonon F.

    (1994) Continue in vivo monitoring van opgewekte dopamine-afgifte in de rattenkern accumbens met amperometrie. Neurowetenschap leerprogramma 62: 647-654.

    1. Edmonds DE,
    2. Gallistel CR

    (1977) Beloning versus prestaties bij zelfstimulering: elektrode-specifieke effecten van α-methyl-p-tyrosine op beloning bij de rat. J. Comp. Physiol. Psychol. 91: 962-974.

    1. Elliott R.,
    2. Sahakian BJ,
    3. Matthews K.,
    4. Bannerjea A.,
    5. Rimmer J.,
    6. Robbins TW

    (1997) Effecten van methylfenidaat op het ruimtelijk werkgeheugen en planning bij gezonde jonge volwassenen. Psychopharmacology 131: 196-206.

    1. Ettenberg A.

    (1989) Dopamine, neuroleptica en versterkt gedrag. Neurosci. Biobehav. Rev. 13: 105-111.

    1. Fagg AH

    (1993) Versterkingstesten voor robot bereiken en grijpen. in Nieuwe perspectieven in de beheersing van de Reach to Grasp-beweging, eds Bennet KMB, Castiello U. (Noord-Holland, Amsterdam), pp 281-308.

    1. Fagg AH,
    2. Arbib MA A

    (1992) model van primaat visueel-motorisch conditioneel leren. Zich aanpassen. Behav. 1: 3-37.

    1. Fibiger HC,
    2. LePiane FG,
    3. Jakubovic A.,
    4. Phillips AG

    (1987) De rol van dopamine bij intracraniële zelfstimulatie van het ventrale tegmentale gebied. J. Neurosci. 7: 3888-3896.

    1. Fibiger HC,
    2. Miller JJ

    (1977) Een anatomisch en elektrofysiologisch onderzoek van de serotonergische projectie van de dorsale raphé-kern naar de substantia nigra bij de rat. Neurowetenschap leerprogramma 2: 975-987.

    1. Fibiger HC,
    2. Phillips AG

    Beloning, motivatie, cognitie: psychobiologie van mesotelencefale dopamine-systemen. Handboek voor fysiologie. Het nerveuze systeem. Intrinsieke Reguleringssystemen van Brain.1986Am. Physiol. Soc.Bethesda, MA, sekte. 1, vol. IV, p. 647-675.

    1. Filion M.,
    2. Tremblay L.,
    3. Bédard PJ

    (1988) Abnormale invloeden van passieve ledemaatbeweging op de activiteit van globus pallidus-neuronen bij de aap van de Parkinson. Brain Res. 444: 165-176.

    1. Flaherty AW,
    2. Graybiel A.

    (1993) Twee invoersystemen voor lichaamsrepresentaties in de striatale matrix van de primaat: experimenteel bewijs in de eekhoornaap. J. Neurosci. 13: 1120-1137.

    1. Flaherty AW,
    2. Graybiel A.

    (1994) Input-output organisatie van het sensorimotorische striatum in de eekhoornaap. J. Neurosci. 14: 599-610.

    1. Bloemen K.,
    2. Downing AC

    (1978) Voorspellende controle van oogbewegingen bij de ziekte van Parkinson. Ann. Neurol. 4: 63-66.

    1. Foote SL,
    2. Aston-Jones G.,
    3. Bloom FE

    (1980) Impulsactiviteit van locus coeruleus-neuronen bij wakkere ratten en apen is een functie van sensorische stimulatie en opwinding. Proc. Natl. Acad. Sci. Verenigde Staten van Amerika 77: 3033-3037.

    1. Freund TF,
    2. Powell JF,
    3. Smith AD

    (1984) Tyrosine hydroxylase-immunoreactieve boutonen in synaptisch contact met geïdentificeerde striatonigrale neuronen, met bijzondere verwijzing naar dendritische spines. Neurowetenschap leerprogramma 13: 1189-1215.

    1. Frey U.,
    2. Schroeder H.,
    3. Matthies H.

    (1990) Dopaminerge antagonisten voorkomen langdurig onderhoud van posttetanisch LTP in het CA1-gebied van plakjes hippocampus. Brain Res. 522: 69-75.

    1. Friston KJ,
    2. Tononi G.,
    3. Reeke GN Jr.,
    4. Sporns O.,
    5. Edelman GM

    (1994) Waarde-afhankelijke selectie in de hersenen: simulatie in een synthetisch neuraal model. Neurowetenschap leerprogramma 59: 229-243.

    1. Fujita K.

    (1987) Soortherkenning door vijf makaken. primaten 28: 353-366.

    1. Furiezos G.,
    2. Verstandige RA

    (1976) Pimozide-geïnduceerde extinctie van intracraniële zelfstimulatie: reactiepatronen sluiten motor- of prestatietekorten uit. Brain Res. 103: 377-380.

    1. Futami T.,
    2. Takakusaki K.,
    3. Kitai ST

    (1995) Glutamaterge en cholinerge inputs van de pedunculopontine tegmentale kern naar dopamine-neuronen in de substantia nigra pars compacta. Neurosci. Res. 21: 331-342.

    1. Gallistel CR

    (1990) De organisatie van leren. (MIT Press, Cambridge, MA).

    1. Garcia CE,
    2. Prett DM,
    3. Morari M.

    (1989) Model voorspellende controle: theorie en praktijk-een enquête. Automatica 25: 335-348.

    1. Garcia-Munoz M.,
    2. Jonge SJ,
    3. Groves P.

    (1992) Presynaptische veranderingen op de lange termijn in de prikkelbaarheid van de corticostriatale route. Neuroreport 3: 357-360.

    1. Gariano RF,
    2. PM van Groves

    (1988) Burst vuren in de dopamineneuronen van de middenhersenen door stimulatie van de mediale prefrontale en anterior cingulate cortices. Brain Res. 462: 194-198.

    1. Garris PA,
    2. Ciolkowski EL,
    3. Pastore P.,
    4. Wightman RM

    (1994a) Efflux van dopamine uit de synaptische spleet in de nucleus accumbens van de hersenen van de rat. J. Neurosci. 14: 6084-6093.

    1. Garris PA,
    2. Ciolkowski EL,
    3. Wightman RM

    (1994b) Heterogeniteit van opgewekte dopamine-overloop in de striatale en striatoamygdaloidegebieden. Neurowetenschap leerprogramma 59: 417-427.

    1. Garris PA,
    2. Wightman RM

    (1994) Verschillende kinetica bepalen dopaminerge transmissie in de amygdala, prefrontale cortex en striatum: een in vivo voltametrische studie. J. Neurosci. 14: 442-450.

    1. Gerfen CR

    (1984) Het neostriatale mozaïek: compartimentering van corticostriatale input en striatonigrale outputsystemen. NATUUR 311: 461-464.

    1. Gerfen CR,
    2. Engber TM,
    3. Mahan LC,
    4. Susel Z.,
    5. Chase TN,
    6. Monsma FJ Jr.,
    7. Sibley DR

    (1990) D1 en D2 dopamine receptor-gereguleerde genexpressie van striatonigrale en striatopallidal neuronen. Wetenschap 250: 1429-1432.

    1. Duitse DC,
    2. Dubach M.,
    3. Askari S.,
    4. Speciale SG,
    5. Bowden DM

    (1988) 1-methyl-4-fenyl-1,2,3,6-tetrahydropyridine (MPTP) -geïnduceerd parkinsonsyndroom bij macaca fascicularis: welke dopaminerge neuronen in de hersenen gaan verloren? Neurowetenschap leerprogramma 24: 161-174.

    1. Gilbert PFC,
    2. Thach WT

    (1977) Purkinje-celactiviteit tijdens motorisch leren. Brain Res. 128: 309-328.

    1. Giros B.,
    2. Jaber M.,
    3. Jones SR,
    4. Wightman RM,
    5. Caron MG

    (1996) Hyperlokomie en onverschilligheid voor cocaïne en amfetamine bij muizen zonder de dopaminetransporteur. NATUUR 379: 606-612.

    1. Goldman-Rakic ​​PS,
    2. Leranth C.,
    3. Williams MS,
    4. Mons N.,
    5. Geffard M.

    (1989) Dopamine synaptisch complex met pyramidale neuronen in de hersenschors van de primaat. Proc. Natl. Acad. Sci. Verenigde Staten van Amerika 86: 9015-9019.

    1. Gonon F.

    (1988) Niet-lineaire relatie tussen impulsstroom en dopamine afgegeven door dopaminerge neuronen van rattenbrein, zoals bestudeerd door in vivo elektrochemie. Neurowetenschap leerprogramma 24: 19-28.

    1. Gonon F.

    (1997) Langdurige en extrasynaptische exciterende werking van dopamine gemedieerd door D1-receptoren in het striatum van de rat in vivo. J. Neurosci. 17: 5972-5978.

    1. Gonzales C.,
    2. Chesselet M.-F.

    (1990) Amygdalonigral pathway: een anterograde studie bij de rat met Phaseolus vulgaris Leucoagglutinine (PHA-L). J. Comp. Neurol. 297: 182-200.

    1. Grace AA

    (1991) Fasische versus tonische dopamine-afgifte en de modulatie van dopamine-systeemresponsiviteit: een hypothese voor de etiologie van schizofrenie. Neurowetenschap leerprogramma 41: 1-24.

    1. Grace AA,
    2. Bunney BS

    (1985) Tegengestelde effecten van striatonigrale feedbackroutes op de activiteit van de dopaminencellen in de middenhersenen. Brain Res. 333: 271-284.

    1. Graybiel AM,
    2. Aosaki T.,
    3. Flaherty AW,
    4. Kimura M.

    (1994) De basale ganglia en adaptieve motorbesturing. Wetenschap 265: 1826-1831.

    1. PM van Groves,
    2. Garcia-Munoz M.,
    3. Linder JC,
    4. Manley MS,
    5. Martone ME,
    6. Young SJ

    (1995) Elementen van de intrinsieke organisatie en informatieverwerking in het neostriatum. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 51-96.

  • Gullapalli, V., Barto, A.G., en Grupen, R. A. Learning admittance mapping voor gedwongen assemblage. In: Proceedings van de 1994 International Conference on Robotics and Automation. Los Alamitos, CA: Computer Society Press, 1994, p. 2633-2638.
    1. Haber SN,
    2. Lynd E.,
    3. Klein C.,
    4. Groenewegen HJ

    (1990) Topografische organisatie van de ventrale striatale efferente projecties in de rhesusaap: een autoradiografisch opsporingsonderzoek. J. Comp. Neurol. 293: 282-298.

    1. Haber S.,
    2. Lynd-Balta E.,
    3. Mitchell SJ

    (1993) De organisatie van de dalende ventrale pallidale projecties in de aap. J. Comp. Neurol. 329: 111-128.

    1. Hammer M.

    (1993) Een geïdentificeerd neuron bemiddelt de ongeconditioneerde stimulus in associatief olfactorisch leren bij honingbijen. NATUUR 366: 59-63.

    1. Hammond C.,
    2. Shibazaki T.,
    3. Rouzaire-Dubois B.

    (1983) Vertakte outputneuronen van de subthalamische nucleus van de rat: elektrofysiologisch onderzoek van de synaptische effecten op geïdentificeerde cellen in de twee belangrijkste doelkernen, de entopedunculaire kern en de substantia nigra. Neurowetenschap leerprogramma 9: 511-520.

    1. Hattori T.,
    2. Fibiger HC,
    3. McGeer PL

    (1975) Demonstratie van een pallido-nigrale projectie voor de innervatie van dopaminerge neuronen. J. Comp. Neurol. 162: 487-504.

    1. Hedreen JC,
    2. DeLong MR

    (1991) Organisatie van striatopallidal, striatonigral en nigrostriatal projecties in de makaak. J. Comp. Neurol. 304: 569-595.

    1. Hernandez-Lopez S.,
    2. Bargas J.,
    3. Surmeier DJ,
    4. Reyes A.,
    5. Galarraga E.

    (1997) D1-receptoractivering verbetert evoked ontlading in neostriatale medium stekelige neuronen door het moduleren van een L-type Ca2+ geleiding. J. Neurosci. 17: 3334-3342.

    1. Herrera-Marschitz M.,
    2. Jij ZB,
    3. Goiny M.,
    4. Meana JJ,
    5. Silveira R.,
    6. Godukhin OV,
    7. Chen Y.,
    8. Espinoza S.,
    9. Pettersson E.,
    10. Loidl CF,
    11. Lubec G.,
    12. Andersson K.,
    13. Nylander I.,
    14. Terenius L.,
    15. Ungerstedt U.

    (1996) Over de oorsprong van extracellulaire glutamaatniveaus gevolgd in de basale ganglia van de rat door in vivo microdialyse. J. Neurochem. 66: 1726-1735.

    1. Hersch SM,
    2. Ciliax BJ,
    3. Gutekunst C.-A.,
    4. Rees HD,
    5. Heilman CJ,
    6. Yung KKL,
    7. Bolam JP,
    8. Ince E.,
    9. Yi H.,
    10. Levey AI

    (1995) Elektronenmicroscopische analyse van D1- en D2-dopaminereceptoreiwitten in het dorsale striatum en hun synaptische relaties met motorische corticostriatale afferenten. J. Neurosci. 15: 5222-5237.

    1. Heym J.,
    2. Trulson ME,
    3. Jacobs BL

    (1982) De activiteit van eenheden in vrij bewegende katten: effecten van fasische auditieve en visuele stimuli. Brain Res. 232: 29-39.

    1. Hikosaka O.,
    2. Sakamoto M.,
    3. Usui S.

    (1989) Functionele eigenschappen van aap caudate neuronen. III. Activiteiten die verband houden met de verwachting van doelwit en beloning. J. Neurophysiol. 61: 814-832.

    1. Hollerman JR,
    2. Schultz W.

    (1996) Activiteit van dopamine-neuronen tijdens het leren in een vertrouwde taakcontext. Soc. Neurosci. Abstr. 22: 1388.

    1. Hollerman JR,
    2. Tremblay L.,
    3. Schultz W.

    (1994) Beloningsafhankelijkheid van verschillende soorten neuronale activiteit in het striatum van een primaat. Soc. Neurosci. Abstr. 20: 780.

    1. Holstein GR,
    2. Pasik P.,
    3. Hamori J.

    (1986) Synapsen tussen GABA-immuunreactieve axonale en dendritische elementen in monkey substantia nigra. Neurosci. Lett. 66: 316-322.

    1. Hoover JE,
    2. Strick PL

    (1993) Meerdere uitgangskanalen in de basale ganglia. Wetenschap 259: 819-821.

    1. Horvitz JC,
    2. Stewart T.,
    3. Jacobs BL

    (1997) Burst-activiteit van ventrale tegmentale dopamine-neuronen wordt opgewekt door sensorische stimuli bij de wakkere kat. Brain Res. 759: 251-258.

    1. Houk JC,
    2. Adams JL,
    3. Barto AG A

    (1995) model van hoe de basale ganglia neurale signalen genereren en gebruiken die versterking voorspellen. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 249-270.

    1. Houk JC,
    2. Buckingham JT,
    3. Barto AG

    (1996) Modellen van het cerebellum en motorisch leren. Behav. Brain Sci. 19: 368-383.

    1. Hrupka BJ,
    2. Lin YM,
    3. Gietzen DW,
    4. Rogers QR

    (1997) Kleine veranderingen in essentiële aminozuurconcentraties veranderen de voedingsselectie bij aminozuur-deficiënte ratten. J. Nutr. 127: 777-784.

    1. Hull CL

    (1943) Principles of Behavior. (Appleton-Century-Crofts, New York).

    1. Ingham CA,
    2. Hood SH,
    3. Weenink A.,
    4. Van Maldegem B.,
    5. Arbuthnott GW

    (1993) Morfologische veranderingen in het neostriatum van de rat na eenzijdige injecties met 6-hydroxydopamine in de nigrostriatale route. Exp. Brain Res. 93: 17-27.

    1. Ito M.

    (1989) Langdurige depressie. Annu. Rev Neurosci. 12: 85-102.

    1. Jacobs BL,
    2. Fornal CA

    (1993) 5-HT en motorbesturing: een hypothese. Trends Neurosci. 16: 346-352.

    1. Jimenez-Castellanos J.,
    2. Graybiel AM

    (1989) Bewijs dat histochemisch onderscheiden zones van de primia substantia nigra pars compacta gerelateerd zijn aan patroonverdelingen van nigrostriatale projectie-neuronen en striatonigrale vezels. Exp. Brain Res. 74: 227-238.

    1. Kalman RE A

    (1960) nieuwe benadering van lineaire filter- en voorspellingsproblemen. J. Basic Eng. Trans. ZOALS IK 82: 35-45.

  • Kamin, L. J. Selectieve associatie en conditionering. In: Fundamentele kwesties in instrumenteel leren, uitgegeven door N. J. Mackintosh en W. K. Honig. Halifax, Canada: Dalhousie University Press, 1969, p. 42-64.
    1. Kawagoe KT,
    2. Garris PA,
    3. Wiedemann DJ,
    4. Wightman RM

    (1992) Regulatie van transiënte dopamineconcentratiegradiënten in de micro-omgeving rond zenuwuiteinden in het striatum van de rat. Neurowetenschap leerprogramma 51: 55-64.

    1. Kawaguchi Y.,
    2. Wilson CJ,
    3. Emson PC

    (1989) Intracellulaire opname van geïdentificeerde neostriatale pleister- en matrix-cellen in een schijfje preparaat met behoud van corticale inputs. J. Neurophysiol. 62: 1052-1068.

    1. Kawato M.,
    2. Gomi H.

    (1992) Het cerebellum en VOR / OKR-leermodellen. Trends Neurosci. 15: 445-453.

    1. Kiskin NI,
    2. Krishtal OA,
    3. Tsyndrenko AY

    (1986) Excitatorische aminozuurreceptoren in hippocampale neuronen: kaïnaat slaagt er niet in ze ongevoelig te maken. Neurosci. Lett. 63: 225-230.

    1. Klopf AH

    (1982) The Hedonistic Neuron: A Theory of Memory, Learning and Intelligence. (Halfrond, Washington, DC).

    1. Knowlton BJ,
    2. Mangels JA,
    3. Squire LR A

    (1996) neostriataal leersysteem van de gewoonte bij mensen. Wetenschap 273: 1399-1402.

    1. Künzle H.

    (1978) Een autoradiografische analyse van de efferente verbindingen van premotorische en aangrenzende prefrontale gebieden (gebieden 6 en 9) in Macaca fascicularis. Hersenen Gedrag. Evol. 15: 185-234.

    1. LeMoal M.,
    2. Olds ME

    (1979) Perifere auditieve input voor het limbische gebied van de middenhersenen en aanverwante structuren. Brain Res. 167: 1-17.

    1. LeMoal M.,
    2. Simon H.

    (1991) Mesocorticolimbisch dopaminerge netwerk: functionele en regelgevende rollen. Physiol. Rev. 71: 155-234.

    1. Levey AI,
    2. Hersch SM,
    3. Rye DB,
    4. Sunahara RK,
    5. Niznik HB,
    6. Kitt CA,
    7. Prijs DL,
    8. Maggio R.,
    9. Brann MR,
    10. Ciliax BJ

    (1993) Lokalisatie van D1- en D2-dopaminereceptoren in de hersenen met subtypespecifieke antilichamen. Proc. Natl. Acad. Sci. Verenigde Staten van Amerika 90: 8861-8865.

    1. Linden A.,
    2. Bracke-Tolkmitt R.,
    3. Lutzenberger W.,
    4. Canavan AGM,
    5. Scholz E.,
    6. Diener HC,
    7. Birbaumer N.

    (1990) Langzame corticale potentialen bij parkinsonpatiënten gedurende een associatieve leertaak. J. Psychophysiol. 4: 145-162.

    1. Ljungberg T.,
    2. Apicella P.,
    3. Schultz W.

    (1991) Antwoorden van dopamineneuronen van aap-middenbreinen tijdens vertraagde afwisselingsprestaties. Brain Res. 586: 337-341.

    1. Ljungberg T.,
    2. Apicella P.,
    3. Schultz W.

    (1992) Antwoorden van aap-dopamine-neuronen tijdens het leren van gedragsreacties. J. Neurophysiol. 67: 145-163.

    1. Llinas R.,
    2. Welsh JP

    (1993) Over het cerebellum en motorisch leren. Curr. Opin. Neurobiol. 3: 958-965.

    1. Lohman AHM,
    2. Van Woerden-Verkley I.

    (1978) Opgaande verbindingen naar de voorhersenen in de tegu hagedis. J. Comp. Neurol. 182: 555-594.

    1. Louilot A.,
    2. LeMoal M.,
    3. Simon H.

    (1986) Differentiële reactiviteit van dopaminerge neuronen in de nucleus accumbens in reactie op verschillende gedragssituaties. Een in vivo voltametrische studie bij vrij bewegende ratten. Brain Res. 397: 395-400.

    1. Lovibond PF

    (1983) Facilitering van instrumenteel gedrag door een Pavlovische stimulus stimulerend met smaak. J. Exp. Psychol. Anim. Behav. Proc. 9: 225-247.

    1. Lovinger DM,
    2. Tyler EC,
    3. Merritt A.

    (1993) Synaptische depressie op korte en lange termijn bij neostriatum bij ratten. J. Neurophysiol. 70: 1937-1949.

    1. Lynd-Balta E.,
    2. Haber SN

    (1994) Primaire striatonigrale projecties: een vergelijking van het sensorimotor-gerelateerde striatum en het ventrale striatum. J. Comp. Neurol. 345: 562-578.

    1. Mackintosh NJ A

    (1975) aandachtstheorie: variaties in de verenigbaarheid van stimulus met versterking. Psychol. Rev. 82: 276-298.

    1. Manzoni OJ,
    2. Manabe T.,
    3. Nicoll RA

    (1994) Afgifte van adenosine door activering van NMDA-receptoren in de hippocampus. Wetenschap 265: 2098-2101.

    1. Marr D. A

    (1969) theorie van de cerebellaire cortex. J. Physiol. (Lond.) 202: 437-470.

    1. Marshall JF,
    2. O'Dell SJ,
    3. Navarrete R.,
    4. Rosenstein AJ

    (1990) Dopamine topografietransport met hoge affiniteit in de hersenen van ratten: grote verschillen tussen dorsale en ventrale striatum. Neurowetenschap leerprogramma 37: 11-21.

  • Matsumoto, K., Nakamura, K., Mikami, A., en Kubota, K. Reactie op onvoorspelbare waterafgifte in de mond van visueel responsieve neuronen in de orbitofontale cortex van apen. Abstr. Satellite Symp. IBR Meeting ter ere van Prof Kubota, Inuyama, Japan, P-14, 1995.
    1. Matsumura M.,
    2. Kojima J.,
    3. Gardiner TW,
    4. Hikosaka O.

    (1992) Visuele en oculomotorische functies van de subthalamische nucleus van een aap. J. Neurophysiol. 67: 1615-1632.

    1. Maunsell JHR,
    2. Gibson JR

    (1992) Visuele responslatenties in de snijlijn van de makakenap. J. Neurophysiol. 68: 1332-1344.

    1. Mazzoni P.,
    2. Andersen RA,
    3. Jordan MI A

    (1991) meer biologisch plausibele leerregel dan backpropagation toegepast op een netwerkmodel van corticale gebied 7. Cereb. schors 1: 293-307.

  • McCallum, A. K. Versterking van leren met selectieve waarneming en verborgen toestanden (Proefschrift). Rochester, NY: Univ. Rochester, 1995.
    1. McCormick DA,
    2. Thompson RF

    (1984) Neuronale responsen van het konere cerebellum tijdens acquisitie en uitwerking van een klassiek geconditioneerde nictiterende membraan-ooglidrespons. J. Neurosci. 4: 2811-2822.

    1. McLaren I.

    (1989) De computereenheid als een verzameling van neuronen: een implementatie van een algoritme voor het corrigeren van fouten. in The Computing Neuron, eds Durbin R., Miall C., Mitchison G. (Addison-Wesley, Amsterdam), pp. 160-178.

    1. Michael AC,
    2. Justitie JB Jr.,
    3. Neill DB

    (1985) In vivo voltametrische bepaling van de kinetiek van het dopaminemetabolisme bij de rat. Neurosci. Lett. 56: 365-369.

    1. Middleton FA,
    2. Strick PL

    (1996) De temporale kwab is een doelwit van de output van de basale ganglia. Proc. Natl. Acad. Sci. Verenigde Staten van Amerika 93: 8683-8687.

    1. Miller EK,
    2. Li L.,
    3. Desimone R.

    (1993) Activiteit van neuronen in de anterieure inferieure temporale cortex tijdens een korte-termijn geheugentaak. J. Neurosci. 13: 1460-1478.

    1. Miller JD,
    2. Sanghera MK,
    3. Duitse DC

    (1981) Mesencephalische dopaminerge eenheidsactiviteit in de gedragsafhankelijke rat. Life Sci. 29: 1255-1263.

    1. Miller R.,
    2. Wickens JR,
    3. Beninger RJ

    (1990) Dopamine D-1- en D-2-receptoren met betrekking tot beloning en prestaties: een voorbeeld van de D-1-receptor als primaire plaats voor therapeutische werking van neuroleptica. Prog. Neurobiol. 34: 143-183.

    1. Mirenowicz J.,
    2. Schultz W.

    (1994) Belang van onvoorspelbaarheid voor beloningsreacties in dopamine-neuronen van primaten. J. Neurophysiol. 72: 1024-1027.

    1. Mirenowicz J.,
    2. Schultz W.

    (1996) Preferentiële activering van dopamineneuronen van de middenhersenen door middel van appetitive in plaats van aversieve stimuli. NATUUR 379: 449-451.

    1. Mitchell SJ,
    2. Richardson RT,
    3. Baker FH,
    4. DeLong MR

    (1987) De primaat globus pallidus: neuronale activiteit in verband met bewegingsrichting. Exp. Brain Res. 68: 491-505.

    1. Mogenson GJ,
    2. Takigawa M.,
    3. Robertson A.,
    4. Wu M.

    (1979) Zelfstimulering van de nucleus accumbens en ventrale tegmentale gebied van Tsai verzwakt door micro-injecties van spiroperidol in de nucleus accumbens. Brain Res. 171: 247-259.

    1. Montague PR,
    2. Dayan P.,
    3. Nowlan SJ,
    4. Pouget A.,
    5. Sejnowski TJ

    (1993) Een periodieke versterking gebruiken voor gerichte zelforganisatie tijdens de ontwikkeling. in Neural Information Processing Systems 5, eds Hanson SJ, Cowan JD, Giles CL (Morgan Kaufmann, San Mateo, CA), pp 969-976.

    1. Montague PR,
    2. Dayan P.,
    3. Persoon C.,
    4. Sejnowski TJ

    (1995) Bijen foerageren in onzekere omgevingen met behulp van voorspellend hebbian leren. NATUUR 377: 725-728.

    1. Montague PR,
    2. Dayan P.,
    3. Sejnowski TJ A

    (1996) raamwerk voor mesencephalische dopamine-systemen op basis van voorspellend Hebbian-leren. J. Neurosci. 16: 1936-1947.

    1. Montague PR,
    2. Sejnowski TJ

    (1994) Het voorspellende brein: tijdelijk coïncidentie en temporele orde in synaptische leermechanismen. Leren. Geheugen 1: 1-33.

    1. Mora F.,
    2. Myers RD

    (1977) Hersenstimulatie: direct bewijs voor de betrokkenheid van dopamine in de prefrontale cortex. Wetenschap 197: 1387-1389.

    1. Murphy BL,
    2. Arnsten AF,
    3. Goldman-Rakic ​​PS,
    4. Roth RH

    (1996) Verhoogde dopamine-turnover in de prefrontale cortex verslechtert de prestaties van ruimtelijk werkgeheugen bij ratten en apen. Proc. Natl. Acad. Sci. Verenigde Staten van Amerika 93: 1325-1329.

    1. Nakamura K.,
    2. Mikami A.,
    3. Kubota K.

    (1992) Activiteit van afzonderlijke neuronen in de aapamygdala tijdens de uitvoering van een visuele discriminatietaak. J. Neurophysiol. 67: 1447-1463.

    1. Nedergaard S.,
    2. Bolam JP,
    3. Greenfield SA

    (1988) Facilitering van dendritische calciumgeleiding door 5-hydroxytryptamine in de substantia nigra. NATUUR 333: 174-177.

    1. Niijima K.,
    2. Yoshida M.

    (1988) Activering van mesencephalische dopamine neuronen door chemische stimulatie van de nucleus tegmenti pedunculopontinus pars compacta. Brain Res. 451: 163-171.

    1. Niki H.,
    2. Watanabe M.

    (1979) Prefrontale activiteit en cingulate-eenheid tijdens het timinggedrag van de aap. Brain Res. 171: 213-224.

    1. Nirenberg MJ,
    2. Vaughan RA,
    3. Uhl GR,
    4. Kuhar MJ,
    5. Pickel VM

    (1996) De dopaminetransporter is gelokaliseerd in dendritische en axonale plasmamembranen van nigrostriatale dopaminerge neuronen. J. Neurosci. 16: 436-447.

    1. Nishijo H.,
    2. Ono T.,
    3. Nishino H.

    (1988) Topografische verdeling van modaliteit-specifieke amygdalaire neuronen in alarmering. J. Neurosci. 8: 3556-3569.

    1. Nishino H.,
    2. Ono T.,
    3. Muramoto KI,
    4. Fukuda M.,
    5. Sasaki K.

    (1987) Neuronale activiteit in het ventrale tegmentale gebied (VTA) tijdens het gemotiveerde voedingsgedrag van de staafpers in de aap. Brain Res. 413: 302-313.

    1. Ojakangas CL,
    2. Ebner TJ

    (1992) Purkinje-celcomplex en eenvoudige spiesveranderingen tijdens een leeropdracht van een vrijwillige armbeweging bij de aap. J. Neurophysiol. 68: 2222-2236.

    1. Olds J.,
    2. Milner P.

    (1954) Positieve versterking door elektrische stimulatie van het septumgebied en andere regio's van het brein van de rat. J. Comp. Physiol. Psychol. 47: 419-427.

    1. Otmakhova NA,
    2. Lisman JE

    (1996) D1 / D5 dopamine-recetoractivering verhoogt de omvang van vroege langetermijnpotentiatie op CA1 hippocampus-synapsen. J. Neurosci. 16: 7478-7486.

    1. Packard MG,
    2. White NM

    (1991) Dissociatie van hippocampus en caudate nucleus geheugensystemen door intracerebrale injectie van dopamine-agonisten na de training. Behav. Neurosci. 105: 295-306.

    1. Pastor MA,
    2. Artieda J.,
    3. Jahanshahi M.,
    4. Obeso JA

    (1992) Tijdschatting en reproductie is abnormaal bij de ziekte van Parkinson. Hersenen 115: 211-225.

    1. Pearce JM,
    2. Hal G. A

    (1980) model voor Pavloviaanse conditionering: variaties in de effectiviteit van geconditioneerde, maar niet van ongeconditioneerde stimuli. Psychol. Rev. 87: 532-552.

    1. Pennartz CMA,
    2. Ameerun RF,
    3. Groenewegen HJ,
    4. Lopes da Silva FH

    (1993) Synaptische plasticiteit in een in vitro slice-preparaat van de rattenkern accumbens. EUR. J. Neurosci. 5: 107-117.

  • Percheron, G., Francois, C., Yelnik, J., en Fenelon, G. Het nigro-striato-pallido-nigrale systeem van de primaat. Niet alleen maar een lus. In: Neurale mechanismen bij bewegingsstoornissen, uitgegeven door A. R. Crossman en M. A. Sambrook. Londen: John Libbey, 1989, p. 103-109.
    1. Phillips AG,
    2. Brooke SM,
    3. Fibiger HC

    (1975) Effecten van amfetamine-isomeren en neuroleptica op zelfstimulatie van de nucleus accumbens en dorsale noradrenerge bundel. Brain Res. 85: 13-22.

    1. Phillips AG,
    2. Carter DA,
    3. Fibiger HC

    (1976) Dopaminerge substraten van intracraniële zelfstimulatie in de caudate nucleus. Brain Res. 104: 221-232.

    1. Phillips AG,
    2. Fibiger HC

    (1978) De rol van dopamine bij het mediëren van zelfstimulatie in het ventrale tegmentum, nucleus accumbens en mediale prefrontale cortex. Kan. J. Psychol. 32: 58-66.

    1. Phillips AG,
    2. Mora F.,
    3. Rolt ET

    (1979) Intracraniële zelfstimulatie in de orbitofrontale cortex en caudate nucleus van rhesus monkey: effecten van apomorfine, pimozide en spiroperidol. Psychopharmacology 62: 79-82.

    1. Pickel VM,
    2. Beckley SC,
    3. Joh TH,
    4. Reis DJ

    (1981) Ultrastructurele immunocytochemische lokalisatie van tyrosine hydroxylase in de neostriatum. Brain Res. 225: 373-385.

    1. Prijs JL,
    2. Amaral DG

    (1981) Een autoradiografische studie van de projecties van de centrale kern van de aapamygdala. J. Neurosci. 1: 1242-1259.

    1. Rao RPN,
    2. Ballard DH

    (1997) Dynamisch visueel herkenningsmodel voorspelt neurale responseigenschappen in de visuele cortex. Neural Computat. 9: 721-763.

    1. Rasmussen K.,
    2. Jacobs BL

    (1986) Enkelvoudige activiteit van locus coeruleus neuronen in de vrij bewegende kat. II. Conditionering en farmacologische studies. Brain Res. 371: 335-344.

    1. Rasmussen K.,
    2. Morilak DA,
    3. Jacobs BL

    (1986) Enkelvoudige activiteit van locus coeruleus neuronen in de vrij bewegende kat. I. Tijdens naturalistisch gedrag en als reactie op eenvoudige en complexe stimuli. Brain Res. 371: 324-334.

    1. Rescorla RA,
    2. Wagner AR A

    (1972) theorie van pavloviaanse conditionering: variaties in de effectiviteit van wapening en versteviging. in Classical Conditioning II: Current Research and Theory, eds Black AH, Prokasy WF (Appleton Century Crofts, New York), pp 64-99.

    1. Richardson RT,
    2. DeLong MR

    (1986) Nucleus basalis van Meynert neuronale activiteit tijdens een uitgestelde antwoordtaak bij aap. Brain Res. 399: 364-368.

    1. Richardson RT,
    2. DeLong MR

    (1990) Context-afhankelijke responsen van primaat nucleus basalis neuronen in een go / no-go-taak. J. Neurosci. 10: 2528-2540.

    1. Richfield EK,
    2. Pennney JB,
    3. Young AB

    (1989) Anatomische en affiniteitstoestandvergelijkingen tussen dopamine D1- en D2-receptoren in het centrale zenuwstelsel van de rat. Neurowetenschap leerprogramma 30: 767-777.

    1. Robbins TW,
    2. Everitt BJ

    (1992) Functies van dopamine in het dorsale en ventrale striatum. Semin. Neurosci. 4: 119-128.

    1. Robbins TW,
    2. Everitt BJ

    (1996) Neurobehavelijke mechanismen van beloning en motivatie. Curr. Opin. Neurobiol. 6: 228-236.

    1. Robinson TE,
    2. Berridge KC

    (1993) De neurale basis voor het hunkeren naar drugs: een incentive-sensitisatie theorie van verslaving. Brain Res. Rev. 18: 247-291.

    1. Rogawski MA

    (1987) Nieuwe richtingen in neurotransmitterwerking: dopamine biedt enkele belangrijke aanwijzingen. Trends Neurosci. 10: 200-205.

    1. Rogers QR,
    2. Harper AE

    (1970) Selectie van een oplossing met histidine door ratten die een histidine-onevenwichtig dieet kregen. J. Comp. Physiol. Psychol. 72: 66-71.

    1. Rolls ET,
    2. Critchley HD,
    3. Mason R.,
    4. Wakeman EA

    (1996) Orbitofrontale cortexneuronen: rol in het leren van olfactorische en visuele associaties. J. Neurophysiol. 75: 1970-1981.

    1. Romo R.,
    2. Scarnati E.,
    3. Schultz W.

    (1992) Rol van primitieve basale ganglia en frontale cortex in de interne generatie van bewegingen: vergelijkingen in striatale neuronen geactiveerd tijdens door stimulus geïnduceerde initiatie en uitvoering van bewegingen. Exp. Brain Res. 91: 385-395.

    1. Romo R.,
    2. Schultz W.

    (1990) Dopamine-neuronen van de aap-middenhersenen: onvoorziene reacties op actieve aanraking tijdens zelfgestuurde armbewegingen. J. Neurophysiol. 63: 592-606.

    1. Rompré P.-P.,
    2. Verstandige RA

    (1989) Gedragsbewijs voor deactivering van dopamine-depolarisatie door middenhormonen. Brain Res. 477: 152-156.

    1. Rossi DJ,
    2. Slater NT

    (1993) De ontwikkeling van NMDA-receptorkanaalactiviteit tijdens neuronale migratie. Neurofarmacologie 32: 1239-1248.

    1. Rumelhart DE,
    2. Hinton GE,
    3. Williams RJ

    (1986) Interne representaties leren kennen door foutpropagatie. in Parallel Distributed Processing I, eds Rumelhart DE, McClelland JL (MIT Press, Cambridge, MA), pp 318-362.

    1. Sah P.,
    2. Hestrin S.,
    3. Nicoll RA

    (1989) Tonale activering van NMDA-receptoren door glutamaat uit de omgeving verhoogt de prikkelbaarheid van neuronen. Wetenschap 246: 815-818.

    1. Salamone JD

    (1987) De acties van neuroleptica op appetitief instrumentaal gedrag. in Handboek van Psychopharmacology, eds Iversen LL, Iversen SD, Snyder SH (Plenum, New York), 19: 576-608.

    1. Salamone JD

    (1992) Complexe motorische en sensorimotorische functies van striatum en accumbens dopamine: betrokkenheid bij instrumentele gedragsprocessen. Psychopharmacology 107: 160-174.

    1. Sands SB,
    2. Barish ME A

    (1989) kwantitatieve beschrijving van exciterende aminozuurneurotransmitterreacties op gekweekte ambryonale spinale neuronen van de Yenopus. Brain Res. 502: 375-386.

    1. Sara SJ,
    2. Segal M.

    (1991) Plasticiteit van sensorische reacties van locus coeruleus neuronen in de gedragende rat: implicaties voor cognitie. Prog. Brain Res. 88: 571-585.

    1. Sawaguchi T.,
    2. Goldman-Rakic ​​PS

    (1991) D1 Dopaminereceptoren in prefrontale cortex: betrokkenheid bij werkgeheugen. Wetenschap 251: 947-950.

    1. Scarnati E.,
    2. Proia A.,
    3. Campana E.,
    4. Pacitti C. A

    (1986) micro-iontoforetische studie naar de aard van de vermeende synaptische neurotransmitter die betrokken is bij de pedunculopontine-substantia nigra pars compacta exciterende route van de rat. Exp. Brain Res. 62: 470-478.

    1. Schultz W.

    (1986) Antwoorden van dopamineneuronen van de middenhersenen op gedragstriemprikkels bij de aap. J. Neurophysiol. 56: 1439-1462.

    1. Schultz W.,
    2. Apicella P.,
    3. Ljungberg T.

    (1993) Antwoorden van aap-dopamineneuronen om beloning en geconditioneerde stimuli te belonen tijdens opeenvolgende stappen van het leren van een vertraagde responstaak. J. Neurosci. 13: 900-913.

    1. Schultz W.,
    2. Apicella P.,
    3. Romo R.,
    4. Scarnati E.

    (1995a) Contextafhankelijke activiteit in het striatum van de primaat dat historische en toekomstige gedragsgebeurtenissen weerspiegelt. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 11-28.

    1. Schultz W.,
    2. Apicella P.,
    3. Scarnati E.,
    4. Ljungberg T.

    (1992) Neuronale activiteit in apenventrale striatum gerelateerd aan de verwachting van beloning. J. Neurosci. 12: 4595-4610.

    1. Schultz W.,
    2. Dayan P.,
    3. Montague RR A

    (1997) neurale substraat van voorspelling en beloning. Wetenschap 275: 1593-1599.

    1. Schultz W.,
    2. Romo R.

    (1987) Antwoorden van nigrostriatale dopamine-neuronen tot somatosensorische stimulatie met hoge intensiteit bij de geanesthetiseerde aap. J. Neurophysiol. 57: 201-217.

    1. Schultz W.,
    2. Romo R.

    (1990) Dopamine-neuronen van de aap-middenhersenen: onvoorziene reacties op stimuli die onmiddellijke gedragsreacties opwekken. J. Neurophysiol. 63: 607-624.

    1. Schultz W.,
    2. Romo R.,
    3. Ljungberg T.,
    4. Mirenowicz J.,
    5. Hollerman JR,
    6. Dickinson A.

    (1995b) Beloningsgerelateerde signalen die worden gedragen door dopamine-neuronen. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambrdige, MA), pp 233-248.

    1. Schultz W.,
    2. Ruffieux A.,
    3. Aebischer P.

    (1983) De activiteit van pars compacta neuronen van de monkey substantia nigra in relatie tot motoractivering. Exp. Brain Res. 51: 377-387.

    1. Sears LL,
    2. Steinmetz JE

    (1991) Dorsale accessoire inferieure olieactiviteit vermindert tijdens de verwerving van het konijn met klassiek geconditioneerde ooglidrespons. Brain Res. 545: 114-122.

    1. Selemon LD,
    2. Goldman-Rakic ​​PS

    (1990) Topografische vermenging van striatonigrale en striatopallidal neuronen in de rhesusaap. J. Comp. Neurol. 297: 359-376.

    1. Sesack SR,
    2. Aoki C.,
    3. Pickel VM

    (1994) Ultrastructurele lokalisatie van D2 receptor-achtige immunoreactiviteit in dopamine-neuronen van de middenhersenen en hun striatale doelen. J. Neurosci. 14: 88-106.

    1. Sesack SR,
    2. Pickel VM

    (1992) Prefrontale corticale efferenten in de synapsen van ratten op niet-gemarkeerde neuron-targets van catecholamineklemmen in de nucleus accumbens septi en op dopamine-neuronen in het ventrale tegmentale gebied. J. Comp. Neurol. 320: 145-160.

    1. Simon H.,
    2. Scatton B.,
    3. LeMoal M.

    (1980) Dopaminergic A10-neuronen zijn betrokken bij cognitieve functies. NATUUR 286: 150-151.

    1. Smith AD,
    2. Bolam JP

    (1990) Het neurale netwerk van de basale ganglia zoals onthuld door de studie van synaptische verbindingen van geïdentificeerde neuronen. Trends Neurosci. 13: 259-265.

    1. Smith ID,
    2. Grace AA

    (1992) Rol van de subthalamische kern in de regulatie van de activiteit van nigral dopamine neuronen. Synaps 12: 287-303.

    1. Smith MC

    (1968) CS-US-interval en US-intensiteit bij klassieke conditionering van de nictiterende membraanrespons van het konijn. J. Comp. Physiol. Psychol. 66: 679-687.

    1. Smith Y.,
    2. Bennett BD,
    3. Bolam JP,
    4. Ouder A.,
    5. Sadikot AF

    (1994) Synaptische relaties tussen dopaminerge afferenten en corticale of thalamische input in het sensorimotorische territorium van het striatum in aap. J. Comp. Neurol. 344: 1-19.

    1. Smith Y.,
    2. Bolam JP

    (1990) De outputneuronen en de dopaminerge neuronen van de substantia nigra ontvangen een GABA-bevattende input van de globus pallidus in de rat. J. Comp. Neurol. 296: 47-64.

    1. Smith Y.,
    2. Bolam JP

    (1991) Convergentie van synaptische inputs van het striatum en de globus pallidus op geïdentificeerde nigrocolliculaire cellen in de rat: een dubbel anterograde labelingstudie. Neurowetenschap leerprogramma 44: 45-73.

    1. Smith Y.,
    2. Hazrati L.-N.,
    3. Ouder A.

    (1990) Effectieve projecties van de subthalmaïsche kern in de eekhoorn aap zoals bestudeerd door de PHA-L anterograde tracing methode. J. Comp. Neurol. 294: 306-323.

    1. Somogyi P.,
    2. Bolam JP,
    3. Totterdell S.,
    4. Smith AD

    (1981) Monosynaptische input van het nucleus accumbens-ventral striatum-gebied tot retroactief gemerkte nigrostriatale neuronen. Brain Res. 217: 245-263.

    1. Sprengelmeyer R.,
    2. Canavan AGM,
    3. Lange HW,
    4. Hömberg V.

    (1995) Associatief leren bij degeneratieve neostriatale aandoeningen: contrasten in expliciete en impliciete herinnering tussen Parkinson- en Huntington-patiënten. Mov. Disord. 10: 85-91.

    1. Surmeier DJ,
    2. Eberwine J.,
    3. Wilson CJ,
    4. Stefani A.,
    5. Kitai ST

    (1992) Dopamine receptor subtypes colocalize in striatonigrale neuronen van ratten. Proc. Natl. Acad. Sci. Verenigde Staten van Amerika 89: 10178-10182.

    1. Stamford JA,
    2. Kruk ZL,
    3. Palij P.,
    4. Millar J.

    (1988) Diffusie en opname van dopamine in het caudaat van de rat en nucleus accumbens vergeleken met behulp van snelle cyclische voltammetrie. Brain Res. 448: 381-385.

    1. Stein L.

    (1964) Zelfstimulatie van de hersenen en de centrale stimulerende werking van amfetamine. Federation Proc. 23: 836-841.

    1. Stein L.,
    2. Xue BG,
    3. Belluzzi JD

    (1994) In vitro versterking van hippocampale barsten: een zoektocht naar Skinner's gedragsatomen. J. Exp. Anaal. Behav. 61: 155-168.

    1. Steinfels GF,
    2. Heym J.,
    3. Strecker RE,
    4. Jacobs BL

    (1983) Gedragsrelaties van dopaminerge activiteit in vrij bewegende katten. Brain Res. 258: 217-228.

    1. Suaud-Chagny MF,
    2. Dugast C.,
    3. Chergui K.,
    4. Msghina M.,
    5. Gonon F.

    (1995) Opname van dopamine die vrijkomt door impulsstroom in het mesolimbische en striatale systeem van de rat in vivo. J. Neurochem. 65: 2603-2611.

    1. Suri RE,
    2. Schultz W. A

    (1996) neuraal leermodel op basis van de activiteit van dopamine-neuronen van primaten. Soc. Neurosci. Abstr. 22: 1389.

    1. Sutton RS

    (1988) Leren voorspellen met de methode van temporeel verschil. Machine leren. 3: 9-44.

    1. Sutton RS,
    2. Barto AG

    (1981) Op weg naar een moderne theorie van adaptieve netwerken: verwachting en voorspelling. Psychol. Rev. 88: 135-170.

    1. Tepper J. M,
    2. Martin LP,
    3. Anderson DR

    (1995) GABAA receptor-gemedieerde remming van substantia nigra dopaminerge neuronen van ratten door pars reticulata projectie neuronen. J. Neurosci. 15: 3092-3103.

    1. Tesauro G.

    (1994) TD-Gammon, een zelflerend backgammon-programma, bereikt het spelen op masterniveau. Neural Comp. 6: 215-219.

    1. Thompson RF,
    2. Gluck MA

    (1991) Hersenen substraten van elementair associatief leren en geheugen. in Perspectives on Cognitive Neuroscience, eds Lister RG, Weingartner HJ (Oxford Univ. Press, New York), pp 25-45.

    1. Thorndike EL

    (1911) Animal Intelligence: Experimental Studies. (MacMillan, New York).

    1. Thorpe SJ,
    2. Rolls ET,
    3. Maddison S.

    (1983) De orbitofrontale cortex: neuronale activiteit in de gedragen aap. Exp. Brain Res. 49: 93-115.

    1. Toan DL,
    2. Schultz W.

    (1985) Reacties van pallidum-cellen van de rat op cortexstimulatie en effecten van veranderde dopaminerge activiteit. Neurowetenschap leerprogramma 15: 683-694.

    1. Tremblay L.,
    2. Schultz W.

    (1995) Verwerking van beloningsgerelateerde informatie in orbitofrontal neuronen van primaten. Soc. Neurosci. Abstr. 21: 952.

    1. Trent F.,
    2. Tepper JM

    (1991) Dorsale raphe-stimulatie modificeert striataal-opgewekte antidromische invasie van nigrale dopamine-neuronen in vivo. Exp. Brain Res. 84: 620-630.

  • Ungerstedt, U. Adipsia en aphagia na 6-hydroxydopamine veroorzaakte degeneratie van het nigro-striatale dopamine-systeem. Acta Physiol. Scand. Suppl. 367: 95-117, 1971.
    1. Vankov A.,
    2. Hervé-Minvielle A.,
    3. Sara SJ

    (1995) Reactie op nieuwheid en zijn snelle gewenning in locus coeruleus-neuronen van de vrij verkennende rat. EUR. J. Neurosci. 7: 1180-1187.

    1. Vriezen ER,
    2. Moscovitch M.

    (1990) Geheugen voor temporele orde en voorwaardelijk associatief leren bij patiënten met de ziekte van Parkinson. Neuropsychologia 28: 1283-1293.

    1. Walsh JP

    (1993) Depressie van excitatory synaptische input in rattenstriatale neuronen. Brain Res. 608: 123-128.

    1. Wang Y.,
    2. Cummings SL,
    3. Gietzen DW

    (1996) Temporaal-ruimtelijk patroon van c-fos-expressie in de hersenen van de rat als reactie op onmisbare aminozuurdeficiëntie. I. De initiële herkenningsfase. Mol. Brain Res. 40: 27-34.

    1. Watanabe M.

    (1989) De geschiktheid van gedragsreacties gecodeerd in post-trial-activiteit van prefrontale eenheden van primaten. Neurosci. Lett. 101: 113-117.

    1. Watanabe M.

    (1990) Prefrontale eenheidsactiviteit tijdens associatief leren in de aap. Exp. Brain Res. 80: 296-309.

    1. Watanabe M.

    (1996) Beloon de verwachting in prefrontale neuronen van de primaten. NATUUR 382: 629-632.

    1. Wauquier A.

    (1976) De invloed van psychoactieve geneesmiddelen op zelfstimulatie van de hersenen bij ratten: een overzicht. in Brain Stimulation Reward, ed. Wauquier A., ​​Rolls ET (Elsevier, New York), pp 123-170.

    1. White NM

    (1989) Beloning of bekrachtiging: wat is het verschil? Neurosci. Biobehav. Rev. 13: 181-186.

    1. Witte NW,
    2. Milner PM

    (1992) De psychobiologie van versterkers. Annu. Rev. Psychol. 43: 443-471.

    1. Wightman RM,
    2. Zimmerman JB

    (1990) Controle van de extracellulaire concentratie van dopamine in rattenstriatum door impulsstroom en opname. Brain Res. Rev. 15: 135-144.

    1. Wickens JR,
    2. Begg AJ,
    3. Arbuthnott GW

    (1996) Dopamine keert de depressie van rat corticostriatale synapsen om, die normaal volgt op hoogfrequente stimulatie van de cortex in vitro. Neurowetenschap leerprogramma 70: 1-5.

    1. Wickens J.,
    2. Kötter R.

    (1995) Mobiele wapeningsmodellen. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 187-214.

  • Widrow, G. en Hoff, M. E. Adaptieve schakelcircuits. IRE Western Electronic Show Conven., Conven. Rec. deel 4: 96-104, 1960.
  • Widrow, G. and Sterns, S.D. Adaptieve signaalverwerking. Englewood Cliffs, NJ: Prentice-Hall, 1985.
    1. Williams SM,
    2. Goldman-Rakic ​​PS

    (1993) Karakterisering van de dopaminerge innervatie van de frontale cortex van de primaat met behulp van een dopamine-specifiek antilichaam. Cereb. schors 3: 199-222.

    1. Williams GV,
    2. Millar J.

    (1990) Concentratie-afhankelijke werkingen van gestimuleerde dopamine-afgifte op neuronale activiteit in rattenstriatum. Neurowetenschap leerprogramma 39: 1-16.

    1. Williams GV,
    2. Rolls ET,
    3. Leonard CM,
    4. Stern C.

    (1993) Neuronale reacties in het ventrale striatum van de gedragen aap. Behav. Brain Res. 55: 243-252.

    1. Wilson C.,
    2. Nomikos GG,
    3. Collu M.,
    4. Fibiger HC

    (1995) Dopaminergische correlaten van gemotiveerd gedrag: belang van drive. J. Neurosci. 15: 5169-5178.

    1. Wilson CJ

    (1995) De bijdrage van corticale neuronen aan het schietpatroon van striatale stekelige neuronen. in modellen van informatieverwerking in de basale ganglia, ed. Houk JC, Davis JL, Beiser DG (MIT Press, Cambridge, MA), pp 29-50.

    1. Wilson FAW,
    2. Rolt ET

    (1990a) Neuronale reacties gerelateerd aan de nieuwheid en bekendheid van visuele stimuli in de substantia innominata, diagonale band van Broca en periventriculair gebied van de voorhersenen van de primaat. Exp. Brain Res. 80: 104-120.

    1. Wilson FAW,
    2. Rolt ET

    (1990b) Neuronale responsen gerelateerd aan wapening in de basale voorhersenen van de primaat. Brain Res. 509: 213-231.

    1. Wilson FAW,
    2. Rolt ET

    (1990c) Leren en geheugen wordt weerspiegeld in de responsen van versterkingsgerelateerde neuronen in de basale voorhersenen van de primaat. J. Neurosci. 10: 1254-1267.

    1. Verstandige RA

    (1982) Neuroleptica en operant gedrag: de anhedonia-hypothese. Behav. Brain Sci. 5: 39-87.

    1. Verstandige RA

    (1996) Neurobiologie van verslaving. Curr. Opin. Neurobiol. 6: 243-251.

    1. Verstandige RA,
    2. Colle L.

    (1984) Pimozide verzwakt de vrije voeding: de analyse met de "beste scores" onthult een gemotiveerd tekort. Psychopharmacologia 84: 446-451.

    1. Verstandige RA,
    2. Hoffman DC

    (1992) Lokalisatie van geneesmiddelbeloningsmechanismen door intracraniële injecties. Synaps 10: 247-263.

    1. Verstandige RA,
    2. Rompre P.-P.

    (1989) Brain dopamine en beloning. Annu. Rev. Psychol. 40: 191-225.

    1. Verstandige RA,
    2. Spindler J.,
    3. de Wit H.,
    4. Gerber GJ

    (1978) Neuroleptica geïnduceerde "anhedonie" bij ratten: blokkades van pimozide belonen de kwaliteit van voedsel. Wetenschap 201: 262-264.

    1. Wynne B.,
    2. Güntürkün O.

    (1995) Dopaminergische innervatie van het telencephalon van de duif (Columba liva): een onderzoek met antilichamen tegen tyrosine hydroxylase en dopamine. J. Comp. Neurol. 357: 446-464.

    1. Yan Z.,
    2. Song WJ,
    3. Surmeier DJ

    (1997) D2-dopaminereceptoren verminderen N-type Ca2+ stromingen in ratten neostriatale cholinerge interneuronen via een membraan-afgebakende, proteïne-kinase-C-ongevoelige route. J. Neurophysiol. 77: 1003-1015.

    1. Yim CY,
    2. Mogenson GJ

    (1982) Respons van nucleus accumbens neuronen op amygdala-stimulatie en de modificatie ervan door dopamine. Brain Res. 239: 401-415.

    1. Jonge AMJ,
    2. Joseph MH,
    3. Gray JA

    (1992) Verhoogde dopamine-afgifte in vivo in nucleus accumbens en caudate nucleus van de rat tijdens het drinken: een microdialyse-onderzoek. Neurowetenschap leerprogramma 48: 871-876.

    1. Jonge AMJ,
    2. Joseph MH,
    3. Gray JA

    (1993) Latente remming van geconditioneerde dopamine-afgifte in rattenucleus accumbens. Neurowetenschap leerprogramma 54: 5-9.

    1. Yung KKL,
    2. Bolam JP,
    3. Smith AD,
    4. Hersch SM,
    5. Ciliax BJ,
    6. Levey AI

    (1995) Immunocytochemische lokalisatie van D1- en D2-dopaminereceptoren in de basale ganglia van de rat: licht- en elektronenmicroscopie. Neurowetenschap leerprogramma 65: 709-730.

  •