Förutsägbarhet modulerar mänskligt hjärnans respons till belöning (2001)

KOMMENTARER: Oförutsägbara belöningar leder till större spetsar av dopamin. Det är det som gör Internet-porr med hög hastighet annorlunda än porno från det förflutna
 
J Neurosci. 2001 Apr 15;21(8):2793-8.
 

Källa

Institutionen för psykiatri och beteendevetenskaper, Emory University School of Medicine, Atlanta, Georgia 30322, USA. [e-postskyddad]

Abstrakt

Vissa klasser av stimuli, såsom mat och droger, är mycket effektiva för att aktivera belöningsregioner. Vi visar hos människor att aktiviteten i dessa regioner kan moduleras av förutsägbarheten för den sekventerade leveransen av två mildt behagliga stimuli, oralt levererad fruktjuice och vatten. Genom att använda funktionell magnetisk resonansbildning var aktiviteten för att belöna stimuli i både nukleär accumbens och medial orbitofrontal cortex störst när stimuli var oförutsägbara. Dessutom var ämnens angivna preferens för antingen juice eller vatten inte direkt korrelerad med aktivitet i belöningsregioner utan istället korrelerad med aktivitet i sensorimotorisk cortex. För glädjande stimuli tyder dessa resultat på att förutsägbarhet modulerar responsen av mänskliga belöningsregioner, och subjektiv preferens kan dissocieras från detta svar.

Beskrivning

Att sträva efter naturliga belöningar som mat, dryck och kön är ett stort yttre inflytande på mänskligt beteende. Emellertid är frågan om hur belöningar påverkar mänskligt beteende fortfarande oupplöst. Det finns många faktorer som bidrar till detta gap i vår kunskap; Ett vägblock har emellertid varit svårigheten att definiera och mäta isolerade effekter av belöningar på mänskligt beteende eller hjärnaktivering. I djur definieras belöning som ett operativt begrepp: en stimulans anses vara givande om den positivt förstärker ett beteende (Hull, 1943; Rescorla och Wagner, 1972; Robbins och Everitt, 1996), det vill säga ökar sannolikheten för beteendet på ett tillförlitligt sätt. Samma begrepp gäller människor; emellertid har människor förmågan att utöva alla slags exekutiv kontroll över sina handlingar, och sålunda är beteendeanalyser ett ofullständigt sätt att undersöka belöningsbehandling. På samma sätt förvirras uttryckliga rapporter om gillanden och ogillandena, dvs preferenser, av en individs subjektiva uppfattning om vad de gillar och vad de väljer att rapportera. För att övervinna dessa experimentella svårigheter skulle man vilja övervaka samtidigt beteendeproduktion, subjektiv preferens och hjärnsvar under en väldefinierad uppgift. Med ett sådant tillvägagångssätt rapporterar vi här att aktivitet i mänskliga belöningsregioner är närmare korrelerad med förutsägbarheten för en sekvens av behagliga stimuli än med uttryckligen angivna preferenser.

Hos människor kan aktivering av belöningsområden visualiseras med funktionell magnetisk resonansavbildning (fMRI) efter administrering av läkemedel, såsom kokain (Breiter et al., 1997); Sådana infusioner kan emellertid inte vara representativa för normalbelöningsprocesser på grund av både direkta och indirekta farmakologiska effekter av kokain. Dessutom kan droger som kokain verka på olika delar av belöningssystemet än så kallade naturliga belöningar som mat och vatten (Bradberry et al., 2000; Carelli et al., 2000). Konditionerade belöningar, t.ex. pengar, kan också fungera på olika delar av belöningssystemet (Thut et al., 1997; Elliott et al., 2000; Knutson et al., 2000) och kan inte vara en lämplig sond för primärbelöningskretsar hos människor. Ett alternativt tillvägagångssätt föreslås av experiment som visar att förutsägbarheten för en primärt givande stimulans är en kritisk parameter för aktivering av belöningsbanor (Schultz et al., 1992, 1997; Schultz, 1998; Garris et al., 1999). Fysiologiska inspelningar hos icke-humana primater har visat att neuroner i regioner som det ventrala tegmentala området (VTA), nucleus accumbens och ventralstriatum svarar på ett adaptivt sätt för att belöna stimuli såsom fruktjuice eller vatten (Shidara et al., 1998). Sålunda kan förutsägbarheten hos en sekvens av stimuli i sig rekrytera belöningsrelaterade neurala strukturer på ett sätt detekterbart med fMRI. Dessutom tyder teoretiska modeller av dopaminfrisättning att oförutsägbara belöningar skulle leda till större aktivitet i dessa regioner (Schultz et al., 1997). Vi försökte testa denna hypotes genom att använda fMRI för att mäta effekten av förutsägbarhet på mänskliga hjärnresponser på sekvenser av punktliga, behagliga stimuli.

MATERIAL OCH METODER

Ämnen. Tjugofem normala vuxna genomgick fMRI-skanning medan de administrerades små mängder av antingen oral fruktjuice eller vatten. Ämnenna varierade i ålder från 18 till 43, och alla ämnen gav informerat samtycke till ett protokoll godkänt av Emory University Human Investigations Committee.

Experimentell uppgift. Medan i skannern fick personer små mängder oralt levererad fruktjuice och vatten på antingen ett förutsägbart eller oförutsägbart sätt. Vi valde en sekvenserad leverans av fruktjuice och vatten av tre skäl: (1) människor hitta både juice och vatten för att vara subjektivt behagliga; (2) båda stimuli används rutinmässigt som förstärkande stimuli medan de utbildar icke-humana primater på beteendemässiga uppgifter. och (3) midhjärndopaminerga neuroner, och förmodligen de neuroner som de projicerar visar fasförändringar i avfyrningsfrekvens som en funktion av den tidsmässiga förutsägbarheten för sekventiella stimuli (Schultz et al., 1992). Deltagarna fick både juice och vatten på antingen ett förutsägbart eller oförutsägbart sätt i två skanningsledningar (Fig. 1). Under förutsägbar körning alternerades saft- och vattenboluserna vid ett bestämt intervall av 10 sek. Under den oförutsägbara tiden randomiserades ordningen av juice och vatten och stimulansintervallet randomiserades genom provtagning av en Poisson-intervallfördelning med ett medelvärde av 10 sek. Varje körning varade 5 min, och ordningen för de två körningarna (förutsägbar eller oförutsägbar) var randomiserad över ämnen. Eftersom tiden för att anpassa sig till antingen förutsägbarhet eller oförutsägbarhet var okänd och eftersom frekvent byte av förhållanden kan orsaka interaktion med varandra, det vill säga "förutsägbarhet för förutsägbarhet" valde vi att skilja förhållandena över skanningsledningar istället för att använda mindre tillståndsblock inom skanningsledningar. Eftersom alla aspekter av experimentet hängde på att manipulera förutsägbarhet valde vi att inte upprepa förhållanden inom ämnen och istället fokuserade på att studera ett större antal ämnen.

Fig. 1.  

Design av fMRI-experimentet. En 2 × 2-faktoriell design användes, med preferensfaktorer (juice eller vatten) och förutsägbarhet (förutsägbar eller oförutsägbar). Ämnen fick 0.8 ml-bolus av juice och vatten i antingen en förutsägbar eller oförutsägbar sekvens. Med hjälp av händelsesrelaterad fMRI analyserades hjärnaktivering med avseende på preferens och förutsägbarhet, liksom interaktionen mellan dem.

Ämnen mottagna 0.8 ml orala bolus av både fruktjuice och vatten via två plaströr. Ett munstycke hållde ändarna av röret på plats över tungan, med fruktjuice infunderad från vänster sida av munstycket och vattnet från höger. Rören var ~10 m långa och anslutna till en datorstyrd dubbelpumppump (Harvard Apparatus, Holliston, MA) utanför scannerns rum. Ämnen utförde inte någon annan uppgift under skanning och fick instruktioner att helt enkelt svalka vätskan varje gång den administrerades. Efter skanningssessionen undersöktes ämnen för deras fluidpreferens.

Förvärv av MR-data. Skanning utfördes på en 1.5 Tesla Philips NT-skanner. Efter förvärv av en T1-vägd anatomisk skanning med hög upplösning genomgick personer två helhjärnfunktionella körningar av 150-skanningar (echo-plan bildbehandling, gradient återkallat eko, upprepningstid, 2000 msek, ekotid, 40 msec, 90 °; 64 × 64-matrisen, 24 5 mm axiella skivor förvärvade parallellt med anteroposterior-kommandolinjen) för mätning av blodsyresubstansnivåberoende (BOLD) -effekten (Kwong et al., 1992; Ogawa et al., 1992). Huvudrörelsen minimerades genom stoppning och begränsningar.

Analys. Data analyserades med användning av statistisk parametrisk kartläggning (SPM99; Wellcome Department of Cognitive Neurology, London, Storbritannien) (Friston et al., 1995b). Rörelsekorrigering till den första funktionella genomsökningen utfördes hos försökspersoner med en sex-parameter styv kroppstransformation. Eftersom sväljning oundvikligen orsakar signifikant huvudrörelse användes också parametrarna för rörelsekorrigering för att avgöra om huvudrörelser skilde sig väsentligt mellan förhållandena. Medelvärdet för de rörelsekorrigerade bilderna registrerades sedan till individens 24-skivor strukturella MR med en 12-parameter affin transformation. Bilderna normaliserades sedan rumsligt till Montreal Neurological Institute (MNI) -mallen (Talairach och Tournoux, 1988) genom att tillämpa en 12-parameteraffine-transformation följt av en olinjär vridning med användning av basfunktioner (Ashburner och Friston, 1999). Bilder mjukades därefter med en 8 mm isotrop Gaussisk kärna och bandpass passerat i den temporala domänen. En slumpmässig, händelsesrelaterad, statistisk analys utfördes med SPM99 (Friston et al., 1995a, 1999). Experimentet analyserades som en 2 × 2-faktoriell design. Först specificerades en separat generell linjär modell (GLM) för varje individ, med fyra betingelser som representerar de fyra möjliga händelsetyperna: förutsägbar föredragen vätska, förutsägbar icke-föredragen vätska, oförutsägbar föredragen vätska och oförutsägbar icke-föredragen vätska. Fyra vektorer av deltafunktioner med tider som motsvarar varje händelse skapades för var och en av de fyra förutsättningarna. Dessa var sammansatta med en generisk hemodynamisk responsfunktion och ingick i en fyrkolonnens designmatris. Medelvärdet av varje skanningskörning avlägsnades på voxelvis basis. Vi beräknade tre tvåsidiga kontrastbilder som motsvarade de främsta effekterna av preferens [kontrastvektor (1-11-1)], förutsägbarhet [kontrastvektor (11-1-1)] och interaktionsperioden [kontrastvektor (1 -1-11)]. Samspelet beskriver hur förutsägbarhet modulerar effekten av preferens. Dessa individuella kontrastbilder ingick i en andra nivåanalys med hjälp av ett separat enprov t test (df = 24) för varje sida av varje term i GLM (totalt sex kontraster). Vi tröstade dessa sammanfattande statistiska kartor på p <0.001 (okorrigerad för flera jämförelser). Dessa kartor var överlagrade på en högupplöst strukturbild i MNI-orientering.

Teoretisk modell. Som ett verktyg för både utformning och tolkning av fMRI-experimentet använde vi en befintlig neuralt nätverksmodell av dopaminfrisättning för att simulera hjärnans respons på olika temporala mönster av givande stimuli (Fig.2). Denna modell baserades på metoden för temporära skillnader (TD), som postulerar att en synaptiskt förstärkande substans, t.ex. dopamin, släpps som svar på fel i belöningsspecifikation (Schultz et al., 1997). Denna modell har använts i ett brett utbud av applikationer, inklusive komplicerade inlärningsuppgifter som backgammon (Sutton, 1988; Tesauro och Sejnowski, 1989) samt framgångsrikt förutsäga aktiviteten hos dopaminneuroner i många konditioneringsparadigmer (Houk et al., 1995; Montague et al., 1995) och motor sekvenseringsuppgifter (Berns och Sejnowski, 1998).

Fig. 2.  

Neurala nätverksmodell av experimentet och hjärnregionerna i samband med informationsbehandling. A, Diagrammet indikerar vår hypotes för hur sekvensen av stimuli kan påverka dopaminergeffekten. I denna hypotes har vi angett att förändringar i dopaminerg effekt kan påverka målnära strukturer på ett sätt som kan detekteras i en fMRI BOLD-mätning. Juften och vattnet har visat sig ha både sensorisk (projicering från ändlig tidfönsterlåda) och belöning (the r vägar) representationer i deras inflytande på dopaminerg aktivitet. För att skapa ett förväntat hemodynamiskt svar från denna hypotes skapade vi ett ändamålsenligt tidsfönster (små lådor för juice och vatten), som bestämde värdet av den omedelbara belöningenr(t) (1 om juice inträffade, 0.5 om vatten inträffade, och 0 om ingen stimulans inträffade). Denna manöver ställer med god smak juice till dubbelt så mycket som värdet av vatten. Detta är inte viktigt för huvudförväntningen som genereras av modellen.B, Förutsedd dopamin effekt för förutsägbara och oförutsägbara sekvenser av juice och vattenavgivning. Horisontell axel är skannnummer. Vertikal axel är det förväntade hemodynamiska svaret förutsagt av en tidsskillnadsmodell. Skalan på vertikal axel är godtycklig. Den viktiga punkten att notera är att den förutsägbara körningen fortskrider till 0, medan den oförutsägbara körningen förblir hög amplitud hela tiden. Spåren genererades genom att convolving en hemodynamisk responskärna med utgången från en tidsskillnadsmodell. Detta föreslog att det genomsnittliga BOLD-svaret skulle vara större när stimuli var oförutsägbara.

Kortfattat beror TD-lärande på två primära antaganden. För det första sker kortsiktig anpassning i en given neuralkrets med målet att förutsäga en diskonterad summa av alla framtida belöningar. Definitionen av belöning beror på det sammanhang där det är mottaget. Om en förmodad belöning ökar förekomsten av ett visst beteende, anses den vara en positiv förstärkare. Beroende på djurets interna tillstånd kan samma belöning inte förstärka ett beteende, t.ex. när djuret är mattat. I samband med ett fMRI-experiment, som i allmänhet är onaturligt, är ett välbekant aptitligt ämne, såsom vatten eller fruktjuice, subjektivt upplevd som trevlig och därför givande. För det andra beror belöningsprognos bara på den nuvarande representationen av en stimulansuppsättning. Stimulanspresentationen är något godtycklig i modellen, och den innefattar viss representation bakåt genom tiden, det vill säga ett stimulansspår. För ämnen som vatten eller fruktjuice finns det både sensoriska dimensioner (t.ex. temperatur och taktil känsla på tungan) och den faktiska belöningen, som är subjektivt upplevd som nöje. Därför är det rimligt att överväga de taktila dimensionerna för fluidtillförseln som både neutrala och skilda från den givande dimensionen. På samma sätt antas dessa distinkta dimensioner behandlas av olika hjärnkretsar, som kan avbildas med fMRI. För att kartlägga modellens utgång på en dimension analog med mätningen som erhölls med fMRI summerade vi utgångarna från både neutrala och givande vägar, som vi antog konvergeras i ventralstriatum och kärnan accumbens. Vi bekräftar att det inte finns några direkta bevis för detta, och beroende på den specifika receptorn kan dopamin ha varierande effekter på neuronaktiviteten. Den exakta experimentella designen ingick i modellen, som simulerades med Matlab 5.3 (MathWorks, Natick, MA). Utsignalerna som motsvarar både de förmodade dopaminneuronerna och deras projektionsställen beräknades för de förutsägbara och oförutsägbara körningarna (Fig. 2).

Vi bör vara noga med att påpeka läsarna att vår användning av den temporala skillnadsmodellen för att förklara vår design och efterföljande tolkning (nedan) baseras på dess tidigare framgång när det beskrivs förändringar i spikproduktionen i dopaminerga neuroner hos primater som genomgår relaterade beteendemässiga uppgifter. Det finns andra troliga beräkningsbeskrivningar som också kan räcka till.

RESULTAT

Efter skanningarna frågades ämnen om deras preferenser för de två stimuli. Arton av 25-ämnen (72%) föredragen juice och det återstående föredragna vattnet. De flesta ämnen hade en distinkt preferens för den ena eller den andra, även om vi inte bad dem kvantifiera detta. Även om det var signifikant huvudrörelse under skanningarna var alla översättningar och rotationer kring varje stimulans generellt små och skilde sig inte signifikant mellan några av villkoren. Exempelvis var den genomsnittliga ± SD-translation som associerades med varje stimulans 0.041 ± 0.069 mm i förutsägbart tillstånd och 0.044 ± 0.069 mm i oförutsägbart tillstånd (parat t testa;p =

Hjärnansvaret på den föredragna vätskan uppvisade överraskande liten differentialaktivitet i förhållande till den icke-föredragna vätskan (Tabell1). Vi observerade ingen signifikant aktivitetsskillnad i klassiska belöningsregioner som nucleus accumbens, hippocampus eller medial prefrontal cortex. Den primära aktivitetsändringen för föredragen> icke-föredragen inträffade i den somatosensoriska cortexen i ett område nära mun- och tungregionen (t = 4.19, MNI-koordinater, -60, -12, 16).

Tabell 1.  

Hjärnområdena visar signifikanta förändringar i uppmätt aktivitet (p <0.001 okorrigerad; klusterstorlek> 10 voxels, utom när det anges)

Huvudseffekten av förutsägbarheten var väsentligt större än den främsta effekten av preferensen (Fig. 3). För oförutsägbar körning i förhållande till förutsägbar körning observerades bilateral aktivering i en stor yta av medial orbitofrontal cortex som inkluderade kärnans accumbens (tabell 1). Ytterligare aktiveringsområden inkluderade ett stort område av parietal cortex bilateralt och paracentralt och små fokala aktiveringar i både den vänstra mediodorsala kärnan i thalamus och höger cerebellum. Eftersom ingen av dessa regioner överlappades med den främsta effekten av preferensen aktiverades de maximalt av oförutsägbara stimuli, oavsett preferens. För förutsägbar körning i förhållande till den oförutsägbara körningen aktiverades ett område av höger överlägsen temporal gyrus, såväl som fokala aktiveringar i vänster precentral gyrus och höger lateral orbitofrontal cortex.

Fig. 3.  

Huvudseffekten av förutsägbarheten visade att belöningsrelaterade regioner hade ett större BOLD-svar på de oförutsägbara stimuli. APlaner som centreras vid (0, 4, -4) visar att bilateral kärnan accumbens / ventral striatum (NAC) och bilateral överlägsen parietal cortex var mer aktiv i förutsägbart tillstånd. BEn liten region i rätt överlägsen temporal gyrus var relativt mer aktiverad av förutsägbara stimuli. Betydelsen tröskelades vidp <0.001 och en utsträckning> 10 angränsande voxels.

Samspelet mellan preferens och förutsägbarhet identifierade områden där en effekt modulerade den andra oberoende av båda huvudverkningarna. Rätt insula, vänster bakre cingulat och höger cerebellum visade en signifikant växelverkan för kontrasten (föredragen icke-föredragen) × (förutsägbar oförutsägbar). Den motsatta konturen, (föredragen icke-föredragen) × (oförutsägbar förutsägbar) avslöjade inte några aktiveringar som var signifikanta vid p <0.001 nivå; emellertid var en liten region i vänster överlägsen temporal gyrus (MNI-koordinater, −48, −4, −16) signifikant vid p <0.01 nivå (t =

Datasimuleringen föreslog att oförutsägbara belöningar skulle framkalla mer dopaminfrisättning än förutsägbara (Fig.2 B). När belöningarna är förutsägbara förutspår varje stimulans perfekt den efterföljande, och felsignalen, som antas vara medierad av dopamin, minskar gradvis. När belöningarna är oförutsägbara finns det ingen möjlighet för systemet att lära sig, och svaret på varje stimulans är större.

DISKUSSION

Våra resultat visade en intressant separation i hjärnans svar på förutsägbarhet och subjektiva rapporter om preferens. Hjärnans respons på preferensen var uteslutande kortikalt, men svaret på förutsägbarhet visade specifik aktivering av belöningssystem som också är känt för att vara målet för dopaminerga neuroner med medelvärde. Om vi ​​antar att aktivering av dessa belöningsområden är angenäm för människor, tyder detta resultat på att den subjektiva preferensrapporten kan dissocieras från neurala kretsar som är kända för att vara kraftfulla determinanter för konditionerade beteenden.

Både vattnet och fruktjuice orsakade signifikanta aktiveringar i hela hjärnan, och även om något av detta svar var hänförligt till de motoriska aspekterna av uppgiften sönderdelades specifika delmängder av dessa regioner i dimensioner av preferens och förutsägbarhet. Effekten av preferensen begränsades till kortikala regioner associerade med sensorisk behandling, och den föredragna stimulansen resulterade i större aktivering i dessa regioner. Dessa regioner ligger nära sensimotorisk cortex som är känd för att aktiveras under tunga rörelser (Corfield et al., 1999) och svälja (Hamdy et al., 1999). I tidigare arbete med hjärnans svar på tungörrörelsen var det en väsentlig aktivering av cerebellum, ett konstaterande som i synnerhet saknar huvudförmågan hos preferensen. Differensialhjärnansvaret, dvs föredraget, icke-föredraget, avlägsnar gemensamma aktiveringsområden; Därför föreslår frånvaron av cerebellär aktivering att skillnader i tunga rörelser osannolikt skulle vara orsaken till mönstret för kortikal aktivering för subjektiv preferens. Det faktum att en somatosensorisk region var korrelerad med angiven preferens antyder att någon differentiell neural bearbetning inträffade för de två stimuli. Det var förvånande att detta uppenbarades i ett primärt sensoriskt bearbetningsområde och inte i klassiska belöningsområden. Även om ämnen tvingades utse ett ämne över det andra som deras preferens, väljades båda vätskorna avsiktligt för att vara behagliga, i motsats till att den var aversiv. Eftersom båda vätskorna i allmänhet var roliga, hade effekten av preferens kanske inte varit tillräckligt stark för att resultera i en signifikant aktivitetsskillnad i belöningsregioner. Detta skulle vara förenligt med fynd att dopaminneuroner med medelvärde aktiveras företrädesvis av aptitiva snarare än aversiva stimuli (Mirenowicz och Schultz, 1996). Våra resultat tyder dock på en systemdifferentiering av subjektiv preferens från enkel belöning, som stöder tidigare hypoteser att "vill" inte är detsamma som "liknar" (Robinson och Berridge, 1993).

Till skillnad från effekten av preferensen korrelerade oförutsägbarheten som en signifikant huvudverkan med aktivitet i nukleär accumbens, thalamus och medial orbitofrontal cortex, medan förutsägbarhet korrelerades huvudsakligen med aktivitet i rätt överlägsen temporal gyrus. De tidigare regionerna motsvarar nära kända dopaminprojektionsställen (Koob, 1992; Cooper et al., 1996). Det var något överraskande att oförutsägbarhet, och inte preferens, var korrelerad med aktivitet i dessa belöningsområden. Om ökad aktivitet i dessa regioner var förknippad med nöje, kunde man dra slutsatsen att oförutsägbara belöningar var mer anmärkningsvärda än förutsägbara. De flesta ämnena uppså emellertid inte någon skillnad mellan förutsägbara och oförutsägbara förhållanden. Om de oförutsägbara belöningarna var mer njutbara än förutsägbara, eller vice versa, då måste detta ske på en undermedveten nivå. En alternativ förklaring antar att dopamin frigörs i ökade mängder till oväntade belöningar (Montague et al., 1996; Schultz et al., 1997;Schultz, 1998). Dopamin kan minska neuronal excitabilitet (Cooper et al., 1996) och kan också direkt stryka mikrovasculaturen (Krimer et al., 1998), men ökad accumbens aktivitet har också associerats med det subjektiva nöje av kokain (Breiter et al., 1997). Dessa resultat tyder på att vår observerade ökning av aktivering med oförutsägbarhet kan relateras till ökat dopaminfrigörande, antingen för att accumbensprojekten till VTA eller för att det erhåller en projicering från VTA, vilken som helst skulle överensstämma med modellresultaten. Denna tolkning bör tempereras av två viktiga fakta: (1) mekanismerna som skulle koppla till ökad dopaminerg överföring till förändringar i BOLD-signalen är okända, och (2) har vi ingen självständig mätning av dopaminerg överföring, endast förändringar i BOLD-svaret. Möjligheten att vi observerar indirekt förändringar i dopaminerg aktivitet är spännande men kan inte bestämt entydigt i ett fMRI-experiment. Det är dock i överensstämmelse med tidigare fynd som använder positronemissionstomografi att dopamin frisätts i ventralstriatum under villkor för monetärt incitament (Koepp et al., 1998). Tillsammans med den förstärkande effekten av oförutsägbarhet är det också förenligt med hypotetiska effekter av dopamin på neuronal "gain" (Cohen och Servan-Schreiber, 1992), med slutresultatet att vissa regioner kommer att öka och andra kommer att minska.

De specifika regioner som aktiverats relativt av oförutsägbarhet motsvarade hjärnregioner associerade med aptitativa funktioner. Förutom kärnan accumbens, den mediala orbitofrontala cortexen visade en huvudeffekt för oförutsägbarhet. Denna region har visats i primater för att integrera både de givande och neutrala aspekterna av smakavkänningar och antages att reflektera primärt de motivativa värdena för dessa stimuli (Rolls, 2000). Denna region innehåller också neuroner som diskriminerar relativ preferens för belöning (Tremblay och Schultz, 1999). Den orbitofrontala cortexen är vanligtvis svår att bilda med fMRI på grund av mottaglighet artefakt från nasala bihålor (Ojemann et al., 1997). Den region som vi identifierade är dock generellt överlägsen och caudal till den vanliga artefaktplatsen. Denna region har tidigare funnits mottaglig för god smak (Francis et al., 1999). En andra region, i överlägsen parietalloben, var förmodligen inte relaterad till de givande aspekterna av uppgiften utan snarare resultatet av förändringar i uppmärksamhet. Denna region har tidigare varit inblandad i visuospatial uppmärksamhet, speciellt vid förväntningsbrott (Nobre et al., 1999). En annan region, i vänster temporal cortex, visade en gränsen signifikant modulering av oförutsägbarhet. I de senaste fMRI-experimenten har den vänstra temporala loben associerats med bearbetning av förutsägbarheten för sekventiella stimuli (Bischoff-Grethe et al., 2000). Här utsträcker vi dessa tidigare fynd från neutrala stimuli till trevliga stimuli, vilket tyder på att denna region kan utföra en generisk övervakning av förutsägbarhet oberoende av stimulusvalens.

Hjärnregionerna som vi identifierade som svar på oförutsägbarhet i direkt eller modulerande sätt har blivit implicerade i ett antal experiment på ekonomisk belöning. Pengar kan vara givande för människor, men det förstärker bara för att det har förvärvat dessa egenskaper genom komplex konditionering. På samma sätt som att kokain verkar på olika neuroner än naturliga förstärkare (Carelli et al., 2000), det är möjligt att konditionerade förstärkare, såsom pengar, agerar på olika neurala system än naturliga förstärkare som mat och vatten. Aktiviteten i både ventralstriatum och midbrain har korrelerats med absoluta nivåer av ekonomisk belöning (Thut et al., 1997;Delgado et al., 2000; Elliott et al., 2000; Knutson et al., 2000), ett resultat som i synnerhet saknas i våra resultat. Såsom noterats tidigare var både juice och vatten mildt angenäm, och så kan det inte ha varit en väsentlig skillnad i absolut belöning, även om vi antog en liten skillnad i den teoretiska modellen. Vi använde inte heller någon aversiv stimuli eller något som skulle kunna tolkas som en negativ belöning, vilket också kan bero på denna skillnad. Intressant är att de regioner som vi identifierade som antingen direkt påverkat eller förstärkt av oförutsägbarhet motsvarade de tidigare konstaterade regionerna för att vara känsliga för det ekonomiska belöningssammanhanget (Rogers et al., 1999; Elliott et al., 2000). I synnerhet var både den subgenuella cingulära och mediala talamus korrelerade med oförutsägbarhet i vår studie och befanns vara kontextberoende av Elliott et al. (2000).

Eftersom förutsägbarhet modulerade effekten av preferens är det viktigt att skilja de potentiella källorna till förutsägelse. I ett klassiskt konditioneringsexperiment föregår en neutral stimulans belöningen. Efter träning blir den tidigare neutrala stimulansen prediktor eller konditionerad stimulans. Eftersom det finns relativt få data om användningen av orala stimuli i fMRI valde vi att förenkla experimentet och kontrollera de motoriska aspekterna av uppgiften genom att använda två olika orala stimuli, vatten och fruktjuice. Således kom källan till förutsägelse i vårt experiment nödvändigtvis från stimulanssekvensen själva. På något sätt är detta enklare än att införa en annan stimulansmodalitet, såsom en visuell signal, men eftersom båda stimulierna var givande, kan vi inte göra några slutsatser när det gäller konditioneringsprocessen. Både den teoretiska modellen (Schultz et al., 1997) och neurofysiologiska data (Schultz et al., 1992, 1993) föreslår att belöningsförutsägelser beräknas under intervallet före belöningsleverans. Eftersom vi inte känner till den tidsskala över vilken sådana förutsägelser beräknas valde vi att analysera experimentet som bara två förutsättningar, förutsägbara och oförutsägbara. Genom att upprätthålla ett psykiskt rimligt intervall mellan stimuli, 10 sek, fanns det otillräcklig tid för att lösa skillnader i interstimulusbehandling. Förmodligen sker sådan behandling, och detta kan lösas med ett annorlunda utformat experiment.

Sammanfattningsvis kan aktiviteten i regionerna för mänskliga belöningar moduleras av den tidsmässiga förutsägbarheten av primärbelöningar som vatten och juice. Dessa resultat ger viktigt stöd för beräkningsmodeller som postulerar att fel i belöningsprognos kan driva synaptisk modifiering och utvidga dessa slutsatser från icke-humana primater till människor. Den regionala specificiteten hos denna modulering föreslår också att information, som belyses av den relativa förutsägbarheten hos en stimulusström, kan vara en form av neural valuta som kan detekteras med fMRI.

fotnoter

    • Mottagna November 11, 2000.
    • Revision mottagen Januari 17, 2001.
    • Godkända Januari 26, 2001.
  • Detta arbete stöddes av National Institute for Drug Abuse Grants K08 DA00367 (till GSB) och RO1 DA11723 (till PRM), National Alliance for Research in Schizophrenia and Depression (GSB) och Kane Family Foundation (PRM). Vi tackar H. Mao, R. King och M. Martin för deras hjälp med datainsamling.

    Korrespondens kan adresseras till Gregory S. Berns, Institutionen för psykiatri och beteendevetenskaper, Emory University School of Medicine, 1639 Pierce Drive, Suite 4000, Atlanta, GA 30322, E-post:[e-postskyddad], eller P. Läs Montague, Division of Neuroscience, Baylor College of Medicine, 1 Baylor Plaza, Houston, TX 77030, E-post:[e-postskyddad].

Artiklar som citerar denna artikel