Předvídatelnost moduluje reakci lidského mozku na odměnu (2001)

KOMENTÁŘE: Nepředvídatelné odměny vedou k větším bodům dopaminu. To je důvod, proč se vysokorychlostní internetové porno liší od porno minulosti
 
J Neurosci. 2001 Apr 15;21(8):2793-8.
 

Zdroj

Ústav psychiatrie a behaviorálních věd, Lékařská fakulta Univerzity Emory, Atlanta, Gruzie 30322, USA. [chráněno e-mailem]

Abstraktní

Některé třídy podnětů, jako je jídlo a drogy, jsou vysoce účinné při aktivaci oblastí odměňování. U lidí ukazujeme, že aktivita v těchto regionech může být modulována předvídatelností sekvenčního dodání dvou mírně příjemných podnětů, orálně dodávané ovocné šťávy a vody. Pomocí funkčního zobrazování magnetickou rezonancí byla aktivita pro odměňování podnětů jak v nucleus accumbens, tak v mediální orbitofrontální kůře největší, když byly podněty nepředvídatelné. Kromě toho preference subjektů, které dávají přednost šťávě nebo vodě, přímo nesouvisely s aktivitou v oblastech odměny, ale naopak korelovaly s aktivitou v senzomotorické kůře. Pro příjemné podněty tato zjištění naznačují, že předvídatelnost moduluje odezvu oblastí lidské odměny a subjektivní preference může být od této odpovědi oddělena.

Úvod

Snaha o přirozené odměny, jako je jídlo, pití a sex, je hlavním vnějším vlivem na lidské chování. Nicméně otázka, jak odměny ovlivňují lidské chování, zůstává primárně nevyřešena. K této mezeře v našich znalostech přispívá mnoho faktorů; Jedním překážkou však bylo obtížné definovat a měřit izolované účinky odměn na lidské chování nebo na aktivaci mozku. U zvířat je odměna definována jako operační koncepce: podnět je považován za odměnu, pokud pozitivně posiluje chování (Hull, 1943; Rescorla a Wagner, 1972; Robbins a Everitt, 1996), to znamená, že spolehlivě zvyšuje pravděpodobnost chování. Stejný koncept platí pro člověka; lidé však mají schopnost vykonávat nejrůznější výkonnou kontrolu nad svými činy, a tak samotné testy chování jsou neúplným způsobem, jak zkoumat zpracování odměn. Podobně explicitní zprávy o tom, co se jim líbí a nelíbí, tj. Preference, jsou zmateny subjektivním vnímáním jednotlivce, co se mu líbí a co se rozhodlo hlásit. Abychom překonali tyto experimentální obtíže, chtěli bychom současně sledovat výstup chování, subjektivní preference a reakci mozku během dobře definované úlohy. Pokud vezmeme takový přístup, uvedeme zde, že aktivita v oblastech lidské odměny více souvisí s předvídatelností sledu příjemných podnětů než s výslovně uvedenými preferencemi.

U lidí může být aktivace odměňovacích oblastí vizualizována pomocí funkčního zobrazování magnetickou rezonancí (fMRI) po podání léků, jako je kokain (Breiter a kol., 1997); tyto infuze však nemusí představovat běžné zpracování odměn, a to z důvodu přímých i nepřímých farmakologických účinků kokainu. Kromě toho drogy, jako je kokain, mohou působit v různých částech systému odměn než v tzv. Přírodních odměnách, jako je jídlo a voda (Bradberry a kol., 2000; Carelli a kol., 2000). Podmíněné odměny, např. Peníze, mohou také působit na různé části systému odměn (Thut a kol., 1997; Elliott a kol., 2000; Knutson a kol., 2000) a nemusí to být vhodná sonda primárních obvodů odměňování u lidí. Alternativní přístup je navrhován experimenty, které prokazují, že předvídatelnost primárně odměňujícího stimulu je kritickým parametrem pro aktivaci odměnových cest (Schultz a kol., 1992, 1997; Schultz, 1998; Garris a kol., 1999). Fyziologické záznamy u primátů nelidských prokázaly, že neurony v oblastech, jako je ventrální tegmentální oblast (VTA), nucleus accumbens a ventrální striatum, reagují adaptivním způsobem na odměňující podněty, jako je ovocná šťáva nebo voda (Shidara a kol., 1998). Předvídatelnost sekvence podnětů může sama o sobě získat neurální struktury související s odměnami způsobem detekovatelným pomocí fMRI. Navíc, teoretické modely uvolňování dopaminu naznačují, že nepředvídatelné odměny by měly vyvolat větší aktivitu v těchto regionech (Schultz a kol., 1997). Snažili jsme se otestovat tuto hypotézu pomocí fMRI k měření vlivu předvídatelnosti na reakce lidského mozku na sekvence punctátových, příjemných podnětů.

MATERIÁLY A METODY

Předměty. Dvacet pět normálních dospělých podstoupilo skenování fMRI, zatímco jim bylo podáváno malé množství perorální ovocné šťávy nebo vody. Subjekty se pohybovaly ve věku od 18 do 43 a všechny subjekty daly informovaný souhlas s protokolem schváleným Výborem pro lidská vyšetřování Emory University.

Experimentální úkol. Během skenování dostali subjekty malé množství orálně dodávané ovocné šťávy a vody buď předvídatelným nebo nepředvídatelným způsobem. Zvolili jsme sekvenční dodávku ovocné šťávy a vody ze tří důvodů: (1) lidé považují jak šťávu, tak vodu za subjektivně příjemné; (2) jsou oba podněty běžně používány jako posilovací podněty při výcviku primátů na nelidské primáty na chování. a (3) dopaminergní neurony midbrainu a pravděpodobně neurony, na které se promítají, vykazují fázové změny rychlosti střelby v závislosti na časové předvídatelnosti sekvenčních podnětů (Schultz a kol., 1992). Účastníci dostali šťávu i vodu buď předvídatelným nebo nepředvídatelným způsobem ve dvou skenovacích cyklech (Obr. 1). Během předvídatelného běhu se střídaly šťávy a vodní bolusy ve fixním intervalu 10 s. Během nepředvídatelného běhu byl randomizován řád šťávy a vody a stimulační interval byl také randomizován vzorkováním distribuce Poissonova intervalu se střední hodnotou 10 sec. Každý běh trval 5 min a pořadí obou běhů (předvídatelné nebo nepředvídatelné) bylo náhodně rozděleno mezi subjekty. Protože čas na přizpůsobení se předvídatelnosti nebo nepředvídatelnosti nebyl znám a protože časté přepínání podmínek by mohlo způsobit vzájemnou interakci, tj. „Předvídatelnost předvídatelnosti“, rozhodli jsme se spíše oddělit podmínky napříč skenovacími cykly, než použít menší stavové bloky. během skenování. Protože všechny aspekty experimentu závisely na manipulaci s předvídatelností, rozhodli jsme se neopakovat podmínky v rámci předmětů a místo toho jsme se zaměřili na studium většího počtu předmětů.

Obr. 1.  

Návrh experimentu fMRI. Byl použit faktorový návrh 2 × 2, s faktory preference (šťáva nebo voda) a předvídatelností (předvídatelné nebo nepředvídatelné). Subjekty dostaly 0.8 ml bolusy šťávy a vody v předvídatelné nebo nepředvídatelné sekvenci. Pomocí události fMRI související s událostí byla analyzována aktivace mozku z hlediska preference a předvídatelnosti, jakož i interakce mezi nimi.

Subjekty dostaly 0.8 ml perorální bolusy ovocné šťávy a vody pomocí dvou plastových zkumavek. Konce trubice držely náustek na místě nad jazykem, s ovocnou šťávou vyluhovanou z levé strany náústku a vodou zprava. Zkumavky byly dlouhé N10 m a byly připojeny k počítačově ovládané pumpě s duální stříkačkou (Harvard Apparatus, Holliston, MA) mimo skenerovou místnost. Subjekty během skenování neprováděly žádné jiné úkoly a bylo jim řečeno, aby tekutinu při každém podání jednoduše spolkly. Po skenovací relaci byli subjekty informováni o jejich tekutinové preferenci.

Získávání dat MRI. Skenování bylo provedeno na skeneru 1.5 Tesla Philips NT. Po získání anatomického skenování s vážením T1 s vážením ve vysokém rozlišení podstoupily subjekty dva funkční mozkové cykly skenování 150 s plným mozkem (echo-planární zobrazení, gradient vyvolané ozvěny; opakovací čas, 2000 msec; echo čas, 40 msec; úhel převrácení, 90 °; 64 × 64 matice, 24 5 mm axiální řezy získané paralelně s anteroposteriorní commissurální linií) pro měření efektu hladiny kyslíku v krvi (BOLD) (Kwong a kol., 1992; Ogawa a kol., 1992). Pohyb hlavy byl minimalizován čalouněním a opěrkami.

Analýza. Data byla analyzována pomocí statistického parametrického mapování (SPM99; Wellcome Department of Cognitive Neurology, London, UK) (Friston a kol., 1995b). Pohybová korekce k prvnímu funkčnímu skenování byla provedena u subjektů pomocí šestiparametrické transformace tuhého těla. Protože polykání nevyhnutelně způsobuje významný pohyb hlavy, parametry korekce pohybu byly také použity ke stanovení, zda se pohyb hlavy mezi podmínkami významně liší. Průměr obrazů s korekcí pohybu byl poté zaregistrován do 24-řezné strukturální MRI jednotlivce pomocí afinitní transformace s 12 parametry. Snímky byly poté prostorově normalizovány podle šablony Montrealského neurologického institutu (MNI) (Talairach a Tournoux, 1988) použitím afinní transformace parametru 12, následované nelineárním deformováním pomocí základních funkcí (Ashburner a Friston, 1999). Obrázky byly následně vyhlazeny izotropním gaussovským jádrem 8 mm a pásmová propust byla filtrována v časové doméně. S SPM99em byla provedena statistická analýza náhodných účinků a událostíFriston a kol., 1995a, 1999). Experiment byl analyzován jako faktorový návrh 2 × 2. Nejprve byl pro každý subjekt určen samostatný obecný lineární model (GLM), přičemž čtyři podmínky představovaly čtyři možné typy událostí: předvídatelná - upřednostňovaná tekutina, předvídatelná - nepřednostní tekutina, nepředvídatelná - upřednostňovaná tekutina a nepředvídatelná - nepřednostní tekutina. Pro každou ze čtyř podmínek byly vytvořeny čtyři vektory funkcí delta s časy odpovídajícími každé události. Tito byli spleteni s obecnou hemodynamickou odezvovou funkcí a vstoupili do čtyř sloupcové matice designu. Průměr každého běhu skenování byl odstraněn na základě voxelwise. Vypočítali jsme tři oboustranné kontrastní obrazy, které odpovídaly hlavním účinkům preferencí [kontrastní vektor (1-11-1)], předvídatelnost [kontrastní vektor (11-1-1)]] a interakční pojem [kontrastní vektor (1) -1-11)]. Interakce popisuje, jak předvídatelnost moduluje účinek preference. Tyto jednotlivé kontrastní obrazy byly vloženy do analýzy druhé úrovně pomocí samostatného jednoho vzorku t test (df = 24) pro každou stranu každého termínu v GLM (celkem šest kontrastů). Tyto souhrnné statistické mapy jsme nastavili na p <0.001 (neopraveno pro více srovnání). Tyto mapy byly překryty strukturálním obrazem s vysokým rozlišením v orientaci MNI.

Teoretický model. Jako nástroj pro navrhování a interpretaci experimentu fMRI jsme použili existující model neuronové sítě uvolňování dopaminu k simulaci mozkové reakce na různé časové vzorce odměňujících podnětů (Obr.2). Tento model byl založen na metodě časových rozdílů (TD), která předpokládá, že se synapticky zesilující látka, např. Dopamin, uvolňuje v reakci na chyby v predikci odměny (Schultz a kol., 1997). Tento model byl použit v celé řadě aplikací, včetně složitých úkolů učení, jako je backgammon (Sutton, 1988; Tesauro a Sejnowski, 1989), stejně jako úspěšné předpovídání aktivity dopaminových neuronů v řadě kondičních paradigmat (Houk a kol., 1995; Montague a kol., 1995) a motorové sekvenční úlohy (Berns a Sejnowski, 1998).

Obr. 2.  

Model neuronové sítě experimentu a oblasti mozku spojené se zpracováním informací. ADiagram ukazuje naši hypotézu o tom, jak by sekvence stimulací mohla ovlivnit dopaminergní výstup. V této hypotéze jsme naznačili, že změny v dopaminergním výstupu by mohly ovlivnit cílové nervové struktury způsobem detekovatelným při měření fMRI BOLD. Šťáva a voda mají oba smyslové účinky (projekce z omezeného času)okno) a odměna ( r cesty) reprezentace jejich vlivu na dopaminergní aktivitu. Abychom vytvořili očekávanou hemodynamickou odpověď z této hypotézy, vytvořili jsme konečné časové okno (malé krabičky pro šťávu a vodu), která určovala hodnotu okamžité odměnyr(t) (1, pokud došlo k šťávě, 0.5, pokud došlo k vodě, a 0, pokud nedošlo k žádnému podnětu). Tento manévr svévolně nastavil šťávu na dvojnásobek hodnoty vody. To není důležité pro hlavní očekávání generovaná modelem.BPředvídaný dopaminový účinek pro předvídatelné a nepředvídatelné sekvence dodávání šťávy a vody. Horizontální osa je číslo skenování. Vertikální osa je očekávaná hemodynamická odpověď predikovaná modelem časového rozdílu. Měřítko na svislá osa je libovolný. Důležité je poznamenat, že předvídatelný průběh postupuje do 0, zatímco nepředvídatelný průběh zůstává po celou dobu vysokou amplitudou. Stopy byly generovány zkroucením jádra hemodynamické odezvy s výstupem modelu časového rozdílu. To svědčí o tom, že průměrná odpověď BOLD by byla větší, kdyby byly podněty nepředvídatelné.

Stručně řečeno, učení TD závisí na dvou primárních předpokladech. Nejprve nastane krátkodobá adaptace v daném nervovém obvodu s cílem předpovědět diskontovanou částku všech budoucích odměn. Definice odměny závisí na kontextu, ve kterém je obdržena. Pokud předpokládaná odměna zvyšuje výskyt určitého chování, považuje se to za pozitivní posílení. V závislosti na vnitřním stavu zvířete nemusí stejná odměna posilovat chování, např. Když je zvíře nasyceno. V kontextu experimentu fMRI, který je obecně nepřirozený, je známá chutná látka, jako je voda nebo ovocná šťáva, subjektivně prožívána jako příjemná, a proto obohacující. Za druhé, předpovědi odměn závisí pouze na současné reprezentaci sady stimulů. Reprezentace stimulu je v modelu poněkud libovolná a zahrnuje určitou reprezentaci zpět v čase, tj. Stopu stimulu. U látek, jako je voda nebo ovocná šťáva, existují jak smyslové dimenze (např. Teplota a hmatový pocit na jazyku), tak skutečná odměna, která je subjektivně vnímána jako potěšení. Je proto rozumné považovat dotykové rozměry dodávky tekutin za neutrální i odlišné od prospěšné dimenze. Podobně se předpokládá, že tyto odlišné dimenze budou zpracovávány různými mozkovými obvody, které mohou být zobrazeny pomocí fMRI. Pro mapování výstupu modelu na rozměr analogický měření získanému pomocí fMRI jsme sečtili výstupy neutrální i odměnující dráhy, které jsme předpokládali konvergované ve ventrálním striatu a nucleus accumbens. Uznáváme, že pro to neexistují žádné přímé důkazy a v závislosti na konkrétním receptoru může mít dopamin různé účinky na neuronální aktivitu. Přesný experimentální návrh byl vstupem do modelu, který byl simulován s Matlab 5.3 (MathWorks, Natick, MA). Výstupy odpovídající předpokládaným dopaminovým neuronům a jejich promítacím místům byly vypočteny pro předvídatelné a nepředvídatelné běhy (Obr. 2).

Měli bychom dávat pozor na čtenáře, že naše použití modelu časových rozdílů k vysvětlení našeho návrhu a následné interpretace (níže) je založeno na jeho předchozím úspěchu v popisu změn ve špičce produkce dopaminergních neuronů u primátů, kteří podstupují související behaviorální úkoly. Mohou stačit i jiné věrohodné výpočtové popisy.

VÝSLEDKY

Po skenování byli subjekty dotázáni na to, jak dávají přednost těmto dvěma podnětům. Osmnáct subjektů 25 (72%) preferovalo šťávu a zbytek preferovanou vodu. Většina subjektů měla jednoznačné preference pro jednoho nebo druhého, i když jsme je nežádali, aby to kvantifikovali. Ačkoli během skenování došlo k významnému pohybu hlavy, všechny translace a rotace kolem každého stimulu byly obecně malé a mezi žádnými podmínkami se významně nelišily. Například průměrný ± SD překlad spojený s každým stimulem byl 0.041 ± 0.069 mm v předvídatelném stavu a 0.044 ± 0.069 mm v nepředvídatelném stavu (spárováno) t test;p = 0.853).

Odezva mozku na upřednostňovanou tekutinu vykazovala překvapivě malou diferenciální aktivitu vzhledem k nevytvrzené tekutině (tabulka 1)1). Nezaznamenali jsme žádný významný rozdíl v aktivitě v klasických oblastech odměn, jako je nucleus accumbens, hippocampus nebo mediální prefrontální kůra. Změna primární aktivity pro preferovanou> nepřednostní došlo v somatosenzorické kůře v oblasti poblíž oblasti úst a jazyka (t = 4.19, souřadnice MNI, -60, -12, 16).

Zobrazit tuto tabulku:  

Tabulka 1.  

Oblasti mozku vykazující významné změny v měřené aktivitě (p <0.001 neopraveno; velikost klastru> 10 voxelů, pokud není uvedeno jinak)

Hlavní účinek předvídatelnosti byl podstatně větší než hlavní účinek preference (Obr. 3). V případě nepředvídatelného běhu vzhledem k předvídatelnému běhu byla pozorována bilaterální aktivace ve velké oblasti mediální orbitofrontální kůry, která obsahovala jádro accumbens (tabulka 1). Další oblasti aktivace zahrnovaly velkou oblast parietálního kortexu bilaterálně a paracentrálně a malé fokální aktivace v levém mediodorsálním jádru thalamu a pravém mozečku. Protože žádná z těchto oblastí se nepřekrývala s hlavním účinkem preference, byly maximálně aktivovány nepředvídatelnými stimuly, bez ohledu na preference. Pro předvídatelný běh relativně k nepředvídatelnému běhu byla aktivována oblast pravého nadřazeného časného gyru, stejně jako fokální aktivace v levém precentrálním gyru a pravém laterálním orbitofrontálním kortexu.

Obr. 3.  

Hlavní účinek předvídatelnosti ukázal, že regiony související s odměnami měly výraznější BOLD reakci na nepředvídatelné podněty. A, Roviny soustředěné na (0, 4, −4) ukazují, že bilaterální jádro accumbens / ventrální striatum (NAC) a bilaterální nadřazená mozková kůra byly v předvídatelném stavu aktivnější. B„Malá oblast v pravém nadřazeném časovém gyru byla relativně více aktivována předvídatelnými stimuly. Význam byl stanoven nap <0.001 a rozsah> 10 sousedících voxelů.

Interakce mezi preferencí a předvídatelností identifikovala oblasti, ve kterých jeden účinek moduloval druhý nezávisle na obou hlavních účincích. Pravý izolát, levý zadní cingulát a pravý mozeček vykazovaly významnou interakci pro kontrast (preferovaný - nepřednostní) × (předvídatelný - nepředvídatelný). Opačný kontrast (preferovaný - nepřednostní) × (nepředvídatelný - předvídatelný) neodhalil žádné významné aktivace na p <0.001 úroveň; malá oblast v levém horním temporálním gyrusu (souřadnice MNI, −48, −4, −16) byla významná na p <0.01 úroveň (t = 3.15).

Počítačová simulace naznačovala, že nepředvídatelné odměny by měly vyvolávat více uvolňování dopaminu než předvídatelné (obr.2 B). Když jsou odměny předvídatelné, každý stimul dokonale předpovídá následující a chybový signál, o kterém se předpokládá, že je zprostředkován dopaminem, se postupně snižuje. Pokud jsou odměny nepředvídatelné, není možné, aby se systém učil, a reakce na každý stimul je větší.

DISKUSE

Naše výsledky prokázaly zajímavé oddělení mozkové reakce na předvídatelnost a subjektivní zprávy o preferenci. Odezva mozku na preferenci byla výhradně kortikální, ale reakce na předvídatelnost ukázala specifickou aktivaci systémů odměňování, o nichž je také známo, že jsou cílem dopaminergních neuronů midbrainu. Pokud předpokládáme, že aktivace těchto oblastí odměňování je pro lidi příjemná, pak toto zjištění naznačuje, že subjektivní zpráva preferencí může být oddělena od nervových obvodů známých jako silné determinanty podmíněného chování.

Jak voda, tak i ovocná šťáva způsobily v mozku významné aktivace, a ačkoli některé z těchto odpovědí lze přičíst motorickým aspektům úkolu, specifické podskupiny těchto regionů byly rozloženy na dimenze preference a předvídatelnosti. Účinek preference byl omezen na kortikální oblasti spojené se senzorickým zpracováním a výhodný stimul vedl k větší aktivaci v těchto regionech. Tyto oblasti leží poblíž senzorimotorové kůry, o které je známo, že je aktivována během pohybů jazyka (Corfield a kol., 1999) a polykání (Hamdy a kol., 1999). V předchozí práci na mozkové odezvě na pohyb jazyka došlo k podstatné aktivaci mozečku, což byl hlavní nedostatek preferencí. Diferenční mozková odpověď, tj. Preferovaná - nebývalá, odstraňuje společné oblasti aktivace; proto absence cerebelární aktivace naznačuje, že diferenciální pohyby jazyka nebyly pravděpodobně subjektivní preferencí vzorce kortikální aktivace. Skutečnost, že somatosenzorická oblast byla korelována s uvedenou preferencí, svědčí o tom, že u těchto dvou podnětů došlo k diferenciálnímu nervovému zpracování. Překvapivé bylo, že se to projevilo v oblasti primárního smyslového zpracování a nikoli v oblastech klasického odměňování. Přestože byli subjekty nuceny určit jednu látku před druhou jako svou preferenci, obě tekutiny byly záměrně zvoleny tak, aby byly příjemné, v rozporu s tím, že jedna je averzivní. Protože obě tekutiny byly obecně příjemné, účinek preference nemusel být dostatečně silný, aby vyústil v významný rozdíl v aktivitě v regionech odměňování. To by bylo v souladu se zjištěními, že dopaminové neurony midbrainu jsou přednostně aktivovány spíše apetitivními než averzivními stimuly (Mirenowicz a Schultz, 1996). Naše zjištění nicméně naznačují systémovou diferenciaci subjektivní preference od jednoduché odměny, což podporuje předchozí hypotézy, že „chtít“ není stejné jako „líbení“ (Robinson a Berridge, 1993).

Na rozdíl od účinku preference, nepředvídatelnost korelovala jako významný hlavní účinek s aktivitou v jádru accumbens, thalamu a mediální orbitofrontální kůře, zatímco předvídatelnost byla korelována převážně s aktivitou v pravém nadřazeném časovém gyru. Bývalé regiony úzce korespondují se známými dopaminovými projekčními místy (Koob, 1992; Cooper et al., 1996). Bylo poněkud překvapivé, že nepředvídatelnost, a nikoli preference, byla v korelaci s aktivitou v těchto oblastech odměňování. Pokud by zvýšená aktivita v těchto regionech byla spojena s potěšením, pak bychom mohli dojít k závěru, že nepředvídatelné odměny byly příjemnější než předvídatelné. Většina subjektů však nerozpoznala žádný rozdíl mezi předvídatelnými a nepředvídatelnými podmínkami. Pokud byly nepředvídatelné odměny příjemnější než předvídatelné, nebo naopak, musí k tomu dojít na podvědomé úrovni. Alternativní vysvětlení předpokládá, že dopamin je uvolňován ve zvýšeném množství na neočekávané odměny (Montague a kol., 1996; Schultz a kol., 1997;Schultz, 1998). Dopamin může snížit neuronální excitabilitu (Cooper et al., 1996) a může také přímo omezit mikrovaskulaturu (Krimer a kol., 1998), ale zvýšená aktivita accumbensu byla také spojena s subjektivním potěšením kokainu (Breiter a kol., 1997). Tato zjištění naznačují, že naše pozorované zvýšení aktivace s nepředvídatelností by mohlo souviset se zvýšeným uvolňováním dopaminu, buď proto, že accumbens promítá do VTA, nebo proto, že dostává projekci z VTA, která by byla v souladu s výsledky modelu. Tato interpretace by měla být zmírněna dvěma důležitými fakty: (1) mechanismy, které by spojily zvýšený dopaminergní přenos ke změnám signálu BOLD, nejsou známy, a (2) nemáme žádné nezávislé měřítko dopaminergního přenosu, pouze změny v odpovědi BOLD. Možnost, že pozorujeme nepřímé změny dopaminergní aktivity, je vzrušující, ale nelze ji jednoznačně rozhodnout v experimentu fMRI. Je však v souladu s předchozími nálezy používajícími pozitronovou emisní tomografii, že dopamin je uvolňován do ventrálního striata za podmínek peněžní motivace (Koepp a kol., 1998). Spolu s zesilujícím účinkem nepředvídatelnosti je také v souladu s předpokládanými účinky dopaminu na neuronální „zisk“ (Cohen a Servan-Schreiber, 1992), s konečným výsledkem, že některé regiony vzrostou a jiné se sníží.

Specifické oblasti aktivované relativně nepředvídatelností odpovídaly oblastem mozku spojeným s chutnými funkcemi. Kromě jádra accumbens vykazoval mediální orbitofrontální kůra hlavní účinek pro nepředvídatelnost. Ukázalo se, že tato oblast u primátů integruje jak prospěšné, tak neutrální aspekty chuťových vjemů a předpokládá se, že odráží především motivační hodnoty těchto podnětů (Rolls, 2000). Tato oblast také obsahuje neurony, které rozlišují relativní preference za odměnu (Tremblay a Schultz, 1999). Orbitofrontální kůra je obvykle obtížně zobrazitelná s fMRI kvůli artefaktu citlivosti z nosních dutin (Ojemann a kol., 1997). Oblast, kterou jsme identifikovali, je však obecně lepší a kaudální než obvyklé umístění artefaktů. Tato oblast byla dříve nalezena jako reakce na příjemné chutě (Francis a kol., 1999). Druhý region, ve vynikajícím parietálním laloku, pravděpodobně nesouvisel s odměňujícími aspekty úkolu, ale spíše s výsledkem změn pozornosti. Tato oblast se dříve podílela na visuospatiální pozornosti, zejména během porušení očekávání (Nobre a kol., 1999). Jiná oblast, v levé časové kůře, vykazovala hraniční významnou modulaci nepředvídatelností. V nedávných experimentech s fMRI byl levý temporální lalok spojen se zpracováním předvídatelnosti sekvenčních podnětů (Bischoff-Grethe a kol., 2000). Zde rozšiřujeme tato předchozí zjištění z neutrálních podnětů na příjemné podněty, což naznačuje, že tato oblast může provádět obecné monitorování předvídatelnosti nezávisle na valenci podnětů.

Oblasti mozku, o nichž jsme zjistili, že reagují na nepředvídatelnost přímým nebo modulačním způsobem, byly zapojeny do řady experimentů o finanční odměně. Peníze mohou být pro člověka prospěšné, ale posilují se pouze proto, že tyto vlastnosti získaly složitým kondicionováním. Podobné zjištění, že kokain působí na jiné neurony než na přírodní zesilovače (Carelli a kol., 2000), je možné, že kondicionované posilovače, jako jsou peníze, působí na jiné nervové systémy než přírodní posilovače, jako je jídlo a voda. Aktivita jak ve ventrálním striatu, tak ve středním mozku byla korelována s absolutní úrovní finanční odměny (Thut a kol., 1997;Delgado a kol., 2000; Elliott a kol., 2000; Knutson a kol., 2000), nález, který v našich výsledcích chybí. Jak bylo uvedeno výše, jak šťáva, tak voda byly mírně příjemné, a tak nemusí existovat podstatný rozdíl v absolutní odměně, i když jsme předpokládali mírný rozdíl v teoretickém modelu. Nepoužili jsme také žádné averzivní podněty ani nic, co by bylo možné chápat jako zápornou odměnu, což může tento rozdíl také vysvětlit. Je zajímavé, že regiony, o nichž jsme identifikovali, že jsou buď přímo ovlivněny nebo zesíleny nepředvídatelností, odpovídaly regionům, o kterých bylo dříve zjištěno, že jsou citlivé na kontextovou závislost finanční odměny (Rogers a kol., 1999; Elliott a kol., 2000). Konkrétně, jak subgenální cingulát, tak mediální thalamus byly v naší studii korelovány s nepředvídatelností a bylo zjištěno, že jsou závislé na kontextu Elliott a kol. (2000).

Protože předvídatelnost modulovala účinek preference, je důležité rozlišit potenciální zdroje predikce. V klasickém kondicionovacím experimentu před odměnou předchází neutrální stimul. Po tréninku se dříve neutrální stimul stane prediktorem nebo podmíněným stimulem. Protože existuje poměrně málo údajů o použití orálních podnětů u fMRI, rozhodli jsme se zjednodušit experiment a kontrolu pro motorické aspekty úkolu pomocí dvou různých orálních podnětů, vody a ovocné šťávy. Zdroj predikce v našem experimentu tedy nutně pocházel ze sekvence samotných podnětů. V některých ohledech je to jednodušší než zavedení jiné stimulační modality, jako je vizuální narážka, ale protože oba podněty byly prospěšné, nemůžeme učinit žádné závěry ohledně procesu kondicionování. Teoretický model (Schultz a kol., 1997) a neurofyziologická data (Schultz a kol., 1992, 1993) naznačují, že předpovědi odměn jsou počítány během intervalu, který předchází odměně. Protože neznáme časový rozsah, ve kterém jsou takové předpovědi počítány, rozhodli jsme se analyzovat experiment jako jednoduše dvě podmínky, předvídatelné a nepředvídatelné. Udržováním psychologicky přiměřeného intervalu mezi podněty, 10 sec, nebyl dostatek času na vyřešení rozdílů ve zpracování interstimulu. Zdá se, že k takovému zpracování dochází, a to by mohlo být vyřešeno experimentem s jiným designem.

Souhrnně lze říci, že aktivita v oblastech odměňování lidí může být modulována časovou předvídatelností primárních odměn, jako je voda a šťáva. Tyto výsledky poskytují důležitou podporu pro výpočetní modely, které předpokládají, že chyby v predikci odměny mohou vést k synaptické modifikaci a rozšířit tyto závěry z primátů na člověka. Regionální specifičnost této modulace také naznačuje, že informace, jak jsou ztělesněny relativní předvídatelností stimulačního proudu, mohou být formou nervové měny, kterou lze detekovat pomocí fMRI.

Poznámky pod čarou

    • Přijaté Listopad 11, 2000.
    • Revize byla přijata Leden 17, 2001.
    • Přijato Leden 26, 2001.
  • Tuto práci podpořili Národní ústav pro granty na zneužívání drog K08 DA00367 (do GSB) a RO1 DA11723 (do PRM), Národní aliance pro výzkum ve schizofrénii a depresi (GSB) a Nadace Kane Family Foundation (PRM). Děkujeme H. Mao, R. Kingovi a M. Martinovi za jejich pomoc při sběru dat.

    Korešponenci lze adresovat buď Gregorymu S. Bernsovi, Ústavu psychiatrie a behaviorálních věd, Lékařská fakulta Univerzity Emory, 1639 Pierce Drive, Suite 4000, Atlanta, GA 30322, E-mail:[chráněno e-mailem]nebo P. Read Montague, Divize neurověd, Lékařská fakulta Baylor, 1 Baylor Plaza, Houston, TX 77030, E-mail:[chráněno e-mailem].

Články citující tento článek