Citlivost nucleus accumbens na porušení v očekávání odměny (2007)

Neuroimage. 2007 Jan 1; 34 (1): 455-61. Epub 2006 Říjen 17.

Spicer J, Galvan A, Zajíc TA, Voss H, Glover G, Casey B.

Zdroj

Sacklerův institut pro vývojovou psychobiologii, Weill Cornell Medical College z Cornell University, 1300 York Avenue, Box 140, New York, NY 10021, USA.

Abstraktní

Tato studie zkoumala, zda ventrální frontostriatální regiony odlišně kódují očekávané a neočekávané výsledky odměny. Parametricky jsme manipulovali s pravděpodobností odměny a zkoumali jsme nervovou reakci na odměnu a neresward pro každou pravděpodobnostní podmínku ve ventrálním striatu a orbitofrontální kůře (OFC). Pozdějšími pokusy experimentu subjekty vykazovaly pomalejší reakce na chování s podmínkou s nejnižší pravděpodobností odměny ve srovnání se stavem s nejvyšší pravděpodobností odměny. Na nervové úrovni vykazovaly jak nucleus accumbens (NAcc), tak OFC větší aktivaci vůči odměněným v porovnání s nerevidovanými zkouškami, ale accumbens se jevil jako nejcitlivější na porušení očekávaných výsledků odměn. Tato data naznačují odlišné role pro frontostriatální obvody v predikci odměny a v reakci na porušení očekávání.

 

Úvod

Vytváření přesných předpovědí a detekce porušení očekávání ohledně nadcházejících odměn je zásadní součástí chování zaměřeného na cíl. Studie zobrazování primátů a lidí ukazují, že frontostriatální oblasti bohaté na dopamin se podílejí na tvorbě předpovědí o budoucích výsledcích odměn a odpovídajícím způsobem optimalizují chování. Nervové mechanismy chyby predikce související s odměnou - reprezentace rozporu mezi skutečnou a očekávanou odměnou (Schultz a kol., 1997) - byly studovány na nelidských primátech, pokud jde o očekávané a neočekávané odměny nebo opomenutí odměny (Hollerman a kol., 1998, Leon a Shadlen, 1999; Tremblay a Schultz, 1999). Současná studie používala jednoduchou úlohu porovnávání prostorového zpoždění se vzorkem, podobnou té, která byla dříve používána u primátů (Fiorillo a kol., 2003), která manipulovala s pravděpodobností výsledku odměny, zkoumala nervové reakce na očekávané a neočekávané odměny.

Konvergující důkazy implikují dopaminový systém jako klíčový pro predikci a zpracování odměn (Olds a Milner, 1954; Montague a kol., 2004, Schultz, 2002 pro shrnutí). Nehumánní primátové studie ukázaly, že neurony dopaminu reagují na neočekávané primární odměny a nakonec na podněty, které tyto odměny předpovídají (Mirencowicz & Schultz, 1994, Tobler a kol., 2005). Dopaminové neurony ve ventrální tegmentální oblasti (VTA) opice vystřelí v reakci na primární odměnu, která je nepředvídaná (nebo s nízkou pravděpodobností predikována) více než na odměnu, která je plně předpovězena (Fiorillo a kol., 2003;Tobler a kol., 2005). Naopak aktivita stejných neuronů je potlačena, pokud není očekávaná odměna doručena vzhledem k očekávanému opomenutí odměny (Fiorillo a kol., 2003; Tobler a kol., 2005). Dopaminové neurony tedy kódují chybu predikce tím, že představují rozpor mezi skutečným a předpokládaným výsledkem (Schultz a kol., 1997; Tobler a kol., 2005), takže neočekávaná prezentace odměny má za následek zvýšení aktivity a neočekávané opomenutí odměny má za následek snížení aktivity.

Změny v odpalování dopaminu v reakci na změny ve výsledku odměny jsou paralelní se změnami chování. Nehumánní primátové studie zjistily, že opice zvýší své předčasné olizování v závislosti na pravděpodobnosti, s níž je podmíněný stimul spojen s následným nepodmíněným stimulem (dodávání šťávy). Stimuly představující vysokou pravděpodobnost následného dodávání šťávy jako takové vyvolávají předčasnější lízání (Fiorillo a kol., 2003).

Existují vzájemné anatomické souvislosti mezi regiony spojenými s cíleným chováním (např. Prefrontální kůra) a regiony spojenými s automatičtějšími chutěmi chování (např. Ventrálním striatem), kde lze vypočítat předpovědi (Shultz a kol., 1997; Haber et al., 2003). Tyto oblasti jsou silně inervovány dopaminem prostřednictvím projekcí z dopaminových neuraminů uprostřed mozku a tato spojení mohou tvořit funkční neuroanatomický obvod, který podporuje optimalizaci chování ve prospěch akcí, které vedou k největším ziskům.

Nedávno studie lidského funkčního zobrazování magnetickou rezonancí (fMRI) zapojily do reprezentace chyby predikce dvě oblasti tohoto obvodu, jádro accumbens a orbitofrontální kůru. Ukázalo se například, že nepředvídatelné sekvence dodávání šťávy a vody vyvolávají zvýšenou aktivitu v NAcc ve srovnání s předvídatelným dodáním (Berns a kol., 2001). Chyba predikce založená na čase (McClure a kol., 2003) a stimul (O'Doherty a kol., 2003 O'Doherty a kol., 2004) porušení také aktivují ventrální striatum.

Role OFC v predikci odměn byla méně jasná. Zatímco některé studie uváděly citlivost OFC v podmínkách chyby predikce (Berns a kol., 2001; O'Doherty a kol., 2003; Ramnini a kol., 2004; Dreher a kol., 2005) ostatní nemají (McClure a kol., 2003; O'Doherty a kol., 2004; Delgado a kol., 2005). Studie s menším důrazem na chybu predikce ukazují větší aktivaci OFC oproti příznivým výsledkům (O'Doherty a kol., 2001; Elliott a kol., 2003; Galvan a kol., 2005) ve studiích s hodnotou odměny (Gottfried et al, 2003) a valence (Cox a kol., 2005; O'Doherty, 2000 O'Doherty, 2003 O'Doherty, 2004). Nedávno, Kringelbach and Rolls (2004) integroval neuroimaging a neuropsychologickou literaturu k účtování rozmanitých funkcí orbitofrontální kůry. Navrhují mediální-laterální rozlišení a přední-posteriorní rozlišení. Mediální a laterální orbitofrontální kůra monitorují hodnotu odměny, respektive hodnocení trestatelů (např O'Doherty a kol., 2001 ; Rolls a kol., 2003). Přední orbitofrontální kůra je myšlenka být více zapojený do reprezentace abstraktních zesilovačů (O'Doherty a kol., 2001) před jednoduššími souvisejícími s chutí (např De Araujo a kol., 2003) a bolest (např Craig a kol., 2000).

Tyto ventrální frontostriatální regiony mají nedávno (Knutson a kol., 2005) byly spojeny s reprezentací očekávané hodnoty (součin očekávané pravděpodobnosti a velikosti výsledku) během roku očekávání výsledku odměny. Vzhledem k elegantnímu, ale složitému designu, který zahrnoval 18 narážky představující četné kombinace velikosti, pravděpodobnosti a / nebo valence, nedostatek statistické síly vyloučil autory v zkoumání aktivace mozku související s motivací výsledky. V této studii jsme použili tři odlišné narážky, z nichž každá byla spojena s odměnou 33%, 66% nebo 100% za správné pokusy. Důraz této studie byl kladen na výsledek odměny spíše než očekávání odměny, aby se prozkoumala citlivost na nervové úrovni na porušování očekávání odměny, spíše než na očekávání odměny před výsledkem. Tato analýza je rozhodující pro pochopení předvídatelnosti odměn kvůli změnám v odpalování dopaminu, ke kterým dochází při výsledku odměny, když dojde k porušení předvídaných očekávání (Fiorillo a kol., 2003) priori předpovědi týkající se accumbens a reakce OFC na očekávanou a neočekávanou peněžní odměnu byly založeny na předchozí obrazové práci, která tyto regiony zapojila do zpracování odměn (Knutson a kol., 2001; 2005; O'Doherty a kol., 2001; Galvan a kol., 2005). Použili jsme jednoduchý prostorový zpožděný zápas k vzorovému vzoru podobnému tomu, který používal Fiorillo et al (2003) v elektrofyziologických studiích dopaminových neuronů u primátů. Předpokládali jsme, že aktivita ve ventrálním striatu, zejména NAcc, by se zvýšila, když by byla doručena neočekávaná odměna, a snížila by se, kdyby nebyla doručena očekávaná odměna. Očekávalo se, že chování bude paralelní s těmito změnami s rychlejším průměrným reakčním časem na nejčastěji narážky na předpovídání odměny, ale nejméně často na pomalejší reakční časy na odměnu předpovídající narážky. Dále jsme předpokládali, že OFC bude citlivý na výsledek odměny (odměna nebo ne), ale že accumbens bude nejcitlivější na změny v předpovědích odměn. Tyto hypotézy byly založeny na zprávách z předchozích zobrazovacích studií (Galvan a kol. 2005(v tisku) a práce nelidských primátů vykazující větší striatální zapojení do parametrů pravděpodobnosti odměny vzhledem k aktivitě OFC zamčené odměnou (Schultz, a kol., 2000) a na pevně stanovenou částku odměny napříč pravděpodobnostními podmínkami.

Metody

Účastníci

Do experimentu fMRI bylo zařazeno dvanáct zdravých dospělých osob (7 žena), věk 19 – 27 (průměrný věk 24 let). Subjekty neměly v anamnéze neurologické nebo psychiatrické onemocnění a všechny subjekty byly před účastí schváleny studii schválenou Institucionální revizní radou.

Experimentální úkol

Účastníci byli testováni pomocí modifikované verze dříve vybrané úlohy se zpožděnou odpovědí popsané dříve (Galvan a kol., 2005) ve studii fMRI související s událostmi (Obrázek 1). V této úloze byly tři podněty spojeny se zřetelnou pravděpodobností (33%, 66% a 100%) získání pevné částky odměny. Subjekty byly instruovány, aby stiskly buď svůj index, nebo prostředníček, aby označily stranu, na které se na výzvu objevila narážka, a aby reagovaly co nejrychleji, aniž by došlo k chybám. Jeden ze tří pirátských kreslených obrázků byl uveden v náhodném pořadí na levé nebo pravé straně středové fixace pro 1000 msec (viz Obrázek 1). Po zpoždění msec 2000 byly subjekty prezentovány s výzvou k odpovědi dvou truhly s pokladem na obou stranách fixace (2000 msec) a byly instruovány, aby stiskly tlačítko pravým ukazováčkem, pokud byl pirát na levé straně fixace nebo jejich pravý prostřední prst, pokud byl pirát na pravé straně fixace. Po dalším zpoždění 2000 msec byla ve středu obrazovky (1000 msec) na základě pravděpodobnosti odměny tohoto zkušebního typu předložena odměna za zpětnou vazbu (kreslené mince) nebo prázdná truhla s pokladem. Před zahájením dalšího pokusu byl intertrial interval 12 s (ITI).

Obrázek 1  

Návrh úlohy

Byly tři podmínky pravděpodobnosti odměny: pravděpodobnost odměny 33%, 66% a 100%. Ve stavu 33% byly subjekty odměněny za 33% pokusů a na ostatních 66% pokusů v tomto stavu nedošlo k žádné odměně (prázdná truhla s pokladem). Ve stavu 66% byly subjekty odměněny za 66% pokusů a za ostatní 33% pokusů nedošlo k žádné odměně. Ve stavu 100% byly subjekty odměněny za všechny správné pokusy.

Subjektům byla zaručena účast na studii $ 50 a bylo jim řečeno, že si mohou vydělat až $ 25 více, v závislosti na výkonu (podle indexu podle doby reakce a přesnosti) na úkolu. Stimuli byli představeni s integrovaným funkčním zobrazovacím systémem (IFIS) (PST, Pittsburgh) s použitím LCD video displeje ve vrtání MR skeneru a zařízení pro sběr optické vlákniny.

Experiment sestával z pěti běhů 18 pokusů (6 každý z 33%, 66% a 100% pravděpodobnost typů odměn), který trval 6 min a 8 s. Každý běh měl 6 zkoušky každé pravděpodobnosti odměny prezentovány v náhodném pořadí. Na konci každého běhu byly subjekty aktualizovány o tom, kolik peněz vydělaly během tohoto běhu. Před zahájením experimentu dostali subjekty podrobné pokyny, které zahrnovaly seznámení se s použitými stimuly a provedením praktického běhu, aby se zajistilo porozumění úkolu. Bylo jim řečeno, že existuje vztah mezi narážkami a peněžními výsledky, ale přesná povaha tohoto vztahu nebyla odhalena.

Image Acquisition

Zobrazování bylo prováděno pomocí 3T General Electric MRI skeneru pomocí kvadraturní hlavové cívky. Funkční skeny byly získány pomocí spirální in a out sekvence (Glover & Thomason, 2004). Parametry zahrnovaly TR = 2000, TE = 30, matice 64 X 64, 29 5 mm koronálních řezů, 3.125 X 3.125 mm in-plane rozlišení, otočení o 90 °) pro 184 opakování, včetně čtyř vyřazených akvizic na začátku každý běh. Anatomické skenování T1 vážené v rovině byly shromážděny (TR = 500, TE = min., 256 x 256, FOV = 200 mm, tloušťka řezu 5 mm) na stejných místech jako funkční obrazy kromě souboru 3D dat obrázků s vysokým rozlišením SPGR (TR = 25, TE = 5, tloušťka řezu 1.5 mm, 124 řezů).

Analýza obrazu

Softwarový balíček Brainvoyager QX (Brain Innovations, Maastricht, Nizozemsko) byl použit k provedení analýzy náhodných efektů zobrazovacích dat. Před analýzou byly na surových obrazech provedeny následující postupy předzpracování: Korekce pohybu 3D pro detekci a korekci malých pohybů hlavy prostorovým zarovnáním všech objemů k prvnímu objemu pomocí transformace tuhého těla, korekce času skenování řezů (pomocí interplace sinu), lineární odstraňování trendů, časové propouštění s vysokým průchodem pro odstranění nelineárních posunů 3 nebo méně cyklů za časový průběh a vyhlazování prostorových dat pomocí gaussovského jádra s 4mm FWHM. Odhadované rotační a translační pohyby nikdy nepřesáhly 2mm u subjektů zahrnutých do této analýzy.

Funkční data byla zaregistrována do anatomického objemu zarovnáním odpovídajících bodů a ručním nastavením tak, aby bylo vizuální kontrolou dosaženo optimálního přizpůsobení, a poté byly transformovány do Talairachova prostoru. Během Talairachovy transformace byly funkční voxely interpolovány na rozlišení 1 mm3 pro účely zarovnání, ale statistické prahy byly založeny na původní velikosti akvizičního voxelu. Jádro accumbens a orbitální frontální kůra byly definovány celkovým mozkem voxelwise GLM s odměnou jako primárním prediktorem (viz níže) a poté lokalizovány pomocí Talairachových souřadnic ve spojení s odkazem na mozkový atlas Duvernoy (Talairach & Tournoux, 1988; Duvernoy, 1991).

Statistické analýzy zobrazovacích dat byly provedeny na celém mozku za použití obecného lineárního modelu (GLM) složeného z 60 (5 zkouší X 12 subjektů) z-normalizované funkční běhy. Primárním prediktorem byla odměna (odměna versus nevhodné zkoušky) napříč všemi pravděpodobnostmi odměny ve výsledku odměny. Prediktor byl získán konvolucí ideální odezvy boxcar (za předpokladu hodnoty 1 pro objem prezentace úkolu a objemu 0 pro zbývající časové body) s lineárním modelem hemodynamické odpovědi (Boynton a kol., 1996) a používá se k sestavení konstrukční matice každého časového průběhu experimentu. Byly zahrnuty pouze správné pokusy a pro predikce chyb byly vytvořeny samostatné prediktory. Poté byly provedeny post hoc kontrastní analýzy na zájmových oblastech na základě t-testů na beta hmotnostech prediktorů. Simulace Monte Carlo byly prováděny pomocí programu AlphaSim v rámci AFNI (Cox, 1996) k určení vhodných prahových hodnot pro dosažení korigované hladiny alfa p <0.05 na základě vyhledávacích objemů přibližně 25,400 3 mm450 a 3 mm20 pro orbitální frontální kůru a nucleus accumbens. Procentní změny v MR signálu vzhledem k základní hodnotě (interval bezprostředně předcházející XNUMXsekundovému pokusu) v nucleus accumbens a orbitální frontální kůře byly vypočítány pomocí průměrování souvisejícího s událostmi u významně aktivních voxelů získaných z kontrastních analýz.

GLM celého mozku byl založen na pokusech o odměnu 50 na subjekt (n = 12) pro celkem 600 studií a 30 nevšedních studií na subjekt (n = 12) pro celkem 360 nevšedních pokusů během celého experimentu. Následné kontrasty k podmínkám pravděpodobnosti odměny sestávaly z různých počtů odměn a bez zkoušek odměny. Pro podmínku pravděpodobnosti odměny 100% byly provedeny testy odměn 6 za běh (5) na subjekt (12) za celkem 360 odměnových zkoušek a žádné nevhodné zkoušky. Pro podmínku pravděpodobnosti odměny v 66% byly prováděny 4 odměnovací testy za běh (5) na subjekt (12) za celkem 240 odměnových testů a 120 nevhodné zkoušky. Pro podmínku pravděpodobnosti odměny 33% byly provedeny testy odměn 2 za běh (5) na subjekt (12) za celkem 120 odměnových testů a 240 nevhodné zkoušky.

výsledky

Behaviorální data

Účinky pravděpodobnosti odměny a času na úkol byly testovány pomocí 3 (33%, 66%, 100%) x 5 (běhy 1 – 5) opakovanou měření analýzy rozptylu (ANOVA) pro závislé proměnné střední reakční doby (RT) ) a střední přesnost.

Nebyly zjištěny žádné hlavní účinky nebo interakce pravděpodobnosti času odměny (F [2,22] = 12, p <85) na úkolu (F [4,44] = 2.02, p <14) nebo pravděpodobnosti odměny X čas na úkolu (F [8, 88] = 1.02, p <41) pro střední přesnost. To se dalo očekávat, protože přesnost účastníků dosáhla úrovně stropu pro všechny pravděpodobnosti experimentu (33% podmínka = 97.2%; 66% podmínka = 97.5%; 100% podmínka = 97.7%).

Došlo k významné interakci mezi pravděpodobností odměny a časem na úkolu (F [8,88] = 3.5, p <01) na průměrné RT, ale žádné hlavní účinky času na úkol (F [4,44] = 611 , p <0.59) nebo pravděpodobnost odměny (F [2,22] = 2.84, p <0.08). Post-hoc t testy významné interakce ukázaly, že došlo k významnému rozdílu mezi 33% a 100% podmínkami pravděpodobnosti odměny během pozdních pokusů experimentu (běh 5) (t (11) = 3.712, p <003), s rychlejším průměrným RT pro podmínku pravděpodobnosti 100% odměny (průměr = 498.30, sd = 206.23) ve srovnání s podmínkou 33% (průměr = 583.74, sd = 270.23).

Rozdíl v průměrné reakční době mezi podmínkami 100% a 33% se od časných do pozdních studií zvýšil dvakrát (viz viz Obrázek 2a). Abychom dále ukázali učení, zavedli jsme na konci experimentu obrácení, přepínání pravděpodobnosti odměny za podmínky 33% a 100%. 2 (pravděpodobnost) X 2 (reverzní a nevratná) ANOVA pro pozdní studie vykazovala významnou interakci (F (1,11) = 18.97, p = 0.001), se snížením RT do stavu, který byl pravděpodobností 33% v non-zvrácení (průměr = 583.74, sd = 270.24) a 100% v obrácení (průměr = 519.89, sd = 180.46) (Obrázek 2b).

Obrázek 2  

Výsledky chování (RT)

Výsledky zobrazování

GLM pro správné pokusy používající pravděpodobnost odměny jako primární prediktor byl modelován v bodě, ve kterém subjekt obdržel zpětnou vazbu odměny nebo ne (tj. Výsledek). Tato analýza identifikovala oblasti NAcc (x = 9, y = 6, z = −1 a x = −9, y = 9, z = −1) a OFC (x = 28, y = 39, z = - 6) (viz Obrázek 3a, b. Obr). Post-hoc t-testy mezi váhami beta u testů s odměnou versus bez odměny ukázaly větší aktivaci v obou těchto regionech k odměně (NAcc: t (11) = 3.48, p <0.01; OFC x = 28, y = 39, z = −6, t (11) = 3.30, p <0.02)1.

Obrázek 3  

Větší aktivace na odměněné versus nezměněné výsledky v a) nucleus accumbens (x = 9, y = 6, z = −1; x = −9, y = 9, z = −1) ab) orbitální frontální kůra (x = 28, y = 39, z = -6).

Existovaly dva možné výsledky (odměna nebo žádná odměna) pro dva přerušované plány odměn (pravděpodobnost 33% a 66%) a pouze jeden výsledek pro průběžný plán odměn (pravděpodobnost odměny 100%), který byl použit jako podmínka srovnání. Zatímco ve výše popsaném OFC byl hlavní účinek odměny (odměna versus žádné zkoušky odměny), aktivita OFC se v aktuální studii nelišila jako funkce pravděpodobnosti odměny [F (2,10) = 0.84, p = 0.46) . Naproti tomu NAcc vykázal výrazné změny aktivity k výsledku jako funkci manipulace s pravděpodobností odměny [F (2,10) = 9.32, p <0.005]. Konkrétně se aktivita NAcc zvýšila na výsledky odměn, když byla odměna neočekávaná (33% podmínka pravděpodobnosti odměny) ve srovnání s očekávanou (100% základní podmínka) [t (11) = 2.54, p <03 viz Obrázek 4a]. Zadruhé, došlo ke snížení aktivity NAcc na žádnou odměnu, když byla očekávaná a neobdržená odměna (66% podmínka pravděpodobnosti odměny) ve srovnání s neočekávanou nebo obdrženou odměnou (33% podmínka pravděpodobnosti odměny; t (59) = 2.08, p <04; viz Obrázek 4b). Všimněte si, že neexistovaly žádné významné rozdíly v aktivaci mezi pravděpodobnostními podmínkami odměny 33% a 66% [t (11) =. 510, p = .62] nebo mezi pravděpodobnými podmínkami odměněnými 66% a 100% [t (11) = = 1.20, p = .26] v odměněných výsledcích. MR signál jako funkce výsledku odměny a pravděpodobnosti jsou uvedeny v Obrázek 4.

Obrázek 4  

Procentuální MR signál se mění jako funkce výsledku odměny a pravděpodobnosti v jádru podle a) odměněných ab) nezměněných výsledků.

Diskuse

Tato studie zkoumala účinky porušení očekávaných výsledků odměňování na chování a nervovou aktivitu v akumbensu a orbitální frontální kůře (OFC), o kterém bylo dříve prokázáno, že se podílí na očekávání výsledků odměňování (McClure a kol. 2004; Knutson a kol., 2005). Ukázali jsme, že jak nucleus accumbens, tak OFC byly přijaty během odměněných studií v porovnání s nevyhodnocenými zkouškami, ale pouze nucleus accumbens vykazovaly citlivost na porušení při předpovídaném výsledku odměny v této studii. Větší citlivost accumbens na hodnotu odměny (např. Velikost) vzhledem k OFC byla prokázána v předchozí práci (Galvan a kol. 2005) a společně tato zjištění naznačují, že tento region může být zapojen do výpočtu velikosti i pravděpodobnosti odměny. Nedostatek citlivosti v OFC na tyto manipulace může odrážet absolutnější reprezentaci odměny nebo dvojznačnosti ve výsledku (Hsu a kol., 2005). Alternativně, protože signál MR byl v této oblasti variabilnější, mohly být tyto účinky v současné studii oslabeny.

V elektrofyziologických studiích na zvířatech bylo prokázáno, že dopaminové neurony ve středním mozku (které se promítají do nucleus accumbens) mají malou až žádnou odpověď na výsledky předvídané odměny (pravděpodobnost = 1.0), ale vykazují fázové střílení, když je odměna doručena s méně než 100 % pravděpodobnosti, a to i po rozsáhlém tréninku (Fiorillo a kol., 2003). V současné studii jsme prokázali větší akumbensovou aktivitu k odměňování, když byla odměna neočekávaná (podmínka 33%) ve srovnání s tím, kdy byla očekávaná (podmínka 100%) v souladu s těmito nálezy. Dále, elektrofyziologické studie dopaminových neuronů u zvířat (např. Fiorillo a kol., 2003) prokázali, že u studií, u nichž byla předpovídána odměna, ale nedošlo k ní, došlo k poklesu neuronální aktivity. Současná studie ukázala podobný vzorec u accumbens, se snížením aktivity v této oblasti v neuznaných studiích pro pravděpodobnost 66% pravděpodobnosti ve srovnání s podmínkou 33%.2

Dopaminové neurony byly zapojeny do učení dvěma způsoby. Za prvé, kódují kontingence mezi podněty (nebo odezvou) a výstupy prostřednictvím signálů chyb predikce, které detekují porušení očekávání (Schultz a kol., 1997; Mirencowicz a Schultz, 1998; Fiorillo a kol., 2003). Zdá se tedy, že chyba predikce poskytuje výukový signál, který odpovídá principům učení, které původně popsal Rescorla a Wagner (1972). Za druhé, slouží ke změně behaviorálních reakcí (Schultz a kol., 1997; McClure a kol., 2004) tak, že akce jsou zkreslené směrem k narážkám, které jsou nejvíce prediktivní. V současné studii jsme ukázali, že v pozdějších pokusech experimentu je nejoptimálnější výkon pro podmínku s nejvyšší pravděpodobností odměny (pravděpodobnost odměny 100%) a nejméně optimální pro podmínku nejnižší pravděpodobnosti (pravděpodobnost odměny 33%). Toto zjištění chování je v souladu s předchozí pravděpodobnostní prací vykazující nejméně optimální výkon s nejnižší pravděpodobností výsledku odměny, což svědčí o tom, že se v průběhu času naučily podmíněné odměnyDelgado a kol., 2005). Abychom dále ukázali učení, zavedli jsme na konci experimentu obrácení, přepínání pravděpodobnosti odměny za podmínky 33% a 100%. Tato manipulace měla za následek zmírnění rozdílů mezi těmito podmínkami, což dále potvrdilo učební účinky.

Hlavním cílem studií souvisejících s odměnami je zjistit, jak odměny ovlivňují a ovlivňují chování (např Robbins a Everitt, 1996; Schultz, 2004) kromě charakterizace základního nervového zpracování. Četné faktory přispívají k tomu, jak rychle a robustně odměňuje chování, včetně harmonogramů posilování (Skinner, 1958), odměna (Galvan a kol., 2005) a předvídatelnost odměn (Fiorillo a kol., 2003; Delgado a kol., 2005). Očekávaná hodnota, která je součinem velikosti a pravděpodobnosti odměny (Pascal, ca 1600), ovlivňuje výběr chování (von Frisch, 1967; Montague a kol., 1995; Montague a Berns, 2002). Pomocí velmi podobného úkolu, ve kterém se pouze výsledek (velikost namísto pravděpodobnosti) lišil od současné studie, jsme ukázali, že jádro accumbens bylo citlivé na diskrétní hodnoty odměn (Galvan a kol., 2005). Spolu s důkazy předloženými zde a jinde (Tobler a kol., 2005), navrhujeme, že ventrální striatum pravděpodobně přispěje k výpočtu očekávané hodnoty odměny vzhledem k její citlivosti na pravděpodobnost odměny i na velikost.

Role orbitální frontální kůry v predikci odměn je v souladu s funkčními členěními této oblasti podle Kringelbach and Rolls (2004). Naznačují, že více předních a středních částí OFC je citlivé na manipulace s abstraktními odměnami. Aktivace OFC v této studii byla pozorována na tomto obecném místě. Elektrofyziologické studie implikují OFC v kódování subjektivní hodnoty stimulu odměny (pro přehled, O'Doherty, 2004). Například neurony OFC střílejí na zvláštní chuť, když je zvíře hladové, ale jakmile je zvíře nasyceno a hodnota odměny za jídlo se sníží (Critchley and Rolls, 1996). Jiní navrhli, že OFC je nejcitlivější na relativní odměny (Tremblay a Schultz, 1999) a preference odměn (Schultz a kol., 2000). Neuroimagingové studie prokázaly analogický vzorec u lidí s různými stimuly, včetně chuti (O'Doherty a kol., 2001; Kringelbach a kol., 2003), čich (Anderson a kol., 2003; Rolls a kol., 2003) a peníze (Elliott a kol., 2003; Galvan a kol., 2005), přičemž každá aktivace se liší v umístění aktivity od přední k zadní a od střední k laterální OFC. OFC byl zapojen do očekávání odměny (O'Doherty et al 2002), ale pouze pokud je prediktivní hodnota odpovědi spojena se specifickou hodnota přidružené odměny, spíše než v pravděpodobnosti, že k takové odměně dojde (O'Doherty, 2004 ). V současné studii jsme v OFC neviděli citlivost na porušení v predikci odměn. Knutson a jeho kolegové (2005) uvedli korelace mezi odhady pravděpodobnosti a aktivací mozku v očekávání odměny v meziální prefrontální kůře (Knutson a kol. 2005), ale nikoli konkrétně v orbitální frontální kůře. V porovnání, Ramnani a kol. (2004 ) uvedla citlivost OFC na chybu pozitivní predikce ve střední orbitální čelní kůře pomocí pasivního pozorovacího úkolu a Dreher a kol. (2005) hlásili predikci chyby OFC v úkolu, který manipuloval jak s pravděpodobností, tak s velikostí prediktivních podnětů, ale tyto nepředvídané události byly získány před skenováním. Je proto stále udržitelné, že OFC může počítat předvídané odměny, ale možná jsou tyto výpočty hrubší (tj. Sčítané v celém rozsahu pravděpodobností) nebo pomalejší, než aby se tvořily vzhledem k přesným výpočtům, které se zdají v NAcc. Alternativně může být tato oblast citlivější na detekci podnětů nejisté a / nebo nejednoznačné hodnoty, jak navrhuje Hsu a kol. (2005), než při odhalování porušení v predikci odměny. Hsu a kol. (2005) ukazují, že míra nejednoznačnosti ve výběru (nejistá rozhodnutí z důvodu chybějících informací) koreluje pozitivně s aktivací v OFC. A konečně, větší variabilita signálu MR v této oblasti může snížit naši schopnost detekovat tyto účinky.

Základní otázkou současné studie bylo to, jak accumbens a OFC odlišně předpovídají výsledky odměn ve vztahu k nepředvídaným výsledkům (tj. Porušení očekávání). Parametricky jsme manipulovali pravděpodobnost odměny a zkoumali jsme nervovou reakci na odměnu a nevhodné zkoušky pro každou podmínku odměny pravděpodobnosti. Naše data jsou v souladu s předchozími lidskými zobrazovacími a nehumánními elektrofyziologickými studiemi (Fiorillo a kol., 2003; Schultz, 2002) a naznačují, že accumbens a OFC jsou citlivé na odměnu za výsledek (odměnu nebo ne). Zdá se však, že aktivita v těchto regionech, zejména v accumbens, je modulována předpovědí o pravděpodobnosti výsledků odměn, které jsou vytvářeny v průběhu času. Tento dynamický vzorec aktivace může představovat modifikace dopaminové aktivity v těchto regionech nebo promítání do těchto regionů, jak se získávají a aktualizují informace o předpokládané odměně.

Poznámky pod čarou

1NAcc [t (11) = 3.2, p <0.04] ​​a OFC [t (11) = 3.5, p <0.02] vykazovaly zvýšenou aktivitu v očekávání odměny za přerušovanou, ale nikoli podmínku kontinuální odměny

2Vynechání výsledku odměny ve stavu 33% mělo za následek mírné zvýšení aktivity NAcc spíše než snížení aktivity podobné tomu, které pozorovalo Knutson a kol., 2001. Jednou z možných interpretací tohoto výsledku je, že subjekty byly vnitřně motivovány nebo odměňovány, pokud předpovídaly, že za tento soud nepřijde žádná odměna, a žádný ne. Alternativně, protože výsledek odměny za tyto pokusy byl nejmenší počet v průběhu experimentu, aktivita může odrážet pokračující učení tohoto stavu.

Zřeknutí se odpovědnosti vydavatele: Jedná se o soubor PDF s neupraveným rukopisem, který byl přijat k publikaci. Jako službu pro naše zákazníky poskytujeme tuto ranní verzi rukopisu. Rukopis podstoupí kopírování, sázení a přezkoumání výsledného důkazu před jeho zveřejněním ve své konečné podobě. Vezměte prosím na vědomí, že během výrobního procesu mohou být objeveny chyby, které by mohly ovlivnit obsah, a veškeré právní odmítnutí týkající se časopisu.

Reference

  • Anderson A, Christoff K, Stappen I, Panitz D, Ghahremani D, Glover G, Gabrieli JD, Sobel N. Disociované nervové reprezentace intenzity a valence v lidské čichu. Přírodní neurovědy. 2003;6: 196-202.
  • Berns GS, McClure SM, Pagnoni G, Montague PR. Předvídatelnost moduluje reakci lidského mozku na odměnu. Journal of Neuroscience. 2001;21: 2793-2798. [PubMed]
  • Boynton GM, Engel SA, Glover GH, Heeger DJ. Lineární systémové analýzy funkčního zobrazování magnetickou rezonancí u člověka V1. Journal of Neuroscience. 1996;16: 4207-4221. [PubMed]
  • Cox RW. AFNI: Software pro analýzu a vizualizaci funkčních neuroobrazů magnetické rezonance. Výpočty v biomedicínském výzkumu. 1996;29: 162-173.
  • Cox SM, Andrade A, Johnsrude JE. Učení se jako: Role pro lidskou orbitofrontální kůru v podmíněné odměně. Journal of Neuroscience. 2005;25: 2733-2740. [PubMed]
  • Craig AD, Chen K, Bandy D, Reiman EM. Termosenzorická aktivace ostrovní kůry. Přírodní neurovědy. 2000;3: 184-190.
  • Critchley HD, Rolls ET. Hlad a sytost modifikují reakce čichových a zrakových neuronů v orbitofrontální kůře primátů. Žurnál neurofyziologie. 1996;75: 1673-1686. [PubMed]
  • De Araujo IET, Kringelbach ML, Rolls ET, McGlone F. Kortikální reakce člověka na vodu v ústech a účinky žízně. Žurnál neurofyziologie. 2003;90: 1865-1876. [PubMed]
  • Delgado MR, Miller M, Inati S, Phelps EA. Studie fMRI o pravděpodobnostním učení souvisejícím s odměnami. Neuroimage. 2005;24: 862-873. [PubMed]
  • Dreher JC, Kohn P, Berman KF. Nervové kódování odlišných statistických vlastností informací o odměňování u lidí. Mozková kůra. 2005 EPUB před tiskem.
  • Elliott R, Newman JL, Longe OA, Deakin JFW. Diferenční vzorce odezvy ve striatu a orbitofrontální kůře na finanční odměnu u lidí: parametrická funkční magnetická rezonance. Journal of Neuroscience. 2003;23: 303-307. [PubMed]
  • Fiorillo CD, Tobler PN, Schultz W. Diskrétní kódování pravděpodobnosti a nejistoty odměny dopaminovými neurony. Science. 2003;299: 1898-1902. [PubMed]
  • Galvan A, Hare TA, Davidson M, Spicer J, Glover G, Casey BJ. Role ventrálních frontostriatálních obvodů v učení založeném na odměňování u lidí. Journal of Neuroscience. 2005;25: 8650-8656. [PubMed]
  • Galvan A, Hare TA, Parra C, Penn J, Voss H, Glover G, Casey BJ. Dřívější vývoj accumbens ve vztahu k orbitofrontální kůře může být základem rizikového chování u dospívajících. Journal of Neuroscience. 2006;26: 6885-6892. [PubMed]
  • Gottfried JA, O'Doherty J, Dolan RJ. Kódování prediktivní hodnoty odměny v lidské amygdální a orbitofronální kortexi. Science. 2003;301: 1104-1107. [PubMed]
  • Haber SN. Bazální ganglie primátů: paralelní a integrační sítě. Journal of Chemical Neuroanatomy. 2003;26: 317-330. [PubMed]
  • Hollerman J, Schultz W. Dopaminové neurony hlásí chybu v časové predikci odměny během učení. Přírodní neurovědy. 1998;1: 304-309.
  • Hsu M, Bhatt M, Adolphs R, Tranel D, Camerer CF. Neuronové systémy reagující na míru nejistoty v lidském rozhodování. Science. 2005;310: 1680-1683. [PubMed]
  • Knutson B, Adams CM, Fong GW, Hommer D. Očekávání zvyšování peněžní odměny selektivně rekrutuje nucleus accumbens. Journal of Neuroscience. 2001;21: 1-5.
  • Knutson B, Taylor J, Kaufman M, Peterson R, Glover G. Zkreslená neurální reprezentace očekávané hodnoty. Journal of Neuroscience. 2005;25: 4806-4812. [PubMed]
  • Kringelbach ML, O'Doherty J, Rolls ET, Andrews C. Aktivace lidské orbitofrontální kůry na tekutý potravní stimul souvisí s jeho subjektivní příjemností. Mozková kůra. 2003;13: 1064-1071. [PubMed]
  • Kringelbach ML, Rolls ET. Funkční neuroanatomie lidské orbitofrontální kůry: důkaz z neuroimagingu a neuropsychologie. Pokrok v neurobiologii. 2004;72: 341-372. [PubMed]
  • Leon MI, Shadlen MN. Vliv očekávané velikosti odměny na odezvu neuronů v dorsolaterální prefrontální kůře makaka. Neuron. 1999;24: 415-425. [PubMed]
  • McClure SM, Berns GS, Montague PR. Časové chyby predikce v pasivním učení aktivují lidský striatum. Neuron. 2003;38: 339-346. [PubMed]
  • McClure SM, Laibson DI, Loewenstein G, Cohen JD. Samostatné nervové systémy oceňují okamžité a zpožděné peněžní odměny. Science. 2004;306: 503-507. [PubMed]
  • Mirenowicz J, Schultz W. Význam nepředvídatelnosti odezvy odměny v neuronech dopaminu primáta. Žurnál neurofyziologie. 1994;72: 1024-1027. [PubMed]
  • Montague PR, Berns GS. Neuronová ekonomika a biologické substráty oceňování. Neuron. 2002;36: 265-284. [PubMed]
  • Montague PR, Hyman SE, Cohen JD. Výpočetní role dopaminu v řízení chování. Příroda. 2004;431: 379-387.
  • O'Doherty JP. Reprezentace odměn a učení související s odměnami v lidském mozku: poznatky z neuroimagingu. Aktuální názor na neurobiologii. 2004;14: 769-776. [PubMed]
  • O'Doherty JP, Dayan P, Friston K, Critchley H, Dolan RJ. Časové rozdíly a modely odměňování v lidském mozku. Neuron. 2003;38: 329-337. [PubMed]
  • O'Doherty JP, Deichmann R, Critchley HD, Dolan RJ. Nervové reakce během očekávání odměny za primární chuť. Neuron. 2002;33: 815-826. [PubMed]
  • O'Doherty J, Kringelbach M, Rolls ET, Hornak J, Andrews C. Abstraktní reprezentace odměn a trestů v lidské orbitofrontální kůře. Přírodní neurovědy. 2001;4: 95-102.
  • O'Doherty J, Rolls ET, Francis S, Bowtell R, McGlone F, Kobal G, Renner B, Ahne G. Čichová aktivace lidské orbitofrontální kůry související se smyslem. Neuroreport. 2000;11: 893-897. [PubMed]
  • Olds J, Milner P. Pozitivní zesílení vyvolané elektrickou stimulací septální oblasti a dalších oblastí mozku krys. Žurnál srovnávací fyziologie a psychologie. 1954;47: 419-427.
  • Ramnani N, Elliott R, Athwal B, Passingham R. Chyba predikce pro bezplatnou peněžní odměnu v lidské prefrontální kůře. NeuroImage. 2004;23: 777-786. [PubMed]
  • Rescorla R, Wagner A. In: Klasické kondicionování 2: Současný výzkum a teorie. Black A, Prokasy W, editoři. Appleton Century-Crofts; New York: 1972. str. 64 – 69.
  • Robbins TW, Everitt BJ. Neurobehaviorální mechanismy odměňování a motivace. Aktuální názory na neurobiologii. 1996;6: 228-235.
  • Rolls E, Kringelbach M, DeAraujo I. Různé reprezentace příjemných a nepříjemných pachů v lidském mozku. European Journal of Neuroscience. 2003;18: 695-703. [PubMed]
  • Schultz W, Dayan P, Montague PR. Neurální substrát předpovědi a odměny. Science. 1997;275: 1593-1599. [PubMed]
  • Schultz W, Tremblay L, Hollerman JR. Zpracování odměn v kortexu orbitofrontal primáta a bazálních gangliích. Cereb Cortex. 2000;10: 272-284. [PubMed]
  • Schultz W. Získání formálního dopaminu a odměny. Neuron. 2002;36: 241-263. [PubMed]
  • Schultz W. Neurální kódování základních pojmů odměny teorie učení zvířat, teorie her, mikroekonomie a behaviorální ekologie. Aktuální názor na neurobiologii. 2004;14: 139-147. [PubMed]
  • Skinner BF. Schémata rozložení výztuže. Žurnál experimentální analýzy chování. 1958;1: 103-107.
  • Sutton RS, Barto AG. Učení posílení: Úvod. MIT Press; Cambridge, MA: 1998.
  • Schultz W, Tremblay L, Hollerman J. Zpracování odměny v orbitofrontální kůře primátů a bazálních gangliích. Mozková kůra. 2000;10: 272-284. [PubMed]
  • Talairach J, Tournoux P. Ko-planární stereotaxický atlas lidského mozku. Thieme; New York: 1988.
  • Tobler PN, Fiorillo CD, Schultz W. Adaptivní kódování hodnoty odměny dopaminovými neurony. Science. 2005;307: 1642-1645. [PubMed]
  • Tremblay L, Schultz W. Relativní preference odměn v orbitofrontální kůře primátů. Příroda. 1999;398: 704-708. [PubMed]
  • von Frisch K. Taneční jazyk a orientace včel. Harvard University Press; Cambridge, Massachusetts: 1967.