Przewidywalność moduluje ludzką reakcję mózgu na nagrodę (2001)

UWAGI: Nieprzewidywalne nagrody prowadzą do większych skoków dopaminy. To właśnie sprawia, że ​​pornografia internetowa o dużej prędkości różni się od pornografii z przeszłości
 
J Neurosci. 2001 Apr 15;21(8):2793-8.
 

Źródło

Katedra Psychiatrii i Nauk Behawioralnych, Emory University School of Medicine, Atlanta, Georgia 30322, USA. [email chroniony]

Abstrakcyjny

Niektóre klasy bodźców, takie jak żywność i leki, są bardzo skuteczne w aktywowaniu regionów nagrody. Pokazujemy u ludzi, że aktywność w tych regionach może być modulowana przez przewidywalność sekwencyjnego dostarczania dwóch łagodnie przyjemnych bodźców, dostarczanego doustnie soku owocowego i wody. Przy użyciu funkcjonalnego rezonansu magnetycznego aktywność nagradzania bodźców zarówno w jądrze półleżącym, jak i przyśrodkowej korze oczodołowo-czołowej była największa, gdy bodźce były nieprzewidywalne. Co więcej, deklarowane przez badanych preferencje dotyczące soku lub wody nie były bezpośrednio skorelowane z aktywnością w regionach nagrody, ale zamiast tego były skorelowane z aktywnością w korze czuciowo-ruchowej. W przypadku bodźców przyjemnych odkrycia te sugerują, że przewidywalność moduluje odpowiedź regionów nagrody ludzkiej, a subiektywne preferencje można oddzielić od tej odpowiedzi.

Wprowadzenie

Dążenie do naturalnych nagród, takich jak jedzenie, picie i seks, jest głównym zewnętrznym wpływem na ludzkie zachowanie. Niemniej jednak kwestia tego, w jaki sposób nagrody wpływają na ludzkie zachowanie, pozostaje przede wszystkim nierozwiązana. Istnieje wiele czynników, które przyczyniają się do tej luki w naszej wiedzy; jednak jedną przeszkodą była trudność w zdefiniowaniu i pomiarze izolowanych efektów nagród na ludzkie zachowanie lub aktywację mózgu. U zwierząt nagrodę definiuje się jako koncepcję operacyjną: bodziec uważa się za nagradzający, jeśli pozytywnie wzmacnia zachowanie (Kadłub, 1943; Rescorla i Wagner, 1972; Robbins i Everitt, 1996), czyli niezawodnie zwiększa prawdopodobieństwo takiego zachowania. Ta sama koncepcja dotyczy ludzi; jednakże ludzie mają zdolność do wywierania wszelkiego rodzaju wykonawczej kontroli nad swoimi działaniami, a więc same testy behawioralne są niepełnym sposobem badania przetwarzania nagrody. Podobnie, wyraźne zgłoszenia upodobań i antypatii, tj. Preferencji, są zdezorientowane przez subiektywne postrzeganie przez jednostkę tego, co lubi i co decyduje się zgłosić. Aby przezwyciężyć te trudności eksperymentalne, chciałoby się jednocześnie monitorować wyniki behawioralne, subiektywne preferencje i odpowiedź mózgu podczas dobrze zdefiniowanego zadania. Przyjmując takie podejście, informujemy tutaj, że aktywność w obszarach ludzkiej nagrody jest ściślej skorelowana z przewidywalnością sekwencji przyjemnych bodźców niż z wyraźnie określonymi preferencjami.

U ludzi aktywację obszarów nagrody można uwidocznić za pomocą funkcjonalnego rezonansu magnetycznego (fMRI) po podaniu leków, takich jak kokaina (Breiter i in., 1997); jednak takie infuzje mogą nie być reprezentatywne dla normalnego przetwarzania nagrody z powodu zarówno bezpośredniego, jak i pośredniego działania farmakologicznego kokainy. Ponadto leki takie jak kokaina mogą działać na różne części systemu nagrody niż tzw. Nagrody naturalne, takie jak żywność i woda (Bradberry i in., 2000; Carelli i wsp., 2000). Uwarunkowane nagrody, np. Pieniądze, mogą również działać na różne części systemu nagrody (Thut i in., 1997; Elliott i in., 2000; Knutson i wsp., 2000) i może nie być odpowiednią sondą pierwotnych obwodów nagrody u ludzi. W eksperymentach sugeruje się alternatywne podejście, które pokazuje, że przewidywalność przede wszystkim satysfakcjonującego bodźca jest krytycznym parametrem dla aktywacji ścieżek nagrody (Schultz i wsp., 1992, 1997; Schultz, 1998; Garris i in., 1999). Zapisy fizjologiczne u naczelnych nieludzkich wykazały, że neurony w regionach takich jak brzuszny obszar nakrywkowy (VTA), jądro półleżące i prążkowia brzuszne reagują w sposób adaptacyjny na nagradzające bodźce, takie jak sok owocowy lub woda (Shidara i in., 1998). Zatem przewidywalność sekwencji bodźców może sama rekrutować struktury nerwowe związane z nagrodą w sposób wykrywalny za pomocą fMRI. Ponadto teoretyczne modele uwalniania dopaminy sugerują, że nieprzewidywalne nagrody powinny wywoływać większą aktywność w tych regionach (Schultz i wsp., 1997). Próbowaliśmy przetestować tę hipotezę, wykorzystując fMRI do pomiaru wpływu przewidywalności na ludzkie reakcje mózgu na sekwencje punktowych, przyjemnych bodźców.

MATERIAŁY I METODY

Przedmioty. Dwudziestu pięciu normalnych dorosłych poddano skanowaniu fMRI podczas podawania małych ilości doustnego soku owocowego lub wody. Wiek pacjentów wahał się od 18 do 43, a wszyscy badani wyrażali świadomą zgodę na protokół zatwierdzony przez Komitet ds. Dochodzeń Człowieka Uniwersytetu Emory.

Zadanie eksperymentalne. Będąc w skanerze, badani otrzymywali niewielkie ilości doustnie dostarczanego soku owocowego i wody w sposób przewidywalny lub nieprzewidywalny. Wybraliśmy sekwencyjną dostawę soku owocowego i wody z trzech powodów: (1) ludzie uważają, że zarówno sok, jak i woda są subiektywnie przyjemne; (2) oba bodźce są rutynowo stosowane jako bodźce wzmacniające podczas szkolenia naczelnych innych niż ludzkie na zadania behawioralne; oraz (3) neurony dopaminergiczne śródmózgowia i przypuszczalnie neurony, do których projektują, wykazują fazowe zmiany szybkości zapłonu jako funkcję czasowej przewidywalności bodźców sekwencyjnych (Schultz i wsp., 1992). Uczestnicy otrzymali zarówno sok, jak i wodę w sposób przewidywalny lub nieprzewidywalny w dwóch cyklach skanowania (ryc. 1). Podczas przewidywalnego biegu, sok i bolusy wody były zmieniane w ustalonym odstępie 10 sek. Podczas nieprzewidywalnego przebiegu losowo dobierano kolejność soków i wody, a interwał bodźca losowano także próbkując rozkład przedziału Poissona ze średnią 10 sek. Każdy przebieg trwał 5 min, a kolejność dwóch przebiegów (przewidywalna lub nieprzewidywalna) była randomizowana wśród pacjentów. Ponieważ czas na dostosowanie się do przewidywalności lub nieprzewidywalności był nieznany, a ponieważ częste przełączanie warunków może powodować wzajemne interakcje, tj. „Przewidywalność przewidywalności”, zdecydowaliśmy się oddzielić warunki między przebiegami skanowania zamiast używać mniejszych bloków warunkowych w trakcie skanowania. Ponieważ wszystkie aspekty eksperymentu zależały od manipulowania przewidywalnością, zdecydowaliśmy się nie powtarzać warunków u badanych i zamiast tego skupiliśmy się na badaniu większej liczby przedmiotów.

Rys.. 1.  

Projekt eksperymentu fMRI. Zastosowano projekt czynnikowy 2 × 2 z czynnikami preferencji (sok lub woda) i przewidywalności (przewidywalny lub nieprzewidywalny). Badani otrzymywali bolusy soku i wody 0.8 ml w przewidywalnej lub nieprzewidywalnej sekwencji. Wykorzystując fMRI związany z wydarzeniami, analizowano aktywację mózgu pod względem preferencji i przewidywalności, a także interakcji między nimi.

Pacjenci otrzymywali doustne bolusy 0.8 ml zarówno z soku owocowego, jak i wody za pomocą dwóch plastikowych rurek. Ustnik trzymał końcówki rurki na miejscu nad językiem, z sokiem owocowym podawanym z lewej strony ustnika i wody z prawej strony. Probówki miały długość N10 m i były podłączone do sterowanej komputerowo pompy podwójnej strzykawki (Harvard Apparatus, Holliston, MA) na zewnątrz pomieszczenia skanera. Pacjenci nie wykonywali żadnych innych zadań podczas skanowania i zostali poinstruowani, aby po prostu połykać płyn za każdym razem, gdy był podawany. Po sesji skanowania uczestnicy zostali przesłuchani pod kątem ich preferencji płynnych.

Pozyskiwanie danych MRI. Skanowanie przeprowadzono na skanerze 1.5 Tesla Philips NT. Po uzyskaniu skanów anatomicznych ważonych T1 o wysokiej rozdzielczości, badani przeszli dwa funkcjonalne skany 150 w całym mózgu (obrazowanie echo-planarne, echo przywołane gradientem; czas powtarzania, 2000 msec; czas echa, 40 msec; kąt odchylenia, 90 °; 64 × 64 matrix, 24 5 mm osiowe plasterki uzyskane równolegle do linii spoidłowej przednio-tylnej) do pomiaru efektu zależnego od poziomu utlenienia krwi (BOLD) (Kwong i in., 1992; Ogawa i in., 1992). Ruch głowy został zminimalizowany dzięki wyściółce i ograniczeniom.

Analiza. Dane analizowano przy użyciu statystycznego mapowania parametrycznego (SPM99; Wellcome Department of Cognitive Neurology, London, UK) (Friston i in., 1995b). Korekcję ruchu w pierwszym skanie czynnościowym przeprowadzono u badanych przy użyciu sześcioparametrowej transformacji ciała sztywnego. Ponieważ połykanie nieuchronnie powoduje znaczny ruch głowy, parametry korekcji ruchu posłużyły również do określenia, czy ruchy głowy różniły się istotnie w zależności od warunków. Średnia z obrazów z korekcją ruchu została następnie zarejestrowana w 24-warstwowym strukturalnym rezonansie magnetycznym danej osoby przy użyciu 12-parametrowej transformacji afinicznej. Obrazy zostały następnie znormalizowane przestrzennie do szablonu Montreal Neurological Institute (MNI) (Talairach i Tournoux, 1988) przez zastosowanie transformacji afinicznej parametru 12, po której następuje nieliniowe odkształcanie przy użyciu funkcji bazowych (Ashburner i Friston, 1999). Obrazy wygładzano następnie izotropowym jądrem Gaussa 8 mm i filtrowano pasmo w domenie czasowej. Przeprowadzono analizę statystyczną efektów losowych, związanych ze zdarzeniami, za pomocą SPM99 (Friston i in., 1995a, 1999). Doświadczenie analizowano jako projekt czynnikowy 2 × 2. Po pierwsze, dla każdego przedmiotu określono osobny ogólny model liniowy (GLM), z czterema warunkami reprezentującymi cztery możliwe typy zdarzeń: przewidywalny - preferowany płyn, przewidywalny - niepreferowany płyn, nieprzewidywalny - preferowany płyn i nieprzewidywalny - niepreferowany płyn. Dla każdego z czterech warunków stworzono cztery wektory funkcji delta z czasami odpowiadającymi każdemu zdarzeniu. Zostały one splecione z ogólną funkcją odpowiedzi hemodynamicznej i wprowadzone do matrycy czterokolumnowej. Średnia z każdego przebiegu skanowania została usunięta na zasadzie voxelwise. Obliczyliśmy trzy dwustronne obrazy kontrastu, które odpowiadały głównym efektom preferencji [wektor kontrastu (1-11-1)], przewidywalność [wektor kontrastu (11-1-1)] oraz termin interakcji [wektor kontrastu (1 -1-11)]. Interakcja opisuje, jak przewidywalność moduluje efekt preferencji. Te indywidualne obrazy kontrastu zostały wprowadzone do analizy drugiego poziomu przy użyciu oddzielnej jednej próbki t test (df = 24) dla każdej strony każdego terminu w GLM (w sumie sześć kontrastów). Zakodowaliśmy te podsumowujące mapy statystyczne w p <0.001 (nieskorygowane przy wielokrotnych porównaniach). Mapy te nałożono na obraz strukturalny o wysokiej rozdzielczości w orientacji MNI.

Model teoretyczny. Jako narzędzie zarówno do projektowania, jak i interpretacji eksperymentu fMRI, wykorzystaliśmy istniejący model uwalniania dopaminy w sieci neuronowej do symulacji odpowiedzi mózgu na różne wzorce czasowe bodźców nagradzających (ryc.2). Model ten opierał się na metodzie różnic czasowych (TD), która zakłada, że ​​substancja wzmacniająca synaptycznie, np. Dopamina, jest uwalniana w odpowiedzi na błędy w przewidywaniu nagrody (Schultz i wsp., 1997). Model ten był używany w wielu różnych aplikacjach, w tym w złożonych zadaniach edukacyjnych, takich jak backgammon (Sutton, 1988; Tesauro i Sejnowski, 1989), jak również skuteczne przewidywanie aktywności neuronów dopaminowych w wielu paradygmatach warunkowania (Houk i in., 1995; Montague i in., 1995) i zadania sekwencjonowania silnika (Berns i Sejnowski, 1998).

Rys.. 2.  

Model sieci neuronowej eksperymentu i obszary mózgu związane z przetwarzaniem informacji. ADiagram wskazuje naszą hipotezę na to, w jaki sposób sekwencja bodźców może wpływać na produkcję dopaminergiczną. W tej hipotezie wskazaliśmy, że zmiany w produkcji dopaminergicznej mogą wpływać na docelowe struktury nerwowe w sposób wykrywalny w pomiarze FMRI BOLD. Pokazano, że sok i woda mają zarówno zmysłowy charakter (projekcja ze skończonego czasu)okno dialogowe) i nagroda ( r ścieżki) reprezentacje w ich wpływie na aktywność dopaminergiczną. Aby wygenerować oczekiwaną odpowiedź hemodynamiczną na podstawie tej hipotezy, stworzyliśmy skończone okno czasowe (małe pudełka na sok i wodę), które określają wartość natychmiastowej nagrodyr(t) (1, jeśli wystąpił sok, 0.5, jeśli wystąpiła woda, i 0, jeśli nie wystąpił bodziec). Ten manewr arbitralnie ustawia sok na dwukrotność wartości wody. Nie jest to ważne dla głównych oczekiwań generowanych przez model.B, Przewidywany efekt dopaminy dla przewidywalnych i nieprzewidywalnych sekwencji dostarczania soku i wody. Pozioma oś to numer skanowania. Oś pionowa jest oczekiwaną odpowiedzią hemodynamiczną przewidywaną przez model różnicy czasowej. Skala na Oś pionowa jest arbitralne. Ważne jest, aby pamiętać, że przewidywalny przebieg przebiega do 0, podczas gdy nieprzewidywalny przebieg pozostaje na wysokim poziomie amplitudy. Ślady wygenerowano przez zwinięcie jądra odpowiedzi hemodynamicznej z wynikiem modelu różnic czasowych. Sugerowało to, że średnia odpowiedź BOLD byłaby większa, gdy bodźce były nieprzewidywalne.

W skrócie, uczenie się TD zależy od dwóch podstawowych założeń. Po pierwsze, krótkoterminowa adaptacja w danym obwodzie neuronowym ma na celu przewidywanie zdyskontowanej sumy wszystkich przyszłych nagród. Definicja nagrody zależy od kontekstu, w którym została otrzymana. Jeśli domniemana nagroda zwiększa występowanie określonego zachowania, uznaje się to za pozytywne wzmocnienie. W zależności od wewnętrznego stanu zwierzęcia, ta sama nagroda może nie wzmacniać zachowania, np. Gdy zwierzę jest nasycone. W kontekście eksperymentu fMRI, który jest na ogół nienaturalny, znana substancja apetyczna, taka jak woda lub sok owocowy, jest subiektywnie doświadczana jako przyjemna, a zatem satysfakcjonująca. Po drugie, przewidywania nagrody zależą tylko od bieżącej reprezentacji zestawu bodźców. Reprezentacja bodźca jest nieco dowolna w modelu i obejmuje pewną reprezentację wstecz w czasie, tj. Ślad bodźca. W przypadku substancji takich jak woda lub sok owocowy istnieją zarówno wymiary sensoryczne (np. Temperatura i wrażenia dotykowe na języku), jak i rzeczywista nagroda, która jest subiektywnie doświadczana jako przyjemność. Dlatego uzasadnione jest uznanie dotykowych wymiarów dostarczania płynu za neutralne i odmienne od wymiaru nagradzającego. Podobnie przypuszcza się, że te odmienne wymiary są przetwarzane przez różne obwody mózgu, które można zobrazować fMRI. Aby odwzorować wyjście modelu na wymiar analogiczny do pomiaru uzyskanego za pomocą fMRI, zsumowaliśmy wyniki zarówno neutralnych, jak i nagradzających ścieżek, które założyliśmy, że zbiegły się w brzusznym prążkowiu i jądrze półleżącym. Uznajemy, że nie ma na to bezpośrednich dowodów i zależnie od konkretnego receptora dopamina może mieć zmienny wpływ na aktywność neuronalną. Dokładny projekt eksperymentalny wprowadzono do modelu, który symulowano za pomocą Matlab 5.3 (MathWorks, Natick, MA). Wyjścia odpowiadające zarówno przypuszczalnym neuronom dopaminowym, jak i ich miejscom projekcji, obliczono dla przewidywalnych i nieprzewidywalnych przebiegów (ryc. 2).

Powinniśmy być ostrożni, aby wskazać czytelnikom, że nasze wykorzystanie modelu różnic czasowych do wyjaśnienia naszego projektu i późniejszej interpretacji (poniżej) opiera się na jego wcześniejszym sukcesie w opisywaniu zmian w wyładowaniu szczytowym w neuronach dopaminergicznych u naczelnych przechodzących powiązane zadania behawioralne. Istnieją również inne wiarygodne opisy obliczeniowe, które również mogą wystarczyć.

WYNIKI

Po skanach badani byli pytani o ich preferencje dla dwóch bodźców. Osiemnaście osób z 25 (72%) preferowało sok, a pozostała część preferowała wodę. Większość badanych miała wyraźne upodobanie do jednego lub drugiego, chociaż nie poprosiliśmy ich o to ilościowo. Chociaż podczas skanowania obserwowano znaczny ruch głowy, wszystkie translacje i obroty wokół każdego bodźca były na ogół małe i nie różniły się istotnie między żadnym z warunków. Na przykład, średnia ± odchylenie SD związane z każdym bodźcem wynosiła 0.041 ± 0.069 mm w przewidywalnym stanie i 0.044 ± 0.069 mm w stanie nieprzewidywalnym (sparowane t test;p =

Odpowiedź mózgu na korzystny płyn wykazywała zaskakująco małą aktywność różnicową w porównaniu z płynem niepreferowanym (Tabela1). Nie zaobserwowaliśmy żadnej znaczącej różnicy aktywności w klasycznych regionach nagrody, takich jak jądro półleżące, hipokamp czy przyśrodkowa kora przedczołowa. Główna zmiana aktywności na preferowane> niepreferowane wystąpiła w korze somatosensorycznej w okolicy ust i języka (t = 4.19, współrzędne MNI, −60, −12, 16).

Wyświetl tę tabelę:  

Tabela 1.  

Regiony mózgu wykazujące istotne zmiany w mierzonej aktywności (p <0.001 nieskorygowane; rozmiar klastra> 10 wokseli, chyba że zaznaczono inaczej)

Główny efekt przewidywalności był znacznie większy niż główny efekt preferencji (ryc. 3). W przypadku nieprzewidywalnego przebiegu w stosunku do przewidywalnego przebiegu, obustronną aktywację obserwowano w dużej przestrzeni środkowej kory oczodołowo-czołowej, która obejmowała jądro półleżące (Tabela 1). Dodatkowe obszary aktywacji obejmowały duży obszar kory ciemieniowej obustronnie i paracentralnie oraz małe ogniskowe aktywacje zarówno w lewym jądrze przyśrodkowym wzgórza i prawego móżdżku. Ponieważ żaden z tych regionów nie pokrywał się z głównym efektem preferencji, były one maksymalnie aktywowane przez nieprzewidywalne bodźce, niezależnie od preferencji. Dla przewidywalnego przebiegu w stosunku do nieprzewidywalnego przebiegu aktywowano obszar prawego górnego zakrętu skroniowego, a także aktywacje ogniskowe w lewym zakręcie przedtrzonowym i prawej bocznej korze oczodołowo-czołowej.

Rys.. 3.  

Główny efekt przewidywalności pokazał, że regiony związane z nagrodą miały większą odpowiedź BOLD na nieprzewidywalne bodźce. A, Płaszczyzny wyśrodkowane na (0, 4, -4) pokazują, że obustronne jądro półleżące / prążkowate brzuszne (NAC) i obustronna górna kora ciemieniowa była bardziej aktywna w przewidywalnym stanie. B, Mały obszar w prawym górnym zakręcie skroniowym był względnie bardziej aktywowany przez przewidywalne bodźce. Wartość progowa została przekroczonap <0.001 i zakres> 10 sąsiadujących wokseli.

Interakcja między preferencją a przewidywalnością zidentyfikowała obszary, w których jeden efekt modulował drugi, niezależnie od obu głównych efektów. Prawa wyspa, lewy tylny obręcz i prawy móżdżek wykazywały znaczącą interakcję dla kontrastu (preferowany - niepreferowany) × (przewidywalny - nieprzewidywalny). Przeciwny kontrast (preferowany - niepreferowany) × (nieprzewidywalny - przewidywalny) nie ujawnił żadnych aktywacji istotnych w p <0.001 poziom; jednak mały obszar w lewym górnym zakręcie skroniowym (współrzędne MNI, -48, -4, -16) był istotny w p <0.01 poziom (t =

Symulacja komputerowa sugerowała, że ​​nieprzewidywalne nagrody powinny wywoływać więcej uwalniania dopaminy niż przewidywalne (ryc.2 B). Kiedy nagrody są przewidywalne, każdy bodziec doskonale przewiduje następny, a sygnał błędu, który przypuszczalnie jest mediowany przez dopaminę, stopniowo maleje. Gdy nagrody są nieprzewidywalne, system nie ma możliwości uczenia się, a odpowiedź na każdy bodziec jest większa.

DYSKUSJA

Nasze wyniki wykazały interesującą separację odpowiedzi mózgu na przewidywalność i subiektywne raporty preferencji. Odpowiedź mózgu na preferencje była wyłącznie korowa, ale odpowiedź na przewidywalność wykazywała specyficzną aktywację systemów nagrody, o których wiadomo, że są celem neuronów dopaminergicznych śródmózgowia. Jeśli przypuszczamy, że aktywacja tych obszarów nagrody jest przyjemna dla ludzi, to odkrycie to sugeruje, że subiektywny raport preferencji może być oddzielony od obwodów nerwowych znanych jako silne determinanty zachowań warunkowych.

Zarówno woda, jak i sok owocowy spowodowały znaczące aktywacje w całym mózgu i chociaż niektóre z tych odpowiedzi można przypisać motorycznym aspektom zadania, określone podzbiory tych regionów zostały rozłożone na wymiary preferencji i przewidywalności. Efekt preferencji był ograniczony do regionów korowych związanych z przetwarzaniem sensorycznym, a korzystny bodziec powodował większą aktywację w tych regionach. Regiony te leżą w pobliżu kory czuciowo-ruchowej, o której wiadomo, że są aktywowane podczas ruchów języka (Corfield i in., 1999) i połykania (Hamdy i in., 1999). We wcześniejszych pracach nad odpowiedzią mózgu na ruchy języka nastąpiła znaczna aktywacja móżdżku, co było wyraźnie nieobecne w głównym efekcie preferencji. Różnicowa odpowiedź mózgu, tj. Preferowana - niepreferowana, usuwa wspólne regiony aktywacji; dlatego brak aktywacji móżdżku sugeruje, że mało prawdopodobne jest, aby zróżnicowane ruchy języka były przyczyną wzorca aktywacji korowej dla subiektywnych preferencji. Fakt, że region somatosensoryczny był skorelowany z podaną preferencją sugerował, że dla dwóch bodźców wystąpiło pewne różnicowe przetwarzanie neuronowe. Zaskakujące było to, że było to widoczne w głównym obszarze przetwarzania sensorycznego, a nie w klasycznych obszarach nagrody. Chociaż badani byli zmuszeni do wyznaczenia jednej substancji nad drugą jako ich preferencji, oba płyny zostały wybrane celowo, aby były przyjemne, w przeciwieństwie do tego, który jest niechętny. Ponieważ oba płyny były ogólnie przyjemne, efekt preferencji mógł nie być wystarczająco silny, aby spowodować znaczną różnicę aktywności w regionach nagrody. Byłoby to zgodne z ustaleniami, że neurony dopaminowe śródmózgowia są preferencyjnie aktywowane raczej przez bodźce apetyczne niż awersyjne (Mirenowicz i Schultz, 1996). Niemniej jednak nasze odkrycia sugerują systemowe zróżnicowanie subiektywnych preferencji od prostej nagrody, która wspiera wcześniejsze hipotezy, że „pragnienie” nie jest tym samym, co „lubienie” (Robinson i Berridge, 1993).

W przeciwieństwie do efektu preferencji, nieprzewidywalność była skorelowana jako istotny efekt główny z aktywnością w jądrze półleżącym, wzgórzu i przyśrodkowej korze oczodołowo-czołowej, podczas gdy przewidywalność była skorelowana głównie z aktywnością w prawym górnym zakręcie skroniowym. Poprzednie regiony ściśle korespondują ze znanymi miejscami projekcji dopaminy (Koob, 1992; Cooper i wsp., 1996). Zaskakujące było, że nieprzewidywalność, a nie preferencje, była skorelowana z aktywnością w tych obszarach nagrody. Jeśli zwiększona aktywność w tych regionach wiązała się z przyjemnością, można by dojść do wniosku, że nieprzewidywalne nagrody były bardziej przyjemne niż przewidywalne. Jednak większość badanych nie dostrzegła żadnej różnicy między przewidywalnymi i nieprzewidywalnymi warunkami. Jeśli nieprzewidywalne nagrody były bardziej przyjemne niż przewidywalne, lub odwrotnie, to musi to mieć miejsce na poziomie podświadomości. Alternatywne wyjaśnienie zakłada, że ​​dopamina jest uwalniana w zwiększonych ilościach do nieoczekiwanych nagród (Montague i in., 1996; Schultz i wsp., 1997;Schultz, 1998). Dopamina może zmniejszać pobudliwość neuronów (Cooper i wsp., 1996) i może również bezpośrednio zwężać mikrokrążenie (Krimer i in., 1998), ale zwiększona aktywność półleżąca związana jest również z subiektywną przyjemnością kokainy (Breiter i in., 1997). Odkrycia te sugerują, że nasz obserwowany wzrost aktywacji z nieprzewidywalnością może być związany ze zwiększonym uwalnianiem dopaminy, ponieważ projekty półleżące trafiają do VTA lub ponieważ otrzymują projekcję z VTA, z których każdy byłby zgodny z wynikami modelu. Interpretacja ta powinna być łagodzona przez dwa ważne fakty: (1) mechanizmy, które łączą zwiększoną transmisję dopaminergiczną ze zmianami w sygnale BOLD są nieznane i (2) nie mamy niezależnej miary transmisji dopaminergicznej, jedynie zmiany w odpowiedzi BOLD. Możliwość, że obserwujemy pośrednio zmiany aktywności dopaminergicznej, jest ekscytująca, ale nie można jej jednoznacznie ustalić w eksperymencie fMRI. Jest jednak zgodne z wcześniejszymi odkryciami wykorzystującymi pozytronową tomografię emisyjną, że dopamina jest uwalniana do brzusznego prążkowia w warunkach zachęty monetarnej (Koepp i in., 1998). W połączeniu z wzmacniającym efektem nieprzewidywalności, jest to również zgodne z hipotetycznymi efektami dopaminy na neuronowe „zyski” (Cohen i Servan-Schreiber, 1992), w wyniku czego niektóre regiony wzrosną, a inne spadną.

Specyficzne regiony aktywowane stosunkowo nieprzewidywalnie odpowiadały regionom mózgu związanym z funkcjami apetycznymi. Oprócz jądra półleżącego, przyśrodkowa kora oczodołowo-czołowa wykazała główny efekt nieprzewidywalności. U naczelnych wykazano, że region ten integruje zarówno satysfakcjonujące, jak i neutralne aspekty doznań smakowych i uważa się, że odzwierciedla przede wszystkim motywacyjne wartości tych bodźców (Rolls, 2000). Ten region zawiera także neurony, które odróżniają względną preferencję dla nagrody (Tremblay i Schultz, 1999). Kora oczodołowo-czołowa jest zazwyczaj trudna do wyobrażenia za pomocą fMRI z powodu artefaktu podatności z zatok nosowych (Ojemann i in., 1997). Jednak region, który zidentyfikowaliśmy, jest generalnie lepszy i ogonowy niż zwykłe miejsce artefaktów. Ten region został wcześniej uznany za reagujący na przyjemne smaki (Francis i in., 1999). Drugi region, w górnym płacie ciemieniowym, prawdopodobnie nie był związany z satysfakcjonującymi aspektami zadania, ale raczej z wynikiem zmian uwagi. Ten region był wcześniej związany z uwagą wzrokowo-przestrzenną, zwłaszcza podczas naruszeń oczekiwań (Nobre i in., 1999). Inny region, w lewej korze skroniowej, wykazał znaczącą modulację graniczną przez nieprzewidywalność. W ostatnich eksperymentach fMRI lewy płat skroniowy był związany z przetwarzaniem przewidywalności bodźców sekwencyjnych (Bischoff-Grethe i in., 2000). Tutaj rozszerzamy te poprzednie ustalenia z bodźców neutralnych na bodźce przyjemne, sugerując, że region ten może wykonywać ogólne monitorowanie przewidywalności niezależnie od wartościowości bodźca.

Regiony mózgu, które zidentyfikowaliśmy jako reagujące na nieprzewidywalność zarówno w sposób bezpośredni, jak i modulacyjny, zostały zaangażowane w szereg eksperymentów dotyczących nagrody finansowej. Pieniądze mogą być satysfakcjonujące dla ludzi, ale wzmacniają się tylko dlatego, że uzyskały te właściwości poprzez złożone uwarunkowania. Podobne do odkrycia, że ​​kokaina działa na różne neurony niż naturalne wzmocnienia (Carelli i wsp., 2000), możliwe jest, że kondycjonowane wzmocnienia, takie jak pieniądze, działają na różne systemy neuronowe niż naturalne wzmacniacze, takie jak żywność i woda. Aktywność zarówno w brzusznym prążkowiu, jak i śródmózgowiu została skorelowana z bezwzględnym poziomem nagrody finansowej (Thut i in., 1997;Delgado i in., 2000; Elliott i in., 2000; Knutson i wsp., 2000), stwierdzenie wyraźnie nieobecne w naszych wynikach. Jak zauważono wcześniej, zarówno sok, jak i woda były łagodnie przyjemne, a więc nie było znaczącej różnicy w absolutnej nagrodzie, chociaż przyjęliśmy niewielką różnicę w modelu teoretycznym. Nie używaliśmy też żadnych bodźców awersyjnych ani niczego, co można by uznać za negatywną nagrodę, która może również wyjaśniać tę różnicę. Co ciekawe, regiony, które zidentyfikowaliśmy jako bezpośrednio dotknięte lub wzmocnione przez nieprzewidywalność, odpowiadały regionom uznanym wcześniej za wrażliwe na zależność kontekstową nagrody finansowej (Rogers i wsp., 1999; Elliott i in., 2000). W szczególności, zarówno subgenual zakrętu obręczy i wzgórza przyśrodkowego były skorelowane z nieprzewidywalnością w naszym badaniu i stwierdzono, że są zależne od kontekstu przez Elliott i in. (2000).

Ponieważ przewidywalność modulowała efekt preferencji, ważne jest, aby odróżnić potencjalne źródła przewidywania. W klasycznym warunkowym eksperymencie neutralny bodziec poprzedza nagrodę. Po treningu poprzednio neutralny bodziec staje się predyktorem lub bodźcem warunkowym. Ponieważ istnieje stosunkowo niewiele danych na temat stosowania bodźców doustnych w fMRI, zdecydowaliśmy się uprościć eksperyment i kontrolę dla motorycznych aspektów zadania, stosując dwa różne bodźce doustne, wodę i sok owocowy. Zatem źródło przewidywania w naszym eksperymencie z konieczności pochodziło z sekwencji samych bodźców. W pewnym sensie jest to prostsze niż wprowadzenie innej modalności bodźca, takiej jak wizualna wskazówka, ale ponieważ oba bodźce były satysfakcjonujące, nie możemy wyciągać żadnych wniosków dotyczących procesu warunkowania. Zarówno model teoretyczny (Schultz i wsp., 1997) i dane neurofizjologiczne (Schultz i wsp., 1992, 1993) sugerują, że przewidywania nagrody są obliczane w przedziale poprzedzającym dostarczenie nagrody. Ponieważ nie znamy skali czasu, w której obliczane są takie prognozy, postanowiliśmy przeanalizować eksperyment jako po prostu dwa warunki, przewidywalne i nieprzewidywalne. Utrzymując rozsądny psychologicznie odstęp między bodźcami, 10 sec, nie było wystarczającego czasu na rozwiązanie różnic w przetwarzaniu międzymiastowym. Przypuszczalnie takie przetwarzanie ma miejsce i można to rozwiązać za pomocą inaczej zaprojektowanego eksperymentu.

Podsumowując, aktywność w regionach ludzkich nagród może być modulowana przez czasową przewidywalność nagród pierwotnych, takich jak woda i sok. Wyniki te stanowią ważne wsparcie dla modeli obliczeniowych, które zakładają, że błędy w przewidywaniu nagrody mogą napędzać modyfikacje synaptyczne i rozszerzyć te wnioski z naczelnych nieludzkich na ludzi. Specyfika regionalna tej modulacji sugeruje również, że informacje, których ucieleśnieniem jest względna przewidywalność strumienia bodźca, mogą być formą waluty neuronowej, którą można wykryć za pomocą fMRI.

Przypisy

    • Odebrane Listopad 11, 2000.
    • Otrzymano wersję Styczeń 17, 2001.
    • Zaakceptowane Styczeń 26, 2001.
  • Praca ta była wspierana przez National Institute on Drug Abuse Grants K08 DA00367 (do GSB) i RO1 DA11723 (do PRM), National Alliance for Research in Schizophrenia and Depression (GSB) oraz Kane Family Foundation (PRM). Dziękujemy H. Mao, R. Kingowi i M. Martinowi za pomoc w gromadzeniu danych.

    Korespondencja może być skierowana do Gregory S. Berns, Wydział Psychiatrii i Nauk Behawioralnych, Emory University School of Medicine, 1639 Pierce Drive, Suite 4000, Atlanta, GA 30322, E-mail:[email chroniony]lub P. Czytaj Montague, Wydział Neurobiologii, Baylor College of Medicine, 1 Baylor Plaza, Houston, TX 77030, E-mail:[email chroniony].

artykuły cytujące ten artykuł