Dopamina, czas i impulsywność u ludzi (2010)

J Neurosci. 2010 czerwca 30;30(26):8888-96 . doi: 10.1523 / JNEUROSCI.6028-09.2010.

Sosna A1, Shiner T, Seymour B, Dolan RJ.

Autor informacji

Abstrakcyjny

Zaburzona neurotransmisja dopaminy bierze udział w pośredniczeniu w impulsywności w szeregu zachowań i zaburzeń, w tym uzależnienia, uzależnienia od hazardu, zaburzeń uwagi i nadpobudliwości oraz zespołu dysregulacji dopaminy. Podczas gdy istniejące teorie podkreślają mechanizmy oparte na nieprawidłowym uczeniu się o nagrodach lub odhamowaniu behawioralnym, nie dają one wystarczającego wyjaśnienia patologicznej nadwrażliwości na opóźnienie czasowe, które stanowi kluczowy fenotyp behawioralny obserwowany w tych zaburzeniach. Poniżej przedstawiamy dowody, że rola dopaminy w kontrolowaniu związku między czasem przyszłych nagród a ich subiektywną wartością może wypełnić tę lukę wyjaśniającą. Korzystając z zadania wyboru międzyokresowego, wykazaliśmy, że farmakologicznie zwiększająca się aktywność dopaminy zwiększa impulsywność, zwiększając zdrobnienie wpływu wzrastającego opóźnienia na wartość nagrody (dyskontowanie czasowe) i odpowiadającą jej reprezentację neuronalną w prążkowiu. Prowadzi to do stanu nadmiernego dyskontowania tymczasowo odległych nagród w stosunku do wcześniejszych. Zatem nasze odkrycia ujawniają nowy mechanizm, dzięki któremu dopamina wpływa na proces podejmowania decyzji przez człowieka, co może wyjaśniać aberracje behawioralne związane z nadczynnym układem dopaminy.

Wprowadzenie

Charakterystyczną utratę samokontroli i impulsywności związaną z nieprawidłową czynnością dopaminy ilustrują takie zaburzenia, jak uzależnienie, zespół deficytu uwagi / nadpobudliwości (ADHD) i zespół dysregulacji dopaminy (Winstanley i wsp., 2006; Dagher i Robbins, 2009; O'Sullivan i in., 2009). W tym drugim przypadku dopaminowa terapia zastępcza w leczeniu choroby Parkinsona (PD) powoduje, że niektórzy pacjenci są podatni na zachowania kompulsywne, które objawiają się nadmiernym hazardem, zakupami, jedzeniem i innymi krótkowzrocznymi zachowaniami. Jednak szeroki fenotyp impulsywności charakteryzujący te zachowania obejmuje różnorodność różnych procesów decyzyjnych, które można oddzielić neurobiologicznie i farmakologicznie (Evenden, 1999; Ho i wsp., 1999; Winstanley i wsp., 2004a, 2006; Dalley i wsp., 2008). Należą do nich brak zahamowania reakcji silniejszego napięcia, przeważanie nagród w stosunku do strat, brak spowolnienia w obliczu konfliktu decyzyjnego oraz skłonność do wybierania mniejszych - wcześniej niż większe - późniejsze nagrody.

Zasadniczo niektóre z wyżej wymienionych deficytów mogą być związane z efektami dopaminergicznymi poprzez ustaloną rolę dopaminy w uczeniu się nagrody (Redish, 2004; Frank i in., 2007; Dagher i Robbins, 2009). Jednak impulsywność czasowa (lub wybór) - preferencja dla mniejszych - wcześniej niż dla większych - późniejszych nagród, z powodu nadmiernego dyskontowania przyszłych nagród (Ainslie, 1975; Evenden, 1999; Ho i wsp., 1999; Cardinal i wsp., 2004) - jest o wiele trudniejszy do wyjaśnienia pod względem uczenia się, chociaż pozostaje ważną cechą domniemanej impulsywności dopaminergicznej. Rzeczywiście, testy laboratoryjne wyboru międzyokresowego wskazują, że uzależnieni i podgrupa pacjentów z ADHD wydają się mieć wyjątkowo wysokie czasowe stopy dyskontowe, zdecydowanie preferując mniejsze - wcześniej nagrody (Sagvolden i Sergeant, 1998; Bickel i Marsch, 2001; Solanto i in., 2001; Winstanley i wsp., 2006; Bickel i in., 2007). Stawia to pytanie, czy dopamina odgrywa szczególną rolę w obliczaniu, w jaki sposób czasowa bliskość nagrody wiąże się z jej subiektywną wartością (tj. Stopą dyskontowania czasowego), niezależnie od jej ustalonego wkładu w uczenie się o nagrodach.

Aby zbadać, czy dopamina moduluje zależne od czasu kodowanie wartości, podaliśmy prekursorowi dopaminy l-dopa, antagonistę dopaminy, haloperidol, i placebo zdrowym ochotnikom, wykonującym zadanie wyboru międzyokresowego. Zadanie wymagało od uczestników dokonywania prawdziwych wyborów między różnymi kwotami pieniędzy oferowanymi w różnych okresach czasu, głównie z wyboru między mniejszymi - wcześniejszymi a większymi - późniejszymi nagrodami pieniężnymi. Takie wybory są dobrze scharakteryzowane przez modele, które zawierają zarówno efekt dyskontowania czasu, jak i efekty dyskontowania rosnącej wielkości nagrody (malejąca użyteczność krańcowa) (Pine i in., 2009). W związku z tym zdyskontowana użyteczność lub subiektywna wartość odroczonej nagrody jest określana przez iloczyn współczynnika dyskontowego (liczba od zera do jednego) i użyteczności nagrody. Jeśli dopamina moduluje indywidualny wybór w tym zadaniu, może to odzwierciedlać zmianę stopy dyskontowej lub wklęsłości / wypukłości użyteczności (patrz Materiały i metody) - rozróżnienie, które mogliśmy zbadać zarówno na poziomie behawioralnym, jak i neurofizjologicznym funkcjonalne obrazowanie metodą rezonansu magnetycznego (fMRI). Dodatkowo oceniliśmy, czy dopamina ma jakikolwiek wpływ na tempo spowolnienia wywołane konfliktem decyzyjnym (Frank i in., 2007; Pochon i in., 2008) aby odróżnić globalne od dyskretnych wpływów na impulsywność.

Materiały i Metody

Użyliśmy fMRI, podczas gdy badani wybierali między dwiema serialnie prezentowanymi opcjami o różnej wielkości (od £ 1 do £ 150) i opóźnieniem (od 1 tygodnia do 1 roku) (Rys. 1). Każdy badany wykonywał to zadanie przy trzech różnych okazjach (w odniesieniu do trzech chorób narkotykowych). Te wybory były często mniejsze - wcześniej w porównaniu z większymi - później. Jeden z wyborów badanych był wybierany losowo na koniec eksperymentu (w każdej sesji eksperymentalnej) i opłacany realnie (tj. W określonym przyszłym terminie) przelewem bankowym. Wykorzystaliśmy wybory badanych do oceny zakresu dyskontowania zarówno pod względem wielkości, jak i czasu. Oceniliśmy model, który łączył funkcję użyteczności (przeliczanie wielkości na użyteczność) ze standardową hiperboliczną funkcją dyskontującą. Mówiąc prosto, funkcja zdyskontowanej użyteczności (wartość subiektywna) opóźnionej nagrody (V) jest równe D × U gdzie D jest czynnikiem dyskontowym między 0 i 1 i U jest niezdyskontowanym narzędziem. D jest zwykle funkcją hiperboliczną opóźnienia nagrody i zawiera parametr stopy dyskontowej (K), który określa, jak szybko dewaluuje się przyszłe nagrody. U jest (zazwyczaj) funkcją wklęsłą wielkości nagrody i zależy od indywidualnego parametru (r), która określa wklęsłość / wypukłość funkcji lub szybkość malejącej użyteczności krańcowej dla zysków, aw konsekwencji chwilową wartość większej w stosunku do mniejszej nagrody. Im większy K or r, im bardziej dana osoba prawdopodobnie wybierze wcześniejszą opcję i dlatego bardziej impulsywna jest jednostka (Ho i wsp., 1999; Pine i in., 2009). Zgodnie z teorią użyteczności wybór zależy od zasady maksymalizacji użyteczności, przy czym wybrana jest opcja o największej zdyskontowanej użyteczności.

Rysunek 1 

Projekt zadania. Badani otrzymali zestaw międzyokresowych wyborów binarnych 220, głównie między mniejszymi - wcześniejszymi i większymi - późniejszymi nagrodami, które różniły się kwotami od £ 1-£ 150 z towarzyszącymi opóźnieniami tygodni 1 – 52. Uwaga ...

Uczestnicy

Do eksperymentu włączono czternastu praworęcznych, zdrowych ochotników (mężczyźni 6; kobiety 8; średni wiek, 21; zakres, 18 – 30). Pacjenci byli wstępnie oceniani, aby wykluczyć osoby z wcześniejszą historią choroby neurologicznej lub psychiatrycznej. Wszyscy pacjenci wyrazili świadomą zgodę, a badanie zostało zatwierdzone przez komisję etyczną University College London. Jeden podmiot wypadł z badania po pierwszej sesji i nie został uwzględniony w wynikach. Inny nie ukończył końcowej sesji (placebo) w skanerze, ale w wynikach uwzględniono dane behawioralne ze wszystkich sesji i dane obrazowe z dwóch sesji.

Procedura i opis zadania

Każdy temat był testowany trzy razy. Po przybyciu za każdym razem uczestnicy otrzymywali arkusz instrukcji do przeczytania wyjaśniający, w jaki sposób zostanie zastosowane oślepianie narkotyków. Następnie uzupełnili wizualną skalę analogową (Bond and Lader, 1974), które mierzyły stany subiektywne, takie jak czujność, a następnie otrzymywały kopertę zawierającą dwie tabletki, które były albo 1.5 mg haloperidolu lub placebo. Półtorej godziny po przyjęciu pierwszego zestawu tabletek pacjentom podano kolejną kopertę zawierającą dwie tabletki Madopar (zawierające 150 mg l-dopy) lub placebo. Tabletki placebo (witamina C lub multiwitaminy) były nie do odróżnienia od leków. W sumie każdy osobnik otrzymał jedną dawkę Madoparu na jednej sesji, jedną dawkę haloperidolu na drugą, a na jednej sesji oba zestawy tabletek były placebo. Kolejność każdego stanu leku w odniesieniu do sesji testowej była zrównoważona wśród badanych i nie była znana eksperymentatorowi w celu uzyskania projektu z podwójnie ślepą próbą. Testy rozpoczęły się 30 min po spożyciu drugiego zestawu tabletek. Miały one na celu osiągnięcie maksymalnego stężenia leku w osoczu w przybliżeniu w połowie badania. Po testowaniu uczestnicy ukończyli kolejną (identyczną) wizualną skalę analogową. W tygodniu 1 nie miały miejsca dwie sesje testowe.

Zadanie behawioralne było w większości opisane przez Pine i in. (2009). Każda próba składała się z wyboru pomiędzy mniejszą - wcześniejszą nagrodą a większą - późniejszą nagrodą. Wybór był prezentowany seryjnie, w trzech etapach (Rys. 1). Pierwsze dwa etapy polegały na przedstawieniu szczegółów każdej opcji, tj. Wielkości nagrody w funtach i opóźnieniu jej otrzymania w miesiącach i tygodniach. Po przedstawieniu opcji, trzeci ekran podpowiedział temat, aby wybrać pomiędzy opcją 1 (pierwsza opcja przedstawiona) lub opcją 2, za pomocą skrzynki z guzikami, używając ich prawej ręki. Opóźnienie 3 nastąpiło po każdej z trzech faz. Wyboru można dokonać tylko podczas 3-ów po prezentacji ekranu wyboru. Po dokonaniu wyboru wybrana opcja została podświetlona na niebiesko. Pod warunkiem, że był wystarczająco dużo czasu, podmiot mógł zmienić zdanie. Nastąpiło niespokojne opóźnienie 1 – 4 po fazie wyboru, po czym nastąpiło przedstawienie krzyża fiksacyjnego dla 1.

Eksperyment składał się z ogółu prób 200. Opcja 1 była mniejszą - wcześniejszą nagrodą w 50% prób. Ponadto uwzględniliśmy kolejne testy „łapania” 20, w których jedna z opcji miała większą wartość i była dostępna wcześniej niż druga. Te próby połowowe miały miejsce mniej więcej co dziesiąte badanie i umożliwiły nam ustalenie, jak dobrze badani koncentrowali się na zadaniu, przy założeniu, że normą jest preferowanie większej - wcześniejszej nagrody w tych wyborach. Każdy osobnik otrzymał taki sam zestaw wyborów na każdej sesji testowej (tj. Każdy stan leku), z wyjątkiem pierwszych dwóch osób, które otrzymały inny zestaw wyborów podczas pierwszej sesji testowej. Wartości opcji zostały utworzone przy użyciu losowo generowanych wielkości zmieniających się od £ 1 do £ 150 w jednostkach £ 1 i opóźnień od 1 tygodnia do 1 roku w jednostkach pojedynczych tygodni (ale przedstawionych jako liczba miesięcy i tygodni), ponownie z losowy rozkład. Ten losowy charakter wartości pomógł w ortogonalizacji wielkości i opóźnienia. Aby stworzyć wybory pomiędzy mniejszymi - wcześniej i większymi - późniejszymi nagrodami, wprowadziliśmy ograniczenie, że opcja o większej wielkości powinna być opóźniona bardziej niż mniejsza i odwrotnie dla prób połowowych. Badani zostali przydzieleni do jednej z dwóch macierzy wyboru w zależności od ich odpowiedzi w ramach prób praktycznych podczas pierwszej sesji. Dokonano tego, aby dopasować przedstawione opcje do poziomu impulsywności obiektu.

Płatność została przeprowadzona za pomocą loterii, aby wybrać jedną próbę z każdej sesji testowej. W celu narzucenia ważności ekologicznej wykorzystaliśmy system płatności, który zapewniał, że wszystkie wybory będą dokonywane w realistyczny sposób, z realistycznymi konsekwencjami. Kluczowym elementem tego projektu był losowy wybór jednego z wyborów dokonanych podczas eksperymentu, z prawdziwą zapłatą wybranej opcji dla tego wyboru. Osiągnięto to poprzez przelew bankowy dokonany w czasie powiązanym z kwotą wybranej opcji. Wybór płatności został wdrożony przy użyciu ręcznej loterii po zakończeniu wszystkich testów. Loteria zawierała kule numerowane 220, z których każda reprezentowała pojedynczą próbę z zadania. Wybrana piłka odpowiadała nagrodzonej próbie podczas tej sesji testowej. Wielkość i opóźnienie opcji, którą przedmiot wybrał w wybranej próbie, określono i przyznano za pomocą przelewu bankowego. Tak więc płatność, jaką otrzymał każdy przedmiot, była określona przez połączenie loterii i dokonanych wyborów - manipulacja, która zapewniała podmiotom traktowanie wszystkich wyborów jako rzeczywistych. System płatności został zaprojektowany tak, aby średnio każdy podmiot otrzymywał £ 75 na sesję. Nie przyznano żadnej innej płatności za udział w eksperymencie.

Zanim przedmioty zostały zabrane do skanera, pokazano im maszynę do loterii i wyjaśniono, w jaki sposób zostanie zrealizowany przelew bankowy, aby zapewnić ich, że system płatności i selekcji był prawdziwy. Po krótkiej praktyce sześciu prób zabrano ich do skanera, gdzie wykonali po dwie sesje prób 110, trwające łącznie ~ 50 min.

Procedura obrazowania

Obrazowanie funkcjonalne przeprowadzono za pomocą skanera MRI firmy 3-tesla Siemens Allegra, aby uzyskać echo-planarne obrazy ważone gradientem T2 * (EPI) z kontrastem zależnym od poziomu utlenienia krwi (BOLD). Użyliśmy sekwencji zaprojektowanej w celu optymalizacji czułości funkcjonalnej w korze oczodołowo-czołowej (Deichmann i in., 2003). Składało się to z przechylonego przechwytywania w ukośnej orientacji przy 30 ° do linii przedniej obręczy AC-PC z przednim zakrętem obręczy, a także zastosowania impulsu przygotowawczego o czasie trwania 1 ms i amplitudzie −2 mT / m w wyborze wycinka kierunek. Sekwencja umożliwiła uzyskanie osiowych plastrów 36 o grubości 3 mm i rozdzielczości płaszczyzny 3 mm z czasem powtarzania (TR) 2.34 s. Pacjenci zostali umieszczeni w lekkim zagłówku wewnątrz skanera, aby ograniczyć ruch głowy podczas akwizycji. Dane obrazowania funkcjonalnego uzyskano w dwóch oddzielnych sesjach objętościowych 610. Obraz strukturalny ważony T1 i mapy terenowe zostały również pozyskane dla każdego obiektu po sesjach testowych.

Analiza behawioralna

Aby uzyskać ogólną miarę impulsywnego wyboru, policzyliśmy liczbę wcześniejszych opcji wybranych z badań 220, dla każdego stanu leku, dla każdego podmiotu. Próby, w których nie udzielono odpowiedzi, zostały wyłączone z tej sumy we wszystkich trzech warunkach narkotykowych. Na przykład, jeśli jeden podmiot nie zareagował na czas przed numerem badania 35 w stanie placebo, próba ta została wykluczona z liczby pozostałych dwóch warunków dla tego podmiotu. Zapewniło to, że porównania były przeprowadzane metodą próbną (ponieważ ten sam zestaw prób był podawany w każdej sesji testowej), a wpływ leku na ten środek nie był związany z liczbą wyborów dokonanych w każdym warunku. Zastosowano ANOVA z powtarzanymi pomiarami, aby sprawdzić wszelkie różnice w tym ogólnym pomiarze w warunkach leku.

Estymacja parametrów

Zaimplementowaliśmy regułę decyzji softmax, aby przypisać prawdopodobieństwo (PO1 dla opcji 1) do każdej opcji wyboru, biorąc pod uwagę wartość opcji (VO1 dla opcji 1)

POi=e(VOi/β)e(VO1/β)+e(VO2/β).
(1)

VOi reprezentuje wartość opcji (tj. opóźnionej nagrody) zgodnie z konkretnym modelem wyceny opcji (patrz poniżej). The β parametr reprezentuje stopień stochastyczności zachowania podmiotu (tj. wrażliwość na wartość każdej opcji).

Zastosowaliśmy zdyskontowany model użytkowy wyceny opcji, który wcześniej informowaliśmy (Pine i in., 2009) jako zapewniające dokładne dopasowanie do wyborów podmiotu w tym zadaniu. Model ten stwierdza, że ​​zdyskontowana użyteczność (V) nagrody wielkości (M) iz opóźnieniem (d) można wyrazić w następujący sposób:

V=D(d)U(M)=1-e(-rM)r(1+Kd),
(2)

gdzie

D=11+Kd

i

U=1-e(-rM)r.

D można uznać za czynnik dyskontujący - czynnik zależny od opóźnienia (między 0 i 1), dzięki któremu narzędzie jest dyskontowane w standardowy sposób hiperboliczny (Mazur, 1987). Parametr stopy dyskontowej K kwantyfikuje skłonność jednostki do dyskontowania przyszłości w taki sposób, że osoba z odlotem K szybko dewaluuje nagrody, gdy stają się bardziej odległe. U jest niezdyskontowanym narzędziem i podlega wielkości każdej opcji i r, darmowy parametr określający krzywiznę relacji. Im większa wartość r, im bardziej wklęsła funkcja użyteczności, i gdzie r jest ujemny, funkcja użyteczności jest wypukła. Im większy r (powyżej zera), im większa jest malejąca użyteczność krańcowa, a bardziej impulsywna jest jednostka do wyboru. Należy zauważyć, że zgodnie z tradycyjnymi modelami wyceny wyboru międzyokresowego, które nie uwzględniają dyskontowania wielkości (Mazur, 1987), impulsywność, definiowana przez skłonność do wyboru mniejszej - wcześniejszej opcji, jest wyłącznie funkcją K i tak można się spodziewać, że te dwie osoby będą się doskonale korelować. Stąd, K jest często uważany za miarę tej cechy. Jednakże, ponieważ wykazano, że dyskontowanie wielkości determinuje wynik wyboru u zwierząt i ludzi (Ho i wsp., 1999; Pine i in., 2009), wolimy zrównać impulsywność z zachowaniem wyboru, ponieważ czasowa stopa dyskontowa nie koreluje idealnie z tym kluczowym miernikiem.

Aby obliczyć parametry największej wiarygodności dla każdego modelu, a także miarę dopasowania, zastosowano oszacowanie największej wiarygodności. Każdy z parametrów (w tym β) mógł swobodnie się zmieniać. Dla każdego przedmiotu prawdopodobieństwo obliczono dla każdej z opcji 220 wybranych z wyborów 220 (w tym prób połowowych), przy użyciu formuły softmax i zaimplementowano z funkcjami optymalizacji w Matlab (MathWorks). Logiczne prawdopodobieństwo obliczono na podstawie prawdopodobieństwa wybranej opcji podczas próby t (PO(t)) od Równ. 1 takie

lnL=ΣtlnPO(t).
(3)

ANOVA z powtarzanymi pomiarami została użyta do sprawdzenia jakichkolwiek różnic w stopie dyskontowej (K) i wklęsłość użyteczności (r) w warunkach lekowych.

Na potrzeby analizy obrazu i czasu reakcji przeprowadzono dalszą ocenę, zgodnie z którą wszystkie wybory z każdego podmiotu w każdym warunku zostały zgrupowane razem (jak gdyby wykonane przez jeden podmiot) i modelowane jako przedmiot kanoniczny do oszacowania kanonicznych wartości parametrów (przy użyciu powyższa procedura dopasowania, estymacja parametru). Wykonano to w celu zmniejszenia szumu związanego z procedurą dopasowania na poziomie pojedynczego obiektu. Ponadto nie chcieliśmy budować różnic behawioralnych w naszych modelach regresji podczas analizy danych fMRI, ponieważ szukaliśmy niezależnych dowodów na nasze wyniki behawioralne.

Analiza obrazu

Analizę obrazu przeprowadzono za pomocą SPM5 (www.fil.ion.ucl.ac.uk/spm). Dla każdej sesji pierwsze pięć obrazów odrzucono, aby uwzględnić efekty równoważenia T1. Pozostałe obrazy zostały wyrównane do szóstej objętości (w celu skorygowania ruchów głowy), bez ostrzeżenia za pomocą map terenowych, przestrzennie znormalizowane do standardowego szablonu mózgu Instytutu Neurologicznego w Montrealu (MNI) i wygładzone przestrzennie za pomocą trójwymiarowego jądra Gaussa z 8 mm pełnego szerokość w połowie maksimum (FWHM) (i ponownie próbkowana, w wyniku czego powstają woksele 3 × 3 × 3 mm). Artefakty o niskiej częstotliwości zostały usunięte przy użyciu filtra górnoprzepustowego 1 / 128 Hz, a czasowa autokorelacja wewnętrzna w szeregu czasowym fMRI została skorygowana przez wcześniejsze zastosowanie procesu AR (1).

Mapy kontrastu z jednym obiektem zostały wygenerowane przy użyciu modulacji parametrycznej w kontekście ogólnego modelu liniowego. Przeprowadziliśmy analizę, badając wariancję w regionalnej odpowiedzi BOLD przypisywanej różnym regresorom zainteresowania: U, D, V dla wszystkich opcji we wszystkich warunkach lekowych. Pozwoliło nam to zidentyfikować regiony biorące udział w ocenie i integracji różnych składników wartości (w warunkach placebo) i poszukać różnic w tych aktywacjach w różnych warunkach leków.

U, D, V dla każdej opcji (dwie na próbę) obliczono za pomocą kanonicznych oszacowań parametrów (K i r) w kontekście naszego zdyskontowanego modelu użytkowego i połączonego z kanoniczną funkcją odpowiedzi hemodynamicznej (HRF) na początku każdej opcji. Wszystkie przypadki modelowano jako funkcje sztyftu i wszystkie regresory w tym samym modelu były ortogonalizowane (w podanych powyżej porządkach) przed analizą za pomocą SPM5. Aby skorygować artefakty ruchu, sześć parametrów wyrównania modelowano jako regresory bez zainteresowania w każdej analizie. W dodatkowej analizie usunęliśmy wszelkie potencjalne zamieszanie związane z ortogonalizacją regresorów w naszej analizie fMRI, wprowadzając inny model regresji, ale usuwając teraz etap ortogonalizacji. Tutaj regresorom pozwolono konkurować o wariancję w taki sposób, że w tym bardziej konserwatywnym modelu usunięto wszystkie współdzielone komponenty wariancji, ujawniając tylko unikalne składniki U, D, V. W tym modelu ponownie zaobserwowaliśmy te same różnice D i V w warunkach narkotykowych i bez różnicy U, chociaż skala różnic została zmniejszona.

Na drugim poziomie (analiza grupowa) regiony wykazujące znaczącą modulację przez każdy z regresorów określonych na pierwszym poziomie zidentyfikowano za pomocą analizy efektów losowych β zdjęcia z map kontrastu pojedynczego obiektu. Uwzględniliśmy zmianę miary impulsywności (różnicę w liczbie wcześniej wybranych) jako współzmienną przy wykonywaniu kontrastu dotyczącego różnic w próbach l-dopa i placebo. Podajemy wyniki dla regionów, w których szczytowy poziom woksela t wartość odpowiada p <0.005 (nieskorygowane), przy minimalnym rozmiarze klastra wynoszącym pięć. Współrzędne zostały przekształcone z tablicy MNI na tablicę stereotaktyczną Talairach i Tournoux (1988) (http://imaging.mrc-cbu.cam.ac.uk/imaging/MniTalairach).

Strukturalne obrazy T1 przypisano do średnich funkcjonalnych obrazów EPI dla każdego pacjenta i znormalizowano przy użyciu parametrów pochodzących z obrazów EPI. Anatomiczną lokalizację wykonano przez nałożenie t mapy na znormalizowanym obrazie strukturalnym uśrednionym dla różnych przedmiotów oraz w odniesieniu do atlasu anatomicznego Mai i in. (2003).

Dane dotyczące opóźnienia decyzji

Aby zbadać wpływ konfliktu decyzyjnego (trudność wyboru) na opóźnienie decyzji, obliczyliśmy miarę trudności dla każdej z opcji 220, obliczając różnicę w zdyskontowanej użyteczności (ΔV) z dwóch opcji. Miara ta została obliczona przy użyciu zdyskontowanego modelu użytkowego i oszacowań parametrów kanonicznych (z tego samego powodu, z jakiego zostały użyte w analizach fMRI). Następnie przeprowadzono regresję liniową, aby modelować zależność między opóźnieniem decyzji dla każdego wyboru a miarą trudności. Szacunki parametrów (βs) zostały następnie wykorzystane jako statystyka podsumowująca, a analiza drugiego poziomu została przeprowadzona za pomocą jednej próbki t test porównujący βs wobec zera. Przeprowadzono to oddzielnie dla grupy w każdym stanie leku. Aby przetestować jakiekolwiek różnice w związku między konfliktem a opóźnieniem w warunkach leku, wykorzystaliśmy sparowane próbki t testów.

Efekt

Najpierw przeanalizowaliśmy wpływ manipulacji lekami na zachowanie, biorąc pod uwagę proporcje mniejszych - wcześniejszych w stosunku do większych - później wybranych opcji, wszystkich wyborów 220, dokonanych w każdym warunku. Dane te ujawniły znaczny wzrost liczby wcześniejszych opcji wybranych w warunkach l-dopa w stosunku do warunku placebo (średnia 136 vs 110, p = 0.013) (Tabela 1, Rys. 2). Uderzające jest to, że wzór ten zaobserwowano u wszystkich osób, u których można było dokonać porównania. Nie było znaczącej różnicy między warunkami haloperidolu i placebo w tej dyspozycji. Zauważ, że zadanie składało się z tej samej tablicy wyboru w każdym warunku.

Rysunek 2 

Porównania behawioralne i oszacowania parametrów w warunkach placebo i l-dopa. a, Uczestnicy wykonali dokładnie ten sam zestaw (220) wyborów we wszystkich trzech warunkach leczenia, ale częściej wybierali mniejsze - wcześniej niż większe - później ...
Tabela 1 

Podsumowanie wyników behawioralnych

Następnie wykorzystaliśmy oszacowanie maksymalnej wiarygodności, aby znaleźć najlepiej pasujące parametry (K i r) dla zdyskontowanego modelu użyteczności, dla każdego osobnika w każdym stanie, aby określić, czy określony wpływ na którykolwiek z tych parametrów pośredniczył w obserwowanym wzroście impulsywności behawioralnej. Porównując oszacowane parametry kontrolujące stopę dyskonta i wklęsłość użyteczności w różnych warunkach, stwierdzono specyficzny wpływ l-dopy na stopę dyskontową, bez wpływu na wklęsłość użyteczności (Tabela 1, Rys. 2, tabela dodatkowa 1, dostępne o www.jneurosci.org as materiał uzupełniający). Tak więc w przypadku l-dopa zaobserwowano wyższą stopę dyskontową w porównaniu z placebo (p = 0.01), prowadząc do większej dewaluacji przyszłych nagród. Tytułem ilustracji, wykorzystując oszacowanie parametru kanonicznego grupy do wykreślenia funkcji dyskontowej dla każdego stanu leku, można zauważyć, że w przypadku placebo wymagało to opóźnienia ~ 35 tygodni, aby nagroda £ 150 miała obecną (subiektywną) wartość £ 100, jednak pod l-dopa ta sama dewaluacja miała miejsce z opóźnieniem zaledwie 15 tygodni (Rys. 2). Kanoniczne oszacowania parametrów używane do analiz obrazowania były 0.0293 dla K i 0.0019 dla r (wszystkie wartości K zgłaszane są obliczane od jednostek czasu tygodni).

Zgodnie z Pine i in. (2009), oszacowania parametrów dla każdego podmiotu (w różnych warunkach) były większe niż zero, ujawniając zarówno znaczący wpływ dyskontowania czasowego (p <0.001) i nieliniowość (wklęsłość) chwilowej użyteczności (p <0.05). Należy zauważyć, że w przeciwieństwie do tradycyjnych modeli wyboru międzyokresowego (Mazur, 1987), gdzie wynik wyboru jest wyłącznie funkcją K, zastosowany model oznacza, że ​​liczba wcześniej wybranych opcji zależy również od r parametr (patrz Materiały i metody) (Pine i in., 2009) i stąd K nie jest sama w sobie czystą miarą impulsywności wyboru. Co więcej, dokładność oszacowanych parametrów zależy zarówno od stochastyczności, jak i spójności odpowiedzi badanych. Na przykład, oszacowane parametry w badaniu placebo badanego 13 były anomalne w stosunku do reszty danych (tabela dodatkowa 1, dostępne o www.jneurosci.org as materiał uzupełniający), wskazując, że ten temat mógł dokonać niespójnych wyborów w tej sesji. Porównując różne przedmioty, należy pamiętać, że liczba wcześniejszych wyborów zależy również od wybranego zestawu, który otrzymał przedmiot (jeden z dwóch).

Ponadto zbadaliśmy, czy spowolnienie opóźnień decyzyjnych było widoczne, ponieważ wybory stawały się coraz trudniejsze - w związku z rosnącą bliskością wartości opcji - i czy jakiekolwiek różnice grupowe były widoczne w tej mierze. Przeprowadziliśmy regresję, aby ocenić zależność między opóźnieniem decyzji a trudnością każdego wyboru mierzoną różnicą w zdyskontowanej użyteczności (ΔV) pomiędzy opcjami wyboru dwóch, obliczonymi przy użyciu oszacowanych wartości parametrów. W placebo (p <0.001), l-dopa (p <0.001) i haloperidol (p <0.001), opóźnienia decyzji badanych wzrosły jako ΔV zmniejszyło się, ponieważ różnica w subiektywnej wartości między opcjami zmniejszyła się. Jednakże nie zaobserwowano ogólnej różnicy w tym pomiarze w warunkach leku. Oznacza to, że w przeciwieństwie do wyniku wyboru, manipulacja dopaminą nie wpłynęła na ilość czasu przeznaczonego na ważenie decyzji lub zdolności do „trzymania koni” i potwierdza sugestię, że impulsywność nie jest jednolitą konstrukcją (Evenden, 1999; Ho i wsp., 1999; Winstanley i wsp., 2004a; Dalley i wsp., 2008). Ta obserwacja zgadza się z wcześniejszym odkryciem, że status leku dopaminowego w PD nie był związany ze zmianą latencji decyzji w zadaniu innego wyboru (Frank i in., 2007).

Subiektywne efekty analizowano porównując zmiany trzech czynników zidentyfikowanych przez Bond and Lader (1974), mianowicie czujność, zadowolenie i spokój w stosunku do zmiany wyników obserwowanych w stanie placebo. Różnice stwierdzono w haloperidolu w porównaniu z warunkami placebo, w których badani byli mniej czujni w przypadku haloperidolu (p < 0.05).

Aby ustalić, jak zwiększona impulsywność pod wpływem l-dopy była reprezentowana na poziomie neuronalnym, zastosowaliśmy trzy (ortogonalizowane) regresory parametryczne, U, D, V, związane z prezentacją każdej opcji, zgodnie z naszym modelem, do danych obrazowania mózgu. Regresory zostały utworzone dla każdego badanego, w każdym stanie, przy użyciu kanonicznych wartości parametrów oszacowanych na podstawie wyborów wszystkich badanych we wszystkich sesjach, w teście hipotezy zerowej, że aktywność mózgu nie różni się między warunkami.

We wstępnej analizie zbadaliśmy korelacje dla tych trzech regresorów w warunkach placebo, aby powtórzyć poprzednie ustalenia (Pine i in., 2009). Nasze wyniki (Uzupełniające wyniki, dostępne o www.jneurosci.org as materiał uzupełniający) były zgodne z poprzednio pokazanymi, w tym D, U, V wszystkie niezależnie skorelowane z aktywnością w jądrze ogoniastym (między innymi regionami). Wspiera to hierarchiczny, zintegrowany widok wyceny opcji, w którym podskładniki wartości są zakodowane niezgodnie z przeznaczeniem, a następnie łączone w celu dostarczenia ogólnej wartości używanej do wyboru.

Krytyczne analizy fMRI koncentrowały się na kluczowej behawioralnej różnicy w wycenie opcji w ramach l-dopa w porównaniu z warunkami placebo. Porównując aktywność neuronową dla U, D, V, stwierdzono znaczne różnice dla obu D i V, odkrycie pasujące do wyniku behawioralnego. W szczególności zaobserwowaliśmy zwiększoną aktywność w regionach w odniesieniu do czynnika dyskontowego D pod l-dopą w stosunku do warunków placebo (Rys. 3a i Uzupełniające wyniki, dostępne o www.jneurosci.org as materiał uzupełniający) i brak wpływu haloperidolu (to znaczy współczynniki regresji w warunkach placebo i haloperidolu nie różniły się znacząco). Regiony te obejmowały prążkowie, wyspę, zakręty subgenualne i boczne kory oczodołowo-czołowe. Wyniki te pokazują, że charakterystyczny spadek aktywności tych regionów w miarę, jak nagrody stają się bardziej opóźnione (lub wzrastają, gdy stają się tymczasowo bliższe) (McClure i in., 2004; Tanaka i in., 2004; Kable i Glimcher, 2007; Pine i in., 2009) (Zobacz też Uzupełniające wyniki dla placebo, dostępne w www.jneurosci.org as materiał uzupełniający) jest bardziej wyraźny w l-dopie w porównaniu do warunków placebo, w sposób, który odpowiada znalezieniu zachowania, gdzie l-dopa zwiększyła preferencje dla wcześniejszych nagród poprzez zwiększenie stopy dyskontowej, tym samym czyniąc szybciej nagrody bardziej atrakcyjnymi w stosunku do późniejszych nagród. Co więcej, tak jak nie było znaczącej różnicy w szacunkach r parametr w tych próbach, nie zaobserwowaliśmy istotnej różnicy w U aktywność między badaniami z użyciem l-dopa i placebo, wskazując, że l-dopa nie wpływa na kodowanie użyteczności nagrody.

Rysunek 3 

Różnice w aktywności neuronalnej między warunkami L-dopa i placebo w odpowiedzi na subiektywną wartość i czynnik dyskontowy (statystyczne parametry parametryczne i oszacowania parametrów). a, Regiony skorelowane z czynnikiem dyskontowym (D) (tj. bliskość nagrody) ...

Poprzednie badania (Kable i Glimcher, 2007; Pine i in., 2009), jak również analizę samej grupy placebo, implikują między innymi regiony prążkowia w kodowaniu zdyskontowanej użyteczności (V). Podczas porównywania regionów skorelowanych z V, zmniejszona aktywność była obserwowana w ogoniastej, wyspie i bocznych dolnych obszarach czołowych, w l-dopie w porównaniu z warunkami placebo (Rys. 3b i Uzupełniające wyniki, dostępne o www.jneurosci.org as materiał uzupełniający). Wynik ten wskazuje, że dla nagrody o określonej wielkości i opóźnieniu, l-dopa wywołała zmniejszoną aktywność w regionach kodujących wartość subiektywną (użyteczność zdyskontowana). Zmniejszenie to było związane ze zwiększonym dyskontowaniem czasowym i doprowadziło do zwiększenia wyboru mniejszych - szybciej (impulsywnych) opcji w tym stanie w porównaniu z placebo.

Ponieważ dane fMRI wykorzystywały ten sam pojedynczy zestaw parametrów kanonicznych (we wszystkich warunkach, testując hipotezę zerową, że wszystkie są takie same), ustalenia te są zgodne z wynikami behawioralnymi, zgodnie z którymi zwiększenie stopy dyskontowej w ramach l-dopa prowadzi do zmniejszenia D, co prowadzi do odpowiedniego zmniejszenia V a zatem zwiększona względna preferencja dla wcześniejszych nagród. Zauważ, że gdyby kodowana przez dopaminę zdyskontowana użyteczność była jedyna, można by przewidzieć przeciwny wynik, z większą aktywnością w stanie l-dopa.

Kontrola wyników behawioralnych (Tabela 1, Rys. 2) ujawnił, że wzrost impulsywności po l-dopie był wyrażany w większym stopniu u niektórych osób niż w innych. Na tej podstawie przeprowadziliśmy analizę współzmienną poprzednich kontrastów, obliczając różnicę punktów w odniesieniu do liczby wcześniejszych opcji wybranych w badaniach placebo i l-dopa. Im większa ta metryka, tym większy wzrost impulsywności (stopy dyskontowej) wywołany przez l-dopę. Regresując tę ​​ilość jako współzmienną w porównaniu kontrastu D w l-dopa minus warunki placebo (Rys. 3a), stwierdziliśmy istotną korelację z aktywnością ciała migdałowatego (obustronnie) (Rys. 4). Ponieważ na różnicę w wynikach wyboru pomiędzy badanymi może częściowo wpłynąć fakt, że badani zostali przypisani do jednego z dwóch możliwych zestawów wyboru i aby zwiększyć moc (będąc w stanie uwzględnić więcej przedmiotów), powtórzyliśmy tę analizę, tym razem za pomocą różnica szacunkowa K wartości od prób placebo do l-dopa. Wynik tej analizy (patrz Uzupełniające wyniki, dostępne o www.jneurosci.org as materiał uzupełniający) ponownie wykazały silną dodatnią korelację między aktywnością ciała migdałowatego a stopniem wzrostu K od placebo do prób z l-dopą. Wyniki te sugerują, że podatność poszczególnych osób na impulsywność pod wpływem l-dopy jest modulowana przez stopień odpowiedzi ciała migdałowatego na czasową bliskość nagrody.

Rysunek 4 

Zmienność osobników we wzroście impulsywności po l-dopie. a, Statystyczna mapa parametryczna przedstawiająca obszary wyrażające ogólną wrażliwość na czynnik dyskontowy (w warunkach l-dopa minus warunki placebo) i zależne od stopnia, w jakim ...

Dyskusja

Istniejące teorie dopaminy koncentrują się na jej roli w uczeniu się o nagrodach, gdzie dopamina jest uważana za pośredniczącą w sygnale błędu prognozowania używanego do aktualizacji wartości stanów i działań, które umożliwiają przewidywanie i kontrolę, odpowiednio, podczas podejmowania decyzji. Modele te zostały wykorzystane do zilustrowania, w jaki sposób nieprawidłowe przetwarzanie dopaminy może prowadzić do zachowań impulsywnych i uzależniających, na podstawie doświadczenia (tj. Poprzez uczenie się) (Redish, 2004; Frank i in., 2007; Dagher i Robbins, 2009). Tutaj wyraźnie zbadano odrębny aspekt impulsywności, oparty na zależności czasu nagród i ich użyteczności, niezależnie od sprzężenia zwrotnego i uczenia się. W międzyokresowym wyborze decydenci muszą wybierać między nagrodami o różnej wielkości i opóźnieniu. Osiąga się to poprzez zdyskontowanie wartości przyszłych wartości użyteczności (zgodnie z ich opóźnieniem) w celu porównania ich obecnych wartości. W tym kontekście dopamina może potencjalnie zwiększyć impulsywny wybór na dwa różne sposoby (Pine i in., 2009), w następujący sposób: w wyniku zwiększonego tempa malejącej użyteczności krańcowej dla zysków (co zmniejszyłoby subiektywną wartość chwilową o większej wielkości w stosunku do nagród o mniejszej wielkości), lub poprzez zwiększone dyskontowanie w czasie przyszłych nagród. Nasze wyniki sugerują, że dopamina selektywnie wpływa na stopę dyskontową, bez znaczącego wpływu na funkcję użyteczności. Co więcej, te wyniki behawioralne były niezależnie wspierane przez dane fMRI, ponieważ kluczową różnicą wynikającą z l-dopa była modulacja odpowiedzi neuronalnych w regionach związanych z dyskontowaniem nagród, aw konsekwencji ich ogólnej subiektywnej wartości, bez widocznych efektów rzeczywista użyteczność nagród. Podsumowując, badanie to dostarcza dowodów na to, że dopamina kontroluje, w jaki sposób czas nagrody jest włączony do konstrukcji jej ostatecznej wartości. Sugeruje to nowy mechanizm, dzięki któremu dopamina kontroluje ludzki wybór i, odpowiednio, cechy takie jak impulsywność.

Nasze wyniki dodają wagi sugestii, że impulsywność nie jest jednolitym konstruktem, a ponadto, że różne podtypy impulsywności można oddzielić farmakologicznie i neurobiologicznie (Evenden, 1999; Ho i wsp., 1999; Winstanley i wsp., 2004a; Dalley i wsp., 2008). Skutki dopaminy były widoczne tylko w impulsywnym wyborze mierzonym wynikiem wyboru / preferencji, ale nie miały wpływu na rozwagę - „trzymanie koni” (Frank i in., 2007) - występuje, gdy opcje są ściśle wyceniane, co prowadzi do konfliktu decyzyjnego (Botvinick, 2007; Pochon i in., 2008) również związane z refleksyjnością lub impulsywnością przygotowania (Evenden, 1999; Clark i in., 2006).

Żadne badanie na ludziach nie wykazało jak dotąd skłonności dopaminy do zwiększania czasowej impulsywności. Wcześniejsze manipulacje dopaminą u gryzoni wykazały niespójne skutki w wyborze międzyokresowym, a niektóre wykazały, że wzmocnienie dopaminy prowadzi do zmniejszenia impulsywnego wyboru lub że osłabienie dopaminy prowadzi do zwiększenia (Richards i in., 1999; Cardinal i wsp., 2000; Wade i in., 2000; Isles i in., 2003; Winstanley i wsp., 2003; van Gaalen i in., 2006; Bizot i in., 2007; Floresco i in., 2008), podczas gdy inni demonstrują coś przeciwnego, efekt zależny od dawki lub brak efektu (Logue i in., 1992; Charrier i Thiébot, 1996; Evenden i Ryan, 1996; Richards i in., 1999; Cardinal i wsp., 2000; Isles i in., 2003; Helms i in., 2006; Bizot i in., 2007; Floresco i in., 2008). Wiele czynników może przyczynić się do tych rozbieżności, a mianowicie, czy manipulacja ma miejsce podczas wstępnego uczenia się czy postlearningu, czy sygnał jest obecny w czasie opóźnienia, presynaptyczny w porównaniu z postsynaptycznym działaniem leku, zastosowany paradygmat, zastosowany lek / celowany receptor, zaangażowanie serotoniny , a zwłaszcza dawkowanie leku. Badania na ludziach dotyczące wyboru międzyokresowego wykazały wzrost samokontroli (de Wit i in., 2002) lub brak efektu (Acheson i de Wit, 2008; Hamidovic i in., 2008) podczas zwiększania funkcji dopaminy. Większość z tych badań jest skomplikowana ze względu na stosowanie monoaminergicznych stymulantów, takich jak amfetamina lub metylofenidat, które często są uważane za zmniejszające impulsywność. Badania te mogą być mylone przez jednoczesne uwalnianie serotoniny (Kuczenski i Segal, 1997), co jest również związane z modulacją wyboru międzyokresowego. W szczególności wykazano, że zwiększenie funkcji serotoniny może zmniejszyć impulsywność w wyborze międzyokresowym lub odwrotnie (Wogar i in., 1993; Richards i Seiden, 1995; Poulos i in., 1996; Ho i wsp., 1999; Mobini i in., 2000) i że zniszczenie neuronów serotoninergicznych może blokować działanie amfetaminy (Winstanley i wsp., 2003). Ponadto uważa się, że na podstawie obszernych dowodów, umiarkowane dawki amfetaminy zmniejszają neurotransmisję dopaminy poprzez efekty presynaptyczne, co może wyjaśniać jej zależne od dawki efekty w wielu wcześniejszych badaniach, jak również skuteczność terapeutyczną (w umiarkowanych dawkach) w przypuszczalnie hiperdopaminergiczny ADHD (Seeman i Madras, 1998, 2002; Solanto, 1998, 2002; Solanto i in., 2001; de Wit i in., 2002). L-Dopa nie była wcześniej używana do wpływania na impulsywny wybór i być może oferuje bardziej przekonujące i bezpośrednie dowody na rolę dopaminy. Chociaż l-dopa może prowadzić do wzrostu poziomu noradrenaliny, a jej dokładny mechanizm działania nie jest dobrze poznany, uważa się, że noradrenalina nie odgrywa głównej roli w regulacji wyboru międzyokresowego (van Gaalen i in., 2006). Ponadto możliwe jest, że l-dopa mogła wywołać subiektywne efekty, które nie zostały wykryte przez subiektywne skale używane tutaj.

Brak znalezienia odpowiedniego zmniejszenia impulsywności w porównaniu z placebo po podaniu domniemanego antagonisty dopaminergicznego haloperydolu prawdopodobnie odzwierciedla szereg czynników. Należą do nich niespecyficzne i szeroko rozpowszechnione działanie farmakologiczne haloperydolu lub jego dawkowanie - niektóre badania wskazują, że haloperydol może paradoksalnie zwiększać dopaminę w małych dawkach, ze względu na presynaptyczny wpływ na autoreceptor D2 (Frank i O'Reilly, 2006). Ponadto subiektywne skutki działania leku, w tym zmniejszenie czujności, mogą spowodować, że dane będą głośniejsze. Dalsze badania powinny wykorzystywać bardziej specyficznych antagonistów dopaminy, aby ocenić, czy zmniejszenie funkcji dopaminy może zmniejszyć impulsywność u ludzi.

Wiadomo, że dopamina wywiera dominujący wpływ na prymitywne zachowania nagrody, takie jak podejście i spełnienie (Parkinson i wsp., 2002). Takie efekty są spójne z szeroką rolą w tworzeniu zachęty motywacyjnej (Berridge, 2007; Robinson i Berridge, 2008) i są trudniejsze do wyjaśnienia pod względem uczenia się per se. Pośrednictwo bezwarunkowych i uwarunkowanych reakcji dopaminy odnosi się do koncepcji impulsywności Pawłowa, gdzie reakcje związane z pierwotnymi, wrodzonymi wartościami tworzą prosty, ewolucyjnie określony zestaw działań, działający równolegle, a czasami konkurujący z innymi mechanizmami kontroli, takimi jak nawyki oparte na działaniach i ukierunkowane na cel (Dayan i in., 2006; Seymour i in., 2009). Co ważne, te „wartości i działania Pawłowa” są charakterystycznie zależne od przestrzennej i czasowej bliskości nagród i jako takie zapewniają jeden możliwy mechanizm, poprzez który dopamina może kontrolować pozorną szybkość dyskontowania czasowego. Gdyby taki proces leżał u podstaw impulsywności wywoływanej przez dopaminę w tym zadaniu, to sugerowałby, że ten wrodzony (pawłowski) system odpowiedzi działa w znacznie szerszym kontekście niż obecnie doceniany, ponieważ nagrody w tym zadaniu są nagrodami wtórnymi występującymi co najmniej w 1 tydzień. Wyjaśnienie to stoi w sprzeczności z ideą selektywnego wzmocnienia dopaminergicznego systemu (opartego na obszarach limbicznych), który ocenia tylko nagrody krótkoterminowe (McClure i in., 2004). Takie konto systemu pojedynku byłoby trudne do pogodzenia z wcześniejszymi badaniami (Kable i Glimcher, 2007; Pine i in., 2009), które sugerują, że obszary limbiczne cenią nagrody we wszystkich opóźnieniach.

Takie stwierdzenie rodzi ważne pytania o zależną od ciała migdałowatego podatność na impulsywność wywołaną dopaminą, którą zaobserwowaliśmy w naszych danych. Tutaj aktywność ciała migdałowatego w odpowiedzi na D zależało od stopnia, w jakim zachowanie stało się bardziej impulsywne po l-dopie. W przekazie Pavlovian – instrumental (PIT), zjawisko zależne od łączności między ciałem migdałowatym a prążkowiem (Cardinal i wsp., 2002; Seymour i Dolan, 2008), i którego ekspresja jest modulowana przez dopaminę (Dickinson i in., 2000; Lex and Hauber, 2008), apetyczne wartości Pawłowa zwiększają odpowiedź na nagrody. Warto zauważyć, że indywidualna podatność na ten wpływ koreluje z aktywnością ciała migdałowatego (Talmi i in., 2008), sugerując, że ciało migdałowate może modulować zakres, w jakim pierwotne uwarunkowane i bezwarunkowe wartości nagrody wpływają na instrumentalny (oparty na nawyku i cel) wybór. Jeśli rzeczywiście tak jest, to przewiduje, że jednoczesne i niezależne przedstawianie wskazówek dotyczących nagrody w czasie międzyokresowego wyboru może wywołać zwiększoną impulsywność czasową za pośrednictwem mechanizmu zależnego od ciała migdałowatego. Zauważamy dowody, że zmiany podstawno-boczne ciała migdałowatego zwiększają impulsywność wyboru u gryzoni (Winstanley i wsp., 2004b), obserwacja przeciwna do tego, czego moglibyśmy się spodziewać na podstawie bieżących danych. W przeciwieństwie do tego stwierdzono, że aktywność ciała migdałowatego koreluje z wielkością dyskontowania czasowego w badaniu fMRI (Hoffman i in., 2008). Zagadnienia te stanowią podstawę przyszłych badań, które mogą systematycznie testować te rozbieżne przewidywania u ludzi.

Wreszcie, wyniki te przemawiają do szerszego kontekstu klinicznego i dają wyjaśnienie, dlaczego obserwuje się wzrost zachowań impulsywnych i ryzykownych w zespole rozregulowania dopaminy, uzależnieniu i ADHD, z których wszystkie są związane ze stanami hiperdopaminergicznymi spowodowanymi zalaniem dopaminą prążkowia lub uczulenie (Solanto, 1998, 2002; Seeman i Madras, 2002; Berridge, 2007; Robinson i Berridge, 2008; Dagher i Robbins, 2009; O'Sullivan i in., 2009). Na poparcie tej tezy Voon i in. (2009) stwierdzili, że status leku dopaminowego u pacjentów z PD z zaburzeniami kontroli impulsów był związany ze zwiększonym odsetkiem dyskontowania czasowego. Podsumowując, przedstawione tutaj wyniki pokazują zdolność dopaminy do zwiększania impulsywności u ludzi i oferują nowy wgląd w jej rolę w modulowaniu impulsywnego wyboru w kontekście dyskontowania czasowego. Odkrycia te sugerują, że ludzie mogą być podatni na przejściowe okresy wzmożonej impulsywności, gdy podczas podejmowania decyzji obecne są czynniki zwiększające aktywność dopaminy, takie jak sensoryczne właściwości nagród.

Materiał uzupełniający

informacje dodatkowe

Podziękowanie

Praca ta została sfinansowana przez Wellcome Trust Program Grant dla RJD, a AP był wspierany przez stypendium Rady Badań Medycznych. Dziękujemy K. Fristonowi, J. Roiserowi i V. Curranowi za pomoc w planowaniu i analizach oraz za wnikliwe dyskusje.

Referencje

  1. Acheson A, de Wit H. Bupropion poprawia uwagę, ale nie wpływa na zachowanie impulsywne u zdrowych młodych dorosłych. Exp Clin Psychopharmacol. 2008; 16: 113 – 123. [PubMed]
  2. Ainslie G. Wyjątkowa nagroda: behawioralna teoria impulsywności i kontroli impulsów. Psychol Bull. 1975; 82: 463 – 496. [PubMed]
  3. Berridge KC. Debata na temat roli dopaminy w nagrodzie: argumenty za istotą zachęty. Psychofarmakologia. 2007; 191: 391–431. [PubMed]
  4. Bickel WK, Marsch LA. W kierunku behawioralnego ekonomicznego zrozumienia uzależnienia od narkotyków: procesy dyskontowania opóźnień. Uzależnienie. 2001; 96: 73 – 86. [PubMed]
  5. Bickel WK, Miller ML, Yi R, Kowal BP, Lindquist DM, Pitcock JA. Behawioralne i neuroekonomiczne uzależnienie od narkotyków: konkurencyjne systemy neuronowe i procesy dyskontowania czasowego. W zależności od alkoholu uzależnionego od narkotyków. 2007; 90 (Suppl 1): S85 – S91. [Artykuł bezpłatny PMC] [PubMed]
  6. Bizot JC, Chenault N, Houzé B, Herpin A, David S, Pothion S, Trovero F. Methylphenidate zmniejszają zachowania impulsywne u młodych szczurów Wistar, ale nie u dorosłych szczurów Wistar, SHR i WKY. Psychopharmacology (Berl) 2007; 193: 215 – 223. [PubMed]
  7. Bond AJ, Lader MH. Zastosowanie skal analogowych w ocenie subiektywnych odczuć. Br J Med. Psychol. 1974; 47: 211 – 218.
  8. Botvinick MM. Monitorowanie konfliktów i podejmowanie decyzji: pogodzenie dwóch perspektyw dotyczących przedniego zakrętu obręczy. Cogn Affect Behav Neurosci. 2007; 7: 356 – 366. [PubMed]
  9. Cardinal RN, Robbins TW, Everitt BJ. Wpływ d-amfetaminy, chlordiazepoksydu, alfa-flupentiksolu i manipulacji behawioralnych na wybór sygnalizowanego i niesygnalizowanego opóźnionego wzmocnienia u szczurów. Psychofarmakologia. 2000; 152: 362 – 375. [PubMed]
  10. Cardinal RN, Parkinson JA, Hall J, Everitt BJ. Emocje i motywacja: rola ciała migdałowatego, prążkowia brzusznego i kory przedczołowej. Neurosci Biobehav Rev. 2002; 26: 321 – 352. [PubMed]
  11. Cardinal RN, Winstanley CA, Robbins TW, Everitt BJ. Limbiczne układy korowo-prążkowane i opóźnione wzmocnienie. Ann NY Acad Sci. 2004; 1021: 33 – 50. [PubMed]
  12. Charrier D, Thiébot MH. Wpływ leków psychotropowych na szczura odpowiadającego paradygmatem operanta obejmującym wybór między opóźnionymi wzmacniaczami. Pharmacol Biochem Behav. 1996; 54: 149 – 157. [PubMed]
  13. Clark L, Robbins TW, Ersche KD, Sahakian BJ. Impulsywność odbicia u obecnych i byłych użytkowników substancji. Biol Psychiatry. 2006; 60: 515 – 522. [PubMed]
  14. Dagher A, Robbins TW. Osobowość, uzależnienie, dopamina: wgląd w chorobę Parkinsona. Neuron. 2009; 61: 502–510. [PubMed]
  15. Dalley JW, Mar AC, Economidou D, Robbins TW. Neurobehawioralne mechanizmy impulsywności: układy czołowo-prążkowate i funkcjonalna neurochemia. Pharmacol Biochem Behav. 2008; 90: 250 – 260. [PubMed]
  16. Dayan P, Niv Y, Seymour B, Daw ND. Złe zachowanie wartości i dyscyplina woli. Sieć neuronowa. 2006; 19: 1153 – 1160. [PubMed]
  17. Deichmann R, Gottfried JA, Hutton C, Turner R. Zoptymalizowany EPI do badań fMRI kory oczodołowo-czołowej. Neuroimage. 2003; 19: 430 – 441. [PubMed]
  18. de Wit H, Enggasser JL, Richards JB. Ostre podawanie d-amfetaminy zmniejsza impulsywność u zdrowych ochotników. Neuropsychofarmakologia. 2002; 27: 813 – 825. [PubMed]
  19. Dickinson A, Smith J, Mirenowicz J. Dysocjacja Pawłowskiego i instrumentalnego uczenia się pod wpływem agonistów dopaminy. Behav Neurosci. 2000; 114: 468 – 483. [PubMed]
  20. Evenden JL. Odmiany impulsywności. Psychofarmakologia. 1999; 146: 348 – 361. [PubMed]
  21. Evenden JL, Ryan CN. Farmakologia zachowań impulsywnych u szczurów: wpływ leków na wybór odpowiedzi przy różnych opóźnieniach wzmocnienia. Psychofarmakologia. 1996; 128: 161 – 170. [PubMed]
  22. Floresco SB, Tse MT, Ghods-Sharifi S. Dopaminergiczna i glutaminergiczna regulacja podejmowania decyzji opartych na wysiłku i opóźnieniu. Neuropsychofarmakologia. 2008; 33: 1966 – 1979. [PubMed]
  23. Frank MJ, O'Reilly RC. Mechanistyczne ujęcie funkcji dopaminy w prążkowiu w poznaniu człowieka: badania psychofarmakologiczne z kabergoliną i haloperidolem. Behav Neurosci. 2006; 120: 497–517. [PubMed]
  24. Frank MJ, Samanta J, Moustafa AA, Sherman SJ. Trzymaj swoje konie: impulsywność, głęboką stymulację mózgu i leki w parkinsonizmie. Nauka. 2007; 318: 1309 – 1312. [PubMed]
  25. Hamidovic A, Kang UJ, de Wit H. Wpływ niskich do umiarkowanych ostrych dawek pramipeksolu na impulsywność i funkcje poznawcze u zdrowych ochotników. J Clin Psychopharmacol. 2008; 28: 45 – 51. [PubMed]
  26. Helms CM, Reeves JM, Mitchell SH. Wpływ szczepu i D-amfetaminy na impulsywność (obniżanie opóźnienia) u wsobnych myszy. Psychopharmacology (Berl) 2006; 188: 144 – 151. [PubMed]
  27. Ho MY, Mobini S, Chiang TJ, Bradshaw CM, Szabadi E. Teoria i metoda w ilościowej analizie zachowania „impulsywnego wyboru”: implikacje dla psychofarmakologii. Psychofarmakologia. 1999; 146: 362 – 372. [PubMed]
  28. Hoffman WF, Schwartz DL, Huckans MS, BH McFarland, Meiri G, Stevens AA, Mitchell SH. Aktywacja korowa podczas dyskontowania opóźnienia u abstynencji osób uzależnionych od metamfetaminy. Psychofarmakologia. 2008; 201: 183 – 193. [Artykuł bezpłatny PMC] [PubMed]
  29. Isles AR, Humby T, Wilkinson LS. Pomiar impulsywności u myszy przy użyciu nowatorskiego zadania opóźnionego wzmocnienia operanta: skutki manipulacji behawioralnych i d-amfetaminy. Psychopharmacology (Berl) 2003; 170: 376 – 382. [PubMed]
  30. Kable JW, Glimcher PW. Neuralne korelaty wartości subiektywnej podczas wyboru międzyokresowego. Nat Neurosci. 2007; 10: 1625 – 1633. [Artykuł bezpłatny PMC] [PubMed]
  31. Kuczenski R, Segal DS. Wpływ metylofenidatu na zewnątrzkomórkową dopaminę, serotoninę i noradrenalinę: porównanie z amfetaminą. J Neurochem. 1997; 68: 2032 – 2037. [PubMed]
  32. Receptory Lex A, Hauber W. Dopamine D1 i D2 w jądrze półleżącym w rdzeniu i powłoce półleżącej pośredniczą w przekazie Pawłowskim. Learn Mem. 2008; 15: 483 – 491. [Artykuł bezpłatny PMC] [PubMed]
  33. Logue AW, Tobin H, Chelonis JJ, Wang RY, Geary N, Schachter S. Cocaine zmniejsza samokontrolę u szczurów: wstępny raport. Psychofarmakologia. 1992; 109: 245 – 247. [PubMed]
  34. Mai JK, Assheuer J, Paxinos G. Atlas ludzkiego mózgu. Ed 2 Academic; San Diego: 2003.
  35. Mazur JE. Procedura dostosowywania do badania opóźnionego wzmocnienia. W: Commons ML, Mazur JE, Nevin JA, Rachlin H, redaktorzy. Ilościowe analizy zachowania. V. Wpływ opóźnienia i interweniujących zdarzeń na wartość wzmocnienia. Lawrence Erlbaum; Hillsdale, NJ: 1987. str. 55 – 73.
  36. McClure SM, Laibson DI, Loewenstein G, Cohen JD. Oddzielne systemy neuronowe cenią natychmiastowe i opóźnione nagrody pieniężne. Nauka. 2004; 306: 503 – 507. [PubMed]
  37. Mobini S, Chiang TJ, Al-Ruwaitea AS, Ho MY, Bradshaw CM, Szabadi E. Wpływ centralnego wyczerpania 5-hydroksytryptaminy na wybór międzyokresowy: analiza ilościowa. Psychopharmacology (Berl) 2000; 149: 313 – 318. [PubMed]
  38. O'Sullivan SS, Evans AH, Lees AJ. Zespół rozregulowania dopaminy: przegląd jego epidemiologii, mechanizmów i postępowania. Leki CNS. 2009; 23: 157–170. [PubMed]
  39. Parkinson JA, Dalley JW, Cardinal RN, Bamford A, Fehnert B, Lachenal G, Rudarakanchana N, Halkerston KM, Robbins TW, Everitt BJ. Nucleus accumbens zubożenie dopaminy osłabia zarówno nabycie, jak i działanie apetycznego zachowania Pawłowa: implikacje dla funkcji dopaminy mesoaccumbens. Behav Brain Res. 2002; 137: 149 – 163. [PubMed]
  40. Pine A, Seymour B, Roiser JP, Bossaerts P, Friston KJ, Curran HV, Dolan RJ. Kodowanie marginalnej użyteczności w czasie w ludzkim mózgu. J Neurosci. 2009; 29: 9575 – 9581. [Artykuł bezpłatny PMC] [PubMed]
  41. Pochon JB, Riis J, Sanfey AG, Nystrom LE, Cohen JD. Funkcjonalne obrazowanie konfliktu decyzyjnego. J Neurosci. 2008; 28: 3468 – 3473. [PubMed]
  42. Poulos CX, Parker JL, Le AD. Dexfenfluramine i 8-OHDPAT modulują impulsywność w paradygmacie opóźnienia nagrody: implikacje dla zgodności ze spożyciem alkoholu. Behav Pharmacol. 1996; 7: 395 – 399. [PubMed]
  43. Czerwonawa AD. Uzależnienie jako proces obliczeniowy poszło nie tak. Nauka. 2004; 306: 1944 – 1947. [PubMed]
  44. Richards JB, Seiden LS. Zubożenie serotoniny zwiększa impulsywne zachowanie szczurów. Soc Neurosci Abstr. 1995; 21: 1693.
  45. Richards JB, Sabol KE, de Wit H. Wpływ metamfetaminy na procedurę regulacji ilości, model impulsywnego zachowania u szczurów. Psychofarmakologia. 1999; 146: 432 – 439. [PubMed]
  46. Robinson TE, Berridge KC. Teoria uzależnienia od zachęt motywacyjnych: niektóre aktualne problemy. Philos Trans R Soc Lond B Biol Sci. 2008; 363: 3137 – 3146. [Artykuł bezpłatny PMC] [PubMed]
  47. Sagvolden T, Sierżant JA. Zespół deficytu uwagi / nadpobudliwości - od dysfunkcji mózgu do zachowania. Behav Brain Res. 1998; 94: 1 – 10. [PubMed]
  48. Seeman P, Madras BK. Leki przeciwdziałające nadaktywności: metylofenaza i amfetamina. Mol Psychiatry. 1998; 3: 386 – 396. [PubMed]
  49. Seeman P, Madras B. Methylphenidate podnosi spoczynkową dopaminę, która obniża impulsowe uwalnianie dopaminy: hipoteza. Behav Brain Res. 2002; 130: 79 – 83. [PubMed]
  50. Seymour B, Dolan R. Emocja, podejmowanie decyzji i ciało migdałowate. Neuron. 2008; 58: 662 – 671. [PubMed]
  51. Seymour B, Yoshida W, Dolan R. Altruistic learning. Front Behav Neurosci. 2009; 3: 23. [Artykuł bezpłatny PMC] [PubMed]
  52. Solanto MV. Neuropsychofarmakologiczne mechanizmy działania leków pobudzających w zaburzeniach nadpobudliwości psychoruchowej: przegląd i integracja. Behav Brain Res. 1998; 94: 127 – 152. [PubMed]
  53. Solanto MV. Dysfunkcja dopaminy w AD / HD: integracja badań klinicznych i podstawowych badań neurologicznych. Behav Brain Res. 2002; 130: 65 – 71. [PubMed]
  54. Solanto MV, Abikoff H, Sonuga-Barke E, Schachar R, Logan GD, Wigal T, Hechtman L, Hinshaw S, Turkel E. Ekologiczna trafność awersji opóźnień i hamowania reakcji jako miar impulsywności w AD / HD: uzupełnienie multimodalne badanie NIMH AD / HD. J Abnorm Child Psychol. 2001; 29: 215 – 228. [PubMed]
  55. Talairach J, Tournoux P. Współpłaszczyznowy stereotaktyczny atlas ludzkiego mózgu. Grupa Wydawnicza Thieme; Stuttgart: 1988.
  56. Talmi D, Seymour B, Dayan P, Dolan RJ. Przeniesienie człowieka z Pawłowa na instrument. J Neurosci. 2008; 28: 360 – 368. [Artykuł bezpłatny PMC] [PubMed]
  57. Tanaka SC, Doya K, Okada G, Ueda K, Okamoto Y, Yamawaki S. Przewidywanie bezpośrednich i przyszłych nagród w różny sposób rekrutuje pętle zwojów korowo-podstawnych. Nat Neurosci. 2004; 7: 887 – 893. [PubMed]
  58. van Gaalen MM, van Koten R, Schoffelmeer AN, Vanderschuren LJ. Krytyczne zaangażowanie neurotransmisji dopaminergicznej w impulsywnym podejmowaniu decyzji. Biol Psychiatry. 2006; 60: 66 – 73. [PubMed]
  59. Voon V, Reynolds B, Brezing C, Gallea C, Skaljic M, Ekanayake V, Fernandez H, Potenza MN, Dolan RJ, Hallett M. Wybór impulsywny i odpowiedź w zachowaniach związanych z kontrolą impulsów związanych z agonistami dopaminy. Psychopharmacology (Berl) 2009; 207: 645 – 659. [Artykuł bezpłatny PMC] [PubMed]
  60. Wade TR, de Wit H, Richards JB. Wpływ leków dopaminergicznych na opóźnioną nagrodę jako miarę impulsywnego zachowania u szczurów. Psychofarmakologia. 2000; 150: 90 – 101. [PubMed]
  61. Winstanley CA, Dalley JW, Theobald DE, Robbins TW. Globalne wyczerpanie 5-HT osłabia zdolność amfetaminy do zmniejszenia impulsywnego wyboru w przypadku zadania polegającego na dyskontowaniu opóźnienia u szczurów. Psychofarmakologia. 2003; 170: 320 – 331. [PubMed]
  62. Winstanley CA, Dalley JW, Theobald DE, Robbins TW. Impulsywność frakcjonująca: kontrastujące skutki wyczerpania centralnego 5-HT dla różnych miar zachowania impulsywnego. Neuropsychofarmakologia. 2004a; 29: 1331 – 1343. [PubMed]
  63. Winstanley CA, Theobald DE, Cardinal RN, Robbins TW. Kontrastujące role ciała podstawno-bocznego ciała migdałowatego i kory oczodołowo-czołowej w impulsywnym wyborze. J Neurosci. 2004b; 24: 4718 – 4722. [PubMed]
  64. Winstanley CA, Eagle DM, Robbins TW. Behawioralne modele impulsywności w stosunku do ADHD: przekład między badaniami klinicznymi i przedklinicznymi. Clin Psychol Rev. 2006; 26: 379 – 395. [Artykuł bezpłatny PMC] [PubMed]
  65. Wogar MA, Bradshaw CM, Szabadi E. Wpływ zmian szlaków wstępujących 5-hydroksytryptaminergicznych na wybór między opóźnionymi wzmacniaczami. Psychofarmakologia. 1993; 113: 239 – 243. [PubMed]