Dysocjowalne wkłady receptorów przedczołowych D1 i D2 do podejmowania decyzji opartych na ryzyku (2011)

 J Neurosci. 2011 Jun 8; 31 (23): 8625-33.

St Onge JR, Abhari H, Floresco SB.

Źródło

Katedra Psychologii i Centrum Badań Mózgu, Uniwersytet Kolumbii Brytyjskiej, Vancouver, Kolumbia Brytyjska V6T 1Z4, Kanada

Abstrakcyjny

Zaproponowano wybór między pewnymi i niepewnymi nagrodami o różnej wielkości, w których pośredniczą zarówno płat czołowy, jak i układ dopaminowy mezokortykolimbiczny (DA). U szczurów ogólnoustrojowe manipulacje aktywności DA lub inaktywacja przyśrodkowej kory przedczołowej (PFC) zakłócają podejmowanie decyzji o ryzyku i korzyściach. Jednak nie jest jasne, w jaki sposób transmisja PFC DA przyczynia się do tych procesów. Zajęliśmy się tym problemem, badając wpływ manipulacji farmakologicznych receptorów D1 i D2 w PFC przyśrodkowej (prelimbicznej) na wybór między małymi, pewnymi i dużymi, ale probabilistycznymi nagrodami. Szczury były szkolone w ramach probabilistycznego dyskontowania, gdzie jedna dźwignia dostarczała jedną pastylkę z prawdopodobieństwem 100%, a druga dostarczała cztery granulki, ale prawdopodobieństwo otrzymania nagrody zmniejszyło się w blokach prób (100, 50, 25, 12.5%). Blokada D1 (SCH23390) w medialnym zmniejszeniu preferencji PFC dla opcji dużej / ryzykownej. W przeciwieństwie do tego, blokada D2 (etikloprid) zmniejszyła dyskontowanie probabilistyczne i zwiększyła ryzykowny wybór. Agonista D1 SKF81297 spowodował nieznaczny, nieistotny wzrost preferencji dla dużej / ryzykownej dźwigni. Jednak stymulacja receptora D2 (chinpirol) wywołała prawdziwe upośledzenie w podejmowaniu decyzji, spłaszczając krzywą dyskontowania i odchylając wybór od lub w kierunku opcji ryzykownej, gdy była ona mniej lub bardziej korzystna. Odkrycia te sugerują, że receptory PFC D1 i D2 powodują dyssocjacyjny, ale uzupełniający się wkład w ocenę ryzyka / nagrody. Uderzając w delikatną równowagę między aktywnością receptora D1 / D2, DA może pomóc udoskonalić te osądy, promując wykorzystanie obecnych korzystnych okoliczności lub eksplorację bardziej dochodowych, gdy zmieniają się warunki.

Wprowadzenie

Aberracje układu dopaminy mezokortykolimbicznej (DA) są powiązane z głębokimi deficytami w podejmowaniu decyzji związanymi z niektórymi chorobami psychiatrycznymi. Należą do nich osoby ze schizofrenią (Hutton i wsp., 2002), chorobą Parkinsona (Pagonabarraga i wsp., 2007) oraz uzależnieniem od środków pobudzających (Rogers i wsp., 1999). Zwierzęce modele podejmowania decyzji ujawniły, że manipulacje transmisją DA mogą głęboko zmienić wybory między małymi, łatwymi do zdobycia nagrodami a dużymi, ale bardziej kosztownymi nagrodami. Systemowa blokada receptorów D1 lub D2 zmniejsza skłonność do dłuższego czekania lub cięższej pracy w celu uzyskania większej nagrody, podczas gdy zwiększenie transmisji DA wywiera zróżnicowany wpływ na podejmowanie decyzji opartych na wysiłku lub opóźnieniach, zwiększając lub zmniejszając preferencję dla większych nagród, które wiążą się z większy koszt (Cousins ​​i in., 1994; Cardinal i in., 2000; Denk i in., 2005; van Gaalen i in., 2006; Floresco i in., 2008a; Bardgett i in., 2009). Podobnie, gdy szczury wybierają między małymi, pewnymi i dużymi, ale ryzykownymi nagrodami w ramach probabilistycznego dyskontowania, systemowe podawanie antagonistów D1 lub D2 zmniejsza preferencje dla dużych, ryzykownych opcji (St. Onge i Floresco, 2009). Z drugiej strony agoniści D1 lub D2 wybierają duże, ryzykowne opcje. Jednakże, biorąc pod uwagę, że liczne regiony mózgu są zaangażowane w ocenę ryzyka / nagrody (np. Płaty czołowe, prążkowia brzuszne, ciało migdałowate) (Floresco i in., 2008b), regiony końcowe, na których DA może oddziaływać na te procesy, pozostają niejasne .

DA moduluje wiele funkcji poznawczych, w których pośredniczą różne regiony kory przedczołowej (PFC), takie jak elastyczność behawioralna, pamięć robocza i procesy uwagi (Williams i Goldman-Rakic, 1995; Granon i in., 2000; Chudasama i Robbins, 2004; Floresco i in., 2006), często na krzywej w kształcie „odwróconej litery U”, gdzie zbyt mała lub zbyt duża aktywność DA osłabia niektóre funkcje wykonawcze. Jednakże przeprowadzono stosunkowo niewiele badań dotyczących wpływu przenoszenia DA PFC na różne formy podejmowania decyzji dotyczących kosztów / korzyści. Zmniejszenie aktywności DA w obręczy przedniej zmienia decyzje oparte na wysiłku (Schweimer i in., 2005; Schweimer i Hauber, 2006), podczas gdy blokada lub stymulacja przyśrodkowych receptorów PFC D1 zmniejsza preferencje dla większych, opóźnionych nagród (Loos i in., 2010 ). W szczególności nie przeprowadzono badań dotyczących wpływu różnych receptorów PFC DA na podejmowanie decyzji w oparciu o ryzyko.

Ostatnie prace zidentyfikowały preflimbiczną przyśrodkową PFC jako region krytyczny w pośrednictwie dyskontowania probabilistycznego, podczas gdy aktywność w innych podregionach (zakręt przedni, oczodołowo-czołowy, wyspowy) nie wydaje się przyczyniać do tego zachowania (St. Onge i Floresco, 2010). Dezaktywacja medialnego PFC zwiększyła preferencje dla większych, probabilistycznych nagród, gdy szanse na ich uzyskanie zmniejszyły się w trakcie sesji, ale zmniejszył się wybór, gdy prawdopodobieństwo nagrody wzrosło w trakcie sesji. Wyniki tego badania doprowadziły nas do wniosku, że medialna PFC służy do integracji informacji o zmieniających się prawdopodobieństwach nagrody w celu aktualizacji reprezentacji wartości, które ułatwiają skuteczniejsze podejmowanie decyzji. Biorąc pod uwagę krytyczną rolę, jaką mezokortykalna DA odgrywa w innych formach poznania (Floresco i Magyar, 2006), niniejsze badanie zbadało wkład przedczołowej aktywności receptora D1 / D2 w podejmowanie decyzji w oparciu o ryzyko, stosując zadanie dyskontowania probabilistycznego.

Materiały i Metody

Zwierząt.

Do eksperymentu wykorzystano samce szczurów Long-Evans (Charles River Laboratories) o masie 275–300 g na początku treningu behawioralnego. Po przybyciu szczury miały 1 tydzień na aklimatyzację w kolonii, a pożywienie ograniczano do 85–90% ich wagi przy swobodnym karmieniu przez dodatkowy tydzień przed treningiem behawioralnym. Szczury miały nieograniczony dostęp do wody na czas trwania eksperymentu. Karmienie odbywało się w klatkach domowych szczurów pod koniec dnia eksperymentu, a masę ciała monitorowano codziennie, aby zapewnić stałą utratę wagi podczas ograniczania i utrzymania pożywienia lub przyrost masy ciała przez resztę eksperymentu. Wszystkie testy były zgodne z Canadian Council of Animal Care i Animal Care Committee na University of British Columbia.

Aparat.

Testy behawioralne przeprowadzono w komorach operacyjnych 12 (30.5 × 24 × 21 cm; Med Associates) zamkniętych w pudełkach tłumiących dźwięki, z których każdy był wyposażony w wentylator zapewniający wentylację i maskujący obcy hałas. Każda komora była wyposażona w dwie chowane dźwignie, jedną umieszczoną po każdej stronie centralnego pojemnika na żywność, gdzie wzmacnianie żywności (45 mg; Bio-Serv) było dostarczane przez dozownik peletek. Komory oświetlano pojedynczym światłem domowym 100 mA umieszczonym w górnej części ściany naprzeciwko dźwigni. Cztery fotony podczerwone zamontowano po bokach każdej komory. Aktywność lokomotoryczna była indeksowana przez liczbę przerw fotobeamowych, które wystąpiły podczas sesji. Wszystkie dane eksperymentalne zostały zarejestrowane przez komputer osobisty IBM podłączony do komór za pośrednictwem interfejsu.

Ćwiczenia z naciśnięciem dźwigni.

Nasze początkowe protokoły szkoleniowe były identyczne z protokołami St. Onge i Floresco (2009), zgodnie z adaptacją Cardinal et al. (2000). Na dzień przed pierwszym kontaktem z komorami szczury otrzymały granulki cukru „25” w klatce domowej. Pierwszego dnia treningu granulki 2 – 3 zostały dostarczone do kubka z jedzeniem, a zmiażdżone granulki zostały umieszczone na dźwigni, zanim zwierzę zostało umieszczone w komorze. Szczury były najpierw szkolone w ustalonym stosunku 1 do kryterium 60 w 30 min, najpierw dla jednej dźwigni, a następnie powtarzane dla drugiej dźwigni (przeciwwagi dla lewej / prawej między badanymi). Szczury były następnie szkolone w uproszczonej wersji pełnego zadania. Te sesje próbne 90 rozpoczęły się z wycofanymi dźwigniami i komorą operacyjną w ciemności. W każdym 40-ie rozpoczęto próbę z oświetleniem światła w domu i włożeniem jednej z dwóch dźwigni do komory. Jeśli szczur nie zareagował na dźwignię w 10 s, dźwignia została wycofana, komora pociemniała, a próba została zaliczona jako pominięcie. Jeśli szczur zareagował w 10 s, dźwignia cofnęła się, a pojedynczy granulat został dostarczony z prawdopodobieństwem 50%. Procedura ta została wykorzystana do zapoznania szczurów z probabilistyczną naturą pełnego zadania. W każdej parze prób lewą lub prawą dźwignię prezentowano raz, a kolejność w próbach była losowa. Szczury były szkolone dla N5 – 6 d do kryterium 80 lub bardziej udanych prób (tj. ≤ pominięcia 10).

Probabilistyczne zadanie dyskontowania.

Podstawowe zadanie wykorzystane w tych badaniach zostało opisane wcześniej (Floresco i Whelan, 2009; Ghods-Sharifi i in., 2009; St. Onge and Floresco, 2009, 2010; St. Onge i in., 2010) i został pierwotnie zmodyfikowany w stosunku do opisanego przez Cardinal i Howes (2005) (ryc. 1). W skrócie, szczury otrzymywały codzienne sesje składające się z prób 72, rozdzielone na bloki 4 prób 18. Cała sesja zakończyła się 48 min, a zwierzęta były szkolone 6 – 7 d na tydzień. Sesja rozpoczęła się w ciemności, gdy obie dźwignie zostały wycofane (stan międzypróbkowy). Każda próba 40 rozpoczęła próbę z oświetleniem światła w domu i 3 s później, włożenie jednej lub obu dźwigni do komory (format pojedynczej próby pokazano na ryc. 1). Jedna dźwignia została oznaczona jako dźwignia duża / ryzykowna, druga dźwignia mała / pewna, która pozostała niezmienna przez cały czas treningu (przeciwwaga w lewo / w prawo). Jeśli szczur nie zareagował naciskając dźwignię w 10 s prezentacji dźwigni, komorę przywrócono do stanu międzyprzedsionkowego do następnej próby (pominięcie). Po wybraniu dźwigni obie dźwignie cofnęły się. Wybór małej / pewnej dźwigni zawsze dostarczał jedną pastylkę z prawdopodobieństwem 100%; wybór dużej / ryzykownej dźwigni dostarczył granulat 4, ale ze szczególnym prawdopodobieństwem. Gdy dostarczono żywność, światło domu pozostało włączone przez kolejne 4 po otrzymaniu odpowiedzi, po czym komora powróciła do stanu międzyprzedmiotowego. Wiele peletów dostarczono osobno 0.5. Bloki 4 obejmowały próby wymuszonego wyboru 8, w których przedstawiono tylko jedną dźwignię (próby 4 dla każdej dźwigni, losowo w parach), pozwalając zwierzętom dowiedzieć się o względnym prawdopodobieństwie otrzymania większej lub mniejszej nagrody w każdym bloku. Następnie odbyły się testy 10 o wolnym wyborze, w których obie dźwignie zostały przedstawione, a zwierzę wybrało małą / pewną lub dużą / ryzykowną dźwignię. Prawdopodobieństwo otrzymania granulek 4 po naciśnięciu dużej / ryzykownej dźwigni różniło się w poszczególnych blokach: początkowo było to odpowiednio 100%, 50%, 25% i 12.5% dla każdego kolejnego bloku. Prawdopodobieństwo otrzymania dużej nagrody za każdą próbę pochodziło z ustalonego rozkładu prawdopodobieństwa. Korzystając z tych prawdopodobieństw, wybór dużej / ryzykownej dźwigni byłby korzystny w pierwszych dwóch blokach i niekorzystny w ostatnim bloku, podczas gdy szczury mogłyby uzyskać równoważną liczbę granulek żywności po odpowiedzi na którąkolwiek z dźwigni podczas bloku 25%. Dlatego w ostatnich trzech próbnych blokach tego zadania wybór większej opcji nagrody niesie ze sobą nieodłączne „ryzyko” nieuzyskania żadnej nagrody na danej próbie. Rejestrowano również opóźnienia w rozpoczęciu wyboru i ogólnej aktywności lokomotorycznej (przerwy fotobeamiczne). Szczury były szkolone w tym zadaniu, aż jako grupa (1) wybrały dużą / ryzykowną dźwignię podczas pierwszego bloku próbnego (prawdopodobieństwo 100%) co najmniej 80% udanych prób, a (2) wykazało stabilne poziomy linii bazowej wybór, oceniany za pomocą procedury podobnej do opisanej przez Winstanleya i in. (2005) i St. Onge and Floresco (2009). W skrócie, dane z trzech kolejnych sesji analizowano za pomocą ANOVA z powtarzanymi pomiarami z dwoma czynnikami wewnątrzobiektowymi (blok dzienny i próbny).

Rysunek 1.

Projekt zadania. Ryzyko związane z kosztami / korzyściami związane z odpowiedzią na jedną z dźwigni (A) i format jednej próby wolnego wyboru (B) na zadanie dyskontowania probabilistycznego.

Zadanie dyskryminacji wielkości nagrody.

Jak już zrobiliśmy wcześniej (Ghods-Sharifi i in., 2009; Stopper i Floresco, 2011), a priori ustaliliśmy, że jeśli konkretna terapia konkretnie zmniejszyła preferencję dla dużej / ryzykownej dźwigni na probabilistycznym zdyskontowaniu, oddziel grupy zwierząt zostanie przeszkolony i przetestowany w ramach zadania dyskryminacji wielkości nagrody w celu ustalenia, czy efekt ten był spowodowany upośledzeniem rozróżniania między wielkościami nagrody związanymi z dwoma dźwigniami. W tych doświadczeniach szczury były szkolone do naciskania dźwigni chowanych, jak w przypadku probabilistycznego dyskontowania, po czym zostały przeszkolone w zakresie zadania dyskryminacji. Tutaj szczury wybierały między jedną dźwignią, która dostarczyła jedną kulkę, a drugą, która dostarczyła cztery granulki. Zarówno małe, jak i duże nagrody zostały dostarczone natychmiast po pojedynczej odpowiedzi z prawdopodobieństwem 100%. Sesja składała się z czterech bloków prób, przy czym każdy blok składał się z wymuszonego wyboru 2, po którym następowały próby wolnego wyboru 10.

Operacja.

Szczury poddano zabiegowi chirurgicznemu, gdy grupa wykazała stabilne wzorce wyboru dla kolejnych dni 3. Po uzyskaniu kryterium stabilności szczury otrzymywały pożywienie ad libitum, a 2 d później poddawano zabiegowi stereotaktycznemu. Szczury znieczulono za pomocą 100 mg / kg chlorowodorku ketaminy i 7 mg / kg ksylazyny, a następnie wszczepiono obustronnymi kaniulami prowadzącymi ze stali nierdzewnej 23 do regionu prelimbicznego przyśrodkowej PFC (płaska czaszka; przednio-tylna, + 3.4 mm; przyśrodkowo-boczna, ± 0.7 mm od bregma i dorsoventral, −2.8 mm od opony twardej). Trzydzieści grubości pogrubiarek, zrównanych z końcem kaniul prowadzących, pozostało na miejscu aż do wykonania wlewów. Szczurom podawano co najmniej 7 d, aby wyzdrowieć po operacji przed badaniem. Podczas tego okresu regeneracji zwierzęta były traktowane przez co najmniej 5 min każdego dnia, a jedzenie ograniczono do 85% ich wagi do karmienia. Masy ciała były stale monitorowane codziennie, aby zapewnić stałą utratę wagi podczas tego okresu regeneracji.

Protokół mikroinfuzji.

Po wyzdrowieniu po operacji, szczury zostały następnie przeszkolone w zakresie probabilistycznego dyskontowania lub zadania dyskryminacji wielkości nagrody dla co najmniej 5 d i do czasu, gdy jako grupa wykazywały stabilne poziomy zachowania wyboru. W przypadku 3 d przed pierwszym dniem testu na mikroinfuzję usunięto obturatory i podano procedurę pozornej infuzji. Wtryskiwacze ze stali nierdzewnej umieszczono w kaniulach prowadzących dla 2 min, ale nie przeprowadzono infuzji. Procedura ta przyzwyczaiła szczury do rutyny infuzji, aby zmniejszyć stres w kolejnych dniach testowych. Dzień po wyświetleniu stabilnego obniżenia grupa otrzymała pierwszy dzień testu na mikroinfuzję.

Do wszystkich eksperymentów wykorzystano projekt wewnątrzobiektowy. Stosowano następujące leki: antagonista D1 R - (+) - chlorowodorek SCH23390 (1.0 μg, 0.1 μg; Sigma-Aldrich), antagonista D2 chlorowodorek etiklopridu (1.0 μg, 0.1 μg; Sigma-Aldrich), agonista receptora D1 SKF81297 (0.4 μg, 0.1 μg; Tocris Bioscience) i agonista D2 chinpirol (10 μg, 1 μg; Sigma-Aldrich). Wszystkie leki rozpuszczono w fizjologicznym roztworze soli fizjologicznej 0.9%, sonikowano do rozpuszczenia i chroniono przed światłem. Wszystkie wybrane dawki zostały dobrze udokumentowane zarówno przez naszą grupę, jak i inne osoby, aby były aktywne behawioralnie, gdy są podawane domózgowo (Seamans i in., 1998; Ragozzino, 2002; Chudasama i Robbins, 2004; Floresco i Magyar, 2006; Floresco i in., 2006; Haluk i Floresco, 2009; Loos i in., 2010).

Wlewy antagonistów, agonistów i soli fizjologicznej D1 i D2 podawano obustronnie do przyśrodkowej PFC za pomocą pompy mikrostrzykawkowej połączonej z rurką PE i kaniulami pomiarowymi 30, które wystawały 0.8 mm poza koniec prowadnicy, z szybkością 0.5 μl / 75 s. Kaniule do iniekcji pozostawiono na miejscu przez dodatkowe 1 min, aby umożliwić dyfuzję. Każdy szczur pozostał w swojej klatce domowej przez kolejny okres 10 min przed badaniem behawioralnym.

Do przetestowania działania każdego z czterech związków użyto czterech oddzielnych grup szczurów (antagonista D1, antagonista D2, agonista D1, agonista D2). Kolejność leczenia (sól fizjologiczna, mała dawka, wysoka dawka) została zrównoważona u szczurów w określonej grupie leczenia. Po pierwszym dniu testu infuzji szczury otrzymały podstawowy dzień treningu (bez infuzji). Jeśli dla dowolnego szczura wybór dużej / ryzykownej dźwigni w tym dniu odchylił się o> 15% od wartości wyjściowej sprzed infuzji, szczur otrzymał dodatkowy dzień treningu przed drugim testem infuzji. Następnego dnia szczury otrzymały drugi wlew ze zrównoważoną równowagą, po którym nastąpił kolejny dzień odniesienia i na koniec ostatnia infuzja.

Histologia.

Po zakończeniu wszystkich testów behawioralnych szczury zabito w komorze z dwutlenkiem węgla. Mózgi usunięto i utrwalono w roztworze formaliny 4%. Mózgi zamrożono i pokrojono w skrawki 50 μm przed zamontowaniem i wybarwieniem fioletem krezolowym. Miejsca zostały zweryfikowane w odniesieniu do atlasu neuroanatomicznego Paxinos i Watson (1998). Lokalizacje dopuszczalnych naparów w środkowej PFC są przedstawione w prawym panelu rysunku 2.

Rysunek 2.

Histologia. Schemat przekrojów czołowych mózgu szczura przedstawiający zakres dopuszczalnych miejsc wlewów przez zakres rostalno-ogonowy przyśrodkowej PFC dla wszystkich szczurów.

Analiza danych.

Podstawową zależną miarą zainteresowania był procent wyborów skierowanych w stronę dużej / ryzykownej dźwigni dla każdego bloku badań z wolnym wyborem, z uwzględnieniem pominięć w badaniach. Dla każdego bloku obliczono to, dzieląc liczbę wyborów z dużej / ryzykownej dźwigni przez całkowitą liczbę pomyślnych prób. Dane dotyczące wyboru dla każdej grupy leków analizowano przy użyciu dwukierunkowych analiz wewnątrzosobniczych ANOVA, z leczeniem (sól fizjologiczna, niska dawka, wysoka dawka) i blokiem próbnym (100, 50, 25, 12.5%) jako czynnikami wewnątrzosobniczymi. Główny efekt bloku dla danych wyboru był znaczący we wszystkich eksperymentach dyskontowania (p <0.05), wskazując, że szczury dyskontowały wybór dużej / ryzykownej dźwigni, ponieważ prawdopodobieństwo dużej nagrody zmieniało się w czterech blokach. Ten efekt nie będzie dalej wspominany. Opóźnienia odpowiedzi, aktywność lokomotoryczna (przerwy w fotokomórce) i liczbę pominięć w badaniach analizowano za pomocą jednokierunkowych analiz ANOVA.

Poprzednia sekcjaNastępna sekcja

Efekt

Cztery grupy zwierząt zostały początkowo przeszkolone w oddzielnych eksperymentach i przydzielone do jednej z czterech grup leków. Pierwsze dwie grupy 16 każda, przeznaczone do eksperymentów antagonistycznych D1 i D2, wymagały średnio 28 d treningu przed osiągnięciem stabilnego wyboru i otrzymaniem zrównoważonych testów mikroinfuzji. Drugie dwie grupy szczurów 14 i 14 dla agonistów D1 i D2 wymagały średnio 34 d treningu przed osiągnięciem stabilnego wyboru. Dane dotyczące opóźnienia reakcji, lokomotorycznego i próbnego pominięcia uzyskane w dniach testowych dla wszystkich czterech grup przedstawiono w tabeli 1.

Tabela 1.

Lokomocja, próbne pominięcie i opóźnienie odpowiedzi uzyskane po infuzji soli fizjologicznej lub leku do przyśrodkowej PFC

Antagonizm receptora D1 i D2 oraz dyskontowanie probabilistyczne

Blokada D1

Początkowo do tego eksperymentu przeszkolono 16 szczurów. Jedno zwierzę zmarło podczas operacji, a dane z trzech innych zostały wyeliminowane z powodu niedokładnego umieszczenia, co dało końcowe n = 12. Analiza wybranych danych wykazała, że ​​infuzje wewnątrz PFC antagonisty D1 SCH23390 spowodowały znaczący główny efekt leczenia. (F (2,22) = 3.26, p = 0.05), ale brak interakcji leczenie × blok (F (6,66) = 0.92, ns). Wysoka dawka SCH23390 (1 μg) znacząco zmniejszyła preferencję dla dużej / ryzykownej dźwigni w ostatnich trzech blokach (p <0.05; Ryc. 3A), podczas gdy niska dawka (0.1 μg) nie spowodowała żadnej wiarygodnej zmiany w zachowaniu wyborczym. Blokada D1 nie miała wpływu na opóźnienia odpowiedzi (F (2,22) = 0.18, ns), pominięcia próby (F (2,22) = 0.54, ns) ani liczby lokomotoryczne (F (2,22) = 1.66, ns ).

Rysunek 3.

Wpływ manipulacji receptorem DA w środkowym PFC na dyskontowanie probabilistyczne. Dane są wykreślane pod względem procentowego wyboru dużej / ryzykownej dźwigni podczas badań wolnego wyboru według bloku prawdopodobieństwa (oś x). Symbole przedstawiają średnią + SEM. Szare gwiazdki oznaczają istotny efekt główny (sól fizjologiczna vs wysoka dawka, p <0.05). Czarne gwiazdy oznaczają istotną różnicę (p <0.05) między warunkami leczenia podczas określonego głównego efektu blokującego prawdopodobieństwo. A, Infuzje dawki 1.0 μg antagonisty D1 SCH23390 przyspieszyły dyskontowanie probabilistyczne, zmniejszając ryzykowny wybór. B, Dla kontrastu, wlewy dawki 1.0 μg antagonisty D2, etikloprydu, opóźniały dyskontowanie i zwiększały ryzyko wyboru. C, agonista D1, SKF81297, wywołał niewielki, nieistotny wzrost ryzykownego wyboru. D, Wlewy 10 μg dawki agonisty D2, chinpirolu, zniosły dyskontowanie, zmniejszając ryzykowny wybór podczas początkowej blokady i zwiększając wybór podczas ostatniego bloku.

Blokada D2

Początkowo do tego eksperymentu przeszkolono 16 szczurów. Jedno zwierzę zmarło podczas operacji, a dane z trzech innych zostały wyeliminowane z powodu niedokładnego umieszczenia, co dało ostateczne n = 12. Analiza danych z wyboru ujawniła również istotny efekt główny leczenia (F (2,22) = 3.76, p <0.05), ale bez interakcji leczenie × blok (F (6,66) = 0.84, ns). Jednak w przeciwieństwie do skutków blokady receptora D1, wysoka dawka etiklopridu (1 μg) znacząco zwiększyła preferencję dla dużej / ryzykownej dźwigni we wszystkich blokach (p <0.05; ryc. 3B), przy niskiej dawce (0.1 μg ) powodując niewielki, ale nieznaczny wzrost wyboru. Etiklopryd nie miał wpływu na opóźnienia odpowiedzi (F (2,22) = 0.63, ns), pominięcia w badaniach (F (2,22) = 1.45, ns) ani liczby lokomotoryczne (F (2,22) = 0.99, ns) . Zatem blokada receptorów D1 lub D2 w środkowej PFC miała jakościowo odwrotny wpływ na dyskontowanie probabilistyczne. Zmniejszenie aktywności receptora D1 zwiększyło dyskontowanie większych, niepewnych nagród, podczas gdy antagonizm receptora D2 zmniejszył dyskontowanie, odzwierciedlając odpowiednio wyraźne spadki i wzrost ryzykownego wyboru.

Stymulacja receptora D1 i D2 i dyskontowanie probabilistyczne

Stymulacja D1

Początkowo szczury 14 były szkolone do tego eksperymentu. Jedno zwierzę zmarło podczas zabiegu chirurgicznego, a dane od jednego szczura zostały wykluczone, ponieważ jego wyjściowe dane wyboru były SD 2 poniżej średniej reszty grupy, co dało końcowy n = 12. Po podaniu agonisty D1 SKF81297 do przyśrodkowej PFC, szczury wykazywały tendencję do wykazywania efektu przeciwnego do wywołanego przez antagonistę D1, wykazując umiarkowany wzrost preferencji dla dźwigni dużej / ryzykownej, przy czym efekt ten był liczbowo większy po leczeniu niższa dawka 0.1 μg. Pomimo tej tendencji analiza danych wyboru nie ujawniła istotnego wpływu leczenia (F (2,22) = 2.05, ns) lub leczenia × interakcji blokowych (F (6,66) = 0.10, ns; Rys. 3C), chociaż bezpośredni Porównanie warunków leczenia niską dawką i solą fizjologiczną wykazało trend w kierunku istotności statystycznej (p = 0.086). Agonista D1 również nie miał wpływu na opóźnienia odpowiedzi (F (2,22) = 0.67, ns), pominięcia próbne (F (2,22) = 0.06, ns), lub liczby lokomotoryczne (F (2,22) = 0.36, ns).

Stymulacja D2

Ponownie wyszkolono 14 szczurów do tego eksperymentu. Dane od jednego szczura zostały wykluczone, ponieważ jego podstawowe dane dotyczące wyboru nie wykazały wyraźnego dyskontowania po 34 dniach treningu, podczas gdy dane dotyczące innego szczura zostały wyeliminowane z powodu niedokładnego umieszczenia, co dało ostateczne n = 12 w tej grupie. Leczenie agonistą D2, chinpirolem, wywoływało wpływ na wybór, który był wyjątkowy w porównaniu z efektem wywoływanym przez antagonistę receptora DA lub agonistę D1. Analiza danych z wyboru nie ujawniła istotnego głównego efektu leczenia (F (2,22) = 0.05, ns), ale wystąpiła istotna interakcja leczenie × blok (F (6,66) = 2.33, p <0.05, p Dunnetta <0.05). Proste analizy efektów głównych wykazały ponadto, że podczas gdy niska dawka (1 µg) chinpirolu nie miała wpływu na wybór, wysoka dawka (10 µg) spowodowała wyraźne „spłaszczenie” krzywej dyskontującej. Konkretnie, ta dawka znacząco (p <0.05) zmniejszyła wybór dużej / ryzykownej dźwigni w początkowym 100% bloku, ale znacznie zwiększyła ryzykowny wybór podczas ostatniego bloku (12.5%) w porównaniu z wlewami soli fizjologicznej (ryc. 3D). Co więcej, po wlewach soli fizjologicznej lub dawki 1.0 μg chinpirolu, szczury wykazywały znaczące dyskontowanie opcji dużej / ryzykownej, ponieważ szansa na uzyskanie większej nagrody malała w ciągu sesji (p <0.005). Natomiast odsetek osób, które wybrały tę opcję, nie zmienił się znacząco w czterech blokach po leczeniu 10 μg chinpirolu (p> 0.25). Chinpirol nie miał wpływu na pominięcia badania (F (2,22) = 0.84, ns) lub liczbę lokomotoryczną (F (2,22) = 1.72, ns), chociaż wysoka dawka znacząco zwiększyła opóźnienia wyboru w czterech blokach (F ( 2,22) = 3.54, p <0.05 i Dunnetta, p <0.05; Tabela 1).

Analiza wygranych / przegranych

Infuzje selektywnych agonistów lub antagonistów receptora D1 lub D2 do przyśrodkowej PFC wywoływały odrębny wpływ na podejmowanie decyzji. Aby uzyskać dalszy wgląd w to, jak te terapie wpływały na wzorce wyboru i wynikające z nich zmiany dyskontowania, przeprowadziliśmy dodatkową analizę danych dotyczących wyboru. W szczególności przeprowadziliśmy analizę typu „wybór z wyboru”, aby określić, czy zmiany w zachowaniu wynikały ze zmian prawdopodobieństwa wyboru ryzykownej dźwigni po uzyskaniu większej nagrody (wygrana-pobyt), czy też zmian w negatywnej wrażliwości na sprzężenia zwrotne (zmiana wydajność) (Bari i in., 2009; Stopper i Floresco, 2011). Wybory zwierząt podczas zadania analizowano zgodnie z wynikami każdej poprzedzającej próby wolnego wyboru (z nagrodą lub bez) i wyrażano jako stosunek. Odsetek zwycięskich prób został obliczony na podstawie tego, ile razy szczur wybrał dużą / ryzykowną dźwignię po wybraniu ryzykownej opcji w poprzednim badaniu i uzyskaniu dużej nagrody (wygranej), podzielonej przez całkowitą liczbę wolnych wyborów próby, w których szczur otrzymał większą nagrodę. Odwrotnie, wydajność w przypadku przegranej zmiany obliczono na podstawie liczby przypadków, w których szczury przeniosły wybór na małą / określoną dźwignię po wybraniu ryzykownej opcji w poprzednim badaniu i nie zostały nagrodzone (strata), podzielonej przez całkowitą liczbę prób z wolnym wyborem powodując stratę.

Z powodu probabilistycznego charakteru zadania we wszystkich czterech eksperymentach wystąpiły przynajmniej przypadki 4 – 5, w których pojedyncze zwierzę albo nie wybrało dużej / ryzykownej dźwigni (a zatem nie mogło „pozostać” ani „przesunąć” po wygranej lub strata) lub w ogóle nie otrzymała dużej nagrody podczas pewnego bloku prawdopodobieństwa (szczególnie dwóch ostatnich bloków). Zatem w każdym z tych przypadków mianownik w równaniu użytym do obliczenia tych stosunków wynosiłby zero dla co najmniej jednego z bloków, co uniemożliwiło nam przeprowadzenie blokowej analizy tych danych. Aby temu zaradzić, przeprowadzono analizę wszystkich prób w czterech blokach, tak jak zrobiliśmy to wcześniej (Stopper i Floresco, 2011). Zmiany w wynikach typu „win-stay” zostały wykorzystane jako ogólny wskaźnik wpływu, jaki otrzymanie dużej, ryzykownej nagrody miało na zachowanie przy kolejnym wyborze, podczas gdy zmiany w wydajności „przegranej zmiany” posłużyły jako wskaźnik ujemnej wrażliwości na sprzężenie zwrotne przez cały czas trwania testu sesja.

Biorąc pod uwagę, że każdy z czterech związków wywoływał odmienny wpływ na zachowania związane z wyborem, byliśmy szczególnie zainteresowani bezpośrednim porównaniem efektów każdego związku w stosunku do traktowania solanką. W tej analizie wykorzystaliśmy dane uzyskane po leczeniu najskuteczniejszymi dawkami każdego leku i odpowiadającymi im wstrzyknięciami nośnika (w przypadku SKF81297 wykorzystaliśmy dane uzyskane po leczeniu niższą, 0.1 μg dawką). Analiza badań typu „win-stay” i „lost-shift” ujawniła znaczącą czterokierunkową interakcję typu badania (wygrana-pobyt vs przegrana-zmiana) × leczenie (sól fizjologiczna vs lek) × receptor (D1 vs D2) × rodzaj leku (antagonista vs agonista ) (F (1,44) = 11.92, p <0.05; ryc. 4, tabela 2). Jak zaobserwowano w analizie ogólnych zachowań związanych z wyborem, ta czterokierunkowa interakcja była spowodowana faktem, że każdy lek wywoływał odrębny wpływ na tendencje wygrywający pobyt / przegrywający. W odniesieniu do wyników wygrywających, w warunkach kontrolnych szczury wykazywały silną tendencję (między 80 a 90%) do wybierania ryzykownej dźwigni po wybraniu tej dźwigni w poprzednim badaniu i otrzymaniu nagrody, jak widzieliśmy wcześniej (Stopper i Floresco , 2011). I odwrotnie, zwierzęta miały tendencję do przechodzenia na małą / pewną dźwignię po „stracie” po wybraniu dużej / ryzykownej dźwigni w ~ 25–30% tych prób w warunkach kontrolnych.

Rysunek 4.

Wpływ manipulacji receptorem PFC DA na tendencje do wygranej (szare słupki) i przegranej (białe słupki). Dla jasności i celów porównawczych dane przedstawiono tutaj w kategoriach wyniku różnicy między stosunkami uzyskanymi w przypadku leczenia lekami a solankami (wartości dodatnie wskazują na zwiększony stosunek, wartości ujemne na spadek po leczeniu lekiem w stosunku do infuzji kontrolnych). Surowe dane wykorzystane w ogólnej analizie, z której uzyskano te wartości, przedstawiono w tabeli 2. Wskaźniki Win-Stay określają odsetek prób, w których szczury wybrały dużą / ryzykowną dźwignię po otrzymaniu większej nagrody za poprzednią próbę. Współczynniki przesunięcia przegubowego wskazują proporcje prób, w których szczury przesunęły wybór do małej / pewnej dźwigni po niewykorzystanym wyborze dużej / ryzykownej dźwigni. Gwiazdy oznaczają znaczącą różnicę w stosunku do soli fizjologicznej na poziomie 0.05. ns, nieistotne.

Tabela 2.

Wskaźniki „wygrana-przegrana / utrata-zmiana” dla szczurów wykonujących probabilistyczne zadanie dyskontowania po wlewie soli fizjologicznej i najwyższej lub najbardziej skutecznej dawki antagonisty lub agonistów D1 i D2

Prosta analiza efektów głównych czterokierunkowej interakcji ujawniła, że ​​antagonista D1 SCH23390 nie wpłynął na wydajność wygranych, ale znacząco zwiększył tendencje do przegranej (Dunnetta, p <0.05), co sugeruje, że zmniejszenie ryzykownego wyboru wywołane tymi terapiami można częściowo przypisać zwiększonej wrażliwości na negatywne sprzężenie zwrotne (tj. pominięcie nagrody). Z kolei blokada D2 etikloprydem (1 μg) istotnie zwiększyła prawdopodobieństwo wybrania ryzykownej opcji po „wygranej” (p <0.05), jednocześnie powodując nieistotny spadek tendencji do przegranej zmiany. Zatem wzrost ryzykownego wyboru wywołany blokadą D2 wydaje się wynikać przede wszystkim ze zwiększonego wpływu uzyskania dużej nagrody na późniejszy wybór.

Agonista D1 SKF81297 (0.1 μg) znacząco zwiększył wydajność wygrywającą w porównaniu z solą fizjologiczną (p <0.05), ale miał również odwrotny efekt SCH23390, zmniejszając tendencję do zmiany po stracie z dużej / ryzykownej dźwigni (p <0.05) . W przeciwieństwie do tego chinpirol (10 μg) miał odwrotny wpływ agonisty D1 na tendencje typu win-stay, znacznie zmniejszając prawdopodobieństwo wyboru dużej / ryzykownej dźwigni po „wygranej” (p <0.05), co sugeruje zmniejszoną wrażliwość na przyjęcie większych, ale niepewnych nagród. Zabieg ten nie miał znaczącego wpływu na stosunek pobytów straconych. Odkrycia te wskazują, że modulacja receptora D1 vs D2 wywołuje zróżnicowane zmiany w dokonywaniu wyboru, które wydają się charakteryzować wyraźnymi zmianami wpływu albo uzyskania większej nagrody, albo wrażliwości na negatywne sprzężenie zwrotne.

Nagradzaj dyskryminację wielkości

Blokada receptorów D1 lub stymulacja receptorów D2 zmniejszyła preferencję dla większej, niepewnej nagrody podczas niektórych próbnych bloków zadania dyskontującego. Aby ocenić, czy efekty te można przypisać ogólnemu zakłóceniu w rozróżnianiu nagród o różnej wielkości, przeprowadziliśmy kolejny eksperyment, w którym dwie oddzielne grupy szczurów szkolono na prostszym zadaniu. Szczury wybierały między dwoma dźwigniami, które dostarczały jeden lub cztery pelety, oba z prawdopodobieństwem 100%. Piętnaście szczurów zostało przeszkolonych pod kątem tego zadania przez 11 d przed otrzymaniem przeciwwagi mikroinfekcyjnej wysokiej dawki SCH23390 (1 μg) lub chinpirolu (10 μg) i soli fizjologicznej. Dane dla jednego zwierzęcia usunięto z powodu niedokładnego umieszczenia, pozostawiając ostateczne n 6 w grupie SCH23390 i 8 w grupie chinpirolu.

Blokada D1

Po wlewach soli fizjologicznej szczury wykazywały bardzo silną tendencję do większej nagrody, wybierając tę ​​opcję w prawie 100% prób (Ryc. 5A). Po wlewach SCH23390 (1 μg) nie było zmiany preferencji w stosunku do opcji czteropeletkowej (F (1,5) = 1.72, ns). W przeciwieństwie do wyboru, zaobserwowaliśmy niewielki wzrost latencji odpowiedzi po blokadzie D1 (sól fizjologiczna = 0.81 ± 0.1 s, SCH23390 = 0.98 ± 0.1 s; F (1,5) = 7.18, p <0.05). Na aktywność lokomotoryczną (F (1,5) = 4.86, ns) i pominięcia w badaniach (F (1,5) = 1.0, ns) nie wpłynął SCH23390. Tak więc, chociaż infuzje tej dawki SCH23390 ograniczyły wybór opcji większej nagrody podczas probabilistycznego zadania dyskontowania, efekt ten nie wydaje się być przypisywany ogólnemu obniżeniu subiektywnej wartości większych nagród.

Rysunek 5.

Wpływ modulacji receptora DA na medialną PFC na dyskryminację wielkości nagrody. Szczury były szkolone, aby wybierać pomiędzy dwoma dźwigniami, które dostarczały nagrodę cztero- lub jednopeletkową natychmiast po jednym naciśnięciu z prawdopodobieństwem 100%. A, blokada D1 (SCH23390, 1 μg) nie zakłóciła znacząco preferencji dla większej nagrody za cztery pelety podczas prób z wolnym wyborem w stosunku do leczenia solą fizjologiczną. B, stymulacja receptora D2 (chinpirol, 10 μg) również nie zmieniła preferencji dla dużej nagrody.

Stymulacja receptora D2

Podobny profil z wyboru zaobserwowano u szczurów otrzymujących dużą dawkę (10 μg) chinpirolu do środkowej PFC. Ponownie, szczury wybrały opcję czterech peletek w prawie wszystkich próbach wolnego wyboru po wlewach soli fizjologicznej. Preferencja ta nie została zmieniona przez stymulację receptorów D2 (F (1,6) = 0.53, ns; Rys. 5B). Chinpirol nie miał również istotnego wpływu na opóźnienia, lokomocję lub zaniedbania (wszystkie wartości F <1.76, ns). Należy zauważyć, że podobne zabiegi ograniczyły wybór większej nagrody w probabilistycznym zadaniu dyskontowania podczas pierwszego bloku 100% prawdopodobieństwa (ryc. 3B). Możliwym wyjaśnieniem tej różnicy jest to, że w przeciwieństwie do szczurów trenowanych w zakresie rozróżniania wielkości nagrody, osoby szkolone w zadaniu dyskontowania nauczyły się, że względna użyteczność opcji duża / ryzykowna zmniejsza się w trakcie sesji. Zatem można by oczekiwać, że ich przedstawienie względnej wartości opcji dużej nagrody będzie bardziej labilne niż w przypadku szczurów tresowanych do prostszego zadania, a zatem bardziej podatne na zakłócenia. Podsumowując, wyniki tego eksperymentu pokazują, że chociaż blokada receptorów D1 i stymulacja receptorów D2 znacząco zmienia wybory pomiędzy małymi, pewnymi i dużymi, probabilistycznymi nagrodami, efekty te nie wydają się być przypisywane bardziej fundamentalnym zaburzeniom zdolności do rozróżniania. między większymi i mniejszymi nagrodami.

Dyskusja

Poniżej podajemy, że receptory D1 i D2 w środkowej PFC wywierają krytyczny wpływ na wybory między probabilistycznymi a pewnymi nagrodami. Ponadto, zmniejszanie lub zwiększanie aktywności każdego z tych receptorów powodowało różne, a czasami przeciwne, zmiany w wyborze, sugerując, że każdy z nich wywiera odmienną, ale uzupełniającą kontrolę modulacyjną nad tymi procesami decyzyjnymi.

Wpływ blokady receptora D1 / D2

Według naszej wiedzy jest to pierwsza demonstracja, że ​​blokada receptora D1 lub D2 w środkowej PFC wywołuje przeciwstawne działanie na zachowanie. Poprzednie badania tego rodzaju ujawniły, że antagonizm D1, ale nie D2, zakłóca funkcje takie jak uwaga lub pamięć robocza (Williams i Goldman-Rakic, 1995; Seamans i in., 1998; Granon i in., 2000) lub że oba Receptory działają wspólnie, aby ułatwić zachowanie przesunięcia lub odchylenia od warunkowych punisherów (Ragozzino, 2002; Floresco i Magyar, 2006). Nasze odkrycia, że ​​SCH23390 i etiklopryd wywołały przeciwne efekty w zależności od wyboru sugerują, że normalne podejmowanie decyzji zależy od krytycznej równowagi działania czołowego płata D1 i aktywności receptora D2, i że zmiana tej równowagi powoduje dysocjacyjne zmiany w wyborze pewnych / niepewnych nagród.

PFC D1 blokuje zmniejszone preferencje dla opcji dużych / ryzykownych w sposób zależny od dawki, najbardziej widoczne podczas ostatnich trzech bloków prawdopodobieństwa. SCH23390 zwiększył dyskontowanie probabilistyczne, przypominając działanie tego związku podawanego ogólnoustrojowo (St. Onge i Floresco, 2009). Co ciekawe, zmniejszenie przenoszenia DA u ludzi poprzez wyczerpanie tyrozyny prowadzi również do bardziej konserwatywnego i gorszego procesu podejmowania decyzji w Cambridge Gambling Task (McLean i in., 2004). Nasze wyniki sugerują, że efekty te mogą być częściowo zależne od zmniejszonej przedczołowej aktywacji D1. Analiza wyboru według wyboru ujawniła ponadto, że ta obniżona preferencja dla opcji ryzykownej była powiązana ze zwiększoną tendencją do wybierania małej / pewnej opcji po niezarobkowym ryzykownym wyborze, co sugeruje, że wpływ na podejmowanie decyzji może być wynikiem zwiększenia wrażliwość na negatywne sprzężenie zwrotne. W podobnym duchu, blokada receptorów D1 w zakręcie przedślubnym lub przednim zmniejsza preferencje dla większych nagród, gdy są one opóźnione (Loos i in., 2010) lub związane z większym kosztem wysiłku (Schweimer i Hauber, 2006). Podsumowując, odkrycia te sugerują, że sygnalizacja PFC D1 wywiera głęboki wpływ na ocenę kosztów i korzyści, ułatwiając przezwyciężenie kosztów, które mogą być związane z większymi nagrodami w celu maksymalizacji długoterminowych zysków.

W ostrym kontraście blokada receptora PFC D2 zwiększyła preferencje dla opcji dużej / ryzykownej, spowalniając przesunięcie nastawienia wyboru, gdy prawdopodobieństwo nagrody spadło w trakcie sesji. Warto zauważyć, że efekt ten przypomina efekt wywołany przez dezaktywację PFC w podobnych warunkach (St. Onge i Floresco, 2010). Nie sądzimy jednak, aby odzwierciedlało to ogólny wzrost zachowań „ryzykownych” per se. Nasze wcześniejsze ustalenia doprowadziły nas raczej do wniosku, że medialna PFC odgrywa kluczową rolę w monitorowaniu zmian prawdopodobieństwa nagrody, aby odpowiednio dostosować zachowanie. Obecne wyniki poszerzają tę wiedzę, ujawniając, że receptory D2 wnoszą istotny wkład w regulację PFC tego aspektu podejmowania decyzji. Ten widoczny wzrost ryzykownego wyboru był bardziej widoczny dzięki zwiększonej tendencji do wybierania ryzykownej opcji po uzyskaniu dużej nagrody w poprzednim procesie. W związku z tym, zamiast integrować informacje o prawdopodobieństwie uzyskania większej nagrody w wielu próbach, blokada D2 spowodowała otrzymanie większej nagrody w celu wywarcia większego i bardziej bezpośredniego wpływu na kierunek kolejnego wyboru. Jest to zgodne z niedawnym badaniem na ludziach, w którym antagonizm D2 zwiększył zarówno wybór opcji związanych z wyższymi prawdopodobieństwami nagrody i odpowiadającymi im zmianami w brzuszno-przyśrodkowej aktywności PFC (Jocham i wsp., 2011). Łącznie wyniki te pokazują, że receptory PFC D1 i D2 tworzą odrębny, ale uzupełniający się wkład w podejmowanie decyzji. Aktywność receptora D1 promuje wybór większych, ale niepewnych lub bardziej kosztownych nagród, podczas gdy receptory D2 łagodzą bezpośredni wpływ, jaki większe, probabilistyczne nagrody wywierają nadmierny błąd wyboru, ułatwiając dostosowanie zachowania w długim okresie, gdy prawdopodobieństwo uzyskania tych nagród zmiany.

Wpływ stymulacji receptora D1 / D2

Wlewy wewnątrzkomórkowe agonisty receptora D1 SKF81297, w zakresie dawek, które, jak wykazano, wywierają zróżnicowany wpływ na inne formy funkcji poznawczych (uwaga, pamięć robocza), nie zmieniły znacząco ryzykownego wyboru, chociaż te zabiegi nieznacznie zwiększyły preferencje dla dużych / ryzykowna dźwignia, przede wszystkim z niską dawką. Interpretacji tego zerowego efektu należy podchodzić z ostrożnością, ponieważ te niemonotoniczne efekty dawka / odpowiedź sugerują, że SKF81297 może mieć skuteczny zakres dawek, który jest węższy niż może to być dla innych funkcji poznawczych. Co więcej, dawka 0.1 μg znacząco zmieniła wzorce wyboru, zwiększając wydajność typu „win-stay” i zmniejszając tendencje do zmiany przesunięcia, gdzie szczury częściej wybierały dużą / ryzykowną dźwignię po pominięciu nagrody i nagrody. Niemniej jednak fakt, że zwiększanie dawek SKF81297 nie zmieniło znacząco wyboru, wskazuje, że ponadnormalna stymulacja receptorów PFC D1 nie wpływa zasadniczo na podejmowanie decyzji dotyczących ryzyka i korzyści. W przeciwieństwie do tego, podobne zabiegi zmniejszają wybór większych, opóźnionych nagród (Loos i in., 2010), zapewniając dalsze wsparcie, że różne typy podejmowania decyzji dotyczących kosztów / korzyści mogą być farmakologicznie rozdzielone.

Chinpirol, agonista D2, wywołał prawdziwe „upośledzenie” w podejmowaniu decyzji, wyraźnie spłaszczając krzywą dyskontowania, przy czym szczury nie wykazywały dostrzegalnego dyskontowania przy zmianach prawdopodobieństwa nagrody. Wybór opcji czterech peletek został zmniejszony w bloku 100% (gdy był najbardziej korzystny), ale zwiększony w bloku 12.5% (gdy jest najmniej korzystny). Po stymulacji D2 ogólna proporcja dużych / ryzykownych wyborów nie zmieniła się w stosunku do soli fizjologicznej (N73%), ale zwierzęta były całkowicie niewrażliwe na zmiany tych prawdopodobieństw. Tak więc, nadmierna aktywacja receptora D2 poważnie zakłóciła zdolność do dostosowywania wyboru, najwyraźniej powodując, że szczury stosowały prostszą strategię przemian w blokach, utrzymując tendencję do dużej / ryzykownej dźwigni. To odkrycie w połączeniu z działaniem etykloprydu, sugeruje, że względny poziom receptora D2 (a nie D1) w środkowej PFC ma krytyczny wpływ na ten aspekt podejmowania decyzji, a zwiększenie lub zmniejszenie tej aktywności może zakłócać działanie.

Niekorzystny schemat wyboru wytwarzany przez chinpirol wykazuje uderzające podobieństwo do wywoływanego przez zmniejszenie motywacji do jedzenia poprzez długotrwałe bezpłatne karmienie (St. Onge i Floresco, 2009). Te uzupełniające ustalenia kuszą do spekulacji, że mogą to być powiązane zjawiska. Rzeczywiście, zaproponowano zmiany w wypływie środkowej PFC DA, aby odzwierciedlić uogólnioną nagrodę żywnościową lub motywacyjny sygnał motywacyjny (Ahn i Phillips, 1999; Winstanley i in., 2006). Tak więc, zmiany w wysokości nagrody uzyskanej w czasie mogą być sygnalizowane PFC przez odpowiednie wahania poziomów mezokortykalnej DA, które poprzez działania na receptory D2 mogą być wykorzystane do wykrywania zmian w wysokości nagrody uzyskanej w czasie i ułatwienia zmian w stronniczość wyboru. Wynika z tego, że zalewające receptory D2 mogą zakłócać ten dynamiczny sygnał, który ostatecznie może wytworzyć bardziej statyczne wzory wyboru.

Dysocjowalne wkłady receptorów PFC D1 i D2 w podejmowanie decyzji w oparciu o ryzyko

Pozostaje pytanie, dlaczego blokada receptorów D1 lub D2 powinna wywierać przeciwny wpływ na ryzykowny wybór, ponieważ endogenna DA aktywuje oba receptory. Współczesna teoria o tym, jak te receptory różnie wpływają na aktywność sieci neuronowej PFC, może dostarczyć wglądu w ten problem (Durstewitz i in., 2000; Seamans i Yang, 2004). Zaproponowano receptory D1, aby zmniejszyć wpływ słabych danych wejściowych, stabilizując aktywność sieci, tak że pojedyncza reprezentacja dominuje na wyjściu PFC. I odwrotnie, aktywność D2 osłabia wpływy hamujące, umożliwiając zespołom neuronowym PFC przetwarzanie wielu bodźców / reprezentacji, umieszczając te sieci w bardziej labilnym stanie, który może pozwolić na zmiany w reprezentacjach.

Podczas różnych etapów wykorzystywanego tutaj zadania dyskontowania probabilistycznego zwierzęta w niektórych punktach muszą albo utrzymywać (w ramach bloku prawdopodobieństwa) albo modyfikować (w blokach) ich reprezentację względnej wartości opcji dużej / ryzykownej. Zatem przeciwstawne działanie opisanego tu antagonizmu D1 / D2 może odzwierciedlać różnicowy udział tych receptorów podczas różnych faz zadania. Aktywność D1 może ustabilizować reprezentację względnej długoterminowej wartości opcji ryzykownej w danym bloku, utrzymując stronniczość wyboru nawet wtedy, gdy ryzykowny wybór prowadzi do pominięcia nagrody (zachowując „oko na nagrodę”). Zablokowanie tych receptorów spowodowałoby, że zwierzęta byłyby bardziej wrażliwe na pominięcia w nagradzaniu (tj. Zwiększanie tendencji do zmiany przesunięcia) i zmniejszanie ryzykownych wyborów. I odwrotnie, ponieważ opcja duża / ryzykowna daje mniej nagród w blokach, receptory D2 (prawdopodobnie na innej populacji neuronów) mogą ułatwiać modyfikacje w reprezentacjach wartości. W związku z tym zmniejszenie ich aktywności zakłóciłoby aktualizację tych reprezentacji i odpowiednie zmiany nastawienia wyboru. Model ten może również częściowo uwzględniać skutki zwiększenia aktywności receptora D1 i D2, co do których oczekuje się, że doprowadzi albo do bardziej trwałego wyboru opcji dużej / ryzykownej, albo do wywołania stanu „hiperelastycznego”, odpowiednio. Dlatego nasze odkrycia sugerują, że ton PFC DA ma krytyczny i złożony wkład w ocenę ryzyka / nagrody. Uderzając w równowagę między aktywnością receptora D1 / D2, mezokortykalna DA może pomóc udoskonalić decyzje dotyczące kosztów / korzyści między opcjami o różnej wielkości i niepewności, promując wykorzystanie obecnych korzystnych okoliczności lub eksplorację bardziej dochodowych, gdy zmieniają się warunki.

Przypisy

Praca ta została wsparta grantem z Kanadyjskich Instytutów Badań nad Zdrowiem (MOP 89861) dla SBFSBF jest Fundacją Michaela Smitha ds. Badań Naukowych Senior Scholar, a JRSO jest stypendystą Rady Naukowej Nauk Przyrodniczych i Inżynierii Kanady i Michała Smith Foundation for Health Research.

Korespondencję należy kierować do dr. Stana B. Floresco, Wydziału Psychologii i Centrum Badań Mózgu, University of British Columbia, 2136 West Mall, Vancouver, BC V6T 1Z4, [email chroniony]

Prawa autorskie © 2011 autorzy 0270-6474 / 11 / 318625-09 $ 15.00 / 0

Referencje

1. ↵

1. Ahn S,

2. Phillips AG

(1999) Dopaminergiczne korelaty czuciowo-specyficznej sytości w przyśrodkowej korze przedczołowej i jądrze półleżącym szczura. J Neurosci 19: RC29, (1 – 6).

Streszczenie / BEZPŁATNY pełny tekst

2. ↵

1. Bardgett ME,

2. Depenbrock M,

3. Downs N,

4. Punkty M,

5. Zielony L

(2009) Dopamina moduluje podejmowanie decyzji na podstawie wysiłku u szczurów. Behav Neurosci 123: 242 – 251.

CrossRefMedline

3. ↵

1. Bari A,

2. Eagle DM,

3. Mar AC,

4. Robinson ES,

5. Robbins TW

(2009) Dysocjujące działanie blokowania wychwytu noradrenaliny, dopaminy i serotoniny na zatrzymanie wykonywania zadań u szczurów. Psychopharmacology 205: 273 – 283.

CrossRefMedline

4. ↵

1. Kardynał rn,

2. Howes NJ

(2005) Wpływ uszkodzeń jądra półleżącego na wybór między małymi pewnymi nagrodami a dużymi niepewnymi nagrodami u szczurów. BMC Neurosci 6: 37.

CrossRefMedline

5. ↵

1. Kardynał rn,

2. Robbins TW,

3. Everitt BJ

(2000) Wpływ d-amfetaminy, chlordiazepoksydu, alfa-flupentiksolu i manipulacji behawioralnych na wybór sygnalizowanego i niesygnalizowanego opóźnionego wzmocnienia u szczurów. Psychopharmacology 152: 362 – 375.

CrossRefMedline

6. ↵

1. Chudasama Y,

2. Robbins TW

(2004) Dopaminergiczna modulacja uwagi wzrokowej i pamięci roboczej w korze przedczołowej gryzonia. Neuropsychopharmacology 29: 1628 – 1636.

CrossRefMedline

7. ↵

1. Cousins ​​MS,

2. Wei W,

3. Salamone JD

(1994) Farmakologiczna charakterystyka działania na równoległej procedurze naciskania / karmienia: wpływ antagonistów dopaminy, leków cholinomimetycznych, uspokajających i stymulujących. Psychopharmacology 116: 529 – 537.

CrossRefMedline

8. ↵

1. Denk F,

2. Walton ME,

3. Jennings KA,

4. Sharp T,

5. Rushworth MF,

6. Bannerman DM

(2005) Zróżnicowane zaangażowanie systemów serotoninowych i dopaminowych w decyzje dotyczące kosztów i korzyści dotyczące opóźnienia lub wysiłku. Psychopharmacology 179: 587 – 596.

CrossRefMedline

9. ↵

1. Durstewitz D,

2. Seamans JK,

3. Sejnowski TJ

(2000) Neurokomputacyjne modele pamięci roboczej. Nat Neurosci 3 (Suppl): 1184 – 1191.

CrossRefMedline

10. ↵

1. Floresco SB,

2. Magyar O

(2006) Mezokortykalna modulacja dopaminy funkcji wykonawczych: poza pamięcią roboczą. Psychopharmacology 188: 567 – 585.

CrossRefMedline

11. ↵

1. Floresco SB,

2. Whelan JM

(2009) Zaburzenia w różnych formach podejmowania decyzji dotyczących kosztów i korzyści wywołanych powtarzającym się narażeniem na amfetaminę. Psychopharmacology 205: 189 – 201.

CrossRefMedline

12. ↵

1. Floresco SB,

2. Magyar O,

3. Ghods-Sharifi S,

4. Vexelman C,

5. Tse MT

(2006) Wiele podtypów receptora dopaminy w przyśrodkowej korze przedczołowej szczura reguluje przesunięcie zestawu. Neuropsychopharmacology 31: 297 – 309.

CrossRefMedline

13. ↵

1. Floresco SB,

2. Tse MT,

3. Ghods-Sharifi S

(2008a) Dopaminergiczna i glutaminergiczna regulacja wysiłku i podejmowanie decyzji w oparciu o opóźnienia. Neuropsychopharmacology 33: 1966 – 1979.

CrossRefMedline

14. ↵

1. Floresco SB,

2. St Onge JR,

3. Ghods-Sharifi S,

4. Winstanley CA.

(2008b) Obwody korowo-limbiczno-prążkowia podporządkowane różnym formom podejmowania decyzji koszt-korzyść. Cogn Affect Behav Neurosci 8: 375 – 389.

CrossRefMedline

15. ↵

1. Ghods-Sharifi S,

2. St Onge JR,

3. Floresco SB

(2009) Podstawowy wkład ciała migdałowatego podstawno-bocznego w różne formy podejmowania decyzji. J Neurosci 29: 5251 – 5259.

Streszczenie / BEZPŁATNY pełny tekst

16. ↵

1. Granon S,

2. Passetti F,

3. Thomas KL,

4. Dalley JW,

5. Everitt BJ,

6. Robbins TW

(2000) Wzmocniona i upośledzona sprawność uwagi po infuzji środków receptora dopaminergicznego D1 do kory przedczołowej szczura. J Neurosci 20: 1208 – 1215.

Streszczenie / BEZPŁATNY pełny tekst

17. ↵

1. Haluk DM,

2. Floresco SB

(2009) Brzuszna prążkowia modulacja dopaminy różnych form elastyczności behawioralnej. Neuropsychopharmacology 34: 2041 – 2052.

CrossRefMedline

18. ↵

1. Hutton SB,

2. Murphy FC,

3. Joyce EM,

4. Rogers RD,

5. Cuthbert I,

6. Barnes TR,

7. McKenna PJ,

8. Sahakian BJ,

9. Robbins TW

(2002) Deficyty decyzyjne u pacjentów z pierwszym epizodem i przewlekłą schizofrenią. Schizophr Res 55: 249 – 257.

CrossRefMedline

19. ↵

1. Jocham G,

2. Klein TA,

3. Ullsperger M

(2011) Sygnały uczenia się za pośrednictwem dopaminy w prążkowiu i brzuszno-przyśrodkowej korze przedczołowej leżą u podstaw wyborów opartych na wartościach. J Neurosci 31: 1606 – 1613.

Streszczenie / BEZPŁATNY pełny tekst

20. ↵

1. Loos M,

2. Pattij T,

3. Janssen MC,

4. Counterte DS,

5. Schoffelmeer AN,

6. Smit AB,

7. Spijker S,

8. van Gaalen MM

(2010) Ekspresja genu receptora dopaminy D1 / D5 w przyśrodkowej korze przedczołowej przewiduje impulsywny wybór u szczurów. Cereb Cortex 20: 1064 – 1070.

Streszczenie / BEZPŁATNY pełny tekst

21. ↵

1. McLean A,

2. Rubinsztein JS,

3. Robbins TW,

4. Sahakian BJ

(2004) Wpływ wyczerpania tyrozyny u zdrowych zdrowych ochotników: implikacje dla depresji jednobiegunowej. Psychopharmacology 171: 286 – 297.

CrossRefMedline

22. ↵

1. Pagonabarraga J,

2. García-Sánchez C,

3. Llebaria G,

4. Pascual-Sedano B,

5. Gironell A,

6. Kulisevsky J

(2007) Kontrolowane badanie dotyczące podejmowania decyzji i upośledzenia funkcji poznawczych w chorobie Parkinsona. Mov Disord 22: 1430–1435.

CrossRefMedline

23. ↵

1. Paxinos G,

2. Watson C

(1998) Mózg szczura o współrzędnych stereotaktycznych (Academic, San Diego), Ed 4.

24. ↵

1. Ragozzino ME

(2002) Wpływ blokady receptora dopaminowego D (1) w obszarach prelimbicznych-infralimbicznych na elastyczność behawioralną. Learn Mem 9: 18 – 28.

Streszczenie / BEZPŁATNY pełny tekst

25. ↵

1. Rogers RD,

2. Everitt BJ,

3. Baldacchino A,

4. Blackshaw AJ,

5. Swainson R,

6. Wynne K,

7. Baker NB,

8. Hunter J,

9. Carthy T,

10. Booker E,

11. London M,

12. Deakin JF,

13. Sahakian BJ,

14. Robbins TW

(1999) Deficyty dysocjujące w podejmowaniu decyzji dotyczących przewlekłych osób nadużywających amfetaminy, osób nadużywających opiatów, pacjentów z ogniskowym uszkodzeniem kory przedczołowej i normalnych ochotników zubożonych w tryptofan: dowody na mechanizmy monoaminergiczne. Neuropsychopharmacology 20: 322 – 339.

CrossRefMedline

26. ↵

1. Schweimer J,

2. Hauber W

(2006) Receptory dopaminy D1 w przedniej obręczy obręczy regulują podejmowanie decyzji na podstawie wysiłku. Learn Mem 13: 777 – 782.

Streszczenie / BEZPŁATNY pełny tekst

27. ↵

1. Schweimer J,

2. Saft S,

3. Hauber W

(2005) Udział neurotransmisji katecholamin w przednim zakręcie obręczy szczura w podejmowaniu decyzji związanych z wysiłkiem. Behav Neurosci 119: 1687 – 1692.

CrossRefMedline

28. ↵

1. Seamans JK,

2. Yang CR

(2004) Główne cechy i mechanizmy modulacji dopaminy w korze przedczołowej. Prog Neurobiol 74: 1 – 58.

CrossRefMedline

29. ↵

1. Seamans JK,

2. Floresco SB,

3. Phillips AG

(1998) Modulacja receptora D1 w przedczołowych obwodach kory przedczołowej integrująca pamięć przestrzenną z funkcjami wykonawczymi u szczura. J Neurosci 18: 1613 – 1621.

Streszczenie / BEZPŁATNY pełny tekst

30. ↵

1. St Onge JR,

2. Floresco SB

(2009) Dopaminergiczna modulacja podejmowania decyzji w oparciu o ryzyko. Neuropsychopharmacology 34: 681 – 697.

CrossRefMedline

31. ↵

1. St Onge JR,

2. Chiu YC,

3. Floresco SB

(2010) Różnicowe efekty manipulacji dopaminergicznych przy ryzykownym wyborze. Psychopharmacology 211: 209 – 221.

CrossRefMedline

32. ↵

1. St Onge JR,

2. Floresco SB

(2010) Wkład korowy przedczołowy w podejmowanie decyzji na podstawie ryzyka. Cereb Cortex 20: 1816 – 1828.

Streszczenie / BEZPŁATNY pełny tekst

33. ↵

1. Korek CM,

2. Floresco SB

(2011) Wkład jądra półleżącego i jego podregionów w różne aspekty podejmowania decyzji w oparciu o ryzyko. Cogn Affect Behav Neurosci 11: 97 – 112.

CrossRefMedline

34. ↵

1. van Gaalen MM,

2. van Koten R,

3. Schoffelmeer AN,

4. Vanderschuren LJ

(2006) Krytyczne zaangażowanie neurotransmisji dopaminergicznej w impulsywnym podejmowaniu decyzji. Biol Psychiatry 60: 66 – 73.

CrossRefMedline

35. ↵

1. Williams GV,

2. Goldman-Rakic ​​PS

(1995) Modulacja pól pamięci przez receptory dopaminy D1 w korze przedczołowej. Nature 376: 572 – 575.

CrossRefMedline

36. ↵

1. Winstanley CA,

2. Theobald DE,

3. Dalley JW,

4. Robbins TW

(2005) Interakcje między serotoniną i dopaminą w kontroli impulsywnego wyboru u szczurów: implikacje terapeutyczne dla zaburzeń kontroli impulsów. Neuropsychopharmacology 30: 669 – 682.

Medline

37. ↵

1. Winstanley CA,

2. Theobald DE,

3. Dalley JW,

4. Kardynał rn,

5. Robbins TW

(2006) Podwójna dysocjacja między modulacją serotonergiczną i dopaminergiczną przyśrodkowej kory przedczołowej i oczodołowo-czołowej wyboru impulsywnego. Cereb Cortex 16: 106 – 114.

Streszczenie / BEZPŁATNY pełny tekst