Różnicowa dynamika uwalniania dopaminy w jądrach Nucleus Accumbens Rdzeń i otoczka ujawniają sygnały uzupełniające do przewidywania błędów i motywacji motywacyjnej (2015)

  1. Regina M. Carelli 2

+Pokaż powiązania

Wkład autorów: badania MPS i FC; MPS i FC przeprowadzili badania; Analizowane dane MPS i FC; MPS, RMW i RMC napisali artykuł.

Abstrakcyjny

Mezolimbiczna dopamina (DA) jest uwalniana fazowo podczas zachowań apetycznych, chociaż istnieje znaczna różnica zdań co do konkretnego celu tych sygnałów DA. Na przykład modele przewidywania błędu (PE) sugerują rolę uczenia się, podczas gdy modele zachęt motywacyjnych (IS) twierdzą, że sygnał DA przenosi bodźce o wartości, a tym samym stymuluje zmotywowane zachowania. Jednak w obrębie jądra półleżącego (NAc) wzory uwalniania DA mogą uderzająco różnić się między podregionami i jako takie możliwe jest, że te wzorce w różny sposób przyczyniają się do aspektów PE i IS. Aby to ocenić, zmierzyliśmy uwalnianie DA w podregionach NAc podczas zadania behawioralnego, które rozdzielało czasoprzestrzennie sekwencyjne bodźce ukierunkowane na cel. Zastosowano metody elektrochemiczne do pomiaru uwalniania dopaminy z drugiego rzędu NAc w rdzeniu i otoczce podczas dobrze poznanego harmonogramu łańcucha instrumentalnego, w którym szczury były szkolone do naciskania jednej dźwigni (szukanie; SL) w celu uzyskania dostępu do drugiej dźwigni (przyjmując; TL) połączone z dostawa żywności, i ponownie podczas wyginięcia. W rdzeniu fazowe uwalnianie DA było największe po początkowej prezentacji SL, ale minimalne w przypadku kolejnych TL i wydarzeń z nagrodami. Natomiast faza fazowa DA wykazywała silne uwalnianie przy wszystkich zdarzeniach związanych z zadaniami. Sygnalizacja zmniejszyła się między początkiem a końcem sesji w powłoce, ale nie rdzeniem. Podczas wygaszania, szczytowe uwalnianie DA w rdzeniu wykazywało stopniowe obniżenie SL i pauzy w uwalnianiu podczas pominiętych oczekiwanych korzyści, podczas gdy uwalnianie powłoki DA zmniejszało się głównie podczas TL. Te dynamiki uwalniania sugerują równoległe sygnały DA zdolne do wspierania odrębnych teorii zachowania apetycznego.

OŚWIADCZENIE O ZNACZENIU Sygnalizacja dopaminowa w mózgu jest ważna dla różnych funkcji poznawczych, takich jak uczenie się i motywacja. Zwykle przyjmuje się, że pojedynczy sygnał dopaminy jest wystarczający, aby wspierać te funkcje poznawcze, chociaż konkurencyjne teorie nie zgadzają się, w jaki sposób dopamina przyczynia się do zachowań opartych na nagrodzie. Tutaj odkryliśmy, że uwalnianie dopaminy w czasie rzeczywistym w jądrze półleżącym (głównym celu neuronów dopaminowych śródmózgowia) jest uderzająco zróżnicowane pomiędzy podregionami rdzenia i powłoki. W rdzeniu dynamika dopaminy jest zgodna z teoriami opartymi na uczeniu się (takimi jak błąd przewidywania nagrody), podczas gdy w skorupie dopamina jest zgodna z teoriami opartymi na motywacji (np. Istotność motywacyjna). Odkrycia te pokazują, że dopamina odgrywa wiele uzupełniających się ról opartych na dyskretnych obwodach, które pomagają zwierzętom optymalizować satysfakcjonujące zachowania.

Wprowadzenie

Zrozumienie roli sygnalizacji dopaminowej (DA) w odniesieniu do uczenia się, zachowania i uzależnienia jest głównym zagadnieniem w neurobiologii behawioralnej. Współczesne teorie są zgodne z anatomiczną organizacją mezolimbicznego układu DA, w którym stosunkowo mała populacja neuronów DAergic w brzusznym obszarze nakrywkowym (VTA) wysyła zabezpieczenia w całym mózgu w celu szerokiej modulacji obwodów do uczenia się i działania. Jednak ostatnie dowody sugerują, że sygnalizacja DA może być bardziej heterogeniczna niż wcześniej rozważano. Na przykład, fazowe uwalnianie DA po skalach prognoz przewidujących nagrody z przewidywaną subiektywną wartością nagrody w jądrze półleżącym (NAc), ale nie w powłoce (Day i in., 2010; Sugam i in., 2012). W przeciwieństwie do tego, motywacyjne przesunięcia w hedonicznym przetwarzaniu leków przewidujących leki są zlokalizowane w fazowych zmianach w uwalnianiu DA w powłoce NAc, ale nie w rdzeniu (Wheeler i in., 2011). Co więcej, my i inni wykazaliśmy, że uwalnianie DA podczas wyuczonych zadań kodowało bodźce w różny sposób między rdzeniem a powłoką (Aragona i in., 2009; Owesson-White i in., 2009; Badrinarayan i in., 2012; Cacciapaglia i in., 2012). Zamiast globalnego sygnału DA, odkrycia te sugerują, że DA może być różnie i dyskretnie dostrajany do określonych regionów docelowych, aby wspierać plastyczność w określonych obwodach związanych z uczeniem się, motywacją i działaniem.

Jednak dokładne funkcje tych heterogenicznych sygnałów DA nie są dobrze poznane. Jeden z wpływowych modeli stwierdził, że DA dostarcza sygnału dydaktycznego do generowania oczekiwanych skojarzeń przyszłych wyników i tego, czy przewidywania te są dokładne [błąd przewidywania (PE)]. Neurony DA wyświetlają ten typ kodowania (Schultz i wsp., 1997; Schultz i Dickinson, 2000; Waelti i in., 2001; Tobler i in., 2003), chociaż ostatnie odkrycia potwierdzają, że zasadniczo wszystkie optogenetycznie zidentyfikowane neurony DA w VTA wykazują sygnalizację typu PE (Cohen i wsp., 2012). W przeciwieństwie do tego, modele zachęt motywacyjnych (IS) sugerują, że DA działa w celu nadania bodźców cennym wzmacniaczom, tworząc motywacyjny popęd dla tych wyników (Berridge i Robinson, 1998; Robinson i Berridge, 2008; Zhang i in., 2009; Berridge, 2012). Chociaż podobne, modele PE i IS dają silnie rozbieżne prognozy dla funkcji DA w odniesieniu do jej konieczności w uczeniu się, motywacji i uzależnieniu od narkotyków (Redish, 2004; Tindell i in., 2009; Bromberg-Martin i wsp., 2010; Berridge, 2012).

W prostych zadaniach warunkujących trudno jest zorientować się, jakie kodowanie fazowe DA jest kodowane (tj. Czy przewiduje przewidywanie nagrody, czy cue salience?). Jednak poprzez czasoprzestrzenne izolowanie bodźców predykcyjnych i najistotniejszych w ramach tego samego zadania, możliwe jest przeanalizowanie specyficznych cech uczenia się i działania w celu wyizolowania komponentów, takich jak wstępne przewidywanie, zachowania konsumpcyjne, motywacja, a nawet wymieranie. Aby rozwiązać ten problem, wykorzystaliśmy zadanie harmonogramu łańcucha narzędziowego, w którym naciśnięcie jednej dźwigni [szukanie dźwigni (SL)] umożliwiło dostęp do prasy na drugiej dźwigni (TL), a prasy na TL spowodowały dostarczenie żywności. Ponadto, używając szybkiej woltamperometrii cyklicznej (FSCV) do pomiaru wzorców uwalniania DA w czasie rzeczywistym w rdzeniu lub powłoce NAc u dobrze wyszkolonych szczurów, rozróżniliśmy, w jaki sposób selektywne pod względem zadań cechy kodowania DA różnią się w poszczególnych podregionach NAc. Na koniec zbadaliśmy, jak te sygnały dynamicznie się zmieniają, gdy zmieniają się aspekty motywacji (poziom głodu) i przewidywania (wygaszanie). Zaobserwowaliśmy zróżnicowane wzory uwalniania DA w rdzeniu i powłoce, które były wysoce zgodne odpowiednio z modelami PE i IS, i ogólnie popierają ideę wielu mezolimbicznych sygnałów DA, które mogą wspierać komplementarne, ale różne aspekty zachowania ukierunkowanego na cel.

Materiały i Metody

Zwierząt.

Dwanaście samców szczurów Sprague-Dawley ważących 280 – 330 g użyto jako osobników. Szczury trzymano pojedynczo w cyklu 12 h light / dark i lekko pożywkę ograniczoną do nie mniejszej niż 90% masy pokarmowej (10-15 g karmy laboratoryjnej Purina każdego dnia, oprócz N2.7 g sacharozy spożywanej podczas codziennych sesji ). Ograniczenie pokarmu obowiązywało przez cały czas trwania testów behawioralnych, z wyjątkiem okresu pooperacyjnego, kiedy pokarm podawano ad libitum. Wszystkie procedury przeprowadzono zgodnie z University of North Carolina w Chapel Hill Institutional Animal Care and Use Committee.

Trening behawioralny: harmonogram łańcucha.

Komory testowe zawierały dwie chowane dźwignie z lampką sygnalizacyjną nad każdą dźwignią i pojemnik na żywność umieszczony w takiej samej odległości między dźwigniami, jak opisano wcześniej (Cacciapaglia i in., 2012). Dla każdego przedmiotu jedną dźwignię (np. Po lewej) oznaczono jako TL, a drugą dźwignię (np. Po prawej) jako SL na czas wszystkich sesji testowych. Strona TL i SL była zrównoważona między badanymi.

Szczury najpierw szkolono w celu uzyskania peletek sacharozy (45 mg, Purina) z pojemnika na żywność. Podczas jednej sesji wstępnego przygotowania granulki 50 były dostarczane losowo mniej więcej raz na każdy 30. Szczury następnie szkolono do samodzielnego podawania peletek sacharozy podczas pojedynczych dziennych sesji. Aby ukształtować reakcję instrumentalną, zwierzęta były najpierw szkolone do naciskania TL. Każda próba podczas kształtowania rozpoczęła się od podświetlenia jasnego wskaźnika bezpośrednio nad TL połączonego z przedłużeniem TL do komory testowej [wyciągnięcie dźwigni (TLO)]. Każde naciśnięcie dźwigni [TLP; ustalony stosunek 1 (FR1)] w obrębie 15 s przedłużenia spowodował dostarczenie pojedynczej peletki sacharozy (45 mg) do pojemnika, wycofanie TL i zakończenie światła sygnalizacyjnego. Jeśli zwierzętom nie udało się nacisnąć TL w 15 s, dźwignia została cofnięta, lampka sygnalizacyjna zgasła, a próba została uznana za pominięcie. Próby rozdzielono zmiennym interwałem międzypróbowym ze średnią 15 s (zakres: 5 – 25 s; dni kształtowania 1 i 2), a następnie zwiększono do średniej 45 s na dni kształtowania 3 – 4 (zakres: 30 – 60 s).

Po ustanowieniu stabilnej odpowiedzi na TL (tj. Nie więcej niż błędach pominięcia 2 w sesji) wprowadzono harmonogram łańcucha (Rys. 1 A), przyjęty z Olmstead i in. (2000). Próby podczas sesji harmonogramu łańcucha rozpoczęły się od rozszerzenia SL i jednoczesnego podświetlenia światła cue bezpośrednio nad nim (SLO). Każda SLP (FR1) spowodowało wycofanie SL i wygaszenie cue, po czym nastąpiła prezentacja TLO (przedłużenie dźwigni, światło cue). Jak powyżej, prasy TL skutkowały wycofaniem TL, zgaszeniem światła sygnalizacyjnego i dostarczeniem peletek sacharozy do kubka spożywczego. Próby rozdzielono zmiennym interwałem międzyseryjnym 45 (zakres: 30 – 60 s), a każda sesja składała się z prób 30. W dniu 1 harmonogramu łańcucha nie było opóźnienia między wycofaniem SL a rozszerzeniem TL. W kolejnych dniach wprowadzono zmienny przedział (VI) 3 – 5 między wycofaniem prasy SL a rozszerzeniem TL. Ponadto wprowadzono VI 1 – 3 pomiędzy prasą TL a dostarczeniem wzmocnienia sacharozy. Podczas treningu wykorzystywano zmienne opóźnienia (tj. Wszystkie sesje przed nagraniami FSCV), aby wyeliminować zdolność szczurów do przewidywania czasu dostarczania zdarzeń. Szczury były szkolone pod kątem 5 d na tym schemacie łańcucha lub dopóki nie wykazywały stabilnej wydajności dwóch kolejnych sesji bez pominięcia SL lub TL, po czym zostały chirurgicznie przygotowane do zapisu woltamperometrycznego.

Trening behawioralny: wymieranie.

Po ostatniej sesji nagraniowej podzbiór zwierząt przeszedł wymieranie (nagrania podstawowe: n = 3; nagrania powłoki: n = 7). Podczas wyginięcia, SLO prezentacje wskazywały na początek nowego procesu. Próby były identyczne z tymi z sesji testowej, gdzie prasy SL zaowocowały prezentacjami TLO 4 s później, ale prasy na TL nie zostały wzmocnione. Sesje wymierania trwały do ​​czasu, gdy szczury przestały reagować na SL dla kolejnych prób 10 (Rys. 1 B).

Poprzednie badania (Schoenbaum i wsp., 2003; Saddoris i in., 2005) wykazali, że neuronalne korelaty aktywności limbicznej są bardzo wrażliwe na zmiany w stanie uczenia się i motywacji, a zatem użyliśmy markerów opóźnienia odpowiedzi do zdefiniowania bloków dla każdego podmiotu (Rys. 1 B). Pierwszym blokiem było wczesne wygaszanie, w którym opóźnienie odpowiedzi dla SLP odpowiedź była podobna do nagrodzonej sesji. Następnie pierwsza SLP opóźnienie odpowiedzi, które było co najmniej 2 SD dłuższe niż podczas poprzednio nagrodzonej sesji łańcuchowej oznaczało początek Delay Extinction. Ostatecznie wszystkie próby, które nastąpiły po pierwszej pominiętej odpowiedzi, były w późnym bloku wymierania i zostały pogrupowane według tego, czy szczur pominął SLP odpowiedź (późno bez naciśnięcia) lub wznowienie odpowiedzi (późne naciśnięcie). Wszystkie zachowania związane z wygaszaniem porównano z bezpośrednio poprzedzającym wzmocnionym harmonogramem łańcucha.

Zabiegi chirurgiczne.

Po treningu behawioralnym zwierzęta przygotowano chirurgicznie do nagrań woltamperometrycznych, jak opisano wcześniej (Cacciapaglia i in., 2012). W skrócie, szczury znieczulono domięśniowym zastrzykiem chlorowodorku ketaminy (100 mg / kg, im) i mieszaniny chlorowodorku ksylazyny (20 mg / kg). Kaniula prowadząca (systemy bioanalityczne) została wszczepiona powyżej powłoki NAc (+ 1.7 mm AP, + 0.8 mm ML) lub rdzenia (+ 1.3 mm AP, + 1.3 mm ML) i bipolarna elektroda stymulująca (Plastics One) została umieszczona w VTA (−5.2 mm AP, + 1.0 mm ML i −7.8 DV). Inna kaniula prowadząca dla referencyjnej elektrody Ag / AgCl została umieszczona w półkuli przeciwnej. Komponenty przymocowano do czaszki za pomocą śrub i cementu korioplastycznego.

Zapis woltamperometryczny.

Zastosowane tutaj techniki nagrywania FSCV były takie, jak opisano szczegółowo powyżej (Cacciapaglia i in., 2012; Sugam i in., 2012). W skrócie, po operacji, szczurom pozwolono powrócić do masy ciała przed operacją (co najmniej 5 d odzysku). W dniu eksperymentu mikroelektrodę z włókna węglowego obniżono do powłoki lub rdzenia NAc za pomocą lokalnie skonstruowanej mikrodyski (Zakład Elektroniczny Wydziału Chemii, University of North Carolina, Chapel Hill, NC), po umieszczeniu elektrody odniesienia Ag / AgCl w półkulę kontralateralną. Mikroelektrodę z włókna węglowego trzymano w elektrodzie odniesienia −0.4 V w stosunku do elektrody odniesienia Ag / AgCl. Okresowo uzyskiwany był cykliczny woltamogram (interwały 100 ms) przez zastosowanie trójkątnego kształtu fali, który napędzał potencjał do 1.3 V i z powrotem do -0.4 V. Przed rozpoczęciem każdej sesji nagrywania uzyskaliśmy wywołane elektrycznie zdarzenia uwalniania DA przez napędzanie bipolarnego stymulowania elektrodę w VTA i zarejestrowano wynikowe uwalnianie DA w NAc. Jeśli stymulacja nie powiodła się przy wywoływaniu uwalniania DA, elektrodę obniżono do nowego miejsca i proces powtórzono. Po pomyślnym wywołaniu stymulacji DA w NAc, zestaw treningowy wywołanego uwalniania DA został utworzony przy użyciu kombinacji częstotliwości stymulujących (między 10 i 60 Hz) i liczby impulsów dwufazowych (od 4 do 25) z bipolarnej elektrody VTA. W podzbiorze nagrań utworzono dodatkowy zestaw treningowy po zakończeniu sesji behawioralnej, aby zapewnić stabilność elektrody podczas sesji. W podzbiorze szczurów (n = 9), po zarejestrowaniu pełnej sesji 30 prób elektrodę opuszczano o kolejne ∼300 μm, aż do znalezienia innego miejsca uwolnienia, w którym to momencie wykonano kolejny zapis dla kolejnej sesji 30 prób. Analiza danych FSCV (Analiza HDCV) wykorzystała analizę chemometryczną głównych składowych do wyodrębnienia zmian prądu spowodowanych DA przy użyciu stymulowanego elektrycznie zestawu treningowego każdego badanego z powiązanej sesji rejestracyjnej zebranej przed badaniem, jak opisano wcześniej (Heien i in., 2005; Keithley i in., 2010). Dla każdego regionu (rdzeń i otoczka) średni ślad stężenia DA był dopasowany do każdego zdarzenia behawioralnego i porównywany ze średnim stężeniem DA w linii bazowej 5 bezpośrednio przed SLO początek przy użyciu dwukierunkowego mieszanego modelu ANOVA (czynniki: zdarzenie, region) na średnich tematycznych.

Dla sesji wymierania ślady DA były podobnie dostosowane do zdarzeń behawioralnych. Jednak ponieważ wiele SLO prezentacje nie były poprzedzone żadnymi prasami podczas wygaszania, wykorzystano dwie różne analizy. W pierwszym, ślady DA zostały wyrównane do SLO i pogrupowane według fazy wymarcia (patrz Rys. 6) i analizowane za pomocą dwukierunkowych powtarzanych pomiarów z wykorzystaniem fazy ekstynkcji i zdarzenia bodźcowego jako czynników. W drugiej analizie tylko próby, w których szczur naciskał TLP zastosowano i maksymalne stężenia DA (tj. maksymalne uwalnianie DA w 300 ms po zdarzeniu) uzyskano dla obu TLP i nagroda, a także analizowane za pomocą dwukierunkowej ANOVA z powtarzanymi pomiarami przy użyciu fazy ekstynkcji i bodźca zadaniowego jako czynników. Wszystko post hoc porównania parami wykonano przy użyciu HSD Tukeya, skorygowano o nierówności N kiedy stosowne. Wszystkie analizy statystyczne przeprowadzono za pomocą Prism 4.0 dla Windows (GraphPad Software) lub Statistica for Windows (StatSoft).

Histologia.

Po każdym eksperymencie szczury głęboko znieczulono mieszaniną ketaminy (100 mg / kg) / ksylazyny (20 mg / kg) (im). Elektroda wolframowa umieszczona w tym samym mikromanipulatorze użytym podczas eksperymentu została obniżona do miejsca zapisu eksperymentalnego i dokonano niewielkiego uszkodzenia elektrolitycznego (50 – 500 μA, 5 s) w celu oznaczenia położenia końcówki elektrody. Wiele uszkodzeń powstało, gdy wykonano wiele nagrań. Każdy mózg usunięto, utrwalono w 4% formaldehydzie, a następnie zamrożono do -80C przed pocięciem na skrawki koronalne 40 μm za pomocą kriostatu. Skrawki montowano na szkiełkach, oglądano przy pomocy mikroskopii w jasnym polu i obrazowano cyfrowo (Rys. 1 C).

Porównanie stymulowanego i wywołanego zdarzeniem uwalniania DA w rdzeniu i otoczce.

Możliwe, że różnice między uwolnieniem DA od rdzenia i powłoki dla zdarzeń behawioralnych wynikały nie z różnic w dynamice uwalniania, ale raczej z różnic w kinetyce klirensu DA między regionami. Na przykład dynamika uwalniania i pobierania DA prążkowia jest wolniejsza w powłoce niż w rdzeniu z powodu mniejszej gęstości transportera dopaminy w powłoce (Jones i in., 1996; Budygin i in., 2002). Jako takie, różnice między rdzeniem a powłoką w późniejszych zdarzeniach (np. TLO, nagroda) może być wyjaśniona przez utrzymywanie się resztkowej DA w regionie synaptycznym w powłoce.

Aby rozwiązać ten problem, porównaliśmy wzory uwalniania i wychwytu DA wywoływane przez zdarzenia behawioralne (tj. SLO) podczas zadania harmonogramu łańcucha dla DA, wywołanego krótkim impulsem elektrycznej stymulacji aferentów VTA. Pierwotnie stymulacja elektryczna (impulsy dwufazowe 2 ms) włókien VTA była prowadzona w szerokim zakresie częstotliwości stymulacji (10–60 Hz) i liczb impulsów (4–25 impulsów) w celu uzyskania pełnego spektrum dynamiki uwalniania w celu zbudowania zestaw treningowy chemometryczny. W związku z tym duża liczba stymulacji elektrycznych była znacznie większa (np. 2000 nm) niż obserwowana w naturalnie występujących przejściach (zwykle 40–150 nm). Przy bardzo dużych stężeniach uwalniania DA możliwe jest, że transporter DA może zostać nasycony, co prowadzi do wolniejszej kinetyki klirensu niż w normalnym zakresie. Aby rozwiązać ten problem bezpośrednio, wybraliśmy tylko „próby” stymulacji elektrycznej, w których szczytowe uwalnianie DA było <200 nm. Podobnie, wybraliśmy tylko badania behawioralne, w których szczytowe uwalnianie DA było zgodne z SLO było co najmniej 100 nm. Dla każdego przedmiotu wszystkie kwalifikujące się próby zostały uśrednione do analizy. Korzystając z tej metryki, uzyskaliśmy stymulacje elektryczne 23 i sesje wywołane cue 15 w rdzeniu oraz stymulacje elektryczne 14 i sesje wywoływane przez 11 w powłoce.

Porównania wyzwalania DA wywoływanego elektrycznie z cue wykonano za pomocą kilku metryk. Po pierwsze, szczytowy DA pochodzi z zdarzeń behawioralnych w SLO (tj. największe stężenie DA w 1.5 s SLO początek), TLO (największe stężenie DA między 4 a 5.5 s po SLO początek) i nagroda (największe stężenie DA między 6.5 – 8 s po SL)O początek) dla zdarzeń sygnalizacyjnych oraz w odpowiednich punktach czasowych dla zdarzeń stymulowanych elektrycznie (tj. te same punkty czasowe, ale po wystąpieniu stymulacji zamiast SLO początek). Następnie zbadano dynamikę luzu za pomocą wcześniej opublikowanych metryk (Yorgason i in., 2011). W szczególności przyjrzeliśmy się opóźnieniu do okresu półtrwania (stężenie w połowie piku stężenia) po piku, T 20 (czas rozpadu 20% od szczytu) i T 80 (czas dla 80% zaniku ze szczytu). Wartości te porównano przy użyciu mieszanego modelu ANOVA z wykorzystaniem regionu (rdzeń, powłoka), typu stymulacji (SLO wyrównane, stymulowane elektrycznie) jako czynniki międzyosobnicze i stężenie DA przy każdym typie zdarzenia (linia bazowa, SLO, TLOi nagroda) lub miara zaniku (opóźnienia do szczytu, T 20, półtrwania i T 80, odpowiednio) jako powtarzane pomiary. Post hoc porównania zostały wykonane przy użyciu HSD Tukeya dla nierówności N.

wyniki

Wzmocnione zachowanie harmonogramu łańcucha

Szczury szybko nauczyły się zadania planowania łańcucha. W końcowej sesji zabiegowej szczury wykonały średnio 99.8% prób dokładnie. Podczas tych sesji szczury przyjmowały średnio 783 ± 253 ms, aby nacisnąć następujące SLOoraz 588 ± 298 ms, aby nacisnąć po TLO, różnica, która była prawie znacząca, t (17) = 1.77, p = 0.085 Jednakże, w dniach zapisu po zabiegu, szczury ponownie prawie nie pominęły (99.5%), ale wykazywały znacznie szybsze opóźnienia odpowiedzi dla TLP (999 ± 64 ms) niż SLP (444 ± 39 ms), t (29) = 7.48, p <0.0001. Co ważne, w dniach rejestracji nie było różnic w opóźnieniu reakcji u zwierząt zarejestrowanych w skorupie i rdzeniu, t (29) = 0.78, p = 0.48. Zatem szczury w obu grupach (rdzeń i skorupa) były w równym stopniu kompetentne, aby ukończyć harmonogram łańcucha, gdy zadanie zostało wzmocnione.

Zróżnicowane uwalnianie DA w rdzeniu i powłoce NAc podczas wzmocnionego harmonogramu łańcucha

Następnie użyliśmy FSCV do uzyskania nagrań DA w czasie rzeczywistym z rdzenia NAc (n = 13) lub powłoka (n = 12) podczas wykonywania w dobrze wyuczonym harmonogramie łańcucha (Rys. 1 C). U szczurów, u których wykonano wiele zapisów, końcówkę elektrody obniżono co najmniej 300 μm między sesjami, aby zapewnić, że końcówka elektrody z włókna węglowego 100 μm była całkowicie w świeżej tkance dla każdego zapisu. Zgodne z obydwoma PE i IS modele, znaleźliśmy solidne fazowe uwalnianie DA, które rozpoczęło się wraz z pojawieniem się SL i cue light (SLO) w rdzeniu i powłoce. Przykłady tej sygnalizacji z reprezentatywnych sesji nagrywania (uśrednione dla prób 30) są pokazane dla rdzenia (Rys. 2 A) i powłoki (Rys. 2 B), z kolorowymi wykresami od pojedynczego zwierzęcia. Sygnalizacja DA różniła się uderzająco między subregionami. Na wszystkich szczurach w rdzeniu (Rys. 2 C – E, czarne ślady), DA osiągnął szybko szczyt na początku najbardziej przewidywalnej wskazówki (SLO początek), a następnie szybko spadł do poziomu wyjściowego do czasu TLP. W przeciwieństwie do tego w powłoce (Rys. 2 C – E, szare ślady), szybkie wzrosty stężenia DA były zbieżne z SLO prezentacja i pozostała podwyższona dla innych stymulujących motywacyjnie bodźców z dyskretnymi pikami przy TLO i nagradzaj dostawę przed powrotem do linii bazowej po zakończeniu próby.

Rysunek 1. 

A , Schemat projektu zadania. Podczas harmonogramu łańcucha jedna dźwignia (SL) została przedłużona do komory testowej w tym samym czasie, gdy światło sygnalizacyjne było oświetlone nad dźwignią (SLO). SLP zgasił światło i cofnął dźwignię. Po pewnym czasie, druga dźwignia w komorze (TL) została przedłużona i powiązane światło sygnalizacji podświetlone (TLO). Po naciśnięciu przycisku TL (TLP) szczury otrzymywały wzmocnienie pokarmu po opóźnieniu (R). B , Zachowanie podczas wymierania zwierząt z zapisami FSCV w rdzeniu lub skorupie. Zachowanie i analizę wyginięcia pogrupowano według bloku na podstawie zachowania szczura. Próby w bezpośrednio poprzedzającym zadaniu łańcuchowym zostały wykorzystane do porównania wydarzeń podczas wymierania. Wczesne wygaszanie dotyczyło wszystkich prób do pierwszej istotnie opóźnionej odpowiedzi na SL, podczas gdy opóźnione wygaszanie dotyczyło wszystkich prób między pierwszym opóźnionym SLP i pierwsza pominięta prasa po SLO prezentacja. W późnym bloku wygaszania dokonano rozróżnienia między tym, czy podmiot naciskał, czy pomijał odpowiedź. C , Histologia rozmieszczenia elektrod w rdzeniu (czarne kółka) i środkowa powłoka (szare kółka).

Rysunek 2. 

Wydajność powiązanego harmonogramu wytworzyła inną dynamikę uwalniania DA w NAc. Dynamika uwalniania dopaminy w rdzeniu ( A ) i powłoki ( B ) NAc wyrównane do czasu przedłużenia SL do komory (SLO). Każda z kolorowych wykresów przedstawia średnie z reprezentatywnego obiektu odpowiednio w rdzeniu i powłoce. Średni czas (▴) przedłużenia TL (TLO) i nagroda (R) i zakres (± 2 SD) względem SLO są pokazane na dole. C - E , Przekroczony temat oznacza uwalnianie DA we wszystkich nagraniach w rdzeniu (czarny) i powłoce (szary) względem ( C ) SLO( D ) SLPi rozszerzenie TLO 4 s później i ( E ) TLP, a pellet żywnościowy z nagrodą (R) dostarczono 2.5 s po prasie. Linia przerywana pokazuje SEM średniej dla każdego regionu. Dolny rząd ( F - H ) pokazuje średnie uwalnianie piku DA dla każdego zdarzenia behawioralnego. *p <0.05 w porównaniu z wartością wyjściową; †p <0.05 rdzeń w porównaniu do powłoki.

Oceniliśmy ilościowo te obserwacje poprzez uśrednienie wszystkich nagrań wykonanych w rdzeniu lub powłoce, dopasowanych do każdego ze zdarzeń behawioralnych w harmonogramie łańcucha (Rys. 2 C – H). W sesjach nagrywania FSCV czas pomiędzy SLP i TLO został naprawiony (4 s), podobnie jak czas między TLP i nagroda za dostarczenie (2.5 s), aby umożliwić lepsze dopasowanie bodźców zadaniowych do analizy DA. Tak więc wyrównanie do SLO, SLP/ TLOi TLP/ nagradza wyrównanie wszystkich markerów behawioralnych i pozwala na analizę szczytowego uwalniania DA względem tych zdarzeń.

Dwukierunkowy ANOVA porównujący pik (maksymalne stężenie DA w 300 ms po zdarzeniu następującym) stężenia DA w całym regionie (rdzeń, powłoka) i zdarzenie (linia bazowa, SLO, SLP, TLO, TLP, nagroda) wskazywała, że ​​powłoka wydała więcej DA ogólnie niż rdzeń, F (1,24) = 13.63, p <0.002. Co ważne, znacząca interakcja region × wydarzenie, F (5,120) = 9.88, p <0.0001, ujawnił, że sygnalizacja DA w rdzeniu i powłoce różnie reagowała na zdarzenia behawioralne (Rys. 2 F – H). W szczególności, podstawowe uwalnianie DA znacznie wzrosło przy SLO, w stosunku do linii bazowej (p <0.0001) i pozostawał powyżej linii podstawowej w czasie SLP (p <0.0001), choć znacznie poniżej poziomu w SLO (p <0.05). Jednak nie było różnic w szczytowej DA w rdzeniu w porównaniu z linią bazową dla żadnego zdarzenia TL (TLO vs linia bazowa, p = 0.59; TLP vs linia bazowa, p = 1.0), i nie ma różnicy od linii bazowej w momencie otrzymania nagrody (p =

W przeciwieństwie do tego, maksymalne stężenia DA w powłoce wykazały znaczące uwalnianie DA dla wszystkich zdarzeń. Wszystkie zdarzenia były związane z większym uwalnianiem DA niż poziom wyjściowy (wszystkie porównania vs BL, p <0.0002), podczas gdy żadne ze zdarzeń nie różniło się istotnie od siebie (wszystkie parami SLO, SLP, TLO, TLPi porównania nagród, p > 0.96).

Bezpośrednio porównując rdzeń i powłokę, stwierdziliśmy istotne różnice w sygnalizacji DA między regionami. Chociaż nie było różnic w uwalnianiu DA podczas żadnej linii podstawowej (p = 1.0) lub zdarzenia SL (SLO, p = 1.0; SLP, p = 0.22), powłoka DA była znacząco podwyższona w porównaniu z rdzeniem dla obu zdarzeń TL (TLO, p <0.01; TLP, p <0.001) i nagroda (p <0.0005; Rys. 3 D-F).

Rysunek 3. 

Zmiany w sygnalizacji DA między początkiem sesji (wczesne; pierwsze próby 5 harmonogramu łańcucha) a końcem sesji (późne; ostatnie testy 5). A , Średnie stężenia DA w rdzeniu NAc ze średnich z pierwszych pięciu badań każdego badanego (jasnoniebieski) i ostatnich pięciu prób (fioletowe). B , W rdzeniu, w obrębie badanych szczytowa sygnalizacja DA była niezmieniona od początku sesji do końca. C , Średnie stężenia DA w powłoce NAc ze średnich z pierwszych pięciu prób każdego badanego (czerwony) i ostatnich pięciu prób (pomarańczowy). D , Shell DA wykazał znaczące zmniejszenie wewnątrzobiektowe w obu SLP i TLP wskazówki i nagrody (**p <0.01), natomiast spadek na SLO wskazówka była prawie znacząca (#p = 0.073). Słupki błędów pokazują SE różnicy (wcześnie vs późno).

Specyficzne dla regionu zmiany w zwolnieniu DA między początkiem a końcem sesji

Następnie porównaliśmy uwalnianie DA w rdzeniu i powłoce podczas zadania harmonogramu wzmocnionego łańcucha na początku sesji (pierwsze próby 5) w porównaniu z końcem sesji (ostatnie próby 5; Rys. 3). To było ważne, aby sprawdzić, czy elektroda była stabilna przez całą sesję (tj., Że elektroda nie traciła czułości w czasie), a także aby ocenić, czy DA śledzi subtelne zmiany w stanie motywacyjnym (na przykład z powodu jakichkolwiek efektów zmniejszonego głodu po spożyciu pokarmu) po prezentacji różnych bodźców.

W rdzeniu (Rys. 3 A), dwukierunkowa ANOVA wskazała znaczący główny efekt zdarzenia (BL, SLO, SLP, TLO, TLP, Rew; F (5,65) = 35.03, p <0.0001), ale bez wpływu fazy sesji (wczesna vs późna; F (1,13) = 3.55, p = 0.08), lub interakcja między zdarzeniem × faza sesji (F (5,65) = 0.82, p = Post hoc porównania między wczesnymi i późnymi blokami wskazywały, że szczytowe uwalnianie DA względem zdarzeń behawioralnych w rdzeniu pozostało takie samo między początkiem a końcem sesji (Tukey: wszystkie porównania wczesnych i późnych par dla BL, SLO, SLP, TLO, TLPi nagrodę, p > 0.50; Rys. 3 B).

Jednak bodźce fazowe uwalniania DA do zadania na ogół zmniejszały się podczas sesji w powłoce (Rys. 3 C,D), ze znaczącymi głównymi efektami zdarzenia (F (5,55) = 13.52, p <0.0001), faza sesji (F (1,11) = 6.95, p = 0.02) oraz interakcję między zdarzeniem a fazą sesji (F (5,55) = 3.74, p = 0.006). Jak w rdzeniu post hoc testy nie wykazały różnicy w BL, ale znaczące spadki szczytowego uwalniania DA do SLP, TLPi nagroda (Tukey: wszystko p <0.0005), trend w kierunku istotności w SLO wskazówka (p = 0.060), ale nie ma różnicy w TLO wskazówka (p = 0.36). Zatem zmiany w powłoce (ale nie w rdzeniu) ograniczały się głównie do działań motywowanych i konsumpcji nagrody z różnicowymi (choć skromnymi) efektami początkowymi. Te zmiany w uwalnianiu DA między sesjami nie były spowodowane uogólnionymi zmianami czułości elektrod, ale zamiast tego sugerują, że specyficzne dla bodźca i powłoki zmiany we wzorcach uwalniania DA wskazują na informacje o zmienionym znaczeniu bodźców zadaniowych w powtarzanych próbach. Biorąc pod uwagę, że zwierzęta spożywały średnio co najmniej 25 granulek do końca każdej sesji rejestracyjnej (tj. 1144 mg, czyli 7.6% wagi dziennego schematu ograniczonego spożycia przez szczury), wyniki te sugerują, że zwiększone spożycie pokarmu skutecznie zmniejszył motywowany stan głodu u zwierzęcia, który objawiał się zmianami w skorupie, ale nie w rdzeniu w trakcie sesji.

Wywołana cue a elektrycznie stymulowana dynamika DA w rdzeniu i powłoce

Jednym z zastrzeżeń do tych ustaleń może być to, że rdzeń i powłoka mają inną dynamikę luzu DA ze względu na mniejszą gęstość transportera DA w powłoce w porównaniu z rdzeniem (Jones i in., 1996; Budygin i in., 2002). Zatem możliwe jest, że powłoka DA obserwowana w przypadku TL i nagrody jest spowodowana resztkowym uwalnianiem DA w czasie SLO, ale nie można go usunąć z przepełnienia synaptycznego tak skutecznie, jak w rdzeniu. Aby rozwiązać ten problem, porównaliśmy elektrycznie stymulowane uwalnianie DA w tym samym miejscu elektrody, co podczas rejestracji harmonogramu łańcucha, aby sprawdzić, czy elektrycznie stymulowana dynamika odpowiada dynamice wywołanej cue w rdzeniu i powłoce (Rys. 4 A). Przewidywaliśmy, że jeśli wolniejsza kinetyka klirensu w powłoce będzie odpowiedzialna za różnice w kolejnej sygnalizacji zdarzeń (np. TLO) pomiędzy rdzeniem a skorupą, a następnie stymulowane elektrycznie i wywołane sygnalizacją uwalnianie w ich odpowiednich podregionach powinno następować niemal identycznymi wzorami uwalniania i usuwania. W przeciwieństwie do tego, znaczne odchylenia od stymulacji elektrycznej sugerowałyby, że uwalnianie DA w tym obszarze śledzi zdarzenia związane z zadaniami w sposób, którego nie można wytłumaczyć jedynie przez dynamikę klirensu synaptycznego.

Rysunek 4. 

Porównanie stymulowanej elektrycznie sygnalizacji DA wywołanej cue w rdzeniu i powłoce NAc. A , Średnie stężenie DA dostosowane do SLO sygnał lub stymulacja elektryczna początku włókien VTA. Czas początku TLO cue i nagroda zostały oszacowane w zakresie czasów odpowiedzi dla tych wyników po SLO (średni czas odpowiedzi wskazany przez trójkąt; szerokość wskazuje ± 95% przedział ufności). B , Porównanie średnich wyjściowych stężeń DA (BL) z maksymalnym stężeniem DA w 1 s SLO lub stymulacja elektryczna (Stim / SLO) oraz w zakresie przedziału ufności 95% dla czasów odpowiadających TLO lub epoki nagrody. C , Latencja do szczytowego stężenia po SLO lub stymulacja elektryczna (Peak Lat) i późniejszy zanik (klirens) po uwolnieniu w rdzeniu i powłoce. T20 oraz T80 są czasy, w których sygnał zanikał odpowiednio 20% i 80% od piku, podczas gdy okres półtrwania jest opóźnieniem po piku do osiągnięcia stężenia połowy piku. *p <0.0001, stymulacja elektryczna / SLO w porównaniu z linią bazową; †p <0.0001, Shell: Cue większe [DA] niż wszystkie inne typy stymulacji; ‡ p <0.0001, powłoka: sygnalizuje większe opóźnienie zaniku od wartości szczytowej niż wszystkie inne typy stymulacji. Słupki błędów pokazują SE różnicy (cue vs electric).

Podsumowując, odkryliśmy, że rdzeń i powłoka ostro różnią się pod względem zależności między wywołanym przez cue a elektrycznie wywołanym uwalnianiem DA (Rys. 4 B). Patrząc na stężenia szczytowe podczas zdarzeń zadaniowych, występowały znaczące różnice w stężeniach DA jako interakcja regionu (rdzeń / powłoka) × typ stymulacji (elektryczność w porównaniu z cue) × zdarzenie (BL, SLO, TLO, Rew; F (3,174) = 12.31, p <0.0001). W rdzeniu maksymalne stężenia DA dla śladów wywołanych przez sygnał i pobudzonych elektrycznie były prawie identyczne; nie było różnic statystycznych między tymi typami stymulacji na początku badania SLO, TLOlub epoki nagród (Tukey: wszystko p > 0.80). W przeciwieństwie do tego, powłoka wykazywała inny wzorzec dynamiki pomiędzy wzorcami uwalniania DA wywołanymi elektrycznie i cue. Chociaż nie było różnicy w stężeniu na początku badania lub SLO (Tukey: oba p > 0.98), DA była istotnie większa dla TLO i nagradzaj epoki w próbach z próbkami w porównaniu z pobudzeniami elektrycznymi (oba p < 0.0001).

Podobnie, tempo uwalniania i późniejszy klirens z synapsy wykazywały podobny wzór (Rys. 4 C). Patrząc na wartości klirensu jako funkcję rozpadu z piku, wystąpiła istotna interakcja między regionem × typ stymulacji × parametr rozpadu (czas szczytu, T20, półtrwania, T80; F (3,174) = 80.23, p <0.00001). Jak wyżej, klirens rdzenia i dynamika rozpadu nie różniły się między typami stymulacji wywołanej cue i wywołanej elektrycznie. Opóźnienie do szczytu, T 20, półtrwania i T 80 wszystkie były statystycznie podobne niezależnie od typu stymulacji (elektryczne vs cue; wszystkie p > 0.95). W przeciwieństwie do tego, poziomy DA w powłoce wykazały znacznie opóźniony zanik do poziomu podstawowego po SLO prezentacje dotyczące prób stymulowanych elektrycznie. Podczas gdy opóźnienie osiąga szczyt i T 20 były podobne między stymulowanymi przez cue i wywołanymi elektrycznie stymulacjami (p > 0.98), opóźnienie do okresu półtrwania (p <0.0001) i T 80 (p <0.0001) były znacząco opóźnione w próbach wskazanych w stosunku do stymulacji elektrycznej. Podsumowując, odkrycia te pokazują, że wewnętrzne różnice w kinetyce klirensu w powłoce i rdzeniu są niewystarczające, aby wyjaśnić różnice w sygnalizacji DA podczas zachowań.

Zachowanie wymierające

Szczury wykazywały zachowanie podczas wygaszania podczas sesji, gdy nagroda pożywienia została pominięta poprzez stopniowe zwiększanie opóźnienia w naciskaniu różnych dźwigni w trakcie sesji wygaszania. Wygenerowaliśmy behawioralnie zdefiniowane fazy w oparciu o te przesunięcia latencji w stosunku do opóźnienia naciśnięcia na SL i TL podczas bezpośrednio poprzedzającej sesji wzmocnionego łańcucha. Faza wczesna została zdefiniowana jako próby, w których opóźnienia były takie same, jak podczas wzmocnionej sesji. Kiedy szczury naciskały dźwignię znacznie wolniej (tj.> 2 SD) niż normalnie, określano to jako fazę opóźnienia, która trwała od pierwszej opóźnionej odpowiedzi do momentu, gdy osobnik pominął odpowiedź. Wszystkie próby po tym pierwszym pominięciu określano jako późną fazę w oparciu o to, czy szczur naciskał (późna prasa), czy też nie reagował (późne brak prasy).

Po pierwsze, oceniliśmy liczbę prób przeprowadzonych zanim szczury wykazały przesunięcie latencji z fazy wczesnej na fazę opóźnienia, jak również liczbę prób do pierwszego pominiętego badania (tj. Przesunięcie do fazy późnej) odpowiednio dla SL i TL (Rys. 5 A). Szczury spowolniły reagowanie na TL znacznie wcześniej niż w przypadku SL, sparowane t test: t (7) = 2.49, p = 0.04, sugerując, że TL (być może z racji bezpośredniego związku z nagrodą) był bardziej wrażliwy na pominięcie nagrody niż SL. Natomiast liczba prób przed pierwszym pominięciem była prawie identyczna dla dźwigni SL i TL (p > 0.9), być może wskazując, że pominięte odpowiedzi były emitowane tylko wtedy, gdy przewidywanie nagrody zostało dokładnie zaktualizowane do zera na początku badania. Zgodnie z tym rzadko spotykaliśmy próby, w których zwierzęta wykonywały SLP ale pominięto kolejny TLP odpowiedź (tylko 4 / 140 całkowita próba w późnej fazie; 2.9%), sugerując, że szczury prawie wyłącznie wykonywały całą sekwencję łańcucha lub wcale. W związku z tym pominięcia były prawdopodobnie bardziej powiązane z informacjami dostępnymi w SL niż TL.

Rysunek 5. 

Zachowanie wyginięcia u zwierząt z zapisami FSCV w rdzeniu lub skorupie. A , Liczba prób przed szczurami po raz pierwszy wykazała znaczny wzrost opóźnienia odpowiedzi w celu przesunięcia z wczesnej do opóźnionej fazy wymierania (po lewej) i pominięcia odpowiedzi (po prawej) dla SL (jasnoszary) i TL (ciemnoszary). Szczury wykazywały przesunięcie latencji dla TL w znacznie mniejszej liczbie prób niż SL, chociaż liczba prób przed pominięciem próby była taka sama między poszukiwaniem a przyjmowaniem odpowiedzi. *p <0.05 SL w porównaniu z TL. B , Opóźnienie odpowiedzi w odpowiedzi na SL (po lewej) i TL (po prawej) w fazach wygaszania. Opóźnienie odpowiedzi zwiększyło się w blokach i było znacznie dłuższe w blokach opóźnienia i opóźnienia ekstynkcji dla pras SL. Prasy na TL były niezawodnie szybsze niż na SL w każdym bloku. *p <0.05, **p <0.01 vs wczesne Ext.

Następnie zbadaliśmy średnie opóźnienia dla SLP i TLP w każdej fazie na podstawie powyższych kryteriów. Dwukierunkowa ANOVA z powtarzanymi pomiarami porównująca opóźnienie odpowiedzi na różnych dźwigniach (SL, TL) podczas różnych faz zadania (łańcuch, wczesne wygaszanie, wygaszanie opóźnienia, późne naciśnięcie) wykazała znaczący główny efekt dźwigni (F (1,4) = 45.7, p = 0.003), który był spowodowany znacznie szybszymi odpowiedziami na TL niż SL (Rys. 5 B), spójne z wydajnością podczas typowych wzmocnionych sesji i znaczącym głównym efektem fazy wygaszania (F (3,12) = 14.5, p <0.001). Dla SL, SLP odpowiedzi podczas wczesnego wymierania były podobne do tych podczas wzmocnionej sesji łańcuchowej (Tukey: p = 1.0), ale znacznie spowolnione przez opóźnienie (p = 0.02 vs wczesne) i późne naciśnięcie (p = 0.003 vs wczesne) fazy. Jednak opóźnienia prasy na SL były podobne między fazą opóźnienia i późną (p = 0.89). W przypadku pras TL zmiany opóźnienia odpowiedzi były bardziej subtelne, a faza późna była znacznie wolniejsza niż faza wczesna (p = 0.04). Jednak kontrast liniowy stanowił największą część wariancji w przesunięciu opóźnienia TL (F (1,4) = 11.08, p = 0.03; 86% wariancji efektu głównego), podczas gdy dla SL kontrast porównujący łańcuch i wczesny w porównaniu z fazą opóźnioną i późną stanowił największą część wariancji efektu (F (1,4) = 15.42, p = 0.02; 97% wariancji efektu głównego).

Wymieranie: pominięty wynik w różny sposób zwiększa sygnał rdzenia i powłoki DA

Sygnalizacja DA związana z zdarzeniem w NAc zmieniła się, gdy szczur przeszedł przez zdefiniowane behawioralnie fazy wymierania. Sposób, w jaki kodowanie DA zostało dotknięte wyginięciem, uderzająco różniło się między rdzeniem a powłoką (Rys. 6).

Rysunek 6. 

Uwalnianie DA w rdzeniu ( A - C ) i powłoki ( D - F ) podczas wyginięcia. A , Dostosowanie do SLO w rdzeniu ujawniło się ciągłe zmniejszanie uwalniania rdzenia DA do cue w iteracyjnych próbach ekstynkcji (niebieskie linie) względem nagradzanych sesji łańcuchowych (czarna linia). Uwolnienie BvCore DA do odpowiedzi operanta i nagrody podczas wzmocnionego harmonogramu łańcucha (czarny) i wczesnego wygaszania (niebieski) wyrównanego do TLP zdarzenie. Szary pasek pokazuje zakres maksymalnych i minimalnych stężeń DA w okresie odniesienia. C , Peak DA względem SLP, TLPi nagrodę we wzmocnionym harmonogramie i wczesnym wymarciu. D , Dostosowanie do SLO w powłoce (czerwone linie) ujawniły się bardziej dyskretne spadki fazowego uwalniania DA do cue w iteracyjnych próbach ekstynkcji względem nagradzanych sesji łańcuchowych (czarna linia). E , Sygnalizacja DA wyrównana do TLP w skorupie we wczesnym wymarciu (czerwony) i wzmocnionym harmonogramie łańcucha (czarny). F , Peak DA w powłoce nie zmienił się w SLP, ale pokazał znaczne spadki w TLP i nagroda. *p <0.05, **p <0.01, łańcuch a wczesne wymieranie; †p <0.05, pominięcie mniejsze niż wartość wyjściowa.

Najpierw zbadaliśmy sygnalizację DA w jądrze podczas wygaszania. W stosunku do SLO, DA znacząco i liniowo zmniejszał się w różnych fazach wymierania w stosunku do nagradzanej sesji łańcucha (interakcja: faza × cue; SLO vs linia bazowa; F (4,157) = 33.19, p <0.0001; Rys. 6 A. Post hoc porównania par pokazały, że szczytowy DA do SLO gwałtownie spadła między fazami łańcucha i wczesnego wygaszania (Tukey: p <0.0001) i ponownie między wczesnym a późnym wymieraniem (p <0.0001). Jednak DA w okresie wygaszania z opóźnieniem nie różnił się od tego w późnym bloku prasowym (p = 0.64) i pik DA nie różnił się w późnej fazie w oparciu o to, czy szczur zareagował czy nie (późna prasa vs późna brak prasy, p = 0.99). Dalej, wydanie DA podczas SLO był znacznie większy niż linia bazowa w łańcuchu (p <0.0001), wczesne wymieranie (p <0.0001) i wygaszanie z opóźnieniem (p <0.001), ale nie w późnych fazach druku lub późnych fazach braku prasy (obie p > 0.5). Te wyniki parami potwierdziły istotny ujemny trend liniowy (F (1,157) = 94.77, p <0.0001), co stanowiło większość (71%) wariancji efektu.

Następnie jedną z cech charakterystycznych sygnałów PE w mózgu jest obecność błędów prognozowania negatywnego w czasie pominiętej oczekiwanej nagrody (Schultz i wsp., 1997). Spodziewaliśmy się, że sygnały te będą najsilniejsze na początku wymarcia, gdy podmiot miał pełne oczekiwanie, że nagroda zostanie dostarczona. W rdzeniu (Rys. 6 B), dwukierunkowa ANOVA wskazała na znaczącą interakcję fazy x zdarzenia (łańcuch vs wczesne wygaszenie; F (3,57) = 3.24, p = 0.029). W szczególności, chociaż szczytowe uwalnianie DA względem poprzedniej SLP został znacznie zmniejszony na początku wymierania w stosunku do wzmocnionej sesji łańcuchowej (Tukey: p = 0.019), uwolnienie DA do TLP był nienaruszony (p = 0.41). Co najważniejsze, rdzeń DA wykazał dowody błędu prognozowania ujemnego podczas wygaszania (Rys. 6 B) takie, że zwolnienie DA w czasie oczekiwanej, ale pominiętej nagrody było znacznie niższe niż podczas sesji wzmocnionej (p = 0.003). Rzeczywiście, podczas gdy szczytowe uwalnianie DA do nagrody nie różniło się od linii podstawowej podczas wzmocnionej sesji Łańcucha (p = 0.99), przesunął się na znacznie mniej niż poziom bazowy podczas pominięć nagrody (p = 0.03). Zatem sygnały DA w rdzeniu podczas wczesnej ekstynkcji wykazywały zarówno dynamiczne przesunięcia w uwalnianiu, aby przewidywać bodźce SL i działania, brak zmian w stosunku do wskaźnika TL, oraz błąd przewidywania ujemnego w celu nagradzania pominięcia.

Powłoka pokazała inny wzór uwalniania DA w stosunku do SLO wskazówka (Rys. 6 D). Tutaj uśredniony tematycznie DA do SLO dynamicznie zmieniany w różnych fazach (interakcja: faza × cue; F (2,24) = 7.95, p <0.0005), ale w przeciwieństwie do rdzenia, DA powłoki nie zmienił się między fazą łańcucha a wczesnym wymieraniem, (p = 0.74), ale sygnalizacja DA do SLO został znacznie zmniejszony podczas fazy ekstynkcji opóźnienia w stosunku do fazy wzmocnionego łańcucha (p = 0.041) i wczesna faza wygaszania (p = 0.02), zbieżne z motywacyjną zmianą zachowania szczurów (Rys. 5). Sygnalizacja DA znacząco zmniejszyła się ponownie między fazą opóźnienia i późnymi fazami (późna prasa, p = 0.03; późno bez prasy, p = 0.004), ale nie było różnicy poziomów DA między późnymi fazami (prasa kontra brak prasy, p = 0.43). Tak jak w rdzeniu, wydanie DA podczas SLO był znacznie powyżej linii bazowej podczas fazy łańcucha, wczesnego wygaszania i wygaszania opóźnienia (Tukey: wszystko p <0.001), ale żadna z późnych faz nie różniła się istotnie od wartości wyjściowej. W ten sposób rdzeń DA szybko i stale śledził zmiany w przewidywaniu najbardziej predykcyjnej wskazówki, podczas gdy wzorce uwalniania DA dla tej samej wskazówki w powłoce zamiast tego śledziły zmiany w stanie motywacji pomiędzy fazami wygaszania.

Patrząc na naciskanie i sygnalizowanie nagrody, uwalnianie DA powłoki różniło się od wzoru w rdzeniu (Rys. 6 E,F). Dwuczynnikowa ANOVA badająca DA na poszczególnych próbach za pomocą typu bodźca (BL, SLP, TLP, nagroda) i faza wygaszania (łańcuch, wczesne wyginięcie) znalazły znaczącą interakcję między bodźcem x wymarciem (F (3,108) = 11.5, p <0.0001; Rys. 6 D). W przeciwieństwie do rdzenia, nie było różnicy w wydaniu DA powłoki szczytowej na SLP wczesne wymieranie (p = 0.44). Zamiast tego wygaszenie spowodowało znaczące zmniejszenie uwalniania DA zarówno do TLP (p = 0.01) oraz w momencie pominięcia nagrody w stosunku do otrzymania nagrody (p <0.0001) względem dopasowanego czasu podczas wzmocnionego harmonogramu łańcucha. Podczas nagradzanej sesji łańcuchowej DA był znacznie podwyższony powyżej linii bazowej (p <0.0001), ale podczas pominięcia nagrody DA była liczbowo większa niż, ale nie statystycznie różna od wartości wyjściowej (p = 0.07). Tak więc, w przeciwieństwie do rdzenia, znaleźliśmy ograniczone dowody na wczesne błędy przewidywania ekstynkcji, a zamiast tego zmniejszenie uwalniania DA względem prasy TL (ale nie SL), jak również eliminację uwalniania DA przy nagrodzie obserwowanej podczas wzmocnionego harmonogramu.

Dyskusja

Fazowe wzory uwalniania DA śledziły bodźce, które uderzająco różniły się między podregionami NAc w sposób zgodny z kontrastującymi teoriami funkcji DA. W dobrze wyuczonym zadaniu harmonogramu łańcucha DA w rdzeniu NAc selektywnie osiąga szczyt przy najbardziej predykcyjnej cue i liniowo śledzone zmiany wartości predykcji i błędy podczas wygaszania. W przeciwieństwie do tego, fazowe uwalnianie DA w powłoce NAc śledziło wszystkie istotne bodźce, gdy zadanie było nagradzane, i zarówno w trakcie sesji, jak i podczas wygaszania, wykazywały zmiany w sygnalizacji zgodne z przesunięciami w motywacji. Jako takie proponujemy, aby te sygnały DA były jednocześnie dostępne dla zwierzęcia podczas zachowania, umożliwiając zarówno informacje prognostyczne, jak i motywacyjne, aby kierować uczeniem się i działaniem.

Błąd przewidywania ścieżek Core DA release

W rdzeniu, DA phasically wzrosło w czasie prezentacji SL sygnału i spadło do linii bazowej dla w pełni przewidywanych późniejszych zdarzeń (np. TL, nagroda), podobnie do poprzednich ustaleń (Roitman i wsp., 2004; Cacciapaglia i in., 2012). Ten wzorzec aktywności jest zgodny z modelami przewidywania błędów, które stwierdzają, że maksymalnie przewidywalne sygnały powinny wywoływać najwyższe uwalnianie DA (tj. Przewidywanie), podczas gdy dokładnie przewidywane zdarzenia, które następują, powinny wywoływać minimalne uwalnianie DA (tj. Błąd przewidywania). Tak więc, ponieważ TL i nagroda były dokładnie przewidywane przez SL, generowały one niewielki błąd przy ich dostarczaniu i wywoływały niewielkie związane z błędami uwalnianie DA (Schultz i wsp., 1997; Schultz i Dickinson, 2000).

Nasze laboratorium i inni wykazali, że sygnały DA w rdzeniu są wrażliwe na różnice w przewidywanej wartości i są modulowane przez subiektywne czynniki, takie jak preferencje ryzyka i opóźnienia wzmocnienia (Day i in., 2010; Gan i in., 2010; Sugam i in., 2012; Saddoris i in., 2013, 2015). Na przykład, u szczurów wykonujących ryzykowne zadanie decyzyjne, podstawowy DA skalowany za pomocą wskazówek, które przewidywały preferowaną opcję szczura i szybko spadał poniżej linii bazowej, gdy oczekiwane nagrody zostały pominięte, co wskazuje na negatywny błąd prognozySugam i in., 2012). Podobnie rdzeń DA śledził zarówno wartość przewidywanych wyników, jak i dynamicznie przesuwany na podstawie zaktualizowanej przewidywanej wartości cue podczas wygaszania. Rzeczywiście, wydanie DA do SLO nie różniła się od linii podstawowej do czasu, gdy szczur zaczął pomijać reakcje podczas wymierania, niezależnie od tego, czy odpowiedź została udzielona, ​​sugerując, że DA zasygnalizował przewidywaną wartość odpowiedzi, a nie motywację do naciskania. Ponadto, pominięcia nagrody we wczesnym wymarciu wywołały silne przerwy w uwalnianiu DA, zgodnie z ujemną prognozą sygnalizacji błędu.

Powłoka DA śledzi istotne bodźce motywacyjne

Uwalnianie DA w powłoce dyskretnie śledziło wszystkie istotne bodźce (SLO, TLO, R). Wzorów tych nie można wyjaśnić wolniejszą kinetyką wychwytu zwrotnego i zamiast tego wydają się odzwierciedlać kodowanie zdarzeń warunkowych w czasie rzeczywistym (Pan i in., 2005) i nabyte zachęty motywacyjne (Berridge i Robinson, 1998; Berridge, 2012; Wassum i wsp., 2012). Zatem zdarzenia uwalniania DA zakodowały zarówno podpowiedzi, jak i nagrody w powłoce, ale tylko podpowiedzi prognostyczne w rdzeniu (Cacciapaglia i in., 2012).

Znaleźliśmy dowody na ten motywacyjny składnik sygnalizacji DA powłoki. Po pierwsze, sygnalizacja DA w powłoce na bodźce została zmniejszona między początkiem a końcem sesji, co nie było widoczne w rdzeniu. Jednym z wyjaśnień jest to, że szczury pod koniec sesji były po prostu bardziej nasycone (z definicji zjadły więcej pokarmu niż na początku sesji), i jako takie wskazówki przewidujące jedzenie odzwierciedlały zmniejszony stan motywacyjny zwierzęcia . W przeciwieństwie do tego, wskazówki wciąż dokładnie przewidywały dostarczanie peletek sacharozy, więc kodowanie typu PE w rdzeniu było stosunkowo mniej dotknięte przez tę zmianę motywacyjną.

Po drugie, podczas wygaszania, uwolnienie DA w powłoce do SLO pozostawała stabilna, gdy szczur wykonywał zadanie na tym samym poziomie motywacji (na co wskazywało opóźnienie odpowiedzi i dokładność), ale znacznie spadła po spadku motywacji szczurów (tj. opóźnienia odpowiedzi) w trakcie wygaszania. W przeciwieństwie do tego, zaobserwowaliśmy gwałtowny spadek fazowego uwalniania DA podczas bodźca TL. Modele SI przewidują, że wskazówki, które zmniejszają niepewność, powinny tworzyć większą motywację i znaczenie motywacyjne (Zhang i in., 2009; Smith i wsp., 2011), który tutaj jest tendencyjny w kierunku TL, ponieważ jest to maksymalny prognostyk nadchodzącej nagrody. Rzeczywiście, infuzje amfetaminy wewnątrz powłoki NAc selektywnie wzmacniają kodowanie sygnałów najbardziej zbliżone do dostarczania nagrody w łańcuchowym zadaniu pavlovian, ale mają mniejszy wpływ na pierwszą wskazówkę w sekwencji (Smith i wsp., 2011). Zatem kodowanie DA przez TL było szczególnie wrażliwe na przewidywaną utratę dostarczenia nagrody w przypadku wyginięcia. Zaskakująco, pominięcia nagrody nie spowodowały uwolnienia DA poniżej linii podstawowej, co sugeruje, że powłoka DA była mniej skłonna do kodowania negatywnego błędu przewidywania niż rdzeń. Łącznie ten wzorzec sygnalizacji w powłoce NAc jest wyraźnie różny od rdzenia i sugeruje kodowanie typu IS.

W uzasadnieniu, powłoka NAc została powiązana z różnymi zachowaniami motywowanymi. Na przykład apetyt na sól, w którym słony roztwór jest zwykle niechętny, może być satysfakcjonujący, jeśli zwierzę jest pozbawione soli. W obu przypadkach przewidywany wynik (sól) jest taki sam, ale motywacja do uzyskania tego wyniku różni się między zwierzętami normalnymi i pozbawionymi soli (Tindell i in., 2009). Kodowanie neuronowe NAc dla roztworu soli jest modulowane w powłoce w oparciu o stopień motywacji solą, podczas gdy neurony rdzeniowe nie wykazują różnic opartych na stanie (Loriaux i in., 2011). Podobnie, mikro-wlewy amfetaminy w obrębie powłoki NAc silnie wzmacniają motywacyjny wigor nacisku dźwigni w obecności wskazówki podczas transferu Pavloviana do instrumentu (PIT), podobnie jak przewlekłe przeżycie wstępne z kokainą (Wyvell i Berridge, 2000; Saddoris i in., 2011; LeBlanc i in., 2013). Rzeczywiście, doświadczenie z samodzielnie podawaną kokainą, która wzmacnia zachowanie PIT, również korzystnie zwiększa kodowanie neuronowe powłoki NAc względem rdzenia (Saddoris i in., 2011).

Ten wzór IS i PE w powłoce i rdzeniu wydaje się śledzić zarówno warunki apetyczne, jak i awersyjne. W warunkowaniu strachu przez pavlovian, fazowy wzrost DA w powłoce NAc dla istotnych sygnałów awersyjnych, podczas gdy widzenie uwolnienia rdzenia DA zmniejsza się i zatrzymuje w zwolnieniu wskazującym na przewidywanie typu PE negatywnego wyniku (Badrinarayan i in., 2012). Zatem nawet negatywne (ale najistotniejsze) zdarzenia można wyjaśnić za pomocą modelu typu IS w powłoce, podczas gdy podstawowe uwalnianie DA pozostaje silnie powiązane z przewidywaniami wartości wyniku.

Złożoność sygnalizacji PE i IS w kondycjonowaniu

Jedynym zastrzeżeniem jest to, że w uwarunkowaniach pavlovian, zwierzęta, które preferencyjnie oddziałują z sygnałami predykcyjnymi („trackerami znakowymi”), wykazują zwiększone uwalnianie DA w rdzeniu NAc w porównaniu z tymi, które natychmiast trafiają do kubka z jedzeniem („trackery celu”; Flagel i wsp., 2011). To zwiększone śledzenie znaków jest opisywane jako wspieranie IS, ponieważ sygnał stał się istotnym bodźcem zdolnym do działania jako „magnes” motywacyjny i zgodny z podobnymi ustaleniami w rdzeniu (Aragona i in., 2009; Peciña i Berridge, 2013; Wassum i wsp., 2013; Ostlund i in., 2014). Wydaje się, że jest to sprzeczne z naszym przypisaniem PE skierowanym do rdzenia i IS do powłoki.

Ważne jest, aby zauważyć, że odpowiednie role sygnału DA w rdzeniu i powłoce są prawdopodobnie złożone. Na przykład, niektóre z powyższych badań niezależnie zbadały rolę muszli i jądra w tych zadaniach, więc zwiększona DA w rdzeniu u zwierząt śledzących znak może po prostu odzwierciedlać ogólny wzrost zachętowych sygnałów DA w szlaku mezolimbicznym. Ponadto nie opowiadamy się za absolutnym podziałem; znaleźliśmy trochę uwolnienia DA do TLO w centrum, chociaż DA do SLO w powłoce przetrwał pomimo zmian w motywacji podczas wymierania, sugerując, że cechy IS mogą być obecne w rdzeniu i PE w powłoce (choć na niższych poziomach i / lub mniej wrażliwe na dynamikę zadań). Raczej sugerujemy, że rdzeń i powłoka stanowią krytyczne odchylenie w kierunku wzorców kodowania typu PE i IS, co jest zgodne z bardziej stopniowanym składem anatomii prążkowia (Haber, 2014).

Implikacje dla uzależnienia

Modelowe różnice w sygnalizacji DA i rdzenia mają ważne implikacje wykraczające poza naturalne uczenie się o nagrodę. Na przykład, chociaż narkotyki początkowo przynoszą satysfakcję, z czasem bodźce związane z lekami mogą wywoływać uczucie intensywnego pragnienia awersji, narzucając negatywny stan afektywny, który napędza poszukiwanie narkotyków (Koob i Le Moal, 1997). Długotrwała abstynencja od narkotyków zwiększa wpływ bodźców związanych z narkotykami, chociaż proces znany jest jako inkubacja głodu (Grimm i wsp., 2001; Hollander i Carelli, 2005; Pickens i in., 2011). Przewidywany wynik (lek) pozostaje niezmieniony zarówno w stanie natychmiastowym, jak i abstynencyjnym, ale obserwuje się głęboki wzrost motywacji do wznowienia przyjmowania narkotyków u osób abstynentów. Sugeruje to znaczącą zmianę w znaczeniu tych bodźców i sugerowałoby, że zmiany związane z abstynencją powinny być preferencyjnie widoczne w powłoce. Podobnie, gdy szczurom, które samodzielnie przyjmują narkotyki, prezentowane są sygnały predykcyjne dla kokainy, które wywołują awersyjny stan motywacyjny, zmiany w sygnalizacji DA śledzą awersyjny stan zwierzęcia w skorupie, ale nie w rdzeniu (Wheeler i in., 2011). Podsumowując, odkrycia te potwierdzają, że wkład DA w rdzeń i otoczkę w proces uczenia się i motywację jest spójny zarówno w przypadku nagród naturalnych, jak i leków.

Przypisy

  • Otrzymano czerwiec 18, 2015.
  • Wersja otrzymana w lipcu 8, 2015.
  • Zaakceptowano lipiec 15, 2015.
  • Prace te były wspierane przez National Institutes on Drug Abuse Grants DA028156 i DA035322 na MPS oraz DA017318 i DA034021 na RMC, a DA010900 na RMW Dziękujemy dr Elizabeth West za komentarze do wcześniejszego projektu tej pracy.

  • Autorzy deklarują brak konkurencyjnych interesów finansowych.

  • Korespondencję należy kierować do dr Michaela Saddorisa, Wydziału Psychologii i Neuronauki, University of Colorado Boulder, Muenzinger, UCB 345, Boulder, CO 80309-0345. [email chroniony]

Referencje

    1. Aragona BJ,
    2. Dzień JJ,
    3. Roitman MF,
    4. Cleaveland NA,
    5. Wightman RM,
    6. Carelli RM

    (2009) Regionalna specyficzność w rozwoju w czasie rzeczywistym fazowych wzorców transmisji dopaminy podczas nabywania skojarzenia cue-kokainy u szczurów. Eur J Neurosci 30: 1889 – 1899.

    1. Badrinarayan A,
    2. Wescott SA,
    3. Vander Weele CM,
    4. Saunders BT,
    5. Couturier BE,
    6. Maren S,
    7. Aragona BJ

    (2012) Bodźce awersyjne różnie modulują dynamikę transmisji dopaminy w czasie rzeczywistym w jądrze półleżącym rdzenia i powłoki. J Neurosci 32: 15779 – 15790.

    1. Berridge KC

    (2012) Od błędu prognozowania do zachęty motywacyjnej: obliczenia mezolimbiczne motywacji nagrody. Eur J Neurosci 35: 1124 – 1143.

    1. Berridge KC,
    2. Robinson TE

    (1998) Jaka jest rola dopaminy w nagrodzie: wpływ hedoniczny, uczenie się nagrody lub motywacja? Brain Res Rev 28: 309 – 369.

    1. Bromberg-Martin ES,
    2. Matsumoto M,
    3. Hikosaka O

    (2010) Dopamina w kontroli motywacyjnej: nagradzanie, awersja i alarmowanie. Neuron 68: 815 – 834.

    1. Budygin EA,
    2. John CE,
    3. Mateo Y,
    4. Jones SR

    (2002) Brak działania kokainy na klirens dopaminy w rdzeniu i skorupie jądra półleżącego myszy z nokautem transportera dopaminy. J Neurosci 22: RC222.

    1. Cacciapaglia F,
    2. Saddoris MP,
    3. Wightman RM,
    4. Carelli RM

    (2012) Różnicowa dynamika uwalniania dopaminy w jądrze półleżącym rdzenia i powłoki śledzi różne aspekty ukierunkowanego zachowania dla sacharozy. Neuropharmacology 62: 2050 – 2056.

    1. Cohen JY,
    2. Haesler S,
    3. Vong L,
    4. Lowell BB,
    5. Uchida N

    (2012) Sygnały specyficzne dla typu neuronowego dla nagrody i kary w brzusznym obszarze nakrywkowym. Natura 482: 85 – 88.

    1. Dzień JJ,
    2. Jones JL,
    3. Wightman RM,
    4. Carelli RM

    (2010) Fazowe jądro półleżące uwalnianie dopaminy koduje koszty związane z wysiłkiem i opóźnieniem. Biol Psychiatry 68: 306 – 309.

    1. Flagel SB,
    2. Clark JJ,
    3. Robinson TE,
    4. Mayo L,
    5. Czujniki A,
    6. Willuhn I,
    7. Akers CA,
    8. Clinton SM,
    9. PE Phillips,
    10. Akil H

    (2011) Selektywna rola dopaminy w nauce o nagradzaniu bodźców. Natura 469: 53 – 57.

    1. Gan JO,
    2. Walton ME,
    3. Phillips PE

    (2010) Dysocjowalne kodowanie kosztów i korzyści przyszłych nagród przez mezolimbiczną dopaminę. Nat Neurosci 13: 25 – 27.

    1. Grimm JW,
    2. Hope BT,
    3. Wise RA,
    4. Shaham Y

    (2001) Neuroadaptacja: inkubacja głodu kokainowego po odstawieniu. Natura 412: 141 – 142.

    1. Haber SN

    (2014) Miejsce dopaminy w obwodzie zwojów korowo-podstawnych. Neuroscience 282C: 248 – 257.

    1. Heien ML,
    2. Khan AS,
    3. Ariansen JL,
    4. Cheer JF,
    5. PE Phillips,
    6. Wassum KM,
    7. Wightman RM

    (2005) Pomiar wahań dopaminy w czasie rzeczywistym po kokainie w mózgu zachowujących się szczurów. Proc Natl Acad Sci USA 102: 10023 – 10028.

    1. Hollander JA,
    2. Carelli RM

    (2005) Wstrzemięźliwość od samodzielnego podawania kokainy potęguje kodowanie neuronalne zachowań ukierunkowanych na cel w półleżących. Neuropsychopharmacology 30: 1464 – 1474.

    1. Keithley RB,
    2. Carelli RM,
    3. Wightman RM

    (2010) Estymacja rangowa i analiza wielowymiarowa in vivo cykliczne dane woltamperometryczne z szybkim skanowaniem. Anal Chem 82: 5541 – 5551.

    1. Koob GF,
    2. Le Moal M

    (1997) Nadużywanie narkotyków: hedoniczne rozregulowanie homeostazy. nauka 278: 52 – 58.

    1. LeBlanc KH,
    2. Maidment NT,
    3. Ostlund SB

    (2013) Powtarzająca się ekspozycja na kokainę ułatwia ekspresję motywującej motywacji i wywołuje nawykową kontrolę u szczurów. PloS One 8: e61355.

    1. Loriaux AL,
    2. Roitman JD,
    3. Roitman MF

    (2011) Nucleus accumbens shell, ale nie rdzeń, śledzi wartość motywacyjną soli. J Neurophysiol 106: 1537 – 1544.

    1. Olmstead MC,
    2. Parkinson JA,
    3. Miles FJ,
    4. Everitt BJ,
    5. Dickinson A

    (2000) Poszukiwanie kokainy przez szczury: regulacja, wzmocnienie i aktywacja. Psychopharmacology 152: 123 – 131.

    1. Ostlund SB,
    2. LeBlanc KH,
    3. Kosheleff AR,
    4. Wassum KM,
    5. Maidment NT

    (2014) Fazowa mezolimbiczna sygnalizacja dopaminy koduje ułatwienie motywacji motywacyjnej wywołanej powtarzaną ekspozycją na kokainę. Neuropsychopharmacology 39: 2441 – 2449.

    1. Owesson-White CA,
    2. Ariansen J,
    3. Stuber GD,
    4. Cleaveland NA,
    5. Cheer JF,
    6. Wightman RM,
    7. Carelli RM

    (2009) Kodowanie neuronowe zachowania poszukującego kokainy jest zbieżne z fazowym uwalnianiem dopaminy w rdzeniu i powłoce półleżącej. Eur J Neurosci 30: 1117 – 1127.

    1. Pan WX,
    2. Schmidt R,
    3. Wickens JR,
    4. Hyland BI

    (2005) Komórki dopaminowe reagują na przewidywane zdarzenia podczas warunkowania klasycznego: dowody na ślady kwalifikowalności w sieci uczenia się nagrody. J Neurosci 25: 6235 – 6242.

    1. Peciña S,
    2. Berridge KC

    (2013) Dopamina lub stymulacja opioidowa jądra półleżącego podobnie wzmacniają wyzwalane przez cue „pragnienie” nagrody: cały rdzeń i środkowa powłoka odwzorowane jako substraty dla wzmocnienia PIT. Eur J Neurosci 37: 1529 – 1540.

    1. Pickens CL,
    2. Airavaara M,
    3. Theberge F,
    4. Fanous S,
    5. Hope BT,
    6. Shaham Y

    (2011) Neurobiologia inkubacji głodu narkotykowego. Trendy Neurosci 34: 411 – 420.

    1. Czerwonawa AD

    (2004) Uzależnienie jako proces obliczeniowy zepsuty. nauka 306: 1944 – 1947.

    1. Robinson TE,
    2. Berridge KC

    (2008) Recenzja: teoria uzależnienia od zachęt motywacyjnych: niektóre aktualne problemy. Philos Trans R Soc Lond B Biol Sci 363: 3137 – 3146.

    1. Roitman MF,
    2. Stuber GD,
    3. PE Phillips,
    4. Wightman RM,
    5. Carelli RM

    (2004) Dopamina działa jako subsekundowy modulator poszukiwania pożywienia. J Neurosci 24: 1265 – 1271.

    1. Saddoris MP,
    2. Gallagher M,
    3. Schoenbaum G

    (2005) Szybkie kodowanie asocjacyjne w jądrze podstawno-bocznym zależy od połączeń z korą oczodołowo-czołową. Neuron 46: 321 – 331.

    1. Saddoris MP,
    2. Stamatakis A,
    3. Carelli RM

    (2011) Neuronowe korelaty przeniesienia Pavlovian-instrumental w jądrze półleżącym są selektywnie wzmacniane po podaniu kokainy. Eur J Neurosci 33: 2274 – 2287.

    1. Saddoris MP,
    2. Sugam JA,
    3. Cacciapaglia F,
    4. Carelli RM

    (2013) Szybka dynamika dopaminy w rdzeniu i powłoce półleżącej: uczenie się i działanie. Front Biosci (Elite Ed) 5: 273 – 288.

    1. Saddoris MP,
    2. Sugam JA,
    3. Stuber GD,
    4. Witten IB,
    5. Deisseroth K,
    6. Carelli RM

    (2015) Mesolimbiczna dopamina dynamicznie śledzi i jest powiązana przyczynowo z dyskretnymi aspektami podejmowania decyzji opartych na wartościach. Biol Psychiatry 77: 903 – 911.

    1. Schoenbaum G,
    2. Setlow B,
    3. Saddoris MP,
    4. Gallagher M.

    (2003) Kodowanie przewidywanego wyniku i wartości nabytej w korze oczodołowo-czołowej podczas próbkowania cue zależy od danych wejściowych z podstawy ciała bocznego. Neuron 39: 855 – 867.

    1. Schultz W,
    2. Dickinson A

    (2000) Kodowanie neuronowe błędów prognozowania. Annu Rev Neurosci 23: 473 – 500.

    1. Schultz W,
    2. Dayan P,
    3. Montague PR

    (1997) Neuronowy substrat przewidywania i nagrody. nauka 275: 1593 – 1599.

    1. Smith KS,
    2. Berridge KC,
    3. Aldridge JW

    (2011) Rozplątywanie przyjemności z bodźców motywacyjnych i sygnałów uczenia się w obwodach nagradzania mózgu. Proc Natl Acad Sci USA 108: E255 – E264.

    1. Sugam JA,
    2. Dzień JJ,
    3. Wightman RM,
    4. Carelli RM

    (2012) Fazowe jądro półleżące dopamina koduje oparte na ryzyku zachowanie decyzyjne. Biol Psychiatry 71: 199 – 205.

    1. Tindell AJ,
    2. Smith KS,
    3. Berridge KC,
    4. Aldridge JW

    (2009) Dynamiczne obliczanie współczynnika zachęt: „pragnienie” tego, co nigdy nie było „lubiane”. J Neurosci 29: 12220 – 12228.

    1. Tobler PN,
    2. Dickinson A,
    3. Schultz W

    (2003) Kodowanie przewidywanego pominięcia nagrody przez neurony dopaminowe w warunkowanym modelu hamowania. J Neurosci 23: 10402 – 10410.

    1. Waelti P,
    2. Dickinson A,
    3. Schultz W

    (2001) Odpowiedzi dopaminowe są zgodne z podstawowymi założeniami teorii uczenia się formalnego. Natura 412: 43 – 48.

    1. Wassum KM,
    2. Ostlund SB,
    3. Maidment NT

    (2012) Fazowa mezolimbiczna sygnalizacja dopaminy poprzedza i przewiduje wykonanie samoczynnie inicjowanego zadania sekwencji czynności. Biol Psychiatry 71: 846 – 854.

    1. Wassum KM,
    2. Ostlund SB,
    3. Gew Loewinger,
    4. Maidment NT

    (2013) Fazowe mezolimbiczne ścieżki uwalniania dopaminy poszukujące nagrody podczas ekspresji transferu Pavlovian-instrumental. Biol Psychiatry 73: 747 – 755.

    1. Wheeler RA,
    2. Aragona BJ,
    3. Fuhrmann KA,
    4. Jones JL,
    5. Dzień JJ,
    6. Cacciapaglia F,
    7. Wightman RM,
    8. Carelli RM

    (2011) Sygnały kokainowe napędzają przeciwstawne zmiany kontekstowe w przetwarzaniu nagród i stanie emocjonalnym. Biol Psychiatry 69: 1067 – 1074.

    1. Wyvell CL,
    2. Berridge KC

    (2000) Amfetamina wewnątrz półleżąca zwiększa uzależnienie warunkowe nagród sacharozy: zwiększenie „chęci” nagrody bez zwiększonego „lubienia” lub wzmocnienia odpowiedzi. J Neurosci 20: 8122 – 8130.

    1. Yorgason JT,
    2. España RA,
    3. Jones SR

    (2011) Demoniczna woltamperometria i oprogramowanie do analizy: analiza indukowanych kokainą zmian w sygnalizacji dopaminy przy użyciu wielu miar kinetycznych. J Neurosci Methods 202: 158 – 164.

    1. Zhang J,
    2. Berridge KC,
    3. Tindell AJ,
    4. Smith KS,
    5. Aldridge JW

    (2009) Neuronowy model obliczeniowy zachęty. PLoS Comput Biol 5: e1000437.

  •