Dysocjacyjna dynamika dopaminy dla uczenia się i motywacji (2019)

https://www.nature.com/articles/s41586-019-1235-y

Abstrakcyjny

Projekcja dopaminy z brzusznej okolicy nakrywkowej (VTA) do jądra półleżącego (NAc) ma kluczowe znaczenie dla motywacji do pracy na nagrody i uczenia się z nagrodą. Jak dopamina wspiera obie funkcje, jest niejasne. Pikowanie komórek dopaminy może kodować błędy przewidywania, które są istotnymi sygnałami uczenia się w obliczeniowych teoriach zachowań adaptacyjnych. Z drugiej strony, uwalnianie dopaminy zwiększa się, gdy zwierzęta zbliżają się do nagrody, odzwierciedlając oczekiwanie nagrody. To niedopasowanie może odzwierciedlać różnice w zadaniach behawioralnych, wolniejsze zmiany w pikach komórek dopaminy lub niezależną od skoków modulację uwalniania dopaminy. Tutaj porównujemy skoki zidentyfikowanych komórek dopaminy VTA z uwalnianiem dopaminy NAc w tym samym zadaniu decyzyjnym. Sygnały wskazujące na nadchodzącą nagrodę zwiększyły zarówno skok, jak i uwolnienie. Jednak podstawowe uwalnianie dopaminy w NAc było również powiązane z dynamicznie zmieniającymi się oczekiwaniami nagrody, bez odpowiadających im zmian w pikach komórek dopaminy VTA. Nasze wyniki sugerują fundamentalną różnicę w sposobie regulacji uwalniania dopaminy w celu osiągnięcia różnych funkcji: rozgłaszane sygnały impulsowe sprzyjają uczeniu się, podczas gdy lokalne sterowanie napędza motywację.

Główny

Dopamina jest znana z „nagrody” - ale jak dokładnie? Jedna funkcja polega na uczeniu się z nieoczekiwanych nagród. Krótkie zwiększenie odpalania komórek dopaminy koduje błędy przewidywania nagrody (RPE)1,2,3—Uczenie sygnałów w celu optymalizacji przyszłych motywowanych zachowań. Manipulacje dopaminą mogą wpływać na naukę, tak jakby zmieniały RPE4,5,6, ale wpływają również natychmiast na zachowania motywowane, tak jakby sygnały dopaminy nagradzały oczekiwanie (wartość)5. Ponadto dopamina NAc zwiększa się podczas podejścia zmotywowanego, zgodnie z wartością kodowania dopaminy7,8,9,10,11.

Z kilkoma wyjątkami2,12,13, wypalanie dopaminy w śródmózgowiu zostało zbadane podczas klasycznego warunkowania u zwierząt z unieruchomioną głową3,14, w przeciwieństwie do uwalniania dopaminy w przodomózgowiu. Dlatego porównaliśmy wypalanie z wypuszczeniem w tych samych warunkach. Zidentyfikowaliśmy neurony dopaminy VTA za pomocą znakowania optogenetycznego3,13. Aby zmierzyć uwalnianie dopaminy NAc, zastosowaliśmy trzy niezależne metody - mikrodializę, woltametrię i czujnik optyczny dLight15—Z zbieżnymi wynikami. Nasz główny wniosek jest taki, że chociaż impulsy skokowe dopaminy VTA w skali RPE zapewniają gwałtowne zmiany uwalniania dopaminy odpowiednie do uczenia się, oddzielne wahania dopaminy NAc związane z motywacją powstają niezależnie od wystrzeliwania komórek dopaminy VTA.

Dopamina śledzi motywację w kluczowych lokalizacjach

Ćwiczyliśmy szczury w operacyjnym „bandycie”5 (Figa. 1a, b). W każdej próbie oświetlenie wejścia do nosa („światło włączone”) powodowało podejście i wejście („centrowanie”). Po zmiennym okresie zatrzymania (0.5–1.5 s), biały szum („Go cue”) skłonił szczura do wycofania się („Center-out”) i szturchnięcia sąsiedniego portu („Side-in”). W nagrodzonych próbach temu wydarzeniu Side-in towarzyszyło kliknięcie pojemnika na żywność, które skłoniło szczura do zbliżenia się do portu z jedzeniem („Food-port-in”) w celu zebrania granulatu cukru. Wybory skierowane w lewo i w prawo były nagradzane niezależnymi prawdopodobieństwami, które czasami zmieniały się bez ostrzeżenia. Kiedy szczury częściej otrzymywały nagrodę, były bardziej zmotywowane do wykonania zadania. Było to widoczne w ich „opóźnieniu” - czasie między włączeniem światła i środka-który był wrażliwy na wyniki poprzednich kilku prób (dane rozszerzone, ryc. 1), a tym samym skalowane odwrotnie ze stopą nagrody (ryc. 1b).

Ryc. 1: Covaries uwalniania dopaminy ze stopą nagrody konkretnie w rdzeniu NAc i brzusznej korze przedramiennej.
figure1

a, Zdarzenia bandytów. b, Przykładowa sesja. Górny rząd, prawdopodobieństwo nagrody w każdym bloku (po lewej: po prawej); w drugim rzędzie haczyki oznaczają wynik każdego badania (wysoki, z nagrodą; niski, bez nagrody); wiersz trzeci, oszacowanie wskaźnika nagrody przez przeciekający integrator (czarny) i bieżąca średnia opóźnienia (cyjan; odwrócona skala logarytmiczna); dolny rząd, dopamina rdzeniowa NAc w tej samej sesji (próbki 1-minutowe). DA, dopamina. c, Górne, miejsca mikrodializy w środkowej korze czołowej i prążkowiu (patrz także dane rozszerzone ryc. 1). n = 51 lokalizacji sond od 12 szczurów, każdy z 2 sondami do mikrodializy, które były opuszczane między sesjami. Kolor słupka wskazuje na korelację między dopaminą a stopą nagrody. ACC - przednia kora zakrętu obręczy; dPL, grzbietowa kora przedlimbiczna; vPL, brzuszna kora przedlimbiczna; IL, kora podbrzuszna; DMS, prążkowie grzbietowo-środkowe. Środkowe, uśrednione korelogramy krzyżowe między dopaminą a stopą nagrody. Czerwone słupki wskazują 99% przedział ufności z przetasowanych szeregów czasowych. Na dole, związki między substancjami neurochemicznymi a stopą nagrody (regresja wielokrotna). NA, noradrenalina; 5-HT, serotonina; ACh, acetylocholina; GABA, kwas γ-aminomasłowy; Glu, glutaminian; NM, normetadrenalina; DOPAC, kwas 3,4-dihydroksyfenylooctowy; 3-MT, 3-metoksytyramina; HVA, kwas homowanilinowy; Kwas 5-HIAA, 5-hydroksyindolooctowy. d, Wpływ przejścia bloków na współczynnik nagrody (po lewej), opóźnienie (środek) i rdzeń dopaminy NAc (po prawej). Przejścia zostały sklasyfikowane według tego, czy wzrosła stopa doświadczanych nagród (n = 25) lub zmniejszona (n = 33). Dane pochodzą ze wszystkich 14 sesji, w których mierzono podstawową dopaminę NAc (po jednej na szczura, łącząc dane z nowych i wcześniej zgłoszonych5 zwierzęta) i wykreślono jako średnią ± sem e, Złożone mapy korelacji między dopaminą a stopą nagrody (n = 19 szczurów, 33 sesje, 58 umieszczeń sond). Zarysy atlasu mózgu na tym rysunku zostały odtworzone za zgodą Paxinos i Watson, 200551.

Wcześniej informowaliśmy5 korelacja między uwalnianiem dopaminy NAc a stopą nagrody, zgodna z motywacyjną rolą dopaminy mezolimbicznej16. Tutaj najpierw chcieliśmy ustalić, czy związek ten jest obserwowany w obrębie celów przodomózgowia, zgodnie z sygnalizacją dopaminową „globalnie nadawaną”17lub jest ograniczony do określonych podregionów. Dalej postawiliśmy hipotezę, że dynamika dopaminy różni się między prążkowiem a korą, ponieważ struktury te mają wyraźną kinetykę wychwytu i degradacji dopaminy18 i może używać dopaminy do różnych funkcji19,20.

Używając mikrodializy z wysokosprawną chromatografią cieczową - spektrometrią mas (HPLC – MS), zbadaliśmy przyśrodkową korę czołową i prążkowia (ryc. 1c, Dane rozszerzone Ryc. 1). Jednocześnie testowaliśmy neuroprzekaźniki i metabolity 21 z rozdzielczością czasową 1-min i zastosowaliśmy regresję do porównania chemicznych szeregów czasowych ze zmiennymi behawioralnymi (dane rozszerzone, ryc. 2).

Replikowaliśmy korelację między stopą nagrody a dopaminą NAc - w przeciwieństwie do innych neuroprzekaźników (ryc. 1c, d). Jednak związek ten był zlokalizowany w rdzeniu NAc i nie obejmował powłoki NAc ani prążkowia grzbietowo-przyśrodkowego. W przeciwieństwie do naszej hipotezy zaobserwowaliśmy podobny wzór przestrzenny w korze czołowej: uwalnianie dopaminy korelowało ze stopą nagrody w brzusznej korze przedramiennej, ale nie w podregionach grzbietowych lub brzusznych (ryc. 1c, e). Choć nieoczekiwane, te dwa „gorące punkty” uwalniania dopaminy związane z wartością mają intrygującą analogię w neuroobrazowaniu u ludzi: sygnał zależny od poziomu tlenu we krwi koreluje z wartością subiektywną, szczególnie w NAc i brzuszno-przyśrodkowej korze przedczołowej21.

Odpalanie VTA nie ma związku z motywacją

Następnie zbadaliśmy, czy ta dopamina przodomózgowia związana z motywacją wynika ze zmiennego odpalania komórek dopaminy śródmózgowia. Rdzeń NAc odbiera dopaminę z bocznych części VTA (VTA-1)6,22,23. U unieruchomionych głową neurony dopaminy VTA-1 mają podobną reakcję podobną do RPE na bodźce warunkowane3. Aby zarejestrować komórki dopaminy VTA-1, zainfekowaliśmy VTA wirusem związanym z adenowirusem (AAV) w celu zależnej od Cre ekspresji channelrhodopsin (AAV-DIO-ChR2) u szczurów, które wyrażają rekombinazę Cre pod promotorem hydroksylazy tyrozynowej (TH) (patrz Metody). Optrodes (ryc. 2a, b) zarejestrował reakcje pojedynczej jednostki na krótkie impulsy niebieskiego lasera (ryc. 2c, Dane rozszerzone 3, 4, Uzupełnienie Rys. 1). Znaleźliśmy dobrze izolowane komórki VTA-1 27 z niezawodnymi impulsami o krótkim opóźnieniu i zidentyfikowaliśmy je jako neurony dopaminy.

Ryc. 2: Aktywność zidentyfikowanych neuronów dopaminy VTA nie zmienia się wraz ze stopą nagrody.
figure2

a, Po lewej, schemat optrody z 16 tetrodami wokół światłowodu o średnicy 200 µm. Po prawej, przykład umieszczenia optrode w bocznym VTA. Skala 1 mm. Czerwona hydroksylaza tyrozynowa markera komórek dopaminy; zielony, ChR2 – EYFP; żółty, zachodzą na siebie. Dla wszystkich miejsc docelowych, patrz Dane dodatkowe Rys. 3. b, Skoki komórek dopaminy VTA. Czerwone paski wskazują wykryte wybuchy i liczbę skoków w każdym wybuchu (patrz Metody). Skala 0.5 s, 0.5 mV. c, Przykład odpowiedzi neuronu na impulsy laserowe o rosnącym czasie trwania. d, Szybkość strzelania dla całej sesji w zależności od szerokości ostrza (w połowie maksymalnej) dla każdej komórki VTA. Niebieskie, znakowane komórki dopaminy; fioletowy, wyraźny skupisko domniemanych neuronów niebędących dopaminą. Wypustki, przykłady średnich przebiegów (napięcie ujemne w górę). e, Szybkość odpalania (niebieski; 1-minutowe pojemniki) neuronu dopaminowego VTA podczas zadania bandyty. Opóźnienia (cyjan) współzmienne z szybkością nagrody, ale szybkość strzelania nie. f, Szybkość strzelania dla wszystkich neuronów VTA (niebieska, dopamina; fioletowa, bez dopaminy; szara, niesklasyfikowana) w blokach o niskim lub wysokim wskaźniku nagrody. Żadna z nich nie wykazała istotnych różnic (Wilcoxon podpisał test rangowy przy użyciu pojemników 1-min) P > 0.05 po uwzględnieniu porównań wielokrotnych). g, Średnia korelacja krzyżowa między odpalaniem komórek dopaminy a wskaźnikiem nagrody nie wykazuje istotnego związku. h, Analiza szybkości strzelania dopaminy przy przejściach blokowych (taki sam format jak na ryc. 1d). n = 95 podwyżek nagród, 76 spadków. i. Rozkład interwałów między skokami (ISI, po lewej) i impulsy po skokach (po prawej) pozostają niezmienione między blokami o wyższej i niższej stopie zwrotu (statystyki Kołmogorowa – Smirnowa: ISI, 0.138, P = 0.92; wybuchy, 0.165, P = 0.63).

Wszystkie neurony dopaminy były tonicznie aktywne, ze stosunkowo niską częstotliwością wyładowań (średnia 7.7 Hz, zakres 3.7-12.9 Hz; w porównaniu ze wszystkimi neuronami VTA-XNUMX zarejestrowanymi razem z komórkami dopaminy, P <0.001 jednostronny test Manna – Whitneya). Mieli również dłuższe przebiegi szczytowe (P <5 × 10-6, jednostronny test Manna – Whitneya), choć były wyjątki (ryc. 2d), co potwierdza, że ​​czas trwania fali jest niewystarczającym markerem komórek dopaminy in vivo3,24. Odrębna grupa neuronów VTA-1 (n = 38, z tych samych sesji) z krótkimi przebiegami i wyższymi częstotliwościami wypalania (> 20 Hz; średnio 41.3 Hz, zakres 20.1–97.1 Hz) nie zawierały oznaczonych komórek dopaminy. Zakładamy, że te szybciej działające komórki są GABAergiczne i / lub glutaminergiczne3,25i określ je poniżej jako „bez dopaminy”.

Zarejestrowaliśmy te same komórki dopaminy w wielu zadaniach behawioralnych. Komórki dopaminy VTA-1 reagowały silnie na losowo klikane kliknięcia leja zasypowego, a stopniowo coraz słabiej, gdy kliknięcia te były bardziej przewidywalne na podstawie wcześniejszych wskazówek (dane rozszerzone ryc. 5). Jest to zgodne z kanonicznym kodowaniem podobnym do RPE przez komórki dopaminy w zadaniach pawłowskich2,3,26.

Na podstawie dowodów uzyskanych od znieczulonych zwierząt, wcześniej argumentowano, że zmienione poziomy dopaminy mierzone za pomocą mikrodializy wynikają ze zmian tonicznej szybkości wyładowań komórek dopaminy27 i / lub proporcja aktywnych i nieaktywnych neuronów dopaminy28. Jednak w zadaniu bandytów strzelanie tonicznymi komórkami dopaminy w każdym bloku prób było obojętne na wskaźnik nagród (ryc. 2e, g). Nie było znaczącej zmiany w szybkościach wyzwalania poszczególnych komórek dopaminy lub innych neuronów VTA-1 między blokami o wyższej i niższej nagrodzie (ryc. 2f, godz; patrz także ref. 29 dla zgodnych wyników u myszy z unieruchomioną głową). Nie było również ogólnej zmiany w częstotliwości, z jaką komórki dopaminy strzelają seriami skoków (ryc. 2i). Ponadto nie zaobserwowaliśmy przełączania się komórek dopaminy między stanami aktywnym i nieaktywnym. Odsetek czasu nieaktywności komórek dopaminy (długie interwały między skokami) był bardzo niski i nie zmieniał się pomiędzy blokami o wyższej i niższej nagrodzie (ryc. 2i).

Anatomia projekcji dopaminy VTA – NAc była intensywnie badana6,22,23, ale - biorąc pod uwagę to pozorne niedopasowanie funkcjonalne między odpaleniem a zwolnieniem - potwierdziliśmy, że nagrywamy z właściwej części VTA. Małe zastrzyki wstecznej toksyny cholery B (CTb) do rdzenia NAc spowodowały gęste znakowanie TH+ neurony w tym samym obszarze VTA-1 co nasze zapisy optrode (dane rozszerzone ryc. 3). W przybliżonej strefie zapisu 21% TH+ komórki były również CTb+, i prawdopodobnie będzie to niedoszacowanie frakcji komórek dopaminy VTA-1 wystających z rdzenia NAc, ponieważ nasze wstrzyknięcia znaczników nie wypełniły całkowicie rdzenia NAc. Zatem nasza próbka n = 27 znakowanych komórek dopaminowych VTA (plus wiele innych nieoznakowanych komórek) prawie na pewno zawiera neurony z projekcją rdzeniową NAc. Wreszcie, u dodatkowego szczura zarejestrowaliśmy dwie oznaczone komórki dopaminy VTA-XNUMX po selektywnej infuzji AAV do rdzenia NAc (dane rozszerzone ryc. 3). Obie komórki zakażone wstecznie wykazywały wzorce odpalania, które pod każdym względem bardzo przypominały inne znakowane komórki dopaminy, w tym brak tonicznych zmian w odpalaniu z różnym współczynnikiem nagrody (Rysunek uzupełniający 1). Stwierdzamy, że zmiany w tonicznym odpalaniu komórek dopaminy VTA-1 nie są odpowiedzialne za związane z motywacją zmiany uwalniania dopaminy w przodomózgowiu.

Wersja śledzenia w wielu skalach czasowych

Czy uwalnianie dopaminy NAc samo przez się śledzi wskaźnik nagrody, jak sugerują niektóre teorie30, czy też ta korelacja jest spowodowana dynamicznymi fluktuacjami uwalniania dopaminy, które są zbyt szybkie, aby można je było rozwiązać za pomocą mikrodializy? Argumentowaliśmy za tą drugą możliwością na podstawie danych woltamperometrii5, ale szukał potwierdzenia przy użyciu niezależnej miary uwalniania dopaminy, która może obejmować różne ramy czasowe. Pakiet dLight1 genetycznie kodowanych optycznych wskaźników dopaminy został opracowany przez wstawienie kołowo permutowanej GFP do receptorów dopaminy D115. Wiązanie dopaminy powoduje wysoce specyficzny wzrost fluorescencji (ryc. 3a). Wlewaliśmy AAV do NAc, aby wyrazić albo dLight1.1 (cztery zweryfikowane umiejscowienie NAc od trzech szczurów), albo jaśniejszy wariant dLight1.3b (sześć zweryfikowanych umiejscowień NAc od czterech szczurów) i monitorowaliśmy fluorescencję za pomocą fotometrii włókien. Zaobserwowaliśmy wyraźne odpowiedzi dopaminy NAc na sygnały Pavlovian przewidujące nagrodę, podobnie jak odpalanie komórek dopaminy VTA (dane rozszerzone, ryc. 5).

Ryc. 3: Mostkowe ramy czasowe pomiaru dopaminy.
figure3

a, Odpowiedź fluorescencji dLight1.3b. Wkładka, miareczkowanie dopaminy (n = 15 interesujących regionów (ROI)) i noradrenalina (n = 9). Główna figura, neuroprzekaźniki nakładane w kąpieli (all n = 12 ROI). Jego, histamina. b, Przykładowa sesja bandyty obejmująca znormalizowany sygnał NAc dLight1.3b (1-min bins). c, Sygnał dLight zmienia się wraz z przejściem bloku. n = 35 podwyżek stawki nagród, 45 spadków. d, Korelacja krzyżowa między dLight a stopą nagrody. e, Bliższy widok zacieniowanej części b. Strzałki: czarne, środkowy nos do wewnątrz; jasnoczerwony, Side-in (z nagrodą); jasnoniebieski, z boku (bez nagrody); ciemnoczerwony, wejście do żywności (z nagrodą); ciemnoniebieski, wejście do żywności (bez nagrody). Następne rzędy: nieszczelny integrator oszacowanie stopy nagrody; dŚwiatło w niskiej rozdzielczości (1 min); dŚwiatło w wysokiej rozdzielczości (50 Hz, zielony; pięciopunktowy filtr mediany, czarny); wartości stanu modelu (cyjan); i RPE (magenta). Po kilku próbach bez nagrody, wartości stanu na początku próby są niskie, a następnie dostarczenie nagrody wywołuje dodatni RPE i towarzyszący mu gwałtowny wzrost dopaminy. Kolejne próby z nagrodami zmniejszają RPE, ale zwiększają wartości stanu, czemu towarzyszy rosnąca dopamina. f, Krótkie korelacje w skali czasowej pokazują ścisły związek między światłem a wartością d oraz mniejszy związek z RPE. g, Korelacje wewnątrzpróbowe między zmiennymi modelu a dLight z różnymi opóźnieniami; korelacja zarówno z wartością, jak i RPE jest najsilniejsza do dLight około 0.3 s później. h, We wszystkich sesjach maksymalna korelacja była większa dla wartości niż dla RPE lub wskaźnika nagrody.

W przypadku zadania bandyty najpierw zbadaliśmy sygnał dLight w pojemnikach 1-min (ryc. 3b) w porównaniu do mikrodializy. Ponownie zauważyliśmy wyraźny związek między uwalnianiem dopaminy NAc i stopą nagrody, zarówno w korelacji krzyżowej, jak i analizie przejść blokowych (ryc. 3c, d). Następnie dokładniej zbadaliśmy, w jaki sposób powstaje ten związek. Zamiast powoli zmieniać się w skali czasu, sygnał dLight wykazywał wysoce dynamiczne wahania w obrębie każdej próby i pomiędzy nimi (ryc. 3e). Porównaliśmy te fluktuacje z wartościami stanu chwilowego i RPE oszacowanymi na podstawie modelu uczenia się przez wzmocnienie (proces decyzyjny pół-Markowa5). Jak wcześniej informowano przy użyciu woltamperometrii5, dopamina NAc z chwili na chwilę wykazywała silną korelację z wartościami stanu (ryc. 3f), widoczne jako przyspieszenie w trakcie prób, gdy oczekiwano nagród (ryc. 3e). Widzieliśmy także przejściowe wzrosty przy mniej oczekiwanych dostawach nagród, zgodne z RPE (zbadane poniżej). W każdej sesji dLight dopamina wykazywała silniejszą korelację z wartościami niż RPE lub wskaźnik nagrody (ryc. 3h, Dane rozszerzone Ryc. 6). Korelacje zarówno z wartościami stanu, jak i RPE były maksymalne w odniesieniu do sygnału dLight ~ 0.3 s później, zgodnie z krótkim opóźnieniem spowodowanym neuronowym przetwarzaniem sygnałów i czasem odpowiedzi czujnika (ryc. 3g; w przypadku woltamperometrii odnotowaliśmy opóźnienie 0.4–0.5 s)5.

Wypalanie dopaminy nie wyjaśnia uwolnienia

Następnie porównaliśmy odpalanie komórek dopaminy i uwalnianie wokół wydarzeń związanych z zadaniem bandytów. Każdy z bodźców zewnętrznych przy sygnalizacji Light-on, Go i nagrodzony Side-in (kliknięcie w pojemniku na żywność) wywoływał szybki wzrost strzelania (ryc. 4a). Odpowiedzi te zaobserwowano w zdecydowanej większości komórek dopaminy (ryc. 4c), chociaż względna wielkość odpowiedzi na różne sygnały różni się w zależności od komórki (Uzupełnienie Rys. 1). Sygnał NAc dLight zareagował również szybko i niezawodnie na każdy z tych istotnych sygnałów (ryc. 4b, c), zgodnie z szybkim odpalaniem komórek dopaminy powodującym uwalnianie dopaminy.

Ryc. 4: Fazowe wypalanie dopaminy VTA nie uwzględnia dynamiki dopaminy NAc.
figure4

a, Aktywność zależna od zdarzenia komórek dopaminy VTA-1. Na górze, rastry szczytowe dla jednej reprezentatywnej komórki; dolna, średnia stopa wzrostu (n = 29). We wszystkich panelach pasma błędu wskazują ± sem b, Dostosowane do zdarzenia NAc dLight. Najlepsza, reprezentatywna sesja; dolny, średni (n = 10), znormalizowane do odpowiedzi bocznej z nagrodą szczytową. Na tym rysunku sygnały dLight są pokazane w odniesieniu do 2-sekundowej epoki „linii bazowej” kończącej się 1 s przed Centrum-in. Zwróć uwagę na wzrosty (strzałki) na krótko przed środkowym i Food-port-in. c, Skumulowane rozkłady czasu potrzebnego dla komórek dopaminy (ciało stałe; n = 29), dLight (przerywana; n = 10), aby zwiększyć następujące ustawienia cue (test shuffle w porównaniu do linii bazowej, 10,000 shuffle, P <0.01, poprawki wielokrotnych porównań). W przypadku trybu Light-on uwzględniono tylko opóźnienia <1 s; tylko dla pobocznych testów z nagrodą. Mediana latencji (z dopasowania sigmoidalnego): Światło włączone, wyzwalanie 152 ms, dLight 266 ms; Idź do cue, wyzwalanie 67 ms, dLight 212 ms; Side-in, wystrzeliwanie 85 ms, dLight 129 ms. Komórki niedopaminowe były zwykle obojętne na ataki sygnałowe (Extended Data Ryc. 8). d, Wyraźne wywołane wskazówką, związane z podejściem uwalnianie dopaminy. Najwyższe, średnie odpalanie komórek dopaminy (n = 29); średni, średni dLight (n = 10); dół, woltamperometria (n = 6), znormalizowany do szczytowej odpowiedzi na światło o krótkim opóźnieniu. Panele lewe, opóźnienia <1 s, prawe, opóźnienia> 2 s. Dane są wyrównywane na Light-on (pełne) lub Center-in (kropkowane); czerwona linia przerywana, mediana opóźnienia. Przy dłuższych opóźnieniach nie ma wzrostu strzelania w pobliżu środkowego wejścia, ale dLight i woltamperometria wykazują wyraźny wzrost. e, Wykres rozproszenia porównujący sygnały szczytowe wyrównane na Light-on (y oś) lub środkowy (x oś). Dla każdej komórki linie połączone z sesją wskazują dane dla różnych zakresów opóźnień (<1 s,> 2 s). Wypalanie dopaminy (u góry) konsekwentnie pokazuje odpowiedź Light-on dla prób z krótkim opóźnieniem (dwukierunkowa analiza wariancji (ANOVA), wyrównanie × opóźnienie interakcji, F = 7.47, P = 0.0008). Sygnały dLight (środkowe), woltamperometryczne (dolne) są konsekwentnie lepiej dopasowane do Center-in (dwukierunkowa ANOVA dla dLight: interakcja wyrównania × latencja, F = 9.28, P = 0.0043). f, Dopamina wzrasta podczas podejścia, określana jako kąt rampowy (patrz Metody). Koła wskazują pojedyncze komórki dopaminy (n = 29), sesje dLight (n = 10).

Widzieliśmy również wyraźny wzrost uwalniania dopaminy NAc, gdy szczury zbliżały się do portu początkowego (tuż przed wejściem do środka) i portu pokarmowego (tuż przed wejściem do jedzenia). To dobrze pasuje do obszernej literatury woltamperometrycznej pokazującej, że zachowaniom motywowanym towarzyszy szybki wzrost dopaminy rdzeniowej NAc5,7,8,9,10,11. Jednak populacja komórek dopaminy VTA-1 nie wykazywała w tych czasach odpowiedniego wzrostu strzelania (ryc. 4a; patrz dane rozszerzone 7 dla dodatkowych porównań, w tym z komórkami innymi niż dopamina).

Aby lepiej oddzielić aktywność dopaminy wywołaną wskazówką i związaną z podejściem, oddzieliliśmy próby krótkimi (<1 s) i długimi (> 2 s) latencjami (ryc. 4d, e). Wzrost strzelania do komórek dopaminy był konsekwentnie zablokowany na początku sygnalizacji w Light-on, najlepiej w próbach z krótkim opóźnieniem. Wszystkie komórki dopaminy 25 ze znacznym wzrostem szybkości strzelania po włączeniu światła były lepiej dopasowane do włączania światła niż do centrowania (ryc. 4e). Przeciwnie, wzrosty uwalniania dopaminy NAc przed Center-in różniły się od wywołanego wskazaniem uwalniania dopaminy (ryc. 4d, e). Sygnały dLight konsekwentnie wzrastały przed wprowadzeniem do środka w próbach o długich opóźnieniach (dziesięć na dziesięć sesji) i przed wprowadzeniem pokarmu (dziewięć na dziesięć sesji), bez odpowiadającego temu wzrostu dawki dopaminy (ryc. 4f).

Wreszcie rozważaliśmy, w jaki sposób sygnały dopaminy związane ze zdarzeniem zależą od niedawnej historii nagród. We wczesnej części każdej próby odpalanie komórek dopaminy nie było zależne od wskaźnika nagród (ryc. 5a), pomimo wpływu stopy nagród na motywację (ryc. 5b). Następnie odpowiedź fazowa na wskazówkę dotyczącą nagrody w Side-in była niezawodnie silniejsza, gdy wskaźnik nagrody był niższy (ryc. 5a), zgodny z dodatnim kodowaniem RPE. Gdy pominięto tę wskazówkę dotyczącą nagrody, komórki dopaminy wstrzymały wypalanie, chociaż kodowanie ujemnych RPE było znacznie słabsze lub nieobecne, niezależnie od tego, czy badano je na poziomie populacji (ryc. 5a, b) lub jako pojedyncze komórki (Extended Data Rys. 8). Wcześniej sugerowano, że ujemne RPE są kodowane podczas trwania przerw dopaminowych31, ale zaobserwowano to tylko w 2 z 29 pojedynczych neuronów. Podobne wyniki uzyskano, jeśli oczekiwanie nagrody zostało oszacowane w inny sposób, w tym oparte na próbach modele uczenia się ze wzmocnieniem (aktor-krytyk i Q-learning) lub po prostu zliczając ostatnie nagrody (Extended Data Ryc. 8).

Ryc. 5: Historia nagród wpływa inaczej na odpalanie komórek dopaminy VTA i uwalnianie dopaminy NAc.
figure5

a, Najważniejsze, uśrednione szybkości wypalania komórek dopaminy (n = 29) wyrównane do Side-in, podzielone według wskaźnika nagrody (tercyle, obliczane oddzielnie dla każdej komórki). Przed Side-in aktywność nie zależy od oczekiwanej nagrody. Po próbach z nagrodą Side-in (czerwony) i bez nagrody (niebieski) są pokazane oddzielnie. Reakcja na kliknięcie żywności jest silniejsza, gdy wskaźnik nagrody jest niski, co jest zgodne z kodowaniem pozytywnych RPE. Na dole, ułamek poszczególnych komórek dopaminy z szybkością wypalania, która znacznie różni się w zależności od szybkości nagrody w każdym momencie (test losowy, P <0.01, poprawki wielokrotnych porównań). Znaczniki u góry wskazują czasy, kiedy ten ułamek był znacznie wyższy niż przypadek (dwumian, P <0.01). Po Side-in testowane są tylko ujemne korelacje - to znaczy potencjalne kodowanie RPE. b, Wykresy regresji dla sesji z zarejestrowanymi komórkami dopaminy, pokazujące wpływ niedawnej historii nagród na (log-) opóźnienie (u góry) i wzrost dopaminy. Gwiazdki wskazują znaczące wagi regresji (t-test, P <0.05). Podczas 0.5 s przed sygnałem Go (podczas gdy szczur musi stabilnie szturchać nosem, aby przeprowadzić próbę), na wzrost dopaminy nie ma wpływu historia nagrody (w środku). Zmienia się to po ujawnieniu wyniku (na dole; ocena szczytu lub minimum aktywności w 0.5 s po Side-in), ale tylko w przypadku prób z nagrodą. c, d, Tak samo jak powyżej, z wyjątkiem dLight (znormalizowany do szczytowej odpowiedzi Side-in). Uwalnianie dopaminy niezawodnie skaluje się ze stopą nagrody, nawet przed Side-in.

Uwalnianie dopaminy w Side-in również wykazało wyraźne, przejściowe kodowanie pozytywnych RPE, ale nie ujemnych RPE (ryc. 5c, d). Ta reakcja dLight była nieco opóźniona i przedłużona w porównaniu do strzelania, zgodnie z czasem potrzebnym do uwolnienia i ponownego wychwytu32, ale pozostał zjawiskiem drugim. Jednak w przeciwieństwie do strzelania sygnały dLight na początku każdej próby były większe, gdy nagradzano ostatnie próby (ryc. 5c), zgodne z kodowaniem wartości. Zaobserwowaliśmy tę zależność od historii nagrody, nawet gdy szczur nie poruszał się aktywnie, ale trzymał nos w środkowym porcie, czekając na sygnał Go (ryc. 5d). Podsumowując, dochodzimy do wniosku, że uwalnianie dopaminy NAc odzwierciedla zarówno wywołane wskazówkami odpowiedzi, jak i oczekiwanie nagrody, i że tylko to pierwsze może być dobrze wyjaśnione przez wypalanie komórek dopaminy przez VTA-1.

Dyskusja

VTA-1 stanowi główne źródło dopaminy w rdzeniu NAc6,23,24. Komórki dopaminy VTA-1, w tym te, które rzutują na rdzeń NAc, konsekwentnie wyświetlają impulsy kodujące RPE3,12. Uważa się, że wybuchy VTA są szczególnie ważne dla napędzania dopaminy NAc32, i rzeczywiście stwierdziliśmy, że wywołane wskazaniami impulsy VTA były dopasowane do wydania NAc. Jednak dodatkowo znaleźliśmy zależne od wartości wzorce uwalniania dopaminy NAc, które nie zostały wygenerowane przez odpalenie komórek dopaminy VTA-1, zarówno w długich (tonicznych), jak i krótkich (fazowych) skalach czasowych. Inne subpopulacje dopaminy mogą przenosić różne sygnały13,33,34, i nie możemy wykluczyć możliwości, że wystrzelenie subpopulacji komórek dopaminowych, które nie zostały zarejestrowane w tym miejscu, powoduje powstanie wartościowej dopaminy w rdzeniu NAc. Jednak w szerokim zakresie badań nigdy nie odnotowano wypalania związanego z wartością dla żadnych komórek dopaminy. Nasze wyniki sugerują, że dynamika dopaminy NAc jest kontrolowana na różne sposoby, w różnym czasie i dla różnych funkcji, oraz że rejestrowanie komórek dopaminy jest ważne, ale niewystarczające do zrozumienia sygnałów dopaminy35.

Uwalnianie z terminali dopaminowych jest silnie zależne od lokalnych mechanizmów nie powodujących gwałtowności36,37,38,39,40. Na przykład, uwalnianie dopaminy NAc jest modulowane przez jądro migdałowate podstawno-boczne, nawet gdy wzrost VTA jest farmakologicznie tłumiony41,42. Od dziesięcioleci zauważono, że lokalna kontrola uwalniania dopaminy może osiągnąć funkcje odmienne od funkcji wzbogacania komórek dopaminy36,43, ale nie zostało to uwzględnione w teoretycznych poglądach na dopaminę. Odrębne podregiony prążkowskie przyczyniają się do różnego rodzaju decyzji i mogą wpływać na własne uwalnianie dopaminy w zależności od potrzeb44. Pozostaje do ustalenia, jak zlokalizowana może być ta kontrola uwalniania dopaminy. Jednym z ograniczeń wspólnych dla 3 sposobów, w jakie mierzyliśmy uwalnianie dopaminy, jest to, że wszystkie one pobierają próbki w skali przestrzennej co najmniej 100 µm, podczas gdy mikroskopia in vivo sugeruje, że uwalnianie dopaminy może być niejednorodne w znacznie mniejszej skali15.

Nasze wyniki nie potwierdzają istnienia żadnego osobnego tonicznego sygnału dopaminy, który mógłby pośredniczyć w motywacyjnych efektach dopaminy. Zamiast tego przesunięcia dopaminy, które wydają się powolne, jeśli są mierzone powoli (za pomocą mikrodializy), przechodzą w szybkie fluktuacje, jeśli są mierzone szybko (za pomocą woltamperometrii lub światła dLight). Ponadto nagrania zidentyfikowanych komórek dopaminy VTA przez nas i innych30 dostarczyć mocnych dowodów przeciwko temu pomysłowi29 zmiany tonicznego odpalania komórek dopaminowych powodują zmiany toniczne w uwalnianiu dopaminy. Chociaż wypalanie toniki może być zmienione przez zmiany chorobowe lub manipulacje narkotykami28, nie jesteśmy świadomi trwałych zmian szybkości strzelania w żadnym zadaniu behawioralnym. Ogień może zmniejszać się w skali czasu około 1 sekundy podczas przewidywania istotnych motywacyjnie wydarzeń45,46. Jednak ten spadek jest przeciwieństwem tego, co byłoby wymagane do zwiększenia uwalniania dopaminy z oczekiwaniem nagrody, i zamiast tego bardziej przypomina sekwencję przejściowych błędów prognozowania ujemnego47. Chociaż trwałe sygnały kodujące bieżącą stawkę nagrody mogą być przydatne obliczeniowo30, dopamina zamiast tego zapewnia szybko zmieniające się sygnały błędu i wartości. Możliwe jest, że trwałe sygnały są obliczane na kolejnym etapie, za pomocą wewnątrzkomórkowych ścieżek sygnałowych za receptorami dopaminy.

Wiele grup zaobserwowało gwałtowne uwalnianie dopaminy, gdy szczury zbliżają się do nagrody5,7,8,9,10,11, spójne z kodowaniem rosnących oczekiwań dotyczących nagrody. Niektórzy twierdzą, że te rampy dopaminowe po prostu odzwierciedlają RPE, zakładając, że szczury albo szybko zapominają o wartościach48 lub że mają wypaczony zestaw reprezentacji państwowych49. Ta ostatnia idea nie jest poparta przez naszą obserwację, że rampowanie jest szybko modulowane od próby do próby na podstawie zaktualizowanych oczekiwań dotyczących nagrody, staje się silniejsze w krótkiej sekwencji kolejnych nagród, podczas gdy reakcje podobne do RPE na sygnały stają się słabsze (ryc. 3e). Mówiąc bardziej ogólnie, żadna teoria, w której dopamina przekazuje wyłącznie RPE (sygnały uczenia się), nie może uwzględniać bardzo dobrze ustalonego związku między trwającą dopaminą mezolimbiczną a motywacją16. Rdzeń NAc nie jest potrzebny do dobrze wyszkolonych odpowiedzi na bodźce warunkowane, ale jest szczególnie ważny przy podejmowaniu czasochłonnej pracy w celu uzyskania nagród50. Rdzeń dopaminy rdzeniowej NAc wydaje się być kluczowym dynamicznym sygnałem tego, jak opłacalne jest przeznaczanie czasu i wysiłku na pracę5,44, mimo że ten sygnał nie jest obecny podczas odpalania komórek dopaminy VTA.

Metody

Zwierzęta

Wszystkie procedury na zwierzętach zostały zatwierdzone przez komisje instytucjonalne ds. Użytkowania i opieki nad zwierzętami Uniwersytetu Michigan lub Uniwersytetu Kalifornijskiego w San Francisco. Samce szczurów (300–500 g, typu dzikiego Long-Evans lub TH-Cre+ z tłem Long-Evans52) utrzymywano na odwrotnym cyklu światło: ciemność 12: 12 i testowano podczas fazy ciemności. Szczury były w niewielkim stopniu pozbawione pokarmu, otrzymując 15 g standardowej laboratoryjnej karmy dla szczurów dziennie, oprócz nagród pokarmowych zdobywanych podczas wykonywania zadania. Nie przeprowadzono wstępnego obliczenia wielkości próbki. Badacze nie byli ślepi na przydział podczas eksperymentów i oceny wyników.


Zachowanie

Trening wstępny i testy przeprowadzono w sterowanych komputerowo komorach operacyjnych Med Associates (25 cm × 30 cm w najszerszym miejscu), każda z pięcioma otworami w ściance z nosem, jak opisano wcześniej5. Sesje zadań bandytów wykorzystywały następujące parametry: długości bloków to próby 35-45, losowo wybrane dla każdego bloku; okres wstrzymania zanim cue Go wynosił 500 – 1,500 ms (rozkład równomierny); prawdopodobieństwa nagrody od lewej do prawej to 10, 50 i 90% (dla elektrofizjologii, fotometrii, woltamperometrii i wcześniej zgłoszonych szczurów do mikrodializy5) lub 20, 50 i 80% (nowo zgłoszone szczury poddawane mikrodializie).

Obecny wskaźnik wynagrodzeń został oszacowany przy użyciu nieszczelnego integratora opartego na czasie53. Stawka nagrody była zwiększana za każdym razem, gdy otrzymywana była nagroda, i rozkładana wykładniczo według stawki określonej przez parametr τ (czas ws, aby stopa nagród spadła o ~ 63%, to znaczy 1-1 / e). Dla wszystkich analiz τ wybrano na podstawie zachowania szczura, maksymalizując (ujemną) korelację między stopą nagrody a logem (opóźnieniem) w każdej sesji. Korelacje między dopaminą przodomózgowia a stopą nagrody nie były bardzo wrażliwe na ten wybór τ (Dane rozszerzone rys. 1).

Aby sklasyfikować przejścia bloków jako „wzrastające” lub „malejące” w stosunku do stopy nagrody, porównaliśmy średnią stawkę nagrody integratora nieszczelnego w ostatnich 5 min bloku ze średnią stopą nagrody w pierwszej 8 min następnego bloku.

Szczury użyte do elektrofizjologii i fotometrii również wykonały zadanie z podejścia Pawłowa, w tej samej komorze operacyjnej, przy włączonym świetle dziennym przez całą sesję. Trzy sygnały dźwiękowe (2 kHz, 5 kHz i 9 kHz) były związane z różnymi prawdopodobieństwami dostarczenia pokarmu (zrównowaŜone u szczurów). Cue były odtwarzane jako ciąg pipsów tonowych (100 ms włączony, 50 ms wyłączony) przez całkowity czas trwania 2.6 s, po którym następował okres opóźnienia 500 ms. Wskazówki i nieprzewidziane dostawy nagród były dostarczane w pseudolosowej kolejności ze zmiennym interwałem między próbami (15–30 s, równomierny rozkład).


Mikrodializa

Chirurgia

Szczurom wszczepiono dwustronnie kaniulami prowadzącymi (CMA, 830 9024) w korze i prążkowiu. Jedna grupa (n = 8) otrzymali jedną kaniulę prowadzącą skierowaną do kory przedklinicznej i podpodłogowej (przednio-tylną (AP) +3.2 mm, środkowo-boczną (ML) 0.6 mm w stosunku do bregmy; i grzbietowo-brzuszną (DV) 1.4 mm poniżej powierzchni mózgu) i drugą skierowaną do grzbietowo-środkowej części prążkowia i jądra półleżącego na przeciwnej półkuli (AP +1.3, ML 1.9 i DV 3.4). Oba implanty zostały odchylone pod kątem 5 stopni od siebie na płaszczyźnie czołowo-ogonowej. Druga grupa (n = 4) otrzymał jedną kaniulę prowadzącą skierowaną na przednią korę zakrętu obręczy (AP +1.6, ML 0.8 i DV 0.8), a drugą nakierowaną na półkule (rdzeń / powłoka na przeciwnej półkuli w AP +1.6, ML 1.4 i DV 5.5 (n = 2) lub AP +1.6, ML 1.9 i DV 5.7 (n = 2). Boki implantu były równoważone przez szczury. Przed ponownym treningiem zwierzęta pozostawiono na tydzień do regeneracji.

Chemikalia

Woda, metanol i acetonitryl dla faz ruchomych były klasy Burdick & Jackson HPLC, zakupione od VWR (Radnor). Wszystkie inne chemikalia zakupiono od Sigma Aldrich, chyba że zaznaczono inaczej. Sztuczny płyn mózgowo-rdzeniowy (aCSF) zawierający 145 mM NaCl, 2.68 mM KCl, 1.40 mM CaCl2, 1.01 mM MgSO44, 1.55 mM Na2HPO4 i 0.45 mM NaH2PO4, doprowadzono pH do 7.4 za pomocą NaOH. Kwas askorbinowy (końcowe stężenie 250 nM) dodano w celu zmniejszenia utleniania analitów.

Pobieranie próbek i HPLC-MS

W dniu testu zwierzęta umieszczono w komorze operacyjnej z włączonym oświetleniem domu. Specjalnie wykonane koncentryczne sondy do mikrodializy z membraną poliakrylonitrylową (membrana dializacyjna 1-mm AN69; Hospal) wprowadzono obustronnie do kaniuli prowadzącej i perfundowano w sposób ciągły (Chemyx, Fusion 400) z aCSF przy 2 µl / min dla 90 min, aby umożliwić równowagę. Po pobraniu linii podstawowej 5-min światło domowe zgasło, kierując zwierzę do dostępności bandytów. Pobieranie próbek kontynuowano w odstępach 1-min i próbki natychmiast derywatyzowano54 z 1.5 ul węglanu sodu, 100 mM; 1.5 µl chlorku benzoilu (2% (v / v) chlorek benzoilu w acetonitrylu); i 1.5 µl znakowanej izotopowo mieszaniny wzorca wewnętrznego rozcieńczonej w 50% (v / v) acetonitrylu zawierającym 1% (v / v) kwas siarkowy i wzbogaconej deuterowanym ACh i choliną (izotopami C / D / N) do końcowego stężenia 20 nM. Pobieranie serii próbek odbywało się naprzemiennie między dwiema sondami w 30-sekundowych odstępach w każdej z 26 sesji, z wyjątkiem jednej sesji, w której pęknięcie błony skutkowało tylko jedną serią (łącznie 51 serii próbek). Próbki analizowano za pomocą systemów Thermo Scientific UHPLC (Accela lub Vanquish Horizon połączonych z potrójnym kwadrupolowym spektrometrem masowym Quantum Ultra wyposażonym w sondę HESI II ESI), działającym w trybie monitorowania wielu reakcji. Pięciomikrolitrowe próbki wstrzyknięto na kolumnę Phenomenex core-shell biphenyl Kinetex HPLC (2.1 mm x 100 mm). Fazą ruchomą A był 10 mM mrówczan amonu z 0.15% kwasem mrówkowym, a fazą ruchomą B był acetonitryl. Fazę ruchomą dostarczano z gradientem elucji przy 450 µl / min, jak następuje: początkowa, 0% B; 0.01 min, 19% B; 1 min, 26% B; 1.5 minuty, 75% B; 2.5 minuty, 100% B; 3 min, 100% B; 3.1 min, 5% B; i 3.5 min, 5% B. Thermo Xcalibur QuanBrowser (Thermo Fisher Scientific) zastosowano do automatycznego przetwarzania i integracji pików. Każdy z> 100,000 XNUMX pików został indywidualnie sprawdzony wizualnie w celu zapewnienia właściwej integracji.

Analizy

Wszystkie dane dotyczące stężenia neurochemicznego zostały wygładzone trzypunktową średnią ruchomą (y′ = [0.25 × (y−1) + 0.5y + 0.25 × (y+ 1)]) i z- wynik znormalizowany w każdej sesji, aby ułatwić porównania między sesjami. Dla każdego regionu docelowego wygenerowano korelogram krzyżowy dla każdej sesji i wykreślono średnią z sesji. Dla każdego wykresu cząstkowego wygenerowano jednoprocentowe granice ufności, tasując jeden szereg czasowy 100,000 0.05 razy i generując rozkład współczynników korelacji dla każdej sesji. Modele wielokrotnej regresji wygenerowano przy użyciu funkcji regresji w programie MATLAB, z neurochemiczną zmienną wyniku i metrykami behawioralnymi jako predyktorami. Współczynniki regresji określono jako istotne na trzech poziomach alfa (0.0005, 0.000005 i 21), po korekcji Bonferroniego dla porównań wielokrotnych (alfa / (7 substancji chemicznych × 9 regionów × 3 regresorów behawioralnych)). Do analizy przejść blokowych dane zostały podzielone na XNUMX-minutowe epoki, odrzucając próbkę zawierającą czas przejścia.


Elektrofizjologia

Szczury (n = 25) wszczepiono za pomocą specjalnie zaprojektowanych napędzanych optrodów, z których każda składała się z 16 tetrod (zbudowanych z drutu nichromowego 12.5 µm, Sandvik) przyklejonych do boku 200 µm włókna światłowodowego i rozciągających się do 500 µm poniżej końcówki włókna. Podczas tej samej operacji wstrzyknęliśmy 1 µl AAV2 / 5-EF1a-DIO-ChR2 (H134R) -EYFP do bocznego rdzenia VTA (AP 5.6, ML 0.8, DV 7.5) lub NAc (AP 1.6, ML 1.6, DV 6.4) . Szerokopasmowe (1–9,000 30,000 Hz) sygnały mózgowe próbkowano (80 XNUMX próbek na s) przy użyciu cyfrowych głowic Intan. Optrody zostały obniżone o co najmniej XNUMX µm pod koniec każdej sesji nagraniowej. Poszczególne jednostki zostały odizolowane offline za pomocą implementacji MATLAB MountainSort55 następnie dokładna ręczna kontrola.

Klasyfikacja

Aby ustalić, czy izolowana jednostka VTA-1 była dopaminergiczna (TH+) zastosowaliśmy test opóźnienia związanego z bodźcem56. W skrócie, pod koniec każdej sesji eksperymentalnej podłączyliśmy optrode do diody laserowej i dostarczyliśmy ciągi impulsów świetlnych o różnych szerokościach i częstotliwościach. Aby jednostka została zidentyfikowana jako reagująca na światło, musiała osiągnąć poziom istotności P <0.001 dla ciągów impulsów 5 ms i 10 ms. Porównaliśmy również przebiegi wywołane światłem (w ciągu 10 ms od początku impulsu laserowego) ze średnimi z całej sesji; wszystkie jednostki wywołane światłem miały współczynnik korelacji Pearsona> 0.9. Z powodzeniem zarejestrowano neurony dopaminowe od czterech szczurów z wlewami VTA-657 AAV (IM1, 1002 jednostka; IM3, 1003 jednostki; IM15, 1037 jednostek; IM9, 1078 jednostek) i jednego szczura z rdzeniem NAc AAV (IM-2, 20 jednostki) . Szerokość piku została zdefiniowana jako pełna szerokość przy połowie maksimum najbardziej widocznej ujemnej składowej wyrównanego, uśrednionego przebiegu szczytowego. Nieoznakowane neurony VTA z częstotliwością wyzwalania w całej sesji> 200 Hz i szerokością piku <XNUMX µs sklasyfikowano jako komórki niedopaminowe. Aby upewnić się, że porównaliśmy komórki dopaminowe i niedopaminowe w tych samych podregionach, przeanalizowaliśmy tylko komórki niedopaminowe zarejestrowane podczas sesji z co najmniej jedną optycznie oznaczoną komórką dopaminową.

Analizy

Impulsy szczytowe zostały wykryte przez konwencjonalne podejście „80 / 160 template”57: za każdym razem, gdy występuje interwał między pikami wynoszący 80 ms lub mniej, te i kolejne impulsy są uważane za część serii, dopóki nie nastąpi interwał 160 ms lub więcej. W celu porównania wypalania „tonikiem” z szybkością nagrody, skoki dopaminy liczono w 1-minutowych pojemnikach. Aby zbadać szybsze zmiany, skonstruowano funkcje gęstości pików przez splatanie ciągów impulsów z jądrem Gaussa z wariancją 20 ms. Aby określić, jak szybko neuron zareagował na daną wskazówkę, zastosowaliśmy przedziały 40 ms (przesuwanie w krokach 20 ms) i zastosowaliśmy test losowy (10,000 cykli) dla każdego przedziału czasowego, porównując szybkość odpalania po rozpoczęciu cue z szybkością 250 ms bezpośrednio poprzedzające cue. Pierwszy pojemnik, w którym szybkość wypalania po cue była znacząco (P <0.01, z korektą dla wielokrotnych porównań) większą niż wartość wyjściowa, uznano za czas do odpowiedzi cue.

Szczytowa szybkość strzelania została obliczona jako maksymalna szybkość wypalania (wygładzona Gaussa) dla każdej próby w oknie 250-ms po side-in dla nagradzanych prób, a dolina została obliczona jako minimalna szybkość strzelania w oknie 2-s, zaczynając jedna sekunda po side-in dla nieuzbrojonych prób.

Aby obliczyć kąt rampowy podczas zachowań zbliżeniowych, wygładziliśmy średnie szybkości strzelania za pomocą jądra gaussowskiego 50-ms, wykryliśmy maksimum / minimum sygnału wynikowego w oknie 0.5-s przed każdym zdarzeniem (środkowy lub port-środkowy ) i zmierzył podpisany kąt łączący dwa skrajności. Aby porównać częstości wystrzeliwania w „wysokich” i „niskich” blokach nagród, dla każdej sesji przeprowadziliśmy medianę podziału średniego wskaźnika wynagrodzeń za nieszczelny integrator w każdym bloku.


Woltamperometria i model obliczeniowy

Pokazane tutaj wyniki szybkiego skanowania cyklicznej woltametrii ponownie analizują dane poprzednio przedstawione szczegółowo5. Szacunkowe wartości błędów stanu i błędów prognozowania w trakcie próby zostały obliczone przy użyciu modelu uczenia się wspomagania procesu decyzyjnego pół-Markowa, dokładnie tak jak opisano wcześniej5.


Fotometria

Zastosowaliśmy wirusowe podejście do ekspresji genetycznie zakodowanego optycznego czujnika dopaminy dLight15. W znieczuleniu izofluranem, 1 μl AAV9-CAG-dLight (1 × 1012 genomy wirusów na ml; Rdzeń wektora UC Davis) powoli (100 nl / min) wstrzyknięto (Nanoject III, Drummond) przez 30-µm szklaną mikropipetę do prążkowia brzusznego obustronnie (AP: 1.7 mm, ML: 1.7 mm, DV: -7.0 mm). Podczas tej samej operacji wprowadzono włókna światłowodowe (rdzeń 400 µm, średnica całkowita 430 µm) przymocowane do metalowej ferruli (Doric) (głębokość docelowa 200 µm wyższa niż AAV) i zacementowano na miejscu. Dane zebrano> trzy tygodnie później, aby umożliwić ekspresję dLight.

Dla wzbudzenia dLight niebieski (470 nm) i fioletowy (405 nm; sterowanie) diody LED były modulowane sinusoidalnie przy różnych częstotliwościach (odpowiednio 211 Hz i 531 Hz58). Zarówno sygnały wzbudzenia, jak i emisja przechodzące przez filtry minicube (Doric) i fluorescencję masową mierzono za pomocą detektora femtowatowego (Newport, Model 2151) próbkującego przy 10 kHz. Demodulacja wytworzyła oddzielne sygnały 470 nm (dopamina) i 405 nm (kontrola), które następnie przeskalowano do siebie za pomocą dopasowania metodą najmniejszych kwadratów58. Frakcyjny sygnał fluorescencyjny (dF/F) został następnie zdefiniowany jako (470–405_fit) / 405_fit. We wszystkich analizach sygnał ten był próbkowany do 50 Hz i wygładzany pięciopunktowym filtrem medianowym. Prezentacja sygnałów 470 nm i 405 nm oddzielnie, patrz Dane rozszerzone rys. 7.

Dane z umiejscowienia światłowodu zostały uwzględnione w analizach, jeśli końcówka światłowodu była w NAc, a odpowiedź fluorescencyjna na co najmniej jedną wskazówkę zadania miała wartość z- wynik> 1. Kryteria te wykluczały jednego szczura i dały trzy szczury / cztery miejsca docelowe (IM1065-lewa, IM1066-dwustronna, IM1089-prawa) dla dLight1.1 i cztery szczury / sześć miejsc (IM1088-dwustronne, IM1105-prawe, IM1106-dwustronne, IM1107-prawy) dla dLight1.3b. Podobne wyniki uzyskano dla dLight1.1 i dLight1.3 (Extended Data Rys. 7), więc dane zostały połączone.

Aby obliczyć kąt rampowy podczas zachowań zbliżeniowych, wykryliśmy maksimum / minimum sygnału wynikowego w oknie 0.5-s przed każdym zdarzeniem (środkowy lub port wejściowy) i zmierzyliśmy podpisany kąt łączący dwie skrajności.


Powinowactwo i swoistość molekularna dLight1.3b

Pomiary in vitro przeprowadzono zgodnie z wcześniejszym opisem15. W skrócie, komórki HEK293T (ATCC CRL # 1573) hodowano i transfekowano plazmidami kodującymi dlight1.3b pod kontrolą promotora CMV i przemywano HBSS (Life Technologies) uzupełnionym Ca2+ (4mM) i Mg2+ (2 mM) przed obrazowaniem. Obrazowanie wykonano przy użyciu obiektywu olejowego 40x na odwróconym mikroskopie konfokalnym Zeiss Observer LSN710 o długościach fal 488 nm / 513 nm (wzbudzenie / emisja). W celu przetestowania odpowiedzi fluorescencyjnych czujnika, neuroprzekaźniki były bezpośrednio nakładane na wannę podczas obrazowania poklatkowego, w co najmniej dwóch niezależnych eksperymentach. Miareczkowanie dopaminy i noradrenaliny uzyskano wykonując dziesięciokrotne seryjne rozcieńczenia w celu uzyskania ośmiu różnych stężeń. Wszystkie inne neuroprzekaźniki testowano w trzech kolejnych stężeniach (100 nM, 1 µM i 10 µM). Wszystkie stężenia neuroprzekaźników uzyskano przez rozcieńczenie z 1 mM podstawowego stężenia w HBSS, przygotowanym na świeżo. Surowe intensywności fluorescencji z obrazowania poklatkowego określono ilościowo na Fidżi; każdy obszar ROI został ręcznie narysowany na błonie poszczególnych komórek. Fluorescencyjna zmiana krotnie (ΔF/F) obliczono jako F szczyt (uśredniona intensywność fluorescencji czterech klatek) - F podstawowa (uśredniona intensywność fluorescencji czterech ramek przed dodaniem ligandów) /F podstawowy. Wykresy i analizy statystyczne przeprowadzono przy użyciu GraphPad Prism 6. Punkty danych analizowano z dopasowaniem krzywej wiązania specyficznej dla jednego miejsca w celu uzyskania Kd wartości. Na wykresach pudełkowych i wąsów pudełko obejmuje zakres od 25% do 75%, a wąsy rozciągają się od wartości minimalnych do maksymalnych.


Podsumowanie raportowania

Dalsze informacje na temat projektu badań są dostępne w Podsumowanie raportowania badań przyrodniczych powiązane z tym artykułem.

Dostępność danych

Wirus AAV.Synapsin.dLight1.3b zastosowany w tym badaniu został zdeponowany w Addgene (nr 125560; http://www.addgene.org). Wszystkie dane będą dostępne za pośrednictwem strony internetowej Collaborative Research in Computational Neuroscience (https://doi.org/110.6080/K0VQ30V9).

Dostępność kodu

Niestandardowy kod MATLAB jest dostępny na żądanie w JDB

Dodatkowe informacje

Uwaga wydawcy: Springer Nature pozostaje neutralny w odniesieniu do roszczeń jurysdykcyjnych w opublikowanych mapach i powiązaniach instytucjonalnych.

Referencje

  1. 1.

    Schultz, W., Dayan, P. i Montague, PR Neuronowy substrat przewidywania i nagrody. nauka 275, 1593 – 1599 (1997).

  2. 2.

    Pan, WX, Schmidt, R., Wickens, JR & Hyland, BI Komórki dopaminy reagują na przewidywane zdarzenia podczas warunkowania klasycznego: dowody na ślady kwalifikowalności w sieci uczenia się z nagrodami. J. Neurosci. 25, 6235 – 6242 (2005).

  3. 3.

    Cohen, JY, Haesler, S., Vong, L., Lowell, BB i Uchida, N. Neuron-type-specific signal for nagroda i kara w brzusznym obszarze nakrywkowym. Natura 482, 85 – 88 (2012).

  4. 4.

    Steinberg, EE i in. Związek przyczynowy między błędami prognozowania, neuronami dopaminy i uczeniem się. Nat. Neurosci. 16, 966 – 973 (2013).

  5. 5.

    Hamid, AA i in. Dopamina mezolimbiczna sygnalizuje wartość pracy. Nat. Neurosci. 19, 117 – 126 (2016).

  6. 6.

    Neurony dopaminowe Saunders, BT, Richard, JM, Margolis, EB i Janak, PH wytwarzają bodźce warunkowe Pawłowa o właściwościach motywacyjnych zdefiniowanych w obwodzie. Nat. Neurosci. 21, 1072 – 1083 (2018).

  7. 7.

    Phillips, PE, Stuber, GD, Heien, ML, Wightman, RM & Carelli, RM Drugie uwalnianie dopaminy promuje poszukiwanie kokainy. Natura 422, 614 – 618 (2003).

  8. 8.

    Roitman, MF, Stuber, GD, Phillips, PE, Wightman, RM & Carelli, RM Dopamine działa jako podsekundowy modulator poszukiwania pożywienia. J. Neurosci. 24, 1265 – 1271 (2004).

  9. 9.

    Wassum, KM, Ostlund, SB & Maidment, NT Fazowa mezolimbiczna sygnalizacja dopaminowa poprzedza i przewiduje wykonanie samoczynnie zainicjowanego zadania sekwencji akcji. Biol. Psychiatria 71, 846 – 854 (2012).

  10. 10.

    Howe, MW, Tierney, PL, Sandberg, SG, Phillips, PE & Graybiel, AM Przedłużona sygnalizacja dopaminowa w prążkowiu sygnalizuje bliskość i wartość odległych nagród. Natura 500, 575 – 579 (2013).

  11. 11.

    Syed, EC i in. Inicjacja akcji kształtuje mezolimbiczne kodowanie dopaminy przyszłych nagród. Nat. Neurosci. 19, 34 – 36 (2016).

  12. 12.

    Morris, G., Nevet, A., Arkadir, D., Vaadia, E. i Bergman, H. Midbrain neurony dopaminowe kodują decyzje dotyczące przyszłych działań. Nat. Neurosci. 9, 1057 – 1063 (2006).

  13. 13.

    da Silva, JA, Tecuapetla, F., Paixão, V. & Costa, RM Aktywność neuronów dopaminowych przed inicjacją działania otwiera i pobudza przyszłe ruchy. Natura 554, 244 – 248 (2018).

  14. 14.

    Fiorillo, CD, Tobler, PN i Schultz, W. Dyskretne kodowanie prawdopodobieństwa nagrody i niepewności przez neurony dopaminowe. nauka 299, 1898 – 1902 (2003).

  15. 15.

    Patriarchi, T., Cho, JR, Merten, K., Howe, MW, i in. Ultraszybkie obrazowanie neuronalne dynamiki dopaminy za pomocą zaprojektowanych genetycznie kodowanych czujników. nauka 360, eaat4422 (2018).

  16. 16.

    Salamone, JD & Correa, M. Tajemnicze funkcje motywacyjne dopaminy mezolimbicznej. Neuron 76, 470 – 485 (2012).

  17. 17.

    Schultz, W. Przewidywalny sygnał nagrody neuronów dopaminowych. J. Neurophysiol. 80, 1 – 27 (1998).

  18. 18.

    Garris, PA i Wightman, RM Różne kinetyki regulują transmisję dopaminergiczną w ciele migdałowatym, korze przedczołowej i prążkowiu: badanie woltamperometryczne in vivo. J. Neurosci. 14, 442 – 450 (1994).

  19. 19.

    Frank, MJ, Doll, BB, Oas-Terpstra, J. & Moreno, F.Geny dopaminergiczne przedczołowe i prążkowia przewidują indywidualne różnice w eksploracji i eksploatacji. Nat. Neurosci. 12, 1062 – 1068 (2009).

  20. 20.

    St Onge, JR, Ahn, S., Phillips, AG & Floresco, SB Dynamiczne fluktuacje wypływu dopaminy w korze przedczołowej i jądrze półleżącym podczas podejmowania decyzji opartych na ryzyku. J. Neurosci. 32, 16880 – 16891 (2012).

  21. 21.

    Bartra, O., McGuire, JT & Kable, JW System wartościowania: oparta na współrzędnych metaanaliza eksperymentów BOLD fMRI badających neuronalne korelaty o subiektywnej wartości. Neuroimage 76, 412 – 427 (2013).

  22. 22.

    Ikemoto, S. Obwody nagradzające dopaminy: dwa systemy projekcji od brzusznego śródmózgowia do jądra kompleksu guzowo-opuchowo-węchowego. Brain Res. Brain Res. Obrót silnika. 56, 27 – 78 (2007).

  23. 23.

    Breton, JM i in. Względny udział i mapowanie brzusznej powierzchniowej dopaminy i neuronów GABA według celu projekcji u szczura. J. Comp. Neurol. (2018).

  24. 24.

    Ungless, MA, Magill, PJ & Bolam, JP Jednolite hamowanie neuronów dopaminowych w brzusznym obszarze nakrywkowym przez bodźce awersyjne. nauka 303, 2040 – 2042 (2004).

  25. 25.

    Morales, M. & Margolis, EB Obszar nakrywki brzusznej: komórkowa heterogeniczność, łączność i zachowanie. Nat. Wielebny Neurosci. 18, 73 – 85 (2017).

  26. 26.

    Morris, G., Arkadir, D., Nevet, A., Vaadia, E. i Bergman, H. Coincident but different messages of midbrain dopamina i prążkowia tonicznie czynne neurony. Neuron 43, 133 – 143 (2004).

  27. 27.

    Floresco, SB, West, AR, Ash, B., Moore, H. & Grace, AA Aferentna modulacja odpalania neuronów dopaminowych w różny sposób reguluje toniczną i fazową transmisję dopaminy. Nat. Neurosci. 6, 968 – 973 (2003).

  28. 28.

    Grace, AA Rozregulowanie układu dopaminowego w patofizjologii schizofrenii i depresji. Nat. Wielebny Neurosci. 17, 524 – 532 (2016).

  29. 29.

    Cohen, JY, Amoroso, MW i Uchida, N. Neurony serotoninergiczne sygnalizują nagrodę i karę w wielu skalach czasowych. eLife 4, e06346 (2015).

  30. 30.

    Niv, Y., Daw, N. & Dayan, P. Jak szybko działa: wigor odpowiedzi, motywacja i tonizująca dopamina. Adv. Neural Inf. Proces. Syst. 18, 1019 (2006).

  31. 31.

    Bayer, HM, Lau, B. & Glimcher, PW Statystyki impulsów neuronów dopaminowych śródmózgowia u obudzonych naczelnych. J. Neurophysiol. 98, 1428 – 1439 (2007).

  32. 32.

    Chergui, K., Suaud-Chagny, MF i Gonon, F. Nieliniowy związek między przepływem impulsów, uwalnianiem dopaminy i eliminacją dopaminy w mózgu szczura in vivo. Neuroscience 62, 641 – 645 (1994).

  33. 33.

    Parker, NF i in. Kodowanie nagrody i wyboru w terminalach śródmózgowych neuronów dopaminowych zależy od celu prążkowia. Nat. Neurosci. 19, 845 – 854 (2016).

  34. 34.

    Menegas, W., Babayan, BM, Uchida, N. & Watabe-Uchida, M. Naprzeciwko inicjalizacji do nowych wskazówek w sygnalizacji dopaminy w prążkowiu brzusznym i tylnym u myszy. eLife 6, e21886 (2017).

  35. 35.

    Trulson, ME Jednoczesne rejestrowanie neuronów istoty czarnej i woltametryczne uwalnianie dopaminy w jądrze kotów zachowujących się. Brain Res. Byk. 15, 221 – 223 (1985).

  36. 36.

    Glowinski, J., Chéramy, A., Romo, R. & Barbeito, L.Presynaptic regulowanie transmisji dopaminergicznej w prążkowiu. Komórka. Mol. Neurobiol. 8, 7 – 17 (1988).

  37. 37.

    Zhou, FM, Liang, Y. & Dani, JA Endogenna nikotynowa aktywność cholinergiczna reguluje uwalnianie dopaminy w prążkowiu. Nat. Neurosci. 4, 1224 – 1229 (2001).

  38. 38.

    Threlfell, S. i in. Uwalnianie prążkowia wyzwalane jest przez zsynchronizowaną aktywność interneuronów cholinergicznych. Neuron 75, 58 – 64 (2012).

  39. 39.

    Cachope, R. i in. Selektywna aktywacja cholinergicznych interneuronów zwiększa akumulację fazową dopaminy w fazie naliczkowej: nadając ton przetwarzaniu nagrody. Raporty komórkowe 2, 33 – 41 (2012).

  40. 40.

    Sulzer, D., Cragg, SJ & Rice, ME Striatal neuroprzekaźnictwo dopaminy: regulacja uwalniania i wchłaniania. Basal Ganglia 6, 123 – 148 (2016).

  41. 41.

    Floresco, SB, Yang, CR, Phillips, AG & Blaha, CD Podstawowa stymulacja ciała migdałowatego wywołuje zależny od receptora glutaminianowego wypływ dopaminy w jądrze półleżącym znieczulonego szczura. Eur. J. Neurosci. 10, 1241 – 1251 (1998).

  42. 42.

    Jones, JL i in. Bazolateralne ciało migdałowate moduluje terminalne uwalnianie dopaminy w jądrze półleżącym i warunkowo reaguje. Biol. Psychiatria 67, 737 – 744 (2010).

  43. 43.

    Schultz, W. Reakcje śródmózgowia neuronów dopaminowych na behawioralne bodźce wyzwalające u małpy. J. Neurophysiol. 56, 1439 – 1461 (1986).

  44. 44.

    Berke, JD Co oznacza dopamina? Nat. Neurosci. 21, 787 – 793 (2018).

  45. 45.

    Bromberg-Martin, ES, Matsumoto, M. & Hikosaka, O. Wyraźna aktywność tonizująca i fazowa antycypacyjna w neuronach bocznych habenula i dopaminowych. Neuron 67, 144 – 155 (2010).

  46. 46.

    Pasquereau, B. & Turner, RS Neurony dopaminowe kodują błędy w przewidywaniu wystąpienia ruchu wyzwalającego. J. Neurophysiol. 113, 1110 – 1123 (2015).

  47. 47.

    Fiorillo, CD, Newsome, WT & Schultz, W. Czasowa precyzja przewidywania nagrody w neuronach dopaminowych. Nat. Neurosci. 11, 966 – 973 (2008).

  48. 48.

    Morita, K. & Kato, A. Striatal ramping dopaminy może wskazywać na elastyczne uczenie się poprzez wzmocnienie z zapominaniem w obwodach zwojów korowo-podstawnych. Z przodu. Obwody neuronowe 8, 36 (2014).

  49. 49.

    Rampy Gershman, SJ Dopamine są konsekwencją błędów w przewidywaniu nagrody. Neural Comput. 26, 467 – 471 (2014).

  50. 50.

    Nicola, SM Hipoteza elastycznego podejścia: unifikacja wysiłku i hipotezy odpowiadające na sygnały dotyczące roli jądra półleżącego dopaminy w aktywacji zachowań polegających na poszukiwaniu nagrody. J. Neurosci. 30, 16585 – 16600 (2010).

  51. 51.

    Paxinos, G. i Watson, C. Mózg szczura w współrzędnych stereotaktycznych 5th edn (Elsevier Academic, 2005).

  52. 52.

    Witten, IB i in. Linie szczurów kierujących rekombinazą: narzędzia, techniki i zastosowanie optogenetyczne do wzmocnienia za pośrednictwem dopaminy. Neuron 72, 721 – 733 (2011).

  53. 53.

    Sugrue, LP, Corrado, GS i Newsome, WT Dopasowywanie zachowania i reprezentacja wartości w korze ciemieniowej. nauka 304, 1782 – 1787 (2004).

  54. 54.

    Wong, JM i in. Derywatyzacja chlorkiem benzoilu za pomocą chromatografii cieczowej-spektrometrii masowej do ukierunkowanej metabolomiki związków neurochemicznych w próbkach biologicznych J. Chromatogr. ZA 1446, 78 – 90 (2016).

  55. 55.

    Chung, JE i in. W pełni zautomatyzowane podejście do sortowania szczytowego. Neuron 95, 1381 – 1394 (2017).

  56. 56.

    Kvitsiani, D. i in. Wyraźne korelacje behawioralne i sieciowe dwóch typów interneuronu w korze przedczołowej. Natura 498, 363 – 366 (2013).

  57. 57.

    Grace, AA i Bunney, BS Kontrola wzorca odpalania w neuronach dopaminy nigralnej: błysk seryjny. J. Neurosci. 4, 2877 – 2890 (1984).

  58. 58.

    Lerner, TN i in. Analizy nienaruszonego mózgu ujawniają wyraźne informacje przenoszone przez podukłady dopaminy SNc. Komórka 162, 635 – 647 (2015).

Pobierz odniesienia

Podziękowania

Dziękujemy P. Dayanowi, H. Fieldsowi, L. Frankowi, C. Donaghue i T. Faustowi za komentarze na temat wczesnej wersji manuskryptu oraz V. Hetrick, R. Hashim i T. Davidson za pomoc techniczną i porady. Prace te były wspierane przez National Institute on Drug Abuse, National Institute of Mental Health, National Institute on Neurological Disorders and Stroke, University of Michigan, Ann Arbor oraz University of California, San Francisco.

Informacje o recenzencie

Natura dziękuję Margaret Rice i innym anonimowym recenzentom za ich wkład w recenzowanie tej pracy.

Autor informacji

AM wykonało i przeanalizowało elektrofizjologię i fotometrię oraz zastosowało model obliczeniowy. JRP przeprowadził i przeanalizował mikrodializę z pomocą J.-MTW i pod nadzorem RTKAAH opracował zadanie behawioralne i początkową konfigurację fotometrii oraz wykonał woltametrię. LTV wykonało śledzenie wsteczne i analizę. TP i LT opracowały czujnik dLight i dzielą się wiedzą. JDB zaprojektował i nadzorował badanie oraz napisał manuskrypt.

Konkurencyjnymi interesami

Autorzy nie deklarują konkurencyjnych interesów.

Korespondencja do Joshua D. Berke.