핵 저감 코어 및 차폐에서의 차이 도파민 방출 동역학은 오류 예측 및 인센티브 동기 부여를위한 상보성 신호 (2015)

  1. 레지나 M. 케어 리 2

+제휴보기

저자 기여 : MPS 및 FC 설계 연구; MPS와 FC는 연구를 수행했다. MPS 및 FC 분석 데이터; MPS, RMW 및 RMC가 논문을 작성했습니다.

추상

Mesolimbic dopamine (DA)은 식욕을 돋우는 행동 중에 단계적으로 방출되지만, 이러한 DA 신호의 특정 목적에 대해서는 실질적으로 의견이 일치하지 않습니다. 예를 들어, 예측 오차 (PE) 모델은 학습의 역할을 제시하는 반면, 인센티브 salience (IS) 모델은 DA 신호가 가치를 자극하여 동기 부여 된 행동을 자극한다고 주장합니다. 그러나, DA 방출의 핵 축적 (NAc) 패턴 내에서 소 영역들간에 현저하게 상이 할 수 있으며, 따라서 이들 패턴은 PE 및 IS의 측면에 차등 적으로 기여할 수있다. 이것을 평가하기 위해, 우리는 시공간 목표 지향적 자극을 spatiotemporally 분리하는 행동 과제 동안 NAc의 소구역에서 DA 방출을 측정했다. 전기 화학적 방법을 사용하여 랫트가 하나의 레버 (탐색; SL)를 눌러 제 2 레버 (탐색; TL)에 접근하도록 훈련 된 잘 알려진 도구 체인 스케줄 동안 코어 및 쉘에서 서브 초 NAc 도파민 방출을 측정 하였다. 음식 배달, 그리고 다시 멸종 중. 핵심적으로 PHAsic DA 출시는 최초 SL 발표 이후 가장 많았지 만 후속 TL 및 보상 이벤트에서는 최소였습니다. 반대로, phasic shell DA는 모든 작업 이벤트에서 강력한 릴리스를 보여주었습니다. 셸에서 세션 시작과 종료 사이에 신호가 줄어들었지만 코어는 아닙니다. 멸종 동안 코어의 피크 DA 릴리스는 SL에 대해 등급이 감소하고 생략 된 예상 보상 동안 릴리스에서 일시 중지 된 반면, 쉘 DA 릴리스는 TL 중에 주로 감소했습니다. 이 릴리스 역학은 식욕을 돋우는 행동에 대한 독특한 이론을 지원할 수있는 병렬 DA 신호를 제안합니다.

의미 진술 뇌의 도파민 신호는 학습 및 동기 부여와 같은 다양한인지 기능에 중요합니다. 경쟁 이론이 도파민이 보상 기반 행동에 어떻게 기여하는지에 대해서는 상충하지만, 일반적으로 단일 도파민 신호가 이러한인지 기능을 지원하기에 충분하다고 가정합니다. 여기, 우리는 핵 accumbens (중뇌 도파민 뉴런의 주요 대상) 내에서 실시간 도파민 방출 눈에 띄게 코어와 셸 하위 영역간에 다양 한 발견. 핵심적으로, 도파민 역학은 학습 기반 이론 (예 : 보상 예측 오류)과 일치하지만, 도파민은 동기 기반 이론 (예 : 인센티브 경감)과 일치합니다. 이러한 발견은 도파민이 동물이 보람 된 행동을 최적화하는 데 도움이되는 개별 회로를 기반으로 여러 개의 보완적인 역할을한다는 것을 보여줍니다.

개요

학습, 행동 및 중독과 관련하여 도파민 (DA) 신호 전달의 역할을 이해하는 것은 행동 신경 과학의 핵심 문제입니다. 현대 이론은 mesolimbic DA 시스템의 해부학 적 조직과 일치합니다 .Ventral Tegmental Area (VTA)에서 비교적 적은 수의 DAergic 뉴런 인구가 뇌 전체에 담보를 보내 학습과 행동을위한 회로를 광범위하게 조정합니다. 그러나, 최근의 증거는 DA 신호 전달이 이전에 고려 된 것보다 더 이질적 일 수 있음을 시사한다. 예를 들어 보상 예측 단서에 따른 위상차 DA 릴리스는 핵 축적 (NAc) 코어에서 예상되는 주관적 보상 값에 비례하지만 쉘 (Day 외., 2010; 수감 외, 2012). 대조적으로, 약물-예측 타르 체의 간헐적 처리에서 동기 부여 변화는 NAc 쉘에서 DA 방출의 위상 변화에 국한되지만 핵심은 아니다 (Wheeler et al., 2011). 또한 우리와 다른 사람들은 학습 된 작업 중 DA 릴리스가 코어와 셸 사이에서 다르게 자극을 인코딩한다는 것을 보여주었습니다.Aragona et al., 2009; Owesson-White 외, 2009; Badrinarayan 등, 2012; Cacciapaglia 등, 2012). 글로벌 DA 신호 대신에, 이러한 발견은 DA가 학습, 동기 부여 및 행동과 관련된 정의 된 회로 내에서 소성을 지원하기 위해 특정 목표 영역에 차등적이고 신중하게 조정될 수 있음을 시사한다.

그러나, 이종 DA 신호의 정확한 기능은 잘 알려져 있지 않다. 한 영향력있는 모델은 DA가 미래의 결과에 대한 연관 기대치를 생성하기위한 교시 신호를 제공하고 이러한 예측이 정확한지 예측합니다 [PE (prediction error)]. DA 뉴런은 이러한 유형의 인코딩을 표시합니다 (Schultz 등, 1997; 슐츠와 디킨슨, 2000; Waelti 등, 2001; 토 블러 (Tobler) 등, 2003), 최근의 발견은 VTA에서 본질적으로 모든 광유 전자적으로 확인 된 DA 뉴런이 PE- 타입 신호 전달을 나타내는 것을 확인하지만 (코헨 (Cohen) 등, 2012). 반면에, 인센티브 솔 리언 스 (IS) 모델은 DA가 가치있는 강화제와 함께 자극을 부여하여 그 결과에 대한 동기 부여 드라이브 (Berridge and Robinson, 1998; Robinson과 Berridge, 2008; Zhang et al., 2009; Berridge, 2012). PE와 IS 모델은 비슷하지만 학습, 동기 부여 및 약물 중독의 필요성과 관련하여 DA 기능에 대해 매우 다양한 예측을합니다 (Redish, 2004; Tindell 등, 2009; Bromberg-Martin 외, 2010; Berridge, 2012).

간단한 컨디셔닝 작업에서 어떤 페이즈 DA 릴리즈가 인코딩되고 있는지 (즉, 보상을 예측 하는가? 또는 큐 존엄성을 아는가) 알기가 어렵습니다. 그러나 동일한 작업 내에서 예측적이고 현저한 자극을 시공간적으로 분리함으로써 학습 및 행동의 특정 기능을 분석하여 초기 예측, 결론적 행동, 동기 부여, 심지어 멸종과 같은 구성 요소를 분리 할 수 ​​있습니다. 이를 해결하기 위해, 우리는 하나의 레버 [탐색 레버 (SL)]를 누르는 것이 두 번째 복용 레버 (TL)를 누르는 것을 허용하고 TL을 누르면 음식을 배달하는 도구 체인 일정 작업을 사용했습니다. 또한, FSCV (fast-scan cyclic voltammetry)를 사용하여 잘 훈련 된 쥐의 NAc 코어 또는 셸에서 실시간 DA 릴리스 패턴을 측정하여 DA 인코딩의 작업 선택 기능이 NAc 하위 지역에서 어떻게 다른지 차별화했습니다. 마지막으로, 동기 부여 (기아 수준) 및 예측 (소멸) 측면이 변경 될 때 이러한 신호가 어떻게 동적으로 이동하는지 조사했습니다. 우리는 각각 PE 및 IS 모델과 매우 일치하는 코어 및 셸에서 DA 릴리스의 차등 패턴을 관찰했으며, 일반적으로 목표 지향적 행동의 보완 적이지만 뚜렷한 측면을 지원할 수있는 여러 mesolimbic DA 신호에 대한 아이디어를 지원합니다.

재료 및 방법

동물.

280-330 g 무게의 12 마리 수컷 스프 라그-돌리 쥐를 대상으로 사용 하였다. 랫트에 개별적으로 12 h 명 / 암주기를 가졌으며, 가벼운 음식은 90 % 자유 사료 무게 (10-15 g의 Purina laboratory chow)와 매일 세션 동안 소비 된 자당의 약 2.7 g ). 음식이 임의로 배정 된 수술 후 회복 기간 동안을 제외하고는 행동 테스트 기간 동안 음식 제한이 적용되었습니다. 모든 절차는 채플 힐 기관 동물 관리 및 사용위원회의 노스 캐롤라이나 대학교에 따라 수행되었습니다.

행동 훈련 : 연쇄 일정.

시험실에는 각각의 레버 위에 신호등이 있고 2 개의 개폐식 레버와 이전에 설명한 바와 같이 레버 사이에 동일한 거리에 위치한 음식 용기가 있습니다 (Cacciapaglia 등, 2012). 각각의 대상에 대하여, 모든 시험 세션 동안 하나의 레버 (예를 들어, 왼쪽)는 TL로 지정되고 다른 레버 (예를 들어, 오른쪽)는 SL로 지정되었다. TL과 SL의 측면은 피험자간에 균형을 맞췄습니다.

래트를 먼저 컵-컵 용기로부터 자당 펠릿 (45 mg, 퓨리나)을 얻도록 훈련시켰다. 단일 프리 트레이닝 세션 동안, 50 펠릿은 매 30마다 대략 한 번씩 무작위로 전달되었습니다. 이어서, 1 일 1 회 세션 동안 래트를 자당 펠렛을자가-투여하도록 훈련시켰다. 도구 반응을 형성하기 위해, 먼저 TL을 누르도록 동물을 훈련시켰다. 성형 중 각 시험은 TL을 테스트 챔버로 연장하는 것과 결합하여 TL 바로 위의 라이트 큐 조명으로 시작했습니다.O)]. 각 테이크 레버 프레스 [TLP; 연장 된 1 내의 고정 비율 1 (FR15)]는 단일 슈 크로스 펠렛 (45 mg)을 리셉터클 내로 전달하고, TL의 수축 및 큐 라이트의 종결을 초래 하였다. 동물이 15s 내에서 TL을 누르지 못하면 레버가 수축되고 큐 조명이 꺼지고 시험은 생략으로 계산됩니다. 평가판은 평균 15 (범위 : 5–25s; 성형 일 1 및 2)의 가변 시험 간격 간격으로 분리 된 다음 성형 일 45–3 (범위 : 4–30)에서 평균 60s로 증가했습니다. 에스).

TL에서 안정적인 응답을 설정 한 후 (즉, 세션에서 2 누락 오류 이하) 체인 일정이 도입되었습니다 (Fig. 1 A)에서 Olmstead et al. (2000). 체인 일정 세션 동안의 시험은 SL의 확장과 그 바로 위의 큐 라이트의 동시 조명으로 시작되었습니다 (SLO). 각 SLP (FR1) 결과 SL이 취소되고 큐가 꺼지고 TL이 표시됩니다.O (레버 확장, 큐 라이트). 상기 한 바와 같이, TL 프레스는 TL의 수축을 초래하여 큐 라이트를 소멸시키고 수 크로스 펠렛을 음식 컵으로 전달 하였다. 시험은 가변 45 시험 간격 (범위 : 30–60 s)으로 구분되었으며 각 세션은 30 시험으로 구성되었습니다. 체인 일정의 1 일 동안 SL 철회와 TL 확장 사이에는 지연이 없었습니다. 이후에는 SL 프레스의 후퇴와 TL의 연장 사이에 3–5의 가변 간격 (VI)이 도입되었습니다. 또한, TL 프레스와 자당 강화제 공급 사이에 VI 1–3가 도입되었습니다. 래트가 사건의 전달을 예측할 수있는 능력을 제거하기 위해, 훈련 중에 가변 지연을 사용 하였다 (즉, FSCV 기록 전 모든 세션). 래트는이 사슬 스케줄에 따라 또는 SL 또는 TL 중 하나를 생략하지 않고 2 개의 연속 세션의 안정적인 성능을 보여줄 때까지 5 d에 대해 훈련을받은 후, 수술 적으로 전압 전류 기록을 위해 준비 하였다.

행동 훈련 : 멸종.

마지막 기록 세션 후, 동물의 일부가 멸종되었습니다 (핵심 기록 : n = 3; 쉘 기록 : n = 7). 멸종, SLO 프레젠테이션은 새로운 시험의 시작을 나타냅니다. 시험은 SL 세션을 통해 TL을 발표 한 테스트 세션과 동일했습니다.O 나중에 4이지만 TL의 프레스는 강화되지 않았습니다. 쥐가 10 연속 시험을 위해 SL에서 반응을 멈출 때까지 멸종 세션이 계속되었다 (Fig. 1 B).

이전 연구들 (Schoenbaum 등, 2003; Saddoris 등 2005)는 변연 활동의 신경 상관 관계가 학습 및 동기 부여 상태의 변화에 ​​매우 민감하다는 것을 보여주었습니다.Fig. 1 B). 첫 번째 블록은 조기 멸종으로 SL에 대한 응답 대기 시간P 응답은 보상 세션과 유사했습니다. 다음으로 첫 번째 SLP 이전에 보상 된 체인 세션 동안보다 2 SD 이상 긴 응답 대기 시간이 지연 지연의 시작을 표시했습니다. 마지막으로, 첫 번째 생략 된 반응을 따르는 모든 시도는 후기 멸종 블록에 있었고, 쥐가 SL을 생략했는지 여부에 따라 그룹화되었습니다.P 응답 (후기 없음) 또는 응답 재개 (후기 누름). 모든 멸종 행동은 직전의 강화 된 연쇄 일정과 비교되었습니다.

수술 절차.

행동 훈련 후, 동물들은 전술 한 바와 같이 전압 전류 기록을 위해 외과 적으로 준비되었다 (Cacciapaglia 등, 2012). 간략하게, 래트를 케타민 하이드로 클로라이드 (100 mg / kg, im) 및 자일 라진 하이드로 클로라이드 (20 mg / kg) 믹스의 근육 내 주사로 마취시켰다. 가이드 캐뉼라 (Bioanalytical Systems)를 NAc 쉘 (+ 1.7 mm AP, + 0.8 mm ML) 또는 코어 (+ 1.3 mm AP, + 1.3 mm ML) 위에 이식하고 양극성 자극 전극 (플라스틱 1)을 VTA (-5.2 mm AP, + 1.0 mm ML 및 -7.8 DV). 기준 Ag / AgCl 전극에 대한 다른 가이드 캐뉼라를 대측 반구에 위치시켰다. 나사와 두개골 형 시멘트로 부품을 두개골에 고정시켰다.

전압 측정 기록.

여기에 사용 된 FSCV 기록 기술은 앞에서 자세히 설명한대로 (Cacciapaglia 등, 2012; 수감 외, 2012). 요약하면, 수술 후, 래트는 수술 전 체중 (적어도 5 d의 회복)으로 회복 될 수 있었다. 실험 당일, Ag / AgCl 기준 전극을 내부에 배치 한 후, 탄소 섬유 미세 전극을 국부적으로 구축 된 마이크로 드라이브 (노스 캐롤라이나 대학교 노스 캐롤라이나 대학교 화학부 전자 시설)에 의해 NAc 쉘 또는 코어 내로 낮추었다. 반대쪽 반구. 탄소 섬유 미세 전극은 Ag / AgCl 기준 전극에 대해 -0.4 V로 유지되었다. 100 V 및 -1.3 V로 전위를 유도하는 삼각 파형을 적용하여 주기적으로 주기적 볼타 모 그램을 획득했습니다 (0.4 ms 간격). 각 기록 세션을 시작하기 전에 바이폴라 자극을 구동하여 전기적으로 발생하는 DA 릴리스 이벤트를 얻었습니다. VTA에서 전극을 생성하고 NAc에서 결과적인 DA 방출을 기록 하였다. DA 방출을 유도하는데 자극이 실패한 경우, 전극을 새로운 위치로 낮추고 과정을 반복 하였다. 전기 자극이 NAc에서 DA 방출을 성공적으로 유발하면, 자극 주파수 (10와 60 Hz 사이)와 양극성 VTA 전극으로부터의 2 상 펄스 수 (4에서 25까지)의 조합을 사용하여 유발 된 DA 방출의 훈련 세트가 생성되었다. 기록의 서브 세트에서, 세션에 대한 전극 안정성을 보장하기 위해 행동 세션의 종료 후에 추가 훈련 세트가 생성되었다. 쥐의 하위 집합에서n = 9), 30 회 시험의 전체 세션을 기록한 후, 다른 방출 부위가 발견 될 때까지 전극을 ~ 300μm 더 낮추었 고, 그 지점에서 30 회의 시험의 또 다른 세션에 대해 또 다른 기록을 수행했습니다. FSCV 데이터 분석 (HDCV 분석)은 이전에 설명한대로 테스트 전에 수집 된 관련 기록 세션에서 각 피험자의 전기 자극 훈련 세트를 사용하여 DA로 인한 전류의 변화를 추출하기 위해 화학계 주성분 분석을 사용했습니다.Heien et al., 2005; 키 슬리 등, 2010). 각 지역 (코어 및 셸)에 대해 평균 DA 농도 추적을 각 행동 이벤트에 맞추고 SL 직전의 5 기준선에 대한 평균 DA 농도와 비교했습니다.O 대상 평균에 대한 양방향 혼합 모델 ANOVA (인자 : 이벤트, 지역)를 사용하여 시작합니다.

멸종 세션의 경우, DA 추적도 마찬가지로 행동 이벤트에 맞춰졌다. 그러나 SL이 많기 때문에O 발표 후에는 멸종 된 프레스가 없었고, 두 가지 다른 분석이 사용되었습니다. 첫 번째로 DA 추적은 SL에 정렬되었습니다.O 멸종 단계별로 분류 Fig. 6), 소멸 단계 및 자극 이벤트를 요인으로 사용하여 양방향 반복 측정을 사용하여 분석했습니다. 두 번째 분석의 경우, 쥐가 TL을 누르는 시험 만P TL 둘 다에 대해 피크 DA 농도 (즉, 이벤트 후 300 ms 이내의 최대 DA 방출)를 사용 하였다.P 소멸 단계와 작업 자극을 요인으로 사용하여 양방향 반복 측정 ANOVA로 보상하고 마찬가지로 분석합니다. 모든 사후 쌍대 비교는 Tukey의 HSD를 사용하여 이루어졌고 동일하지 않은 경우 수정되었습니다. N 적절한 경우. 모든 통계 분석은 Windows 용 Prism 4.0 (GraphPad Software) 또는 Statistica for Windows (StatSoft)를 사용하여 수행되었습니다.

조직학.

각각의 실험 후, 래트를 케타민 (100 mg / kg) / 자일 라진 (20 mg / kg) 혼합물 (im)로 깊이 마취시켰다. 실험 동안 사용 된 동일한 마이크로 매니퓰레이터에 수용된 텅스텐 전극을 실험 기록 장소로 낮추고 전극 팁의 위치를 ​​표시하기 위해 작은 전해 병변 (50-500 μA, 5 s)을 만들었다. 여러 번의 기록이 완료되었을 때 발생한 여러 병변. 각각의 뇌를 제거하고, 4 % 포름 알데히드로 고정시킨 다음, -80C로 동결시킨 후, 크라이 오 스탯을 갖는 40 μm 관상 섹션으로 슬라이스되었다. 섹션을 슬라이드에 장착하고 명 시야 현미경으로 관찰하고 디지털 이미지 (Fig. 1 C).

코어 및 셸에서 자극 및 이벤트 발생 DA 릴리스 비교

거동 사건에 대한 코어 및 쉘 DA 방출 사이의 차이는 방출 역학의 차이가 아니라, 영역들 사이의 DA 클리어런스의 동역학의 차이로 인한 것일 수있다. 예를 들어, 쉘에서 도파민 수송 체의 밀도가 낮기 때문에 코어보다 쉘에서 트리아 DA 방출 및 흡수 역학이 느리다 (Jones 외, 1996; Budygin et al., 2002). 따라서 이후 이벤트에서 코어와 셸의 차이 (예 : TLO, 보상)은 껍질의 시냅스 영역에서 잔류 DA의 지속성에 의해 설명 될 수있다.

이 문제를 해결하기 위해 행동 이벤트 (예 : SL)에 의해 유발 된 DA 방출 및 흡수 패턴을 비교했습니다.O) VTA 구 심성에 대한 전기 자극의 짧은 버스트에 의해 유도되는 DA에 대한 체인 일정 작업 동안. 원래, VTA 섬유의 전기 자극 (2ms 이상 펄스)은 다양한 자극 주파수 (10-60Hz) 및 펄스 수 (4-25 펄스)에서 수행되어 전체 스펙트럼의 방출 역학을 얻습니다. 화학 측정 훈련 세트. 따라서 많은 수의 전기 자극이 자연적으로 발생하는 과도 상태 (일반적으로 2000 ~ 40nm)에서 볼 수있는 것보다 훨씬 더 컸습니다 (예 : 150nm). 매우 높은 농도의 DA 방출에서 DA 수송 체가 포화되어 정상 범위에서 볼 수있는 것보다 더 느린 클리어런스 동역학을 유발할 수 있습니다. 이 문제를 직접 해결하기 위해 피크 DA 방출이 <200nm 인 전기 자극 "시험"만 선택했습니다. 마찬가지로, 우리는 최고 DA 릴리스가 SL에 맞춰진 행동 시험 만 선택했습니다.O 100 nm 이상이었다. 각각의 대상에 대해, 모든 적격 시험은 분석을 위해 평균화되었다. 이 메트릭을 사용하여 코어에서 23 전기 자극 및 15 큐 유발 세션과 쉘에서 14 전기 자극 및 11 큐 유발 세션을 얻었습니다.

큐 대 전기 호출 DA 릴리스의 비교는 몇 가지 메트릭을 사용하여 수행되었습니다. 첫째, 피크 DA는 SL의 행동 이벤트에서 파생되었습니다.O (즉, 1.5의 SL 내에서 가장 큰 DA 농도O 발병), TLO (SL 다음에 4와 5.5 사이에서 가장 큰 DA 농도O 발병) 및 보상 (SL 이후 6.5–8 사이에서 가장 큰 DA 농도)O 큐 이벤트의 경우, 및 전기적으로 자극 된 이벤트의 해당 시점에서 (즉, 동일한 시점이지만 SL이 아닌 자극 개시 이후)O 습격). 다음으로 이전에 게시 된 메트릭을 사용하여 클리어런스 역학을 검사했습니다 (요르가 손 (Yorgason) 등의 2011). 특히 피크 이후 반감기 (피크 농도의 절반)에 대한 대기 시간을 살펴 보았습니다. T 20 (피크에서 20 % 붕괴 시간) 및 T 80 (피크에서 80 % 붕괴 시간). 이 값들은 영역 (코어, 쉘), 자극 유형 (SL)을 사용하는 혼합 모델 ANOVA를 사용하여 비교되었습니다.O 각 사건 유형 (기준선, SL)에서 개체 간 요인 및 DA 농도로 정렬되고 전기적으로 자극 됨O, TLO보상 및 보상 측정 (대기 시간이 최고치, T 20, 반감기 및 T 80)를 각각 반복해서 측정합니다. 사후 특별 불평등에 대해 Tukey의 HSD를 사용하여 비교가 수행되었습니다. N.

결과

강화 된 체인 일정 동작

쥐는 사슬 일정 과제를 빠르게 배웠다. 마지막 presurgery 세션에서 쥐는 평균적으로 실험의 99.8 %를 정확하게 완료했습니다. 이러한 세션 동안, 래트는 SL을 따라 누르기 위해 평균 783 ± 253 ms를 걸었다.O, XTLX ± 588 ms 후 TL 후 누름O거의 중요한 차이 t (17) = 1.77, p = 0.085 그러나, 수술후 기록 일에, 래트는 다시 거의 생략하지 않았지만 (99.5 %), TL에 대해 훨씬 더 빠른 반응 지연을 나타냈다P SL보다 (999 ± 64 ms)P (444 ± 39 ms), t (29) = 7.48, p <0.0001. 중요한 것은 기록 일에 셸과 코어에 기록 된 동물의 반응 지연 시간에 차이가 없었습니다. t (29) = 0.78, p = 0.48. 따라서, 두 그룹 (코어 및 쉘)의 래트는 작업이 강화 될 때 체인 스케줄을 완료하는 데 동등하게 유능했다.

강화 된 체인 일정 동안 NAc 코어 및 셸의 차등 DA 릴리스

다음으로 FSCV를 사용하여 NAc 코어에서 실시간 DA 레코딩을 얻었습니다 (n = 13) 또는 셸 (n 잘 배운 체인 일정 (성능을 익힌 체인 일정 (12))Fig. 1 C). 다중 기록을 수행 한 래트에서, 300 μm 탄소 섬유 전극 팁이 각각의 기록에 대해 완전히 새로운 조직에 있도록 세션 사이에 전극 팁을 적어도 100 μm 낮추었다. 둘 다와 일치 PEIS 모델, 우리는 SL과 신호등 (SL)의 시작으로 시작된 강력한 위상 DA 릴리스를 발견했습니다.O) 코어와 쉘 모두에서. 대표적인 기록 세션 (30 시험에서 평균)의이 신호의 예는 코어 (Fig. 2 A) 및 셸 (Fig. 2 B), 개별 동물의 색상 도표와 함께. DA 신호 전달은 하위 지역간에 현저하게 달랐습니다. 핵심에서 모든 쥐에 걸쳐 (Fig. 2 C-E, 검은 색 흔적), DA는 가장 예측적인 신호 (SL)가 시작될 때 빠르게 정점에 도달했습니다.O 발병) TL 시점에 기준선으로 급격히 감소P. 반대로 셸에서Fig. 2 C-E, 회색 흔적), DA 농도의 급격한 증가는 SL과 일치했습니다.O TL에서 불연속 최고점을 가진 다른 동기 부여 자극성 자극에 대한 프레젠테이션 및 상승 상태 유지O 평가판 종료시 기준으로 돌아 가기 전에 배송 보상.

그림 1. 

A , 작업 설계도. 체인 스케줄 동안, 큐 라이트가 레버 (SL) 위에 조명되는 것과 동시에 하나의 레버 (SL)가 테스트 챔버로 연장되었습니다.O). SLP 빛을 끄고 레버를 집어 넣습니다. 지연 후 챔버의 다른 레버 (TL)가 확장되고 관련 큐 조명이 켜졌습니다 (TLO). TL (TL)을 누르면P) 쥐들은 지체 후 음식 강화를 받았다 (R). B , 핵심 또는 껍질에 FSCV 기록이있는 동물의 멸종 행동. 멸종의 행동과 분석은 쥐의 행동을 기반으로 블록별로 분류되었습니다. 멸종 된 사건을 비교하기 위해 직전 연쇄 과제의 시험이 사용되었습니다. 조기 소멸은 SL에 대한 첫 번째 현저한 지연 반응까지 모든 시험이었고, 지연 소멸은 첫 번째 지연된 SL 사이의 모든 시험이었습니다.P SL에 이어 첫 번째 생략 된 프레스O 표시. 후기 소멸 블록 내에서, 피험자가 프레스를했는지 또는 응답을 생략했는지에 대한 구별이 이루어졌다. C , 코어 (검은 색 원) 및 중간 껍질 (회색 원) 내 전극 배치의 조직학.

그림 2. 

체인 스케줄의 성능은 NAc 내에서 다른 DA 릴리스 역학을 생성했습니다. 코어의 도파민 방출 역학 A ) 및 셸 ( B )는 챔버 내로의 SL 연장 시간에 정렬 된 NAc의 (SL)O). 색상 도표는 각각 핵심 및 셸에서 대표 주제의 평균을 보여줍니다. TL 확장 (TL)의 평균 시간 (▴)O) 및 SL에 대한 보상 (R) 및 범위 (± 2 SD)O 하단에 표시됩니다. C - E ,을 기준으로 코어 (검정) 및 셸 (회색)의 모든 기록에서 교차 대상 평균 DA 릴리즈 C ) SLO( D ) SLP, TL의 확장O 나중에 4이고 ( E TLP, 보상 (R) 식품 펠렛은 프레스 후 2.5를 전달했습니다. 점선은 각 지역에 대한 평균의 SEM을 보여줍니다. 맨 아래 줄 ( F - H )는 각 행동 이벤트에 대한 평균 피크 DA 릴리스를 보여줍니다. *p 기준선 대비 <0.05; †p <0.05 코어 대 쉘.

체인 스케줄의 각 행동 이벤트에 맞춰 코어 또는 쉘에서 촬영 한 모든 기록을 평균화하여 이러한 관측치를 정량화했습니다 (Fig. 2 CH). FSCV 기록 세션에서 SL 사이의 시간P TLO TL 사이의 시간과 마찬가지로 고정 (4 초)P DA 분석을위한 작업 자극을보다 잘 정렬 할 수 있도록 보상 전달 (2.5). 따라서 SL에 정렬O, SLP/ TLO, TLP보상은 모든 행동 마커의 정렬을 허용하고 이러한 사건에 대한 피크 DA 방출의 분석을 허용했다.

영역 (코어, 셸) 및 이벤트 (기준선, SL)에서 피크 (이벤트 후 300 ms 이내의 최대 DA 농도)를 비교하는 양방향 ANOVAO, SLP, TLO, TLP보상)은 쉘이 코어보다 전체적으로 더 많은 DA를 릴리스했음을 나타냅니다. F (1,24) = 13.63, p <0.002. 중요한 것은 지역 × 이벤트의 중요한 상호 작용, F (5,120) = 9.88, p <0.0001, 코어 및 셸의 DA 신호가 행동 이벤트에 차등 적으로 반응 함을 나타냅니다 (Fig. 2 F–H). 특히 SL에서 코어 DA 릴리스가 크게 증가했습니다.O기준선 (p <0.0001), SL 시점에 기준선 이상 유지P (p <0.0001), SL에서는 훨씬 낮음O (p <0.05). 그러나 TL 이벤트 (TL)에 대한 기준과 비교하여 코어의 피크 DA에는 차이가 없었습니다.O 기준선 p = 0.59; TLP 기준선 p = 1.0) 및 보상 수령시 기준과의 차이가 없습니다 (p = 1.0).

대조적으로, 쉘에서 피크 DA 농도는 모든 사건에 대해 상당한 DA 방출을 나타냈다. 모든 이벤트는 기준보다 더 큰 DA 릴리스와 연관되어 있습니다 (모든 비교 대 BL, p <0.0002), 어떤 이벤트도 서로 크게 다르지 않은 반면 (모두 pairwise SLO, SLP, TLO, TLP보상 비교, p > 0.96).

코어와 셸을 직접 비교하면 지역 간 DA 신호에서 중요한 차이점을 발견했습니다. 두 기준선 중 DA 릴리스에는 차이가 없었지만 (p = 1.0) 또는 SL 이벤트 (SLO, p = 1.0; SLP, p = 0.22), 쉘 DA는 두 TL 이벤트 (TL 모두에 대해 코어와 비교하여 크게 증가했습니다.O, p <0.01; TLP, p <0.001) 및 보상 (p <0.0005; Fig. 3 D-F).

그림 3. 

세션의 시작 (초기; 체인 스케줄의 첫 번째 5 시험)과 세션의 끝 (늦은; 마지막 5 시험) 사이의 DA 신호 변경. A , 각 피험자의 처음 XNUMX 회 시험 (연한 파란색) 및 마지막 XNUMX 회 시험 (보라색)의 평균으로부터 얻은 NAc 코어의 평균 DA 농도. B , 코어에서, 개체 내 피크 DA 신호는 세션의 시작과 끝 사이에서 변하지 않았다. C , 각 피험자의 처음 XNUMX 회 시험 (빨간색) 및 마지막 XNUMX 회 시험 (주황색)의 평균에서 얻은 NAc 쉘의 평균 DA 농도. D , 쉘 DA는 SL 둘 다에서 개체-내에서 유의미한 감소를 나타냈다P TLP 신호와 보상 (**p <0.01), SL에서의 감소O 큐는 거의 중요했다 (#p = 0.073). 오차 막대는 차이의 SE를 나타냅니다 (초기 및 늦음).

세션 시작과 종료 사이의 DA 릴리스의 지역별 변경

다음으로, 세션 시작시 (1 차 5 시험) 강화 된 체인 스케줄 작업 중 코어 및 셸의 DA 릴리스와 세션 종료 (마지막 5 시험)를 비교했습니다. Fig. 3). 이것은 세션 내내 전극이 안정적인지 (즉, 시간이 지남에 따라 전극이 감도를 잃지 않았는지) 확인하고 DA가 동기 상태의 미묘한 변화를 추적하는지 (예 : 영향으로 인해) 평가하는 데 중요했습니다. 다른 자극이 나타난 후 음식 섭취 후 기아 감소.

핵심에서 (Fig. 3 A), 양방향 ANOVA는 이벤트의 주요 주요 영향을 나타 냈습니다 (BL, SLO, SLP, TLO, TLPRew; F (5,65) = 35.03, p <0.0001), 그러나 세션 단계 (초기 vs 후기; F (1,13) = 3.55, p = 0.08) 또는 이벤트 × 세션 단계 (F (5,65) = 0.82, p = 0.54). 사후 특별 초기 블록과 늦은 블록 사이의 비교는 코어에서의 행동 이벤트에 대한 피크 DA 방출이 세션의 시작과 끝 사이에서 동일하게 유지됨을 나타냈다 (터키 : BL, SL에 대한 모든 초기 및 늦은 쌍별 비교)O, SLP, TLO, TLP보상하고 p > 0.50; Fig. 3 B).

그러나 작업 자극에 대한 phasic DA 릴리스는 일반적으로 쉘의 세션에서 감소했습니다 (Fig. 3 C,D), 이벤트의 주요 영향 (F (5,55) = 13.52, p <0.0001), 세션 단계 (F (1,11) = 6.95, p = 0.02) 및 이벤트와 세션 단계 (F (5,55) = 3.74, p = 0.006). 핵심 에서처럼 사후 테스트 결과 BL에서 차이는 없었지만 SL로 피크 DA 방출이 크게 감소했습니다.P, TLP, 보상 (Tukey : 모두 p <0.0005), SL에서 유의미한 경향O 큐 (p = 0.060), TL에서 차이가 없음O 큐 (p = 0.36). 따라서 셸 (핵심은 아님)의 변화는 주로 동기 부여 된 행동과 차등 적 (겸손하지만) 효과 신호 발생을 통한 보상 소비로 제한되었습니다. DA 방출의 이러한 세션 간 이동은 전극 감도의 일반화 된 변화 때문이 아니라 DA 방출 패턴의 자극 및 쉘 특정 변화가 반복 된 시험에서 작업 자극의 변경된 중요성에 대한 정보를 나타냄을 시사합니다. 동물이 각 기록 세션이 끝날 때까지 평균 25 개 이상의 펠릿을 섭취했음을 감안할 때 (즉, 1144 mg 또는 쥐의 일일 식품 제한 요법 무게의 7.6 %) 이러한 결과는 식품 섭취가 증가했음을 시사합니다. 동물의 동기 부여 된 굶주림 상태를 성공적으로 줄 였는데, 이는 세션 과정에서 핵심이 아닌 껍질의 변화에서 나타났습니다.

코어 및 쉘에서 큐 유발 및 전기 자극 DA 역학

이러한 발견에 대한 하나의 경고는 코어와 쉘이 코어와 비교하여 쉘에서 DA 운송업자의 밀도가 낮기 때문에 DA 간극 역학이 다르다는 것입니다.Jones 외, 1996; Budygin et al., 2002). 따라서 TL 및 보상 이벤트에서 볼 수있는 쉘 DA는 SL 시점의 잔여 DA 릴리스로 인한 것일 수 있습니다.O, 그러나 코어 에서처럼 시냅스 오버 플로우에서 효과적으로 제거 될 수는 없습니다. 이를 해결하기 위해 체인 스케줄 기록과 동일한 전극 위치에서 전기적으로 자극 된 DA 방출을 비교하여 전기적으로 자극 된 다이나믹이 코어와 쉘의 큐 유발 다이나믹과 일치하는지 확인했습니다 (Fig. 4 A). 쉘에서 느린 클리어런스 속도론이 후속 이벤트 신호의 차이 (예 : TL)를 담당 한 경우O) 코어와 쉘 사이에서 각각의 소 영역에서 전기적으로 자극되고 큐 유발 방출은 거의 동일한 방출 및 클리어런스 패턴을 따라야한다. 대조적으로, 전기 자극으로부터의 상당한 편차는 그 영역에서의 DA 방출이 시냅스 간극 역학만으로는 설명 될 수없는 방식으로 작업 관련 사건을 추적하고 있음을 시사 할 것이다.

그림 4. 

NAc 코어 및 쉘에서 전기적으로 자극 된 신호 대 큐 유발 된 DA 신호의 비교. A , SL에 정렬 된 DA의 평균 농도O VTA 섬유 발병의 큐 또는 전기 자극. TL의 시작시기O 큐와 보상은 SL에 따른 결과에 대한 응답 시간 범위에서 추정되었습니다.O (평균 응답 시간은 삼각형으로 표시되고 너비는 ± 95 % 신뢰 구간을 나타냅니다). B , SL의 1s 내에서 평균 기준선 (BL) DA 농도 대 피크 DA 농도의 비교O 또는 전기 자극 (Stim / SLO) 및 TL에 해당하는 시간 동안 95 % 신뢰 구간 범위 내O 또는 신기원 보상. C , SL에 따른 대기 시간-피크 농도O 또는 코어 및 쉘에서 방출 후 전기 자극 (피크 라트) 및 후속 붕괴 (클리어런스). 티20 그리고 T80 신호가 피크에서 각각 20 % 및 80 %로 감쇠 한 시간이며 반감기는 피크에 도달 한 후 피크 피크에 이르는 대기 시간입니다. *p <0.0001, 전기 자극 / SLO 기준선 대; †p <0.0001, Shell : 다른 모든 자극 유형보다 더 큰 큐 [DA]; ‡ p <0.0001, Shell : 다른 모든 자극 유형보다 피크에서 감쇠까지 대기 시간이 더 길어집니다. 오차 막대는 차이의 SE를 보여줍니다 (큐 대 전기).

전체적으로, 우리는 코어와 쉘이 큐 유발과 전기 유발 DA 방출 사이의 관계에서 급격히 다르다는 것을 발견했다 (Fig. 4 B). 작업 이벤트에서 피크 농도를 살펴보면 영역 (코어 / 쉘) × 자극 유형 (전기 대 큐) × 이벤트 (BL, SL의 상호 작용으로 DA 농도에 상당한 차이가있었습니다.O, TLORew; F (3,174) = 12.31, p <0.0001). 코어에서 큐 유발 및 전기 자극 트레이스에 대한 피크 DA 농도는 거의 동일했습니다. 기준선 SL에서 이러한 자극 유형간에 통계적 차이가 없었습니다.O, TLO또는 신기원 보상 (터키 : 모두 p > 0.80). 대조적으로, 쉘은 전기적 및 신호 유발 DA 방출 패턴 사이에서 다른 역학 패턴을 보여주었습니다. 기준치 또는 SL에서 농도 차이는 없었지만O (터키 : 둘 다 p > 0.98), DA는 TL에서 상당히 컸습니다.O 전기 자극과 비교하여 단서 시험에서 신기원 보상 p <0.0001).

마찬가지로, 시냅스로부터의 방출 속도 및 후속 클리어런스도 유사한 패턴을 나타냈다 (Fig. 4 C). 피크로부터 붕괴의 함수로서 클리어런스 율을 살펴보면, 영역 × 자극 유형 × 붕괴 파라미터 (피크 시간, T20반감기, T80; F (3,174) = 80.23, p <0.00001). 위와 같이 코어 클리어런스 및 감쇠 역학은 큐 유발 및 전기 유발 자극 유형간에 차이가 없습니다. 최대 대기 시간, T 20, 반감기 및 T 80 자극 유형에 관계없이 모두 통계적으로 유사했습니다 (전기적 대 큐; 모두 p > 0.95). 대조적으로, 껍질의 DA 수준은 SL 이후 기준선까지 상당히 지연된 붕괴를 나타냈다.O 전기적으로 자극 된 시험에 대한 프레젠테이션. 대기 시간이 정점에 도달하는 동안 T 20 큐 유발 자극과 전기 유발 자극 사이에 유사했습니다.p > 0.98), 반감기 지연 (p <0.0001) 및 T 80 (p <0.0001)은 전기 자극에 비해 단서 시험에서 상당히 지연되었습니다. 종합적으로, 이러한 발견은 쉘과 코어의 클리어런스 동역학의 본질적인 차이가 행동 성능 동안 DA 신호의 차이를 설명하기에 불충분하다는 것을 보여줍니다.

멸종 행동

쥐는 멸종 세션 동안 다른 레버를 누르는 대기 시간을 점진적으로 증가시켜 음식 보상이 생략되었을 때 세션 동안 멸종 행동을 보였습니다. 우리는 바로 이전의 강화 된 체인 세션 동안 SL 및 TL의 프레스 지연 시간과 관련된 이러한 지연 시간 변화를 기반으로 행동 적으로 정의 된 단계를 생성했습니다. 초기 단계는 강화 된 세션 동안 대기 시간이 동일한 시험으로 정의되었습니다. 래트가 레버를 정상보다 상당히 느리게 눌렀을 때 (즉,> 2 SD), 이것은 피험자가 반응을 생략 할 때까지 첫 번째 지연된 반응부터 지속되는 지연 단계라고합니다. 이 첫 번째 생략 이후의 모든 시험은 쥐가 압박을 받았는지 (늦게 압박) 응답을 생략했는지 (늦게 압박하지 않음)에 따라 후기 단계로 명명되었습니다.

먼저, 랫트가 SL에서 TL에 대한 초기 실험에서 지연 단계로의 지연 시간 이동과 첫 번째 생략 된 실험으로의 실험 수 (즉, 늦은 단계로의 이동)를 각각 나타 내기 전에 수행 된 실험의 수를 평가했습니다 (Fig. 5 A). SL이 SL에 대해 그렇게하기 전에 TL에 대한 래트의 반응이 상당히 느려졌다. t 테스트 : t (7) = 2.49, p = 0.04, TL (아마도 보상과의 직접적인 관계로 인해)은 SL보다 보상 누락에 더 민감하다는 것을 암시합니다. 대조적으로, 첫 번째 생략을 시도하기 전의 시험 횟수는 SL과 TL 레버 모두에서 거의 동일했습니다 (p > 0.9), 아마도 생략 된 응답이 시험 시작시 보상 예측이 정확히 XNUMX으로 업데이트 된 경우에만 방출되었음을 나타냅니다. 이와 일치하여 동물이 SL을 수행 한 실험은 거의 발견되지 않았습니다.P 그러나 후속 TL은 생략P 반응 (4 / 140 총 후기 임상 시험; 2.9 %), 쥐가 거의 독점적으로 전체 사슬 서열을 수행하거나 전혀 수행하지 않음을 시사합니다. 따라서 누락은 TL보다 SL에서 사용 가능한 정보와 더 관련이있을 수 있습니다.

그림 5. 

코어 또는 쉘에 FSCV 기록이있는 동물의 멸종 행동. A , 쥐가 처음으로 시도하기 전의 시험 횟수는 SL (연회색) 및 TL (진회색)에 대한 소멸의 초기 단계에서 지연 단계 (왼쪽) 및 반응 생략 (오른쪽)으로 이동하기 위해 반응 지연이 크게 증가한 것으로 나타났습니다. 래트는 SL보다 상당히 적은 수의 시도에서 TL에 대한 지연 시간 이동을 보였지만, 시도가 생략되기 전에 시도 횟수는 반응을 찾는 것과 응시하는 사이에 동일했지만. *p <0.05 SL 대 TL. B , 멸종 단계에서 SL (왼쪽)과 TL (오른쪽)에서 응답하기위한 응답 대기 시간. 응답 지연은 블록 전체에서 증가했으며 SL 프레스의 지연 및 지연 소멸 블록에서 상당히 길었습니다. TL의 프레스는 각 블록 내 SL의 프레스보다 훨씬 빠릅니다. *p <0.05, **p <0.01 대 초기 Ext.

다음으로 SL의 평균 대기 시간을 조사했습니다.P TLP 위의 기준에 따라 각 단계에서. 작업의 여러 단계 (체인, 조기 소멸, 지연 소멸, 늦게 누르는 동안)에서 다른 레버 (SL, TL)에 대한 응답 대기 시간을 비교하는 양방향 반복 측정 ANOVA는 레버의 중요한 주요 효과를 보여주었습니다 (F (1,4) = 45.7, p = 0.003), 이는 SL보다 TL에 대한 응답이 훨씬 빠르기 때문입니다 (Fig. 5 B), 일반적인 강화 세션 동안의 성능 및 일관된 소멸 단계의 주요 효과 (F (3,12) = 14.5, p <0.001). SL의 경우 SLP 조기 소멸 동안의 반응은 강화 된 연쇄 세션 동안의 반응과 유사했습니다 (Tukey : p = 1.0)이지만 지연에 의해 상당히 느려집니다 (p = 0.02 vs 초기) 및 늦게 누름 (p = 0.003 대 초기 단계. 그러나 SL의 프레스 대기 시간은 지연과 후기 단계에서 비슷했습니다 (p = 0.89). TL 프레스의 경우 응답 레이턴시 이동이 미묘하고 후기 단계가 초기 단계보다 상당히 느립니다 (p = 0.04). 그러나 선형 대비는 TL 대기 시간 이동에서 가장 큰 분산 비율을 차지했습니다 (F (1,4) = 11.08, p = 0.03; 주요 효과 분산의 86 %), SL의 경우 체인과 초기 및 지연 및 후기 위상을 비교하는 대비가 효과 분산의 가장 큰 비율을 차지했습니다 (F (1,4) = 15.42, p = 0.02; 주 효과 분산의 97 %).

소멸 : 생략 된 결과는 코어 및 쉘 DA 신호를 차등 적으로 향상시킵니다.

랫트가 행동 적으로 정의 된 멸종 단계를 통해 진행됨에 따라 NAc에서 사건 관련 DA 신호 전달이 이동 하였다. 소멸에 의해 DA 인코딩이 영향을받는 방식은 코어와 셸 (Fig. 6).

그림 6. 

코어의 DA 릴리스 ( A - C ) 및 셸 ( D - F ) 멸종 중. A , SL에 대한 정렬O 핵심에서 보상 된 연쇄 세션 (검은 색 선)에 비해 반복적 소멸 시험 (파란색 선)에 대한 신호에 대한 핵심 DA 방출의 연속 감소가 밝혀졌다. TL에 맞춰 강화 된 체인 일정 (검정색) 및 조기 멸종 (파란색) 동안 작동 반응 및 보상에 대한 BvCore DA 릴리스P 행사. 회색 막대는 기준 기간 동안 DA의 최대 및 최소 농도 범위를 보여줍니다. C SL에 대한 피크 DAP, TLP, 강화 된 일정과 조기 멸종 보상. D , SL에 대한 정렬O 셸 (빨간색 선)에서 보상 된 연쇄 세션 (검은 색 선)에 비해 반복적 인 멸종 실험에 대한 단서의 위상 DA 방출이 더 이산 적으로 감소한 것으로 나타났습니다. E , DA 신호는 TL에 정렬P 멸종 위기에 처한 껍질 (빨간색)과 강화 된 사슬 스케줄 (검은 색). F 쉘의 피크 DA는 SL에서 변경되지 않았습니다.PTL에서 크게 감소했습니다.P 그리고 보상. *p <0.05, **p <0.01, 사슬 대 조기 멸종; †p <0.05, 기준선보다 누락이 적습니다.

우리는 먼저 소멸 동안 코어에서 DA 신호를 조사했다. SL에 상대적O, DA 보상 체인 세션에 비해 소멸의 여러 단계에 걸쳐 크게 선형으로 감소 (상호 작용 : 위상 × 큐; SLO 기준선; F (4,157) = 33.19, p <0.0001; Fig. 6 포스트 포스트 pairwise 비교는 SL에 대한 피크 DAO 체인과 멸종 단계 사이에서 급격히 감소했습니다 (Tukey : p <0.0001), 그리고 다시 조기 멸종과 후기 멸종 사이 (p <0.0001). 그러나 지연 소멸 중 DA는 후기 보도 블록 (p = 0.64) 및 피크 DA는 래트가 반응을했는지의 여부에 따라 말기에 상이하지 않았다 (후기 언론 대 늦은 언론, p = 0.99). 또한 SL 중 DA 릴리스O 체인의 기준선보다 훨씬 컸습니다 (p <0.0001), 조기 멸종 (p <0.0001), 멸종 지연 (p <0.001) 단계, 그러나 늦은 프레스 또는 늦은 프레스 없음 단계 (둘 다 p > 0.5). 이러한 쌍별 결과는 유의미한 음의 선형 추세 (F (1,157) = 94.77, p <0.0001), 효과 분산의 대부분 (71 %)을 차지했습니다.

다음으로, 뇌에서 PE 신호의 특징 중 하나는 예상 보상이 생략 될 때 부정적인 예측 오류가 존재한다는 것입니다.Schultz 등, 1997). 우리는 피험자가 보상이 전달 될 것이라고 완전히 기대했을 때 이들 신호가 멸종 초기에 가장 강할 것으로 예상했다. 핵심에서 (Fig. 6 B), 양방향 ANOVA는 사건 × 단계 (사슬 대 초기 멸종의 유의 한 상호 작용; F (3,57) = 3.24, p = 0.029). 특히, 이전 SL에 비해 피크 DA 방출P 강화 된 연쇄 세션에 비해 조기 멸종이 현저히 감소했습니다 (Tukey : p = 0.019), TL로 DA 릴리스P 영향을받지 않았다 (p = 0.41). 비판적으로 핵심 DA는 멸종 중 부정적인 예측 오류의 증거를 보여 주었다 (Fig. 6 B) 예상되었지만 생략 된 보상 시간 동안 DA 릴리스가 강화 된 세션보다 현저히 낮았습니다 (p = 0.003). 실제로 보상에 대한 최대 DA 릴리스는 강화 된 체인 세션 동안 기준선과 다르지 않았습니다 (p = 0.99), 보상 누락시 기준선보다 크게 줄었습니다 (p = 0.03). 따라서, 조기 소멸 동안 코어의 DA 신호는 예측 SL 자극 및 동작으로의 릴리스에서의 동적 시프트, TL 큐에 대한 변화가 없음, 및 누락을 보상하기위한 네거티브 예측 에러를 모두 표시 하였다.

쉘은 SL에 비해 다른 패턴의 DA 방출을 보여 주었다O 큐 (Fig. 6 D). 여기, 주제 평균 큐 유발 DA가 SL로O 여러 단계에 걸쳐 동적으로 변경됨 (상호 작용 : 단계 × 큐; F (2,24) = 7.95, p <0.0005), 그러나 코어와 달리 쉘 DA는 체인 단계와 조기 멸종 사이에 변하지 않았습니다.p = 0.74)이지만 SL에 DA 신호O 지연 쇠퇴 단계에서 강화 사슬 단계 모두에 비해p = 0.041) 및 조기 소멸 단계 (p = 0.02), 쥐의 행동 동기 부여 변화 (Fig. 5). DA 신호는 지연 단계와 후기 단계 사이에서 다시 크게 감소했습니다 (후기 프레스, p = 0.03; 늦게 언론 p = 0.004)이지만 후기 사이에 DA 수준에는 차이가 없었습니다 (프레스 대 프레스 없음, p = 0.43). 코어에서와 같이 SL 중 DA 릴리스O 체인, 조기 소멸 및 지연 소멸 단계에서 기준선보다 상당히 높음 (Tukey : all p <0.001), 그러나 후기 단계 중 어느 것도 기준선과 크게 다르지 않았습니다. 따라서 코어 DA 릴리스는 가장 예측 가능한 큐에 대한 예측의 변화를 신속하고 지속적으로 추적하는 반면, 쉘에서 동일한 큐에 대한 DA 릴리스 패턴은 대신 멸종 단계 사이의 동기 부여 상태 변화를 추적합니다.

압축 및 보상 신호를 살펴보면 셸 DA 릴리스는 코어의 패턴과 다릅니다 (Fig. 6 E,F). 자극 유형 (BL, SL)에 의한 개별 시험에서 DA를 검사하는 양방향 ANOVAP, TLP, 보상)과 멸종 단계 (사슬, 조기 멸종)는 자극 × 멸종 (F (3,108) = 11.5, p <0.0001; Fig. 6 D). 코어와 달리 SL에 대한 피크 쉘 DA 릴리스에는 차이가 없었습니다.P 멸종 초기 (p = 0.44). 대신, 소멸은 TL 둘 다에 대한 DA 방출의 현저한 감소를 유도 하였다P (p = 0.01) 및 보상 수령과 관련하여 보상 누락시 (p <0.0001)은 강화 된 체인 일정 중 일치 된 시간과 관련됩니다. 보상 형 체인 세션 동안 DA는 기준선 (p <0.0001), 그러나 보상 누락 동안 DA는 수치 적으로 더 크지 만 기준선과 통계적으로 다르지 않았습니다 (p = 0.07). 따라서 핵심과는 달리, 우리는 조기 멸종 예측 오류에 대한 제한된 증거를 발견했으며, 대신 TL (SL은 아님) 프레스에 비해 DA 릴리스가 감소하고 강화 된 스케줄 중에 나타난 보상에서 DA 릴리스가 제거되었습니다.

토론

Phasic DA 릴리스 패턴 추적 DA 기능의 이론과 일치하는 방식으로 NAc subregions 사이 현저 하 게 다른 자극을 추적. 잘 알려진 체인 일정 작업에서 NAc 코어의 DA는 가장 예측적인 큐에서 선택적으로 정점에 도달했으며 소멸 중 예측 값과 오류의 변화를 선형으로 추적했습니다. 대조적으로, NAc 쉘의 phasic DA 릴리스는 작업이 보상되었을 때 모든 두드러진 자극을 추적했으며, 세션 내에서 그리고 멸종 중에 동기의 변화와 일치하는 신호의 변화를 나타냈다. 따라서, 우리는 이러한 DA 신호를 행동 중에 동물에게 동시에 사용할 수 있으며, 예측 및 동기 정보가 학습과 행동을 안내 할 수 있도록 제안합니다.

핵심 DA 릴리스 예측 오류 추적

핵심적으로, DA는 SL 큐 발표 시점에서 위상이 크게 증가했으며 이전의 발견과 유사하게 완전히 예측 된 이후의 사건 (예 : TL, 보상)에 대한 기준으로 거절했습니다.Roitman et al., 2004; Cacciapaglia 등, 2012). 이 활동 패턴은 오류 예측 모델과 일치하며, 최대 예측 신호는 가장 높은 DA 릴리스 (예측, 예측)를 이끌어 내야하지만, 뒤 따르는 정확하게 예측 된 이벤트는 최소한의 DA 릴리스 (예측 오류)를 이끌어 내야합니다. 따라서 SL에 의해 TL과 보상이 정확하게 예측되었으므로 배송시 오류가 거의 발생하지 않았으며 오류 관련 DA 릴리스가 거의 발생하지 않았습니다.Schultz 등, 1997; 슐츠와 디킨슨, 2000).

우리 실험실과 다른 사람들은 핵심의 DA 신호가 예측 값의 차이에 민감하고 위험 선호도 및 강화 지연과 같은 주관적 요인에 의해 변조된다는 것을 보여주었습니다.Day 외., 2010; Gan et al., 2010; 수감 외, 2012; Saddoris 등 2013, 2015). 예를 들어, 위험한 의사 결정 작업을 수행하는 쥐에서 핵심 DA는 쥐가 선호하는 옵션을 예측하는 단서로 확장되었으며 예상되는 보상이 생략되면 기준선 아래로 빠르게 하락하여 부정적인 예측 오류를 나타냅니다 (수감 외, 2012). 마찬가지로 코어 DA는 예측 결과의 값을 추적하고 소멸 중에 업데이트 된 예측 된 큐 값을 기반으로 동적으로 이동했습니다. 실제로, DA 로의 SL 출시O DA가 반응 동기 여부에 관계없이 멸종 동안 반응을 생략하기 시작했을 때 기준선과 다르지 않았다. 이는 DA가 언론에 대한 동기보다는 반응의 예상 가치를 신호로 보냈다는 것을 암시한다. 또한, 멸종 초기의 보상 누락은 부정적인 예측 오류 신호와 일치하여 DA 릴리스에서 강력한 일시 중지를 유발했습니다.

Shell DA, 동기 부여 자극적 인 자극 추적

쉘의 DA 방출은 모든 두드러진 자극 (SL)을 신중하게 추적O, TLOR). 이러한 패턴은 느린 재 흡수 속도론으로 설명 할 수 없으며 대신 우연한 이벤트의 실시간 인코딩을 반영하는 것으로 보입니다 (Pan 등, 2005) 및 인센티브 경품 획득 (Berridge and Robinson, 1998; Berridge, 2012; Wassum 등, 2012). 따라서 DA 릴리스 이벤트는 셸에서 예측 단서와 보상을 모두 인코딩했지만 코어에서는 예측 단서 만 인코딩했습니다 (Cacciapaglia 등, 2012).

쉘 DA 신호의이 동기 부여 요소에 대한 증거를 찾았습니다. 첫째, 자극에서 껍질로의 DA 신호 전달은 세션의 시작과 끝 사이에서 감소되었으며, 코어에서는 보이지 않았다. 한 가지 설명은 세션이 끝날 때 쥐의 크기가 더 높았다는 것입니다. . 대조적으로, 단서는 여전히 자당 펠렛의 전달을 정확하게 예측 했으므로, 코어에서의 PE- 타입 인코딩은 이러한 동기 이동에 의해 상대적으로 덜 영향을 받는다.

둘째, 멸종 동안 쉘에서 DA가 SL로 방출O 쥐가 동일한 동기 수준에서 작업을 수행하는 동안 (반응 대기 시간 및 정확도로 표시됨) 안정적으로 유지되었지만, 멸종 과정에서 쥐의 동기가 감소한 후 (즉, 반응 대기 시간) 크게 감소했습니다. 대조적으로, 우리는 TL 자극 동안 phasic DA 방출의 급격한 감소를 보았습니다. IS 모델은 불확실성을 줄이는 단서가 더 큰 동기 부여와 인센티브를 창출해야한다고 예측합니다 (Zhang et al., 2009; 스미스 (Smith) 등, 2011)는 임박한 보상 제공을 최대한 예측하므로 TL에 대해 편향되어 있습니다. 실제로, 암페타민의 비 -NAc 쉘 주입은 연쇄 파빌로 비안 작업에서 보상의 전달에 가장 근접한 큐의 인코딩을 선택적으로 강화하지만, 시퀀스의 첫 번째 큐에는 영향을 미치지 않습니다 (스미스 (Smith) 등, 2011). 따라서, TL의 DA 인코딩은 멸종 보상 보상 손실 예측에 특히 민감했다. 놀랍게도, 보상 누락으로 인해 기준선 아래에서 DA가 방출되지 않았으며, 이는 쉘 DA가 코어보다 음의 예측 오류를 인코딩 할 가능성이 적다는 것을 시사합니다. 종합적으로, NAc 쉘 내에서의 이러한 시그널링 패턴은 코어와 명백히 상이하며, IS- 타입 인코딩을 암시한다.

지원으로 NAc 쉘은 다양한 동기 부여 방식의 동작과 관련이 있습니다. 예를 들어 짠 용액이 일반적으로 혐오스러운 소금 식욕은 동물이 소금이 부족한 경우 보람을 줄 수 있습니다. 두 경우 모두 예측 된 결과 (소금)는 동일하지만 결과를 얻는 동기는 정상적인 동물과 소금이없는 동물간에 다릅니다 (Tindell 등, 2009). 짠 용액에 대한 NAc 신경 인코딩은 소금 동기의 정도에 따라 셸에서 변조되는 반면 핵심 뉴런은 상태 기반의 차이를 표시하지 못했습니다 (Loriaux 등, 2011). 유사하게, 암페타민의 비 -NAc 쉘 미세 주입은 코카인에 대한 만성 전이 전달 경험과 같이 파블로프에서기구로의 전이 (PIT) 동안 큐의 존재에서 레버 프레싱의 동 기부 동력을 강력하게 강화시킨다 (Wyvell과 Berridge, 2000; Saddoris 등 2011; LeBlanc et al., 2013). 실제로, PIT 행동을 강화시키는자가 투여 코카인에 대한 경험은 또한 코어에 비해 NAc 쉘 신경 인코딩을 우선적으로 증가시킨다 (Saddoris 등 2011).

쉘과 코어에서 이러한 IS 및 PE 패턴은 식욕을 돋우는 조건과 혐오스러운 조건을 모두 추적하는 것으로 보입니다. 파블로프의 공포 조절에서, 현저한 혐오 신호에 대해 NAc 쉘에서 phasic DA가 증가하는 반면, 핵심 DA 방출은 음의 결과에 대한 PE- 타입 예측을 나타내는 방출에서 감소 및 일시 정지되었다 (Badrinarayan 등, 2012). 따라서 핵심 DA 릴리스는 결과 값의 예측과 밀접하게 관련되어있는 반면, 부정적인 (그러나 현저한) 이벤트조차도 쉘 내의 IS 유형 모델로 설명 할 수 있습니다.

컨디셔닝에서 PE 및 IS 신호의 복잡성

한 가지주의 할 점은 파블로프 컨디셔닝에서 예측 신호와 우선적으로 상호 작용하는 동물 ( "sign trackers")이 음식 컵에 바로가는 동물 ( "goal trackers")에 비해 NAc 코어에서 향상된 DA 방출을 나타냅니다. Flagel et al., 2011). 이 증가 된 부호 추적은 신호가 동기 "자석"으로 작용할 수있는 핵심 자극이되어 핵심에서 비슷한 결과를 얻음에 따라 IS를 지원하는 것으로 설명됩니다 (Aragona et al., 2009; Peciña와 Berridge, 2013; Wassum 등, 2013; Ostlund et al., 2014). 이것은 PE가 코어에 바이어스되고 IS가 쉘에 바이어스되는 것과는 상충되는 것으로 보입니다.

코어와 쉘에서 DA 신호의 각 역할은 복잡 할 수 있습니다. 예를 들어, 위의 연구 중 일부는 이러한 작업에서 쉘과 코어의 역할을 독립적으로 조사한 결과 추적 추적 동물의 코어에서 DA의 증가는 단순히 mesolimbic 경로에서 인센티브 DA 신호의 일반화 된 증가를 반영 할 수 있습니다. 또한 우리는 절대적인 분열을 옹호하지 않습니다. TL에 대한 일부 DA 릴리스를 찾았습니다.O 핵심은 SL에 DA이지만O 소각 동안 동기 부여의 변화에도 불구하고 소각에서 쉘의 코어 및 PE에 IS의 특징이 존재할 수 있음을 시사한다 (낮은 수준 및 / 또는 작업 역학에 덜 반응하지만). 오히려 코어와 셸이 PE 및 IS 유형 인코딩 패턴을 향한 결정적인 편향을 나타내며, 이는 선조 해부 구조의 등급이 더 높은 구성과 일치합니다 (하버, 2014).

중독에 대한 시사점

코어 및 셸 DA 신호의 모델 기반 차이는 자연적인 보상 학습 이상의 중요한 의미를 갖습니다. 예를 들어, 남용 약물은 처음에는 보람이 있지만, 시간이 지남에 따라 약물 관련 자극은 강렬한 욕구를 불러 일으키고 약물을 찾는 부정적인 정서적 상태를 유발할 수 있습니다 (Koob and Le Moal, 1997). 약물에 대한 장기 금욕은 갈망의 배양으로 알려진 과정을 통해 약물 관련 자극의 영향을 증가시킵니다.Grimm 외, 2001; Hollander and Carelli, 2005; Pickens et al., 2011). 예상 결과 (약물)는 즉각적인 상태와 금욕적인 상태 모두에서 변하지 않지만, 금욕적인 피험자에게 약물 복용을 재개하려는 동기는 크게 증가합니다. 이것은 그러한 자극의 인센티브 현저성에 상당한 변화를 암시하고 금욕 관련 변화가 우선적으로 쉘에서 보여 져야한다고 예측할 것입니다. 이와 관련하여 약물자가 투여 쥐에게 혐오 적 동기 부여 상태를 유도하는 코카인 예측 단서가 제시되면 DA 신호 전달의 변화는 껍데기에서 동물의 혐오 상태를 추적하지만 코어는 추적하지 않습니다 (Wheeler et al., 2011). 종합적으로, 이러한 발견은 학습 및 동기 부여에 대한 핵심 및 셸 DA 기여가 자연 및 약물 보상 모두에서 일관됨을 뒷받침합니다.

각주

  • 6 월 18, 2015를 받았습니다.
  • 수정 버전은 7 월 8, 2015입니다.
  • 7 월 15, 2015에 허용됩니다.
  • 이 연구는 National Institutes of Drug Abuse Grants DA028156 및 DA035322 to MPS, DA017318 및 DA034021 to RMC, DA010900 to RMW에 의해 지원되었습니다.이 연구의 초기 초안에 대한 의견에 대해 Elizabeth West 박사에게 감사드립니다.

  • 저자는 경쟁적인 금전적 이해 관계가 없음을 선언합니다.

  • 해당 내용은 콜로라도 대학교 볼더, Mu 젠저, UCB 345, 볼더, CO 80309-0345의 심리학과 신경 과학과 Michael Saddoris 박사에게 문의해야합니다. [이메일 보호]

참고자료

    1. 아 라고나 BJ,
    2. JJ 일,
    3. Roitman MF,
    4. 클리브랜드 NA,
    5. 와이트 맨 RM,
    6. Carelli RM

    (2009) 쥐의 큐-코카인 협회 획득 중 위상 도파민 전달 패턴의 실시간 개발에있어 지역 특이성. Eur J Neurosci 30 : 1889–1899입니다.

    1. 배드 리나 얀 A,
    2. 웨 스콧 SA,
    3. 밴더 웰레 CM,
    4. 손더스 BT,
    5. Couturier BE,
    6. 마렌 S,
    7. 아 라고나 BJ

    (2012) Aversive 자극은 핵 accumbens 코어와 쉘 내에서 실시간 도파민 전달 역학을 차등 적으로 조절합니다. J 신경 과학 32 : 15779–15790입니다.

    1. Berridge KC

    (2012) 예측 오류에서 인센티브 경이로움 : 보상 동기 부여의 중급 계산. Eur J Neurosci 35 : 1124–1143입니다.

    1. 버 릿지 KC,
    2. 로빈슨 TE

    (1998) 보상에서 도파민의 역할은 무엇입니까? 쾌락 영향, 보상 학습, 또는 인센티브 현저함? 브레인 레브 레브 28 : 309–369입니다.

    1. 브롬 버그-마틴 ES,
    2. 마츠모토 M,
    3. 히코 사카 오

    (2010) 동기 부여 제어의 도파민 : 보람, 혐오 및 경고. 신경 68 : 815–834입니다.

    1. Budygin EA,
    2. 존 CE,
    3. 마테오 Y,
    4. 존스 SR

    (2002) 도파민 수송 체 녹아웃 마우스의 핵 축적의 코어 및 껍질에서 도파민 제거에 대한 코카인 효과 부족. J 신경 과학 22 : RC222입니다.

    1. Cacciapaglia F,
    2. Saddoris MP,
    3. 와이트 맨 RM,
    4. Carelli RM

    (2012) 핵 축적 핵과 껍질에서의 차등 도파민 방출 역학은 자당에 대한 목표 지향적 행동의 뚜렷한 측면을 추적합니다. 신경 약리학 62 : 2050–2056입니다.

    1. 코헨 JY
    2. 헤 슬러 S,
    3. 봉 L,
    4. 로웰 BB,
    5. 우치다 N

    (2012) 복부 Tegmental 영역에서 보상 및 처벌을위한 뉴런 유형별 신호. 자연 482 : 85–88입니다.

    1. JJ 일,
    2. 존스 JL,
    3. 와이트 맨 RM,
    4. Carelli RM

    (2010) Phasic nucleus accumbens 도파민 방출은 노력과 지연 관련 비용을 인코딩합니다. BIOL 정신과 68 : 306–309입니다.

    1. 플라 글 SB,
    2. 클라크 JJ
    3. 로빈슨 TE,
    4. 메이요 L,
    5. Czuj A,
    6. Willuhn I,
    7. Akers CA,
    8. 클린턴 SM,
    9. 필립스 PE,
    10. Akil H

    (2011) 자극 보상 학습에서 도파민에 대한 선택적 역할. 자연 469 : 53–57입니다.

    1. 간 조
    2. 월튼 ME,
    3. 필립스 PE

    (2010) mesolimbic dopamine에 의한 미래 보상의 분리 가능한 비용 및 이익 인코딩. 냇 뉴로시 13 : 25–27입니다.

    1. 그림 JW,
    2. 희망 BT,
    3. 현명한 RA,
    4. 샤함 Y

    (2001) Neuroadaptation : 철수 후 코카인 갈망의 배양. 자연 412 : 141–142입니다.

    1. 하버 SN

    (2014) 코르티코 기초 신경절 회로에서 도파민의 위치. 신경 과학 282C : 248–257입니다.

    1. Heien ML,
    2. 칸 AS,
    3. 아리안 센 JL
    4. 응원 JF
    5. 필립스 PE,
    6. Wassum KM,
    7. 와이트 맨 RM

    (2005) 행동하는 쥐의 뇌에서 코카인 후 도파민 변동의 실시간 측정. Proc Natl Acad Sci USA 102 : 10023–10028입니다.

    1. Hollander JA,
    2. Carelli RM

    (2005) 코카인자가 관리의 부재는 Accumbens에서 목표 지향적 행동의 신경 인코딩을 높입니다. Neuropsychopharmacology 30 : 1464–1474입니다.

    1. 키 슬리 RB,
    2. 카렐 리 RM,
    3. 와이트 맨 RM

    (2010) 순위 추정 및 다변량 분석 생체내에서 고속 스캔 순환 전압 전류 데이터. 항문 화학 82 : 5541–5551입니다.

    1. Koob GF,
    2. 르 모알 남

    (1997) 약물 남용 : 지혈 성 항상성 조절 곤란. 과학 278 : 52–58입니다.

    1. 르블랑 KH
    2. 하녀 NT,
    3. 오스트 룬드 SB

    (2013) 반복 된 코카인 노출은 인센티브 동기 부여의 표현을 용이하게하고 쥐의 습관적 조절을 유도합니다. PloS 하나 8 : e61355입니다.

    1. 로리아 AL,
    2. Roitman JD,
    3. 로트 만 MF

    (2011) 핵 축적은 핵심은 아니지만 껍질의 동기 부여 가치를 추적합니다. J 신경 피시 올 106 : 1537–1544입니다.

    1. Olmstead MC,
    2. Parkinson JA,
    3. 마일 FJ,
    4. 에버릿 BJ,
    5. 디킨슨 A

    (2000) 쥐의 코카인 찾기 : 조절, 강화 및 활성화. 정신 약리학 152 : 123–131입니다.

    1. 오스트 런드 SB,
    2. 르블랑 KH
    3. 코셀 레프 AR,
    4. Wassum KM,
    5. 메더먼트 NT

    (2014) Phasic mesolimbic dopamine 신호는 반복 된 코카인 노출에 의해 생성 된 인센티브 동기 부여를 촉진합니다. Neuropsychopharmacology 39 : 2441–2449입니다.

    1. 오 웨손-화이트 CA,
    2. 아리안 센 J,
    3. 스터 버 GD,
    4. 클리브랜드 NA,
    5. 응원 JF
    6. 와이트 맨 RM,
    7. Carelli RM

    (2009) 코카인을 찾는 행동의 신경 인코딩은 accumbens 코어와 쉘에서 phasic dopamine 방출과 일치합니다. Eur J Neurosci 30 : 1117–1127입니다.

    1. 팬 WX,
    2. 슈미트 R,
    3. Wickens JR,
    4. 하이랜드 BI

    (2005) 도파민 세포는 고전적 조절 동안 예측 된 이벤트에 반응합니다 : 보상 학습 네트워크에서 자격 추적에 대한 증거. J 신경 과학 25 : 6235–6242입니다.

    1. 페시 냐 S,
    2. Berridge KC

    (2013) 핵 어 큐벤의 도파민 또는 오피오이드 자극은 유사하게 큐 트리거 된“원하는”보상을 증폭시킵니다. Eur J Neurosci 37 : 1529–1540입니다.

    1. Pickens CL,
    2. Airavaara M,
    3. Theberge F,
    4. Fanous S,
    5. 희망 BT,
    6. 샤함 Y

    (2011) 약물 갈망의 배양에 대한 신경 생물학. 트렌드 신경 과학 34 : 411–420입니다.

    1. 레디 쉬 광고

    (2004) 계산 프로세스로서의 중독이 사라졌습니다. 과학 306 : 1944–1947입니다.

    1. 로빈슨 TE,
    2. Berridge KC

    (2008) 검토 : 중독에 대한 인센티브 과민성 이론 : 몇 가지 현재 문제. Philos Trans R Soc Lond B Biol Sci 363 : 3137–3146입니다.

    1. Roitman MF,
    2. 스터 버 GD,
    3. 필립스 PE,
    4. 와이트 맨 RM,
    5. Carelli RM

    (2004) 도파민은 1 초 이하의 식량 탐색 조절 제로 작동합니다. J 신경 과학 24 : 1265–1271입니다.

    1. Saddoris MP,
    2. 갤러거 M,
    3. oen 바움 G

    (2005) 기저 측 편도에서의 신속한 연관 인코딩은 궤도 전두엽 피질과의 연결에 의존합니다. 신경 46 : 321–331입니다.

    1. Saddoris MP,
    2. 스타 마타 키스 A,
    3. Carelli RM

    (2011) 핵 축적 핵에서 Pavlovian-to-instrumental transfer의 신경 상관은 코카인자가 투여 후 선택적으로 강화됩니다. Eur J Neurosci 33 : 2274–2287입니다.

    1. Saddoris MP,
    2. 수감 JA,
    3. Cacciapaglia F,
    4. Carelli RM

    (2013) Accumbens 코어 및 쉘의 빠른 도파민 역학 : 학습 및 행동. 전면 바이오시 (Elite Ed) 5 : 273–288입니다.

    1. Saddoris MP,
    2. 수감 JA,
    3. 스터 버 GD,
    4. 위트 IB,
    5. Deisseroth K,
    6. Carelli RM

    (2015) Mesolimbic dopamine은 가치 기반 의사 결정의 개별 측면을 동적으로 추적하고 인과 관계가 있습니다. BIOL 정신과 77 : 903–911입니다.

    1. 쇼엔 바움 G,
    2. Setlow B,
    3. Saddoris MP,
    4. 갤러거 M

    (2003) 큐 샘플링 동안 궤도 전두엽 피질에서의 예측 결과 및 획득 된 값을 인코딩하는 것은 기저 측 편도의 입력에 의존합니다. 신경 39 : 855–867입니다.

    1. 슐츠여
    2. 디킨슨 A

    (2000) 예측 오류의 신경 코딩. Annu Rev Neurosci 23 : 473–500입니다.

    1. 슐츠여
    2. Dayan P,
    3. Montague PR

    (1997) 예측과 보상의 신경 기질. 과학 275 : 1593–1599입니다.

    1. 스미스 KS,
    2. 버 릿지 KC,
    3. 올드 리지 JW

    (2011) 뇌 보상 회로에서 인센티브 경의와 학습 신호로부터 즐거움을 분리합니다. Proc Natl Acad Sci USA 108 : E255–E264입니다.

    1. 수감 JA,
    2. JJ 일,
    3. 와이트 맨 RM,
    4. Carelli RM

    (2012) Phasic nucleus accumbens 도파민은 위험 기반 의사 결정 행동을 인코딩합니다. BIOL 정신과 71 : 199–205입니다.

    1. Tindell AJ,
    2. 스미스 KS,
    3. 버 릿지 KC,
    4. 올드 리지 JW

    (2009) 인센티브 경의 동적 계산 : "좋아요"를 "좋아하지 않음" J 신경 과학 29 : 12220–12228입니다.

    1. Tobler PN,
    2. 디킨슨 A,
    3. 슐츠 W

    (2003) 조절 된 억제 패러다임에서 도파민 뉴런에 의해 예측 된 보상 생략의 코딩. J 신경 과학 23 : 10402–10410입니다.

    1. 월티 P,
    2. 디킨슨 A,
    3. 슐츠 W

    (2001) 도파민 반응은 공식 학습 이론의 기본 가정을 준수합니다. 자연 412 : 43–48입니다.

    1. Wassum KM,
    2. 오스트 런드 SB,
    3. 메더먼트 NT

    (2012) Phasic mesolimbic dopamine 신호는 자기 개시 행동 서열 작업의 성능을 선행하고 예측합니다. BIOL 정신과 71 : 846–854입니다.

    1. Wassum KM,
    2. 오스트 런드 SB,
    3. Loewinger GC,
    4. 메더먼트 NT

    (2013) Phasic mesolimbic dopamine release는 pavlovian-to-instrumental transfer의 표현 중 보상 추구를 추적합니다. BIOL 정신과 73 : 747–755입니다.

    1. 휠러 RA,
    2. 아 라고나 BJ,
    3. Fuhrmann KA,
    4. 존스 JL,
    5. JJ 일,
    6. Cacciapaglia F,
    7. 와이트 맨 RM,
    8. Carelli RM

    (2011) 코카인 큐는 보상 처리와 감정 상태에서 상황에 따른 변화를 반대합니다. BIOL 정신과 69 : 1067–1074입니다.

    1. 위벨 CL,
    2. Berridge KC

    (2000) intra-accumbens 암페타민은 자당 보상의 조건부 인센티브 효과를 증가시킵니다. J 신경 과학 20 : 8122–8130입니다.

    1. 요르가 손 JT,
    2. 에스파냐 RA,
    3. 존스 SR

    (2011) 악마 전압 전류 측정 및 분석 소프트웨어 : 다중 운동 측정을 사용하여 도파민 신호에서 코카인으로 인한 변화 분석. J Neurosci 방법 202 : 158–164입니다.

    1. 장 J,
    2. 버 릿지 KC,
    3. Tindell AJ,
    4. 스미스 KS,
    5. 올드 리지 JW

    (2009) 인센티브 salience의 신경 계산 모델. PLoS Comput Biol 5 : e1000437입니다.

  •