Предиктивный сигнал вознаграждения дофаминовых нейронов (1998)

J Neurophysiol. 1998 Jul;80(1):1-27.

Шульц W1.

Абстрактные

Эффекты поражений, блокирования рецепторов, электрической самостимуляции и злоупотребления наркотиками предполагают, что дофаминовые системы среднего мозга вовлечены в обработку информации о вознаграждении и в подходе к обучению. Большинство дофаминовых нейронов проявляют фазные активации после первичной жидкой и пищевой награды и обусловленных, предсказывающих награду визуальных и слуховых стимулов. Они показывают двухфазные, активационно-депрессивные ответы после стимулов, которые напоминают предсказывающие вознаграждение стимулы или являются новыми или особенно заметными. Тем не менее, только несколько фазических активаций следуют за отвращающими стимулами. Таким образом, дофаминовые нейроны маркируют стимулы окружающей среды аппетитным значением, предсказывают и обнаруживают награды и сигнализируют о событиях и мотивации. Не делая различий между различными наградами, дофаминовые нейроны, кажется, испускают предупреждающее сообщение о неожиданном присутствии или отсутствии вознаграждений. Все ответы на вознаграждения и стимулы, предсказывающие вознаграждение, зависят от предсказуемости события. Дофаминовые нейроны активируются вознаграждением событий, которые лучше, чем прогнозировалось, на них не влияют события, которые столь же хороши, как прогнозировалось, и подавляются событиями, которые хуже прогнозируемых. Сигнализируя вознаграждения в соответствии с ошибкой предсказания, ответы допамина имеют формальные характеристики обучающего сигнала, постулируемого теориями обучения с подкреплением. Ответы дофамина переносятся в процессе обучения от первичных вознаграждений к предсказывающим вознаграждение стимулам. Это может способствовать нейрональным механизмам, лежащим в основе ретроградного действия вознаграждений, одной из главных загадок в обучении подкреплению. Импульсная реакция высвобождает короткий импульс дофамина на многие дендриты, таким образом передавая довольно глобальный сигнал усиления постсинаптическим нейронам. Этот сигнал может улучшить поведение при заходе на посадку, предоставляя предварительную информацию о вознаграждении до того, как это произойдет, и может способствовать обучению путем изменения синаптической передачи. Сигнал вознаграждения допамина дополняется активностью в нейронах в полосатом теле, лобной коре и миндалине, которые обрабатывают специфическую информацию о вознаграждении, но не излучают сигнал ошибки предсказания глобального вознаграждения. Сотрудничество между различными сигналами вознаграждения может обеспечить использование определенных вознаграждений для выборочного усиления поведения. Среди других проекционных систем норадреналиновые нейроны преимущественно служат механизмам внимания, а ядерные базальные нейроны кодируют награды гетерогенно. Волокна, поднимающиеся по мозжечку, сигнализируют об ошибках двигательной активности или об ошибках в прогнозировании аверсивных явлений в клетках Пуркинье мозжечка. Большинство дефицитов после дофамин-истощающих поражений нелегко объяснить дефектным сигналом вознаграждения, но они могут отражать отсутствие общей стимулирующей функции уровня тоника внеклеточного дофамина. Таким образом, дофаминовые системы могут иметь две функции: поэтапную передачу информации о вознаграждении и тонизирующее действие постсинаптических нейронов.

ВВЕДЕНИЕ

Когда многоклеточные организмы возникли в результате эволюции самовоспроизводящихся молекул, они разработали эндогенные механизмы ауторегуляции, гарантирующие, что их потребности в благополучии и выживании были удовлетворены. Субъекты используют различные формы подходящего поведения для получения ресурсов для поддержания гомеостатического баланса и воспроизводства. Один класс ресурсов называется вознаграждением, которое вызывает и усиливает подходящее поведение. Функции вознаграждения получили дальнейшее развитие в ходе эволюции высших млекопитающих, чтобы поддерживать более сложные формы индивидуального и социального поведения. Таким образом, биологические и когнитивные потребности определяют природу вознаграждения, а доступность вознаграждения определяет некоторые из основных параметров условий жизни субъекта.

Награды бывают разных физических форм, сильно варьируются во времени и зависят от конкретной среды субъекта. Несмотря на их важность, награды не влияют на мозг через выделенные периферические рецепторы, настроенные на ограниченный диапазон физических модальностей, как в случае первичных сенсорных систем. Скорее, информация о вознаграждении извлекается мозгом из большого разнообразия полисенсорных, неоднородных и непостоянных стимулов с использованием определенных нейрональных механизмов. Очень разнообразный характер вознаграждений требует высокой степени адаптации в нейронных системах, обрабатывающих их.

По-видимому, одной из основных нейронных систем, участвующих в обработке информации о вознаграждении, является система допамина. Поведенческие исследования показывают, что проекции дофамина в стриатум и лобную кору играют центральную роль в опосредовании эффектов вознаграждения на поведение при подходе и обучение. Эти результаты получены в результате избирательных поражений различных компонентов дофаминовых систем, системного и внутримозгового введения препаратов прямого и непрямого действия агонистов и антагонистов дофаминовых рецепторов, электрической самостимуляции и самостоятельного введения основных лекарств от злоупотребления, таких как кокаин, амфетамин, опиаты, алкоголь и никотин (Бенингер и Хан 1983; Di Chiara 1995; Фибигер и Филлипс 1986; Роббинс и Эверитт 1992; Робинсон и Берридж 1993; Мудрый 1996; Мудрый и Хоффман 1992; Мудрый и соавт. 1978).

В настоящей статье обобщаются последние исследования, касающиеся передачи сигналов стимулирующих факторов окружающей среды дофаминовыми нейронами, и оцениваются потенциальные функции этих сигналов для изменения поведенческих реакций с учетом анатомической организации, теорий обучения, моделей искусственных нейронов, других нейронных систем и дефицита после поражений. Будут описаны все известные характеристики отклика дофаминовых нейронов, но преимущественно ответы на стимулы, связанные с вознаграждением, будут концептуализированы, потому что они лучше всего понятны в настоящее время. Из-за большого количества данных, доступных в литературе, основной обсуждаемой системой будет нигростриатальная дофаминовая проекция, но проекции от дофаминовых нейронов среднего мозга до вентрального стриатума и лобной коры также будут рассматриваться, насколько позволяют современные знания.

НАГРАДЫ И ПРОГНОЗЫ

Функции наград

Определенные объекты и события в окружающей среде имеют особое мотивационное значение, поскольку они влияют на благосостояние, выживание и воспроизводство. Согласно выявленным поведенческим реакциям, мотивационная ценность объектов окружающей среды может быть аппетитной (поощрительной) или отвратительной (наказывающей). (Обратите внимание, что «аппетит» используется как синоним «вознаграждение», но не «подготовительный».) У аппетитных объектов есть три основные функции, которые можно разделить. В их первой функции награды выявляют подход и непревзойденное поведение. Это связано с тем, что объекты помечены как имеющие аппетит через врожденные механизмы или, в большинстве случаев, через обучение. В своей второй функции награды увеличивают частоту и интенсивность поведения, приводящего к таким объектам (обучению), и они поддерживают усвоенное поведение, предотвращая вымирание. Награды служат положительным подкреплением поведения в классических и инструментальных процедур кондиционирования. В общем обучении с помощью стимулов экологические стимулы приобретают аппетитную ценность после классически обусловленных ассоциаций стимул-вознаграждение и побуждают к подходу (Биндра 1968). В инструментальной обусловленности вознаграждение «усиливает» поведение путем усиления связей между стимулами и поведенческими реакциями (Закон эффекта: Торндайк 1911). В этом суть «возвращаться к большему» и связана с общим представлением о наградах, полученных за то, что они сделали что-то хорошее. В инструментальной форме стимулирующего обучения вознаграждения являются «стимулами» и служат в качестве целей поведения, следующих за ассоциациями между поведенческими реакциями и результатами (Дикинсон и Баллейн 1994). В их третьей функции награды вызывают субъективные ощущения удовольствия (hedonia) и положительные эмоциональные состояния. Аверсивные раздражители действуют в противоположных направлениях. Они вызывают реакцию отмены и действуют как отрицательные подкрепления, увеличивая и поддерживая поведение избегания при повторном представлении, тем самым уменьшая воздействие разрушительных событий. Кроме того, они вызывают внутренние эмоциональные состояния гнева, страха и паники.

Функции прогнозов

Прогнозы предоставляют предварительную информацию о будущих стимулах, событиях или состояниях системы. Они обеспечивают основное преимущество выигрыша времени для поведенческих реакций. Некоторые формы предсказаний приписывают мотивационные ценности стимулам окружающей среды, связывая их с конкретными результатами, таким образом идентифицируя объекты жизненно важной важности и выделяя их из менее ценных объектов. Другие формы кодируют физические параметры прогнозируемых объектов, такие как пространственное положение, скорость и вес. Предсказания позволяют организму оценивать будущие события до того, как они действительно произойдут, позволяют выбирать и подготавливать поведенческие реакции и увеличивают вероятность приближения или избегания объектов, обозначенных мотивационными ценностями. Например, повторяющиеся движения объектов в одной и той же последовательности позволяют прогнозировать предстоящие позиции и уже готовят следующее движение, преследуя настоящий объект. Это уменьшает время реакции между отдельными целями, ускоряет общую производительность и приводит к более раннему результату. Прогнозирующие движения глаз улучшают поведенческие качества благодаря предварительной фокусировке (Цветы и Даунинг 1978).

На более продвинутом уровне предварительная информация, обеспечиваемая предсказаниями, позволяет принимать решения между альтернативами для достижения определенных состояний системы, сближения с редко встречающимися объектами цели или избежания непоправимого неблагоприятного воздействия. Промышленные приложения используют Внутренний Контроль Модели, чтобы предсказать и отреагировать на состояния системы, прежде чем они действительно произойдут (Гарсия и др. 1989). Например, метод «летать по проводам» в современной авиации вычисляет предсказуемые предстоящие состояния самолетов. Решения о полетных маневрах учитывают эту информацию и помогают избежать чрезмерной нагрузки на механические компоненты самолета, тем самым уменьшая вес и увеличивая дальность полета.

Использование прогнозирующей информации зависит от характера представляемых будущих событий или состояний системы. Простые представления непосредственно касаются положения предстоящих целей и последующей поведенческой реакции, тем самым сокращая время реакции довольно автоматическим способом. Более высокие формы предсказаний основаны на представлениях, допускающих логический вывод, к которым можно обращаться и обращаться с различной степенью интенциональности и выбора. Они часто обрабатываются сознательно у людей. До того как произойдут предсказанные события или состояния системы и будут проведены поведенческие реакции, такие предсказания позволяют мысленно оценивать различные стратегии путем интеграции знаний из разных источников, разработки различных способов реакции и сравнения выгод и потерь от каждой возможной реакции.

Поведенческая обусловленность

Ассоциативное аппетитное обучение включает в себя повторяющееся и случайное спаривание между произвольным стимулом и первичной наградой (рис. 1). Это приводит к все более частому поведению при подходе, индуцированному ныне «условным» стимулом, что отчасти напоминает поведение при подходе, вызванное первичной наградой, а также зависит от природы условного стимула. Похоже, что условный стимул служит предиктором вознаграждения и, часто на основе соответствующего влечения, устанавливает внутреннее мотивационное состояние, ведущее к поведенческой реакции. Сходство реакций подхода указывает на то, что некоторые общие подготовительные компоненты поведенческого ответа переносятся с первичной награды на самый ранний условный, предсказывающий награду стимул. Таким образом, условный стимул частично выступает в качестве мотивационного заменителя первичного стимула, вероятно, посредством обучения в Павлове (Дикинсон 1980).

Рис. 1. 

Обработка аппетитных стимулов в процессе обучения. Произвольный стимул становится связанным с первичной пищей или жидким вознаграждением через повторное, случайное соединение. Этот обусловленный, предсказывающий вознаграждение стимул вызывает внутреннее мотивационное состояние, вызывая ожидание вознаграждения, часто на основе соответствующего голода или жажды, и вызывает поведенческую реакцию. Эта схема повторяет основные понятия теории побудительной мотивации, разработанной Биндра (1968) и Боллы (1972), Это относится к классической обусловленности, где вознаграждение автоматически доставляется после условного стимула, и к инструментальной (оперантной) обусловленности, где выдача вознаграждения требует реакции субъекта на условный раздражитель. Эта схема применима также к аверсивной обусловленности, которая не дорабатывается по причинам краткости.

Многие так называемые «безусловные» продукты питания и жидкие награды, вероятно, выучены на опыте, что может подтвердить каждый посетитель зарубежных стран. Основная награда может состоять из вкуса, который испытывает объект, когда он активирует вкусовые рецепторы, но это опять-таки может быть изучено. Окончательный полезный эффект питательных объектов, вероятно, заключается в их специфическом влиянии на основные биологические переменные, такие как концентрации электролита, глюкозы или аминокислот в плазме и мозге. Эти переменные определяются вегетативными потребностями организма и возникают в результате эволюции. Животные избегают питательных веществ, которые не могут влиять на важные вегетативные переменные, например, продукты, в которых отсутствуют такие незаменимые аминокислоты, как гистидин (Роджерс и Харпер 1970), треонин (Hrupka et al. 1997; Wang et al. 1996) или метионин (Делани и Гелперин 1986). Несколько первичных наград могут быть определены врожденными инстинктами и поддерживают начальный подход к поведению и проглатыванию в молодости, тогда как большинство наград будут изучены в течение последующего жизненного опыта субъекта. Физическое проявление наград может быть использовано для прогнозирования гораздо более медленных вегетативных эффектов. Это значительно ускорит обнаружение наград и станет основным преимуществом для выживания. Изучение наград также позволяет субъектам использовать гораздо большее разнообразие питательных веществ в качестве эффективных наград и, таким образом, увеличить свои шансы на выживание в зонах ограниченных ресурсов.

АДАПТИВНЫЕ ОТВЕТЫ НА АПЕТИТИВНЫЕ СТИМУЛИ

Клеточные тела дофаминовых нейронов расположены в основном в группах среднего мозга A8 (дорсально-латеральная черная субстанция), A9 (парциальная компакта черной субстанции) и A10 (вентрально-тегментальная область от медиальной до черной субстанции). Эти нейроны высвобождают нейротрансмиттер дофамин с нервными импульсами от варикозного расширения аксонов в полосатом теле (хвостатое ядро, путамен и вентральный полосатый свет, включая прилежащее ядро) и лобной коре, чтобы назвать наиболее важные участки. Мы регистрируем импульсную активность клеточных тел отдельных дофаминовых нейронов в течение периодов 20 – 60 min с подвижными микроэлектродами из внеклеточных положений, в то время как обезьяны учатся или выполняют поведенческие задачи. Характерные многофазные, относительно длинные импульсы, излучаемые на низких частотах, делают дофаминовые нейроны легко отличимыми от других нейронов среднего мозга. Используемые поведенческие парадигмы включают задачи времени реакции, задачи прямого и отсроченного бездействия, задачи пространственного отсроченного ответа и чередования, задачи активного избегания воздушной затяжки и солевого раствора, оперантные и классически обусловленные задачи визуальной дискриминации, самостоятельные движения и непредсказуемые поставки вознаграждение при отсутствии какого-либо формального задания. О 100 – 250 дофаминовые нейроны изучаются в каждой поведенческой ситуации, и фракции задачно-модулированных нейронов относятся к этим образцам.

В начальных исследованиях были найдены корреляты паркинсонического двигательного и когнитивного дефицита в дофаминовых нейронах, но не удалось найти четких ковариаций движений рук и глаз (Делонг и соавт. 1983; Шульц и Ромо 1990; Schultz et al. 1983) или с мнемоническими или пространственными компонентами задач с отложенным ответом (Schultz et al. 1993). Напротив, было обнаружено, что дофаминовые нейроны активируются весьма отличительным образом благодаря полезным характеристикам широкого спектра соматосенсорных, зрительных и слуховых стимулов.

Активация первичными стимулами аппетита

Около 75% нейронов дофамина показывают фазные активации, когда животные касаются небольшого куска скрытой пищи во время исследовательских движений в отсутствие других фазовых стимулов, без активации самим движением (Ромо и Шульц 1990). Оставшиеся дофаминовые нейроны не реагируют ни на один из протестированных факторов окружающей среды. Дофаминовые нейроны также активируются с помощью капли жидкости, поступающей в рот вне какой-либо поведенческой задачи или при изучении таких различных парадигм, как визуальные или слуховые задачи времени реакции, пространственная задержка реакции или чередование и визуальная дискриминация, часто у одного и того же животного (рис. , 2 топ) (Холлерман и Шульц 1996; Ljungberg et al. 1991, 1992; Миренович и Шульц 1994; Schultz et al. 1993). Ответные ответы происходят независимо от учебного контекста. Таким образом, дофаминовые нейроны, по-видимому, не делают различий между различными пищевыми объектами и жидкими наградами. Тем не менее, их ответы отличают награды от неприбыльных объектов (Ромо и Шульц 1990). Только 14% нейронов дофамина показывают фазные активации, когда представлены первичные аверсивные стимулы, такие как воздушная затяжка в руке или гипертонический солевой раствор во рту, и большинство активированных нейронов также реагируют на вознаграждения (Миренович и Шульц 1996). Несмотря на то, что эти раздражители не являются вредными, они являются отвратительными, поскольку они нарушают поведение и вызывают реакции активного избегания. Тем не менее, дофаминовые нейроны не совсем нечувствительны к неприятным раздражителям, о чем свидетельствуют медленные депрессии или случайные медленные активации после болевых ощущений у обезболенных обезьян (Шульц и Ромо 1987) и повышенным выделением дофамина в полосатом теле после поражения электрическим током и защемления хвоста у бодрствующих крыс (Abercrombie et al. 1989; Доэрти и Граттон 1992; Louilot et al. 1986; Young et al. 1993). Это говорит о том, что фазовые ответы нейронов дофамина преимущественно сообщают о стимулах окружающей среды с первичной аппетитной ценностью, тогда как об аверсивных событиях можно сигнализировать с значительно более медленным течением времени.

Рис. 2. 

Дофаминовые нейроны сообщают о наградах в соответствии с ошибкой в ​​прогнозе вознаграждения. Топовое: падение жидкости происходит, хотя награда не предсказана в это время. Возникновение вознаграждения, таким образом, представляет собой положительную ошибку в прогнозировании вознаграждения. Дофаминовый нейрон активируется непредвиденным появлением жидкости. средняя: условный стимул предсказывает вознаграждение, и вознаграждение происходит в соответствии с предсказанием, следовательно, нет ошибки в предсказании вознаграждения. Дофаминовый нейрон не активируется предсказанным вознаграждением (право). Это также показывает активацию после стимула, предсказывающего вознаграждение, которое происходит независимо от ошибки в предсказании более позднего вознаграждения (оставил). Дно: условный раздражитель предсказывает вознаграждение, но вознаграждение не наступает из-за отсутствия реакции животного. Активность дофаминового нейрона подавляется как раз в то время, когда могло бы произойти вознаграждение. Обратите внимание на депрессию, возникающую более чем через 1 секунду после условного стимула без каких-либо промежуточных стимулов, выявляя внутренний процесс ожидания вознаграждения. Нейрональная активность на 3 графиках соответствует уравнению: дофаминовая реакция (вознаграждение) = полученное вознаграждение - прогнозируемое вознаграждение. CS - условный раздражитель; R, основная награда. Перепечатано с Шульц и соавт. (1997) с разрешения Американской ассоциации содействия развитию науки.

Непредсказуемость вознаграждения

Важной особенностью ответов дофамина является их зависимость от непредсказуемости события. Активация после вознаграждения не происходит, когда пище и жидкости предшествуют фазические раздражители, которые были обусловлены для предсказания такого вознаграждения (рис. 2, средний) (Ljungberg et al. 1992; Миренович и Шульц 1994; Ромо и Шульц 1990). Одним из важных различий между обучением и полностью усвоенным поведением является степень непредсказуемости вознаграждения. Дофаминовые нейроны активируются наградами во время фазы обучения, но перестают отвечать после полного овладения зрительными и слуховыми задачами времени реакции (Ljungberg et al. 1992; Миренович и Шульц 1994), пространственные задачи с задержкой ответа (Schultz et al. 1993) и одновременное визуальное различение (Холлерман и Шульц 1996). Потеря ответа не происходит из-за развивающейся общей нечувствительности к вознаграждениям, поскольку активация после вознаграждений, полученных вне заданий, не уменьшается в течение нескольких месяцев экспериментов (Миренович и Шульц 1994). Важность непредсказуемости включает время вознаграждения, о чем свидетельствуют кратковременные активации после вознаграждений, которые неожиданно доставляются раньше или позже, чем прогнозировалось (Холлерман и Шульц 1996). Взятые вместе, возникновение награды, включая время, должно быть непредсказуемым для активации дофаминовых нейронов.

Депрессия из-за пропуска предсказанного вознаграждения

Дофаминовые нейроны подавляются точно во время обычного возникновения награды, когда полностью предсказанное вознаграждение не может произойти, даже в отсутствие непосредственно предшествующего стимула (рис. 2, нижний). Это наблюдается, когда животные не могут получить вознаграждение из-за ошибочного поведения, когда экспериментатор останавливает поток жидкости, несмотря на правильное поведение, или когда звуковой клапан открывается без подачи жидкости (Холлерман и Шульц 1996; Ljungberg et al. 1991; Schultz et al. 1993). Когда доставка вознаграждения задерживается для 0.5 или 1.0 s, снижение активности нейронов происходит в обычное время вознаграждения, и активация следует за вознаграждением в новое время (Холлерман и Шульц 1996). Оба ответа происходят только в течение нескольких повторений, пока новое время доставки вознаграждения не станет предсказанным снова. Напротив, предоставление вознаграждения раньше, чем обычно, приводит к активации в новое время вознаграждения, но не может вызвать депрессию в обычное время. Это говорит о том, что необычно ранняя доставка вознаграждения отменяет прогноз вознаграждения за привычное время. Таким образом, дофаминовые нейроны контролируют как возникновение, так и время вознаграждения. В отсутствие стимулов, непосредственно предшествующих пропущенному вознаграждению, депрессии не представляют собой простой нейрональный ответ, но отражают процесс ожидания, основанный на внутренних часах, отслеживающих точное время прогнозируемого вознаграждения.

Активация с помощью условных, прогнозирующих стимулов

О 55 – 70% дофаминовых нейронов активируются условными зрительными и слуховыми стимулами в различных классических или инструментальных условных задачах, описанных ранее (рис. 2, средний и нижний) (Холлерман и Шульц 1996; Ljungberg et al. 1991, 1992; Миренович и Шульц 1994; Шульц 1986; Шульц и Ромо 1990; P. Waelti, J. Mirenowicz и W. Schultz, неопубликованные данные). Первые ответы допамина на условный свет были зарегистрированы Миллер и соавт. (1981) у крыс, получавших галоперидол, что увеличивало частоту и спонтанную активность дофаминовых нейронов, но приводило к более устойчивым ответам, чем у ненарушенных животных. Хотя ответы происходят близко к поведенческим реакциям (Нишино и соавт. 1987) они сами не связаны с движениями рук и глаз, так как они происходят также в стороне от движущейся руки и в испытаниях без движений рук или глаз (Шульц и Ромо 1990). Условные раздражители несколько менее эффективны, чем первичные вознаграждения, с точки зрения величины реакции и доли активированных нейронов. Дофаминовые нейроны реагируют только на начало условных раздражителей, а не на их смещение, даже если смещение стимула предсказывает вознаграждение (Шульц и Ромо 1990). Дофаминовые нейроны не различают визуальные и слуховые модальности условных стимулов аппетита. Однако они различают аппетитные и нейтральные или отвращающие стимулы, если они физически достаточно различны (Ljungberg et al. 1992; P. Waelti, J. Mirenowicz и W. Schultz, неопубликованные данные). Только 11% нейронов дофамина, большинство из которых имеют аппетитные реакции, показывают типичные фазовые активации также в ответ на условно-отрицательные зрительные или слуховые раздражители в задачах активного избегания, в которых животные выпускают ключ, чтобы избежать воздушной затяжки или капли гипертонического солевого раствора. (Миренович и Шульц 1996), хотя такое избегание можно рассматривать как «полезное». Эти несколько активаций недостаточно сильны, чтобы вызвать реакцию среднего населения. Таким образом, фазовые ответы дофаминовых нейронов преимущественно сообщают об экологических стимулах с аппетитной мотивационной ценностью, но без различия между различными сенсорными модальностями.

Передача активации

В ходе обучения дофаминовые нейроны постепенно активируются с помощью обусловленных, предсказывающих вознаграждение стимулов и постепенно теряют свои реакции на первичные пищевые или жидкие вознаграждения, которые становятся предсказуемыми (Холлерман и Шульц 1996; Ljungberg et al. 1992; Миренович и Шульц 1994) (Рис. 2 и 3). В течение переходного периода обучения, как награды, так и условные стимулы вызывают активации дофамина. Этот переход от первичного вознаграждения к условному стимулу происходит мгновенно в одиночных дофаминовых нейронах, протестированных в двух хорошо изученных задачах, использующих, соответственно, непредсказуемые и предсказанные вознаграждения (Ромо и Шульц 1990).

Рис. 3. 

Передача дофаминового ответа на самый ранний прогностический стимул. Реакции на непредсказуемую первичную передачу вознаграждения на все более ранние предсказывающие вознаграждение стимулы. На всех дисплеях показаны гистограммы популяции, полученные путем усреднения нормированных гистограмм времени в целом для всех дофаминовых нейронов, зарегистрированных в указанных поведенческих ситуациях, независимо от наличия или отсутствия ответа. Топовое: вне какой-либо поведенческой задачи, нет реакции популяции в нейронах 44, протестированных с небольшим светом (данные из Ljungberg et al. 1992), но в среднем 35 нейронов реагируют на каплю жидкости, попавшую в носик перед ртом животного (Миренович и Шульц 1994). средняя: ответ на триггерный стимул, предсказывающий вознаграждение, в задаче пространственного достижения с выбором 2, но отсутствие реакции на вознаграждение, доставленное во время установленного выполнения задачи в тех же нейронах 23 (Schultz et al. 1993). Дно: ответ на сигнал команды, предшествующий триггерному стимулу, предсказывающему награду, через фиксированный интервал 1 s в заданной задаче пространственного достижения (нейроны 19) (Schultz et al. 1993). Временная база разделена из-за различных интервалов между условными стимулами и вознаграждением. Перепечатано из Шульц и соавт. (1995b) с разрешения MIT Press.

Непредсказуемость условных раздражителей

Активации после условных, предсказывающих вознаграждение стимулов не происходят, когда самим этим стимулам в определенном интервале времени предшествуют фазические условные стимулы. Таким образом, при последовательных условных стимулах дофаминовые нейроны активируются самым ранним стимулом, предсказывающим награду, тогда как все стимулы и вознаграждения, следующие в предсказуемые моменты времени, оказываются неэффективными (рис. 3) (Schultz et al. 1993). Только случайно расположенные последовательные стимулы вызывают индивидуальные ответы. Кроме того, интенсивное перетренирование с высоко стереотипным выполнением задачи ослабляет реакцию на условные раздражители, вероятно, потому, что раздражители становятся предсказанными событиями в предыдущем испытании (Ljungberg et al. 1992). Это говорит о том, что непредсказуемость стимулов является общим требованием для всех стимулов, активирующих дофаминовые нейроны.

Депрессия путем пропуска предсказанных условных раздражителей

Предварительные данные из предыдущего эксперимента (Schultz et al. 1993предполагают, что дофаминовые нейроны также находятся в депрессии, когда условный, предсказывающий вознаграждение стимул сам предсказывается в определенное время предшествующим стимулом, но не происходит из-за ошибки животного. Как и в случае с первичным вознаграждением, депрессии возникают во время обычного возникновения условного раздражителя, без непосредственного воздействия предшествующего раздражителя. Таким образом, депрессия, вызванная упущением, может быть распространена на все аппетитные события.

Активация-депрессия с генерализацией ответа

Дофаминовые нейроны также реагируют на стимулы, которые не предсказывают вознаграждение, но очень похожи на предсказывающие вознаграждение стимулы, возникающие в том же контексте. Эти ответы состоят в основном из активации, за которой следует немедленная депрессия, но иногда могут состоять из чистой активации или чистой депрессии. Активации меньше и реже, чем при стимулах, предсказывающих вознаграждение, а депрессии наблюдаются у 30 – 60% нейронов. Дофаминовые нейроны реагируют на зрительные стимулы, которые не сопровождаются вознаграждением, но очень похожи на предсказывающие вознаграждение стимулы, несмотря на правильную поведенческую дискриминацию (Шульц и Ромо 1990). Открытие пустой коробки не активирует дофаминовые нейроны, но становится эффективным в каждом испытании, как только коробка иногда содержит пищу (Ljungberg et al. 1992; Шульц 1986; Шульц и Ромо 1990) или когда соседний, идентичный ящик, всегда содержащий еду, открывается в случайном порядке (Шульц и Ромо 1990). Пустая коробка вызывает более слабые активации, чем приманка. Животные выполняют беспорядочную глазную ориентацию на каждую коробку, но приближаются к коробке с наживкой только рукой. Во время обучения дофаминовые нейроны продолжают реагировать на ранее обусловленные стимулы, которые теряют свой прогноз вознаграждения при изменении непредвиденных обстоятельств (Schultz et al. 1993) или реагировать на новые раздражители, напоминающие ранее обусловленные раздражители (Холлерман и Шульц 1996). Реакции возникают даже на аверсивные стимулы, представленные в случайном чередовании с физически сходными, обусловленными аппетитом стимулами той же сенсорной модальности, причем аверсивный ответ слабее, чем аппетитный (Миренович и Шульц 1996). Реакции обобщаются даже на поведенческие потухшие аппетитные стимулы. По-видимому, нейрональные ответы обобщаются на неаппетитные стимулы из-за их физического сходства с аппетитными стимулами.

Новизна ответов

Новые стимулы вызывают активацию дофаминовых нейронов, которая часто сопровождается депрессией и сохраняется до тех пор, пока возникают поведенческие ориентировочные реакции (например, глазные саккады). Активации стихают вместе с ориентировочными реакциями после нескольких повторений стимулов, в зависимости от физического воздействия стимулов. В то время как маленькие светодиоды почти не вызывают реакции новизны, вспышки света и быстрое визуальное и слуховое открытие маленькой коробки вызывают активации, которые постепенно сходят на нет в течение <100 испытаний (Ljungberg et al. 1992). Громкие щелчки или большие изображения непосредственно перед животным вызывают сильные реакции новизны, которые затухают, но все же вызывают измеримые активации после> 1,000 испытаний (Холлерман и Шульц 1996; Хорвиц и соавт. 1997; Steinfels et al. 1983). фигура 4 схематически показывает различные величины отклика с новыми стимулами различной физической значимости. Ответы постепенно затухают при повторном воздействии, но могут сохраняться при уменьшенных величинах при очень заметных раздражителях. Величины ответа снова возрастают, когда те же стимулы аппетитно обусловлены. Напротив, ответы на новые, даже большие, стимулы быстро стихают, когда стимулы используются для формирования поведения активного избегания (Миренович и Шульц 1996). Очень немногие нейроны (<5%) при более чем нескольких попытках реагируют на заметные, но физически слабые раздражители, такие как крошка бумаги или грубые движения рук экспериментатора.

Рис. 4. 

Временные ходы активаций дофаминовых нейронов к новым, предупреждающим и условным раздражителям. Активации после новых стимулов уменьшаются при повторном воздействии в течение последовательных испытаний. Их величина зависит от физической значимости стимулов, поскольку более сильные стимулы вызывают более высокие активации, которые иногда превышают таковые после условных стимулов. Особенно существенные стимулы продолжают активировать дофаминовые нейроны с ограниченной величиной даже после потери их новизны без сочетания с первичными наградами. Последовательные активации появляются снова, когда стимулы становятся связаны с первичными наградами. Эту схему внес Хосе Контрерас-Видаль.

Однородный характер ответов

Проведенные до сих пор эксперименты показали, что большинство нейронов в группах допаминовых клеток среднего мозга A8, A9 и A10 демонстрируют очень похожие активации и депрессии в данной поведенческой ситуации, тогда как остальные нейроны дофамина вообще не реагируют. Существует тенденция к увеличению доли нейронов, отвечающих в более медиальных областях среднего мозга, таких как вентральная сегментарная область и медиальная черная субстанция, по сравнению с более латеральными областями, которые иногда достигают статистической значимости (Шульц 1986; Schultz et al. 1993). Латентность ответа (50–110 мс) и продолжительность (<200 мс) одинаковы для первичных поощрений, условных стимулов и новых стимулов. Таким образом, дофаминовый ответ представляет собой относительно однородный скалярный популяционный сигнал. Он оценивается по величине реактивностью отдельных нейронов и долей отвечающих нейронов в популяции.

Резюме 1: адаптивные ответы во время обучения

Характеристики реакций дофамина на стимулы, связанные с вознаграждением, лучше всего иллюстрируются в эпизодах обучения, во время которых награды особенно важны для получения поведенческих реакций. Сигнал вознаграждения допамина претерпевает систематические изменения в процессе обучения и происходит с самым ранним фазовым стимулом, связанным с вознаграждением, который является либо первичным вознаграждением, либо стимулом, предсказывающим вознаграждение (Ljungberg et al. 1992; Миренович и Шульц 1994). Во время обучения новые, изначально нейтральные стимулы временно вызывают реакции, которые вскоре ослабевают и исчезают (рис. 4). Первичное вознаграждение происходит непредсказуемо во время начального спаривания с такими стимулами и вызывает нейронные активации. При повторном спаривании награды становятся предсказуемыми с помощью условных раздражителей. Активации после вознаграждения постепенно уменьшаются и переходят в условный, предсказывающий вознаграждение стимул. Однако, если прогнозируемое вознаграждение не происходит из-за ошибки животного, дофаминовые нейроны находятся в депрессии в то время, когда вознаграждение произошло бы. При повторном изучении заданий (Schultz et al. 1993) или компоненты задачи (Холлерман и Шульц 1996), самые ранние условные раздражители активируют дофаминовые нейроны на всех этапах обучения из-за обобщения на ранее изученные аналогичные раздражители, тогда как последующие условные раздражители и первичные вознаграждения активируют дофаминовые нейроны только временно, пока они неопределенны, и создаются новые непредвиденные обстоятельства.

Резюме 2: эффективные стимулы для дофаминовых нейронов

Ответы допамина вызываются тремя категориями раздражителей. Первая категория включает в себя первичные вознаграждения и стимулы, которые стали действительными предикторами вознаграждения за счет повторного и условного сопряжения с вознаграждениями. Эти стимулы образуют общий класс явных стимулов, предсказывающих вознаграждение, поскольку первичные вознаграждения служат предикторами вегетативных поощрительных эффектов. Эффективные стимулы, по-видимому, имеют предупреждающий компонент, так как эффективны только стимулы с явным началом. Дофаминовые нейроны демонстрируют чистую активацию после явных стимулов, предсказывающих вознаграждение, и находятся в депрессии, когда предсказанное, но пропущенное вознаграждение не происходит (рис. 5, топ).

Рис. 5. 

Схематическое отображение ответов дофаминовых нейронов на типы условных раздражителей 2. Топовое: представление явного стимула, предсказывающего вознаграждение, приводит к активации после стимула, отсутствию реакции на предсказанное вознаграждение и депрессии, когда предсказанное вознаграждение не происходит. Дно: предъявление стимула, очень похожего на условный, предсказывающий вознаграждение стимул, приводит к активации, сопровождаемой депрессией, активацией после вознаграждения и отсутствием реакции, когда вознаграждение не происходит. Активация после стимула, вероятно, отражает генерализацию реакции из-за физического сходства. Этот стимул явно не предсказывает вознаграждение, но связан с вознаграждением через его сходство со стимулом, предсказывающим вознаграждение. По сравнению с явными стимулами, предсказывающими вознаграждение, активация ниже и часто сопровождается депрессией, что делает различие между вознагражденными (CS +) и невыплаченными (CS-) условными стимулами. Эта схема суммирует результаты предыдущих и текущих экспериментов (Холлерман и Шульц 1996; Ljungberg et al. 1992; Миренович и Шульц 1996; Шульц и Ромо 1990; Schultz et al. 1993; П. Ваэлти и В. Шульц, неопубликованные результаты).

Вторая категория включает стимулы, которые вызывают обобщающие ответы. Эти стимулы не предсказывают явно вознаграждения, но являются эффективными из-за их физического сходства со стимулами, которые стали явными предикторами вознаграждения посредством обусловленности. Эти стимулы вызывают активации, которые имеют меньшую величину и задействуют меньше нейронов, по сравнению с явными стимулами, предсказывающими награды (рис. 5, нижний). За ними часто следуют немедленные депрессии. В то время как начальная активация может представлять собой обобщенный аппетитный ответ, который сигнализирует о возможном вознаграждении, последующее снижение может отражать прогноз отсутствия вознаграждения в общем контексте прогнозирования вознаграждения и отменять ошибочное допущение вознаграждения. Отсутствие явного прогноза вознаграждения подтверждается наличием активации после первичного вознаграждения и отсутствием депрессии без вознаграждения. Вместе с реакциями на предсказывающие вознаграждение стимулы создается впечатление, что при активации допамина сообщается о аппетитной «метке», прикрепленной к стимулам, связанным с вознаграждением.

Третья категория включает в себя новые или особенно важные стимулы, которые не обязательно связаны с конкретными наградами. Вызывая поведенческие ориентирующие реакции, эти стимулы предупреждают и требуют внимания. Тем не менее, они также имеют мотивирующие функции и могут быть полезными (Fujita 1987). Новые стимулы потенциально аппетитны. Новые или особенно заметные стимулы вызывают активации, за которыми часто следуют депрессии, аналогичные реакциям на обобщающие стимулы.

Таким образом, фазовые ответы нейронов допамина сообщают о событиях с положительными и потенциально положительными мотивирующими эффектами, такими как первичное вознаграждение, предсказывающие вознаграждение стимулы, напоминающие вознаграждение события и предупреждающие стимулы. Тем не менее, они не обнаруживают в значительной степени события с негативными побудительными эффектами, такие как аверсивные стимулы.

Резюме 3: сигнал ошибки предсказания награды за допамин

Ответы допамина на явные события, связанные с вознаграждением, могут быть лучше всего поняты и поняты с точки зрения формальных теорий обучения. Дофаминовые нейроны сообщают о вознаграждениях относительно их прогноза, а не сообщают о первичных вознаграждениях безоговорочно (рис. 2). Реакция допамина является положительной (активация), когда первичное вознаграждение происходит без предсказания. Реакция равна нулю, когда вознаграждение происходит так, как предсказано. Реакция отрицательная (депрессия), когда прогнозируемые вознаграждения опущены. Таким образом, дофаминовые нейроны сообщают о первичных вознаграждениях в соответствии с разницей между возникновением и предсказанием вознаграждения, которое можно назвать ошибкой в ​​предсказании вознаграждения (Шульц и соавт. 1995b, 1997) и предварительно формализовано как

DopamineResponse (Предложение)=RewardOccurred-RewardPredicted

Уравнение 1 Это предположение может быть распространено на обусловленные аппетит события, которые также сообщаются дофаминовыми нейронами относительно прогноза. Таким образом, дофаминовые нейроны могут сообщать об ошибке в прогнозировании всех аппетитных событий, и Eq. 1 можно изложить в более общем виде

DopamineResponse (ApEvent)=ApEventOccurred-ApEventPredicted

Уравнение 2Это обобщение совместимо с идеей, что большинство наград на самом деле являются условными стимулами. С несколькими последовательными, хорошо установленными событиями, предсказывающими награды, только первое событие непредсказуемо и вызывает активацию дофамина.

СВЯЗЬ ДОФАМИНОВЫХ НЕЙРОНОВ

Происхождение ответа дофамина

Какие анатомические данные могут быть ответственны за селективность и полисенсорный характер дофаминовых ответов? Какая входная активность может привести к кодированию ошибок предсказания, вызвать адаптивную передачу ответа на самое раннее непредсказуемое событие аппетита и оценить время вознаграждения?

Спинной и вентральный стриатум.

ГАМКергические нейроны в стриосомах (пятнах) стриатума проецируются в широком топографическом и частично перекрывающемся, встречном порядке с дофаминовыми нейронами почти во всех парсовых компактах черной субстанции, в то время как нейроны гораздо более крупного стриального матрикса контактируют преимущественно с недопаминовыми нейронами pars reticulata черной субстанции, кроме их проекции на глобус бледный (Герфен 1984; Хедрин и Делонг 1991; Holstein et al. 1986; Хименес-Кастелланос и Грейбиль 1989; Селемон и Гольдман-Ракич 1990; Смит и Болам 1991). Нейроны в вентральном стриатуме проецируются нетопографически как в pars compacta, так и в pars reticulata из медиальной черной субстанции и в вентральную сегментарную область (Берендсе и соавт. 1992; Haber et al. 1990; Линд-Балта и Хабер 1994; Somogyi et al. 1981). ГАМКергическая стриатонигральная проекция может оказывать два четко различающихся влияния на дофаминовые нейроны: прямое торможение и косвенная активация (Грейс и Банни 1985; Смит и Грейс 1992; Tepper et al. 1995). Последний опосредуется стриатальным торможением нейронов pars reticulata и последующим ГАМКергическим ингибированием от локальных аксонов коллатералей выходных нейронов pars reticulata на дофаминовые нейроны. Это представляет собой двойное ингибирующее звено и приводит к полной активации дофаминовых нейронов полосатым телом. Таким образом, стриосомы и вентральный стриатум могут моносинаптически ингибировать, а матрица может косвенно активировать дофаминовые нейроны.

Спинные и вентральные полосатые нейроны демонстрируют ряд активаций, которые могут способствовать ответным реакциям на дофамин, а именно ответам на первичные вознаграждения (Apicella et al. 1991a; Williams et al. 1993), ответы на стимулирующие предсказания стимулы (Hollerman et al. 1994; Romo et al. 1992) и устойчивые активации во время ожидания стимулов, предсказывающих вознаграждение, и первичных вознаграждений (Apicella et al. 1992; Schultz et al. 1992). Однако положения этих нейронов относительно стриосом и матрикса неизвестны, и стриатальные активации, отражающие время ожидаемого вознаграждения, пока не сообщались.

Полисенсорные ответные реакции могут быть результатом выделения признаков в областях кортикальной ассоциации. Задержки ответа 30 – 75 мс в первичной и ассоциативной зрительной коре (Мэнселл и Гибсон 1992; Miller et al. 1993) может сочетаться с быстрой проводимостью к полосатому телу и двойным ингибированием черной субстанции, чтобы вызвать короткие задержки ответа дофамина <100 мс. В то время как для задней ассоциативной коры не сообщалось об активности, связанной с вознаграждением, нейроны в дорсолатеральной и орбитальной префронтальной коре отвечают на первичные вознаграждения и стимулы, предсказывающие вознаграждение, и демонстрируют устойчивую активацию во время ожидания вознаграждения (Rolls et al. 1996; Торп и соавт. 1983; Тремблей и Шульц 1995; Watanabe 1996). Некоторые ответные реакции во фронтальной коре зависят от непредсказуемости (Мацумото и соавт. 1995; L. Tremblay и W. Schultz, неопубликованные результаты) или отражают поведенческие ошибки или пропущенные вознаграждения (Ники и Ватанабэ 1979; Watanabe 1989). Влияние коры на дофаминовые нейроны будет даже быстрее благодаря прямой проекции, исходящей из префронтальной коры головного мозга у крыс (Гариано и рощи 1988; Sesack и Pickel 1992; Тонг и соавт. 1996) но быть слабым у обезьян (Künzle 1978).

NUCLEUS PEDUNCULOPONTINUS.

Короткие задержки ответных реакций могут быть получены из адаптивных механизмов обработки признаков в стволе мозга. Ядро pedunculopontinus является эволюционным предшественником черной субстанции. У позвоночных, не являющихся млекопитающими, он содержит дофаминовые нейроны и проецируется в палеостриатум (Ломан и Ван Вурден-Веркли 1978). У млекопитающих это ядро ​​оказывает сильное возбуждающее, холинергическое и глутаматергическое влияние на большую долю дофаминовых нейронов с латентностью ∼7 мс (Болам и соавт. 1991; Кларк и соавт. 1987; Futami et al. 1995; Скарнати и др. 1986). Активация проекций педункулопонтин-дофамина вызывает кружение (Ниджима и Йошида 1988), предполагая функциональное влияние на дофаминовые нейроны.

Мозжечковая миндалина.

Массивный, вероятно, возбуждающий вклад в дофаминовые нейроны возникает из разных ядер миндалины (Gonzalez and Chesselet 1990; Прайс и Амарал 1981). Нейроны миндалины реагируют на первичные награды и прогнозирующие награды визуальные и слуховые стимулы. Нейрональные ответы, известные до сих пор, не зависят от непредсказуемости стимула и плохо различают аппетит и отвращение (Накамура и соавт. 1992; Nishijo et al. 1988). Большинство ответов показывают задержки 140 – 310 мс, которые длиннее, чем в дофаминовых нейронах, хотя несколько ответов происходят при задержках 60 – 100 мс.

Спинной раф.

Моносинаптическая проекция спинного рафа (Corvaja et al. 1993; Недергаард и соавт. 1988) оказывает депрессивное влияние на дофаминовые нейроны (Fibiger et al. 1977; Трент и Теппер 1991). Нейроны Raphé показывают короткую латентную активацию после интенсивных стимулов окружающей среды (Heym et al. 1982), что позволяет им участвовать в реакциях допамина после новых или особенно заметных стимулов.

СИНТЕЗ.

Несколько хорошо известных структур ввода являются наиболее вероятными кандидатами для опосредования ответов дофамина, хотя также могут существовать дополнительные входы. Активация дофаминовых нейронов первичными наградами и стимулами, предсказывающими награды, может быть опосредована двойным ингибирующим, чистым активирующим вводом из стриатального матрикса (для упрощенной схемы см. Рис. 6). Активации также могут быть вызваны ядром педункулопонтина или, возможно, активностью, связанной с ожидаемым вознаграждением, в нейронах субталамического ядра, проецирующихся на дофаминовые нейроны (Hammond et al. 1983; Мацумура и соавт. 1992; Смит и соавт. 1990). Отсутствие активации с полностью предсказуемым вознаграждением может быть результатом моносинаптического ингибирования стриосом, одновременно отменяя активацию матричного ввода. Депрессии во время пропущенного вознаграждения могут быть опосредованы ингибирующими воздействиями нейронов в стриатальных стриосомах (Houk et al. 1995) или глобус бледный (Haber et al. 1993; Хаттори и соавт. 1975; Y. Смит и Болам 1990, 1991). Конвергенция между различными входами до или на уровне дофаминовых нейронов может привести к довольно сложному кодированию ошибок прогнозирования вознаграждения и адаптивного перехода ответа от первичных вознаграждений к стимулам предсказания вознаграждения.

Рис. 6. 

Упрощенная схема входов дофаминовых нейронов среднего мозга, потенциально опосредующих дофаминовые ответы. Из соображений простоты показаны только входные данные от хвостатого до черной субстанции (SN) pars compacta и reticulata. Активации могут возникать благодаря двойному ингибирующему сетевому активирующему влиянию нейронов ГАМКергического матрикса в хвостатом и путамене через ГАМКергические нейроны SN pars reticulata на дофаминовые нейроны SN pars compacta. Активации также могут быть опосредованы возбуждающими холинергическими или аминокислотными проекциями из ядра pedunculopontinus. Депрессии могут быть вызваны моносинаптическими ГАМКергическими проекциями от стриосом (пластырей) в хвостатом и путамен до дофаминовых нейронов. Подобные проекции существуют от вентрального полосатого тела до дофаминовых нейронов в медиальной SN pars compacta и в группе A10 в вентральной сегментарной области и от дорсального стриатума до до A8 дофаминовых нейронов группы дорсолатерально к SN (Линд-Балта и Хабер 1994). Тяжелый кружок представляет дофаминовые нейроны. Эти прогнозы представляют наиболее вероятные исходные данные, лежащие в основе ответов дофамина, не исключая входных данных от глобуса бледного и субталамического ядра.

Фазовое допаминовое влияние на целевые структуры

ГЛОБАЛЬНАЯ ПРИРОДА ДОФАМИННОГО СИГНАЛА.

Расходящиеся прогнозы. В каждой черной субстанции крыс имеется N8,000 дофаминовые нейроны (Оршот 1996) и 80,000 – 116,000 у макак (German et al. 1988; Percheron et al. 1989). Каждый стриатум содержит N2.8 миллионов нейронов у крыс и 31 миллионов у макак, что приводит к фактору дивергенции в нигростриатальном диапазоне 300 – 400. Каждый аксон дофамина обильно разветвляется в ограниченной терминальной области в полосатом теле и имеет has500,000 варикозное расширение вен, из которого высвобождается дофамин (Andén et al. 1966). Это приводит к введению допамина почти в каждый стриальный нейрон (Groves et al. 1995) и умеренно топографическая нигростриатальная проекция (Линд-Балта и Хабер 1994). Корневая дофаминовая иннервация у обезьян самая высокая в областях 4 и 6, она все еще имеет значительные размеры в лобной, теменной и височной долях и является самой низкой в ​​затылочной доле (Berger et al. 1988; Уильямс и Гольдман-Ракич 1993). Корковые дофаминовые синапсы преимущественно обнаруживаются в слоях I и V – VI, контактируя с большой долей кортикальных нейронов. Вместе с довольно однородной природой ответа эти данные позволяют предположить, что ответ допамина развивается как одновременная параллельная волна активности от среднего мозга до стриатума и лобной коры (рис. 7).

Рис. 7. 

Глобальный сигнал допамина продвигается к стриатуме и коре. Относительно однородный популяционный ответ большинства дофаминовых нейронов на стимулы аппетита и предупреждения и его прогрессирование от черной субстанции до постсинаптических структур можно схематически рассматривать как волну синхронной параллельной активности, развивающейся со скоростью 1 – 2 м / с (Шульц и Ромо 1987) по расходящимся проекциям от среднего мозга до стриатума (хвостата и путамена) и коры головного мозга. Ответы качественно неразличимы между нейронами черной субстанции (SN), pars compacta и вентральной области (VTA). Иннервация дофамина всех нейронов в полосатом теле и многих нейронов в лобной коре позволила бы усилению сигнала допамина оказывать довольно глобальный эффект. Волна была сжата, чтобы подчеркнуть параллельную природу.

Выпуск допамина. Импульсы дофаминовых нейронов с интервалами 20 – 100 мс приводят к значительно более высокой концентрации дофамина в стриатуме, чем такое же количество импульсов с интервалами 200 мс (Гаррис и Вайтман 1994; Гонон 1988). Эта нелинейность обусловлена ​​главным образом быстрым насыщением транспортера обратного захвата дофамина, который очищает высвобождающийся дофамин от внессинаптической области (Chergui et al. 1994). Тот же эффект наблюдается в прилежащем ядре (Вайтман и Циммерман 1990) и происходит даже с более длительными импульсными интервалами из-за более редких сайтов обратного захвата (Гаррис и соавт. 1994b; Marshall et al. 1990; Стэмфорд и соавт. 1988). Высвобождение дофамина после всплеска импульса длительностью <300 мс слишком короткое для активации опосредованного ауторецепторами снижения выброса (Chergui et al. 1994) или даже более медленная ферментативная деградация (Майкл и соавт. 1985). Таким образом, разрывная реакция дофамина особенно эффективна для высвобождения дофамина.

Оценки, основанные на вольтамперометрии in vivo, показывают, что один импульс высвобождает молекулы дофамина N1,000 в синапсах в стриатуме и в прилежащем ядре. Это приводит к немедленной концентрации синаптического дофамина 0.5 – 3.0 мкМ (Гаррис и соавт. 1994a; Kawagoe et al. 1992). Через 40 мкс после начала высвобождения> 90% дофамина покидает синапс, а часть остального позже элиминируется синаптическим обратным захватом (половинное время начала 30–37 мс). Через 3–9 мс после начала высвобождения концентрации дофамина достигают пика ~ 250 нМ, когда все соседние варикозные узлы одновременно выделяют дофамин. Концентрации однородны в пределах сферы диаметром 4 мкм (Гонон 1997), которое является средним расстоянием между варикозамиDoucet et al. 1986; Groves et al. 1995). Максимальная диффузия ограничивается 12 мкм транспортером обратного захвата и достигается через 75 мс после начала высвобождения (время начала половинного транспортера 30–37 мс). Концентрации будут немного ниже и менее однородными в регионах с меньшим количеством варикозных расширений или когда активировано <100% дофаминовых нейронов, но они в два-три раза выше при импульсных всплесках. Таким образом, вызываемые вознаграждением, умеренно синхронные, взрывные активации в ~ 75% дофаминовых нейронов могут приводить к довольно однородным пикам концентрации порядка 150-400 нМ. Общее увеличение внеклеточного дофамина длится 200 мс после одиночного импульса и 500-600 мс после нескольких импульсов с интервалами 20-100 мс, приложенных в течение 100-200 мс (Chergui et al. 1994; Дугаст и соавт. 1994). Экстрасинаптический транспортер обратного захвата (Ниренберг и соавт. 1996) впоследствии приводит концентрацию дофамина к исходному уровню 5 – 10 нМ (Herrera-Marschitz et al. 1996). Таким образом, в отличие от классической строго синаптической нейротрансмиссии, синаптически высвобождаемый дофамин быстро диффундирует в непосредственную слизисто-синаптическую область и достигает коротких пиков региональных гомогенных внеклеточных концентраций.

Рецепторы. Из двух основных типов дофаминовых рецепторов рецепторы типа D1, активирующие аденилатциклазу, составляют ∼80% рецепторов дофамина в стриатуме. Из них 80% находятся в низкоаффинном состоянии 2 – 4 мкМ и 20% в высокоаффинном состоянии 9 – 74 нМ (Ричфилд и др. 1989). Остальные 20% рецепторов стриатального допамина относятся к типу D2, ингибирующему аденилазную циклазу, где 10-0% находятся в состоянии с низкой аффинностью, а 80-90% в состоянии с высокой аффинностью, с такими же аффинностями, что и рецепторы D1. Таким образом, рецепторы D1 в целом имеют в 100 раз меньшее сродство, чем рецепторы D2. Стриатальные D1-рецепторы расположены преимущественно на нейронах, выступающих на внутренний паллидум и субстанцию ​​nigra pars reticulata, тогда как стриатальные D2-рецепторы расположены в основном на нейронах, выступающих на наружный паллидум (Bergson et al. 1995; Герфен и соавт. 1990; Hersch et al. 1995; Levey et al. 1993). Тем не менее, различия в чувствительности рецепторов могут не играть роль за пределами передачи сигнала, таким образом уменьшая различия в чувствительности к дофамину между двумя типами стриатальных выходных нейронов.

Дофамин высвобождается до 30 – 40% от синаптических и до 60 – 70% от экстрасинаптических варикозных расширений (Descarries et al. 1996). Синаптически высвобождаемый дофамин действует на постсинаптические дофаминовые рецепторы в четырех анатомически отличных местах в полосатом теле, а именно в синапсах дофамина, непосредственно примыкающих к синапсам дофамина, внутри кортикостриатальных синапсов глутамата и в экстрасинаптических участках, удаленных от мест высвобождения (рис. 8) (Levey et al. 1993; Sesack et al. 1994; Юнг и соавт. 1995). Рецепторы D1 локализуются в основном за пределами синапсов дофамина (Caillé et al. 1996). Высокие кратковременные концентрации дофамина после фазовых импульсных всплесков будут активировать рецепторы D1 в непосредственной близости от сайтов активного высвобождения и активировать и даже насыщать рецепторы D2 повсюду. Рецепторы D2 остаются частично активированными, когда концентрация допамина в окружающей среде возвращается к исходному уровню после фазового повышения.

Рис. 8. 

Влияние высвобождения допамина на типичные срединно-колючие нейроны в дорсальном и вентральном полосатом теле. Дофамин, высвобождаемый импульсами синаптических варикозов, активирует несколько синаптических рецепторов (вероятно, типа D2 в состоянии с низкой аффинностью) и быстро диффундирует из синапса, чтобы достичь рецепторов типа D1 с низкой аффинностью (D1?), Которые расположены поблизости, в кортикостриатальных синапсах или на ограниченном расстоянии. Фазически повышенный дофамин активирует близкие высокоаффинные рецепторы типа D2 к насыщению (D2?). Рецепторы D2 остаются частично активированными окружающими концентрациями дофамина после фазически увеличенного высвобождения. Экстрасинаптически высвобождаемый дофамин может разбавляться диффузией и активировать рецепторы D2 с высоким сродством. Следует отметить, что, в отличие от этой схематической диаграммы, большинство рецепторов D1 и D2 расположены на разных нейронах. Глутамат, высвобождаемый из кортикостриатальных терминалов, достигает постсинаптических рецепторов, расположенных на тех же дендритных шипиках, что и варикозное расширение вен допамина. Глутамат также достигает пресинаптического варикозного расширения допамина, где он контролирует высвобождение дофамина. Влияние дофамина на колючие нейроны лобной коры во многом сопоставимо.

Основная. Наблюдаемый умеренный разрыв, кратковременный, почти синхронный ответ большинства дофаминовых нейронов приводит к оптимальному одновременному высвобождению дофамина из большинства близко расположенных варикозных полос. Нейрональный ответ индуцирует короткое дуновение дофамина, который высвобождается из внезинаптических участков или быстро диффундирует из синапсов в юкстасинаптическую область. Дофамин быстро достигает региональных гомогенных концентраций, которые могут влиять на дендриты, вероятно, всех стриатальных и многих корковых нейронов. Таким образом, сообщение о вознаграждении в 60 – 80% дофаминовых нейронов транслируется в виде расходящегося, довольно глобального сигнала усиления в стриатум, прилежащее ядро ​​и лобную кору, обеспечивая поэтапное влияние на максимальное количество синапсов, участвующих в обработке. стимулов и действий, ведущих к вознаграждению (рис. 7). Дофамин, высвобождаемый активациями нейронов после поощрений и предсказывающих вознаграждение стимулов, будет влиять на сукссинаптические рецепторы D1 на стриатальных нейронах, выступающих на внутренний паллидум и субстанцию ​​nigra pars reticulata, и на все рецепторы D2 на нейронах, выступающих на внешний паллидум. Снижение выброса дофамина, вызванное депрессиями с пропущенными поощрениями и предсказывающими вознаграждения стимулами, уменьшит тоническую стимуляцию рецепторов D2 окружающим дофамином. Таким образом, ошибки прогнозирования положительного вознаграждения влияют на все типы нейронов стриатального выхода, тогда как ошибка отрицательного прогнозирования может преимущественно влиять на нейроны, проецируемые на внешний паллидум.

Потенциальные кокаиновые механизмы. Блокада переносчика обратного захвата дофамина такими препаратами, как кокаин или амфетамин, усиливает и продлевает периодическое увеличение концентрации дофамина (Черч и др. 1987a; Giros et al. 1996; Suaud-Chagny et al. 1995). Усиление будет особенно заметным, когда быстрое, вызванное взрывом увеличение концентрации дофамина достигнет пика, прежде чем регулирование с обратной связью станет эффективным. Этот механизм может привести к значительному усилению дофаминового сигнала после первичных поощрений и предсказывающих вознаграждение стимулов. Это также увеличило бы немного более слабый дофаминовый сигнал после стимулов, напоминающих вознаграждение, новые стимулы и особенно существенные стимулы, которые могут быть частыми в повседневной жизни. Усиление кокаином позволило бы этим невыгодным стимулам казаться такими же сильными или даже более сильными, чем естественные выгоды без кокаина. Постсинаптические нейроны могут неправильно истолковывать такой сигнал как особенно заметное событие, связанное с вознаграждением, и подвергаться долговременным изменениям в синаптической передаче.

МЕМБРАННЫЕ МЕРОПРИЯТИЯ ДОФАМИНА.

Действия допамина на стриатальные нейроны зависят от типа активированного рецептора, связаны с деполяризованным и гиперполяризованным состояниями мембранных потенциалов и часто включают глутаматные рецепторы. Активация дофаминовых рецепторов D1 усиливает возбуждение, вызванное активацией N-метил-д-аспартатные (NMDA) рецепторы после кортикальных входов через Са L-типа2+ каналы, когда мембранный потенциал находится в деполяризованном состоянии (Cepeda et al. 1993, 1998; Эрнандес-Лопес и др. 1997; Кавагути и соавт. 1989). Напротив, активация D1, по-видимому, уменьшает вызванные возбуждения, когда мембранный потенциал находится в гиперполяризованном состоянии (Эрнандес-Лопес и др. 1997). In vivo ионофорез дофамина и аксональная стимуляция индуцируют D1-опосредованные возбуждения, продолжающиеся 100 – 500 мс после выделения дофамина (Гонон 1997; Уильямс и Миллар 1991). Активация D2 дофаминовых рецепторов снижает Na+ и N-типа Са2+ токи и ослабление возбуждения, вызванного активацией рецепторов NMDA или α-амино-3-гидрокси-5-метил-4-изоксазолпропионовой кислоты (AMPA) в любом мембранном состоянии (Cepeda et al. 1995; Ян и др. 1997). На системном уровне дофамин оказывает фокусирующий эффект, при котором только самые сильные входные сигналы проходят через стриатум во внешний и внутренний паллидум, тогда как более слабая активность теряется (Браун и Арбутнотт 1983; Филион и соавт. 1988; Тоан и Шульц 1985; Йим и Могенсон 1982). Таким образом, допамин, высвобождаемый реакцией дофамина, может приводить к немедленному общему снижению активности стриата, хотя стимулирующее воздействие на вызванные коркой возбуждения может быть опосредовано через рецепторы D1. Следующее обсуждение покажет, что эффекты нейротрансмиссии дофамина могут не ограничиваться изменениями в поляризации мембраны.

ДОПАМИН-ЗАВИСИМАЯ ПЛАСТИЧНОСТЬ.

Тетаническая электрическая стимуляция корковых или лимбических входов в стриатум и прилежащее ядро ​​вызывает посттетанические депрессии, продолжительностью в несколько десятков минут в срезах (Calabresi et al. 1992a; Lovinger et al. 1993; Pennartz et al. 1993; Уолш 1993; Wickens et al. 1996). Эта манипуляция также повышает возбудимость кортикостриатальных терминалов (Гарсия-Муньос и соавт. 1992). Посттетаническое потенцирование схожих длительностей наблюдается в полосатом теле и прилежащем ядре, когда постсинаптическая деполяризация облегчается удалением магния или применением антагонистов γ-аминомасляной кислоты (ГАМК) (Boeijinga et al. 1993; Calabresi et al. 1992b; Pennartz et al. 1993). Антагонисты рецептора допамина D1 или D2 или нокаут рецептора D2 устраняют посттетаническую кортикостриатальную депрессию (Calabresi et al. 1992a; Calabresi et al. 1997; Гарсия-Муньос и соавт. 1992), но не влияют на потенцирование в прилежащем ядре (Pennartz et al. 1993). Применение дофамина восстанавливает стриатальную посттетаническую депрессию в срезах у крыс, пораженных дофамином (Calabresi et al. 1992a) но не может изменить посттетаническое потенцирование (Pennartz et al. 1993). Короткие импульсы дофамина (5 – 20 мс) вызывают долгосрочное потенцирование в срезах полосатого тела при одновременном применении с тетанической кортикостриатальной стимуляцией и постсинаптической деполяризацией в соответствии с правилом обучения трехфакторного усиления (Wickens et al. 1996).

Дополнительные доказательства синаптической пластичности, связанной с дофамином, можно найти в других структурах мозга или другими методами. В гиппокампе посттетаническое усиление усиливается при применении в ванне агонистов D1 (Отмахова и Лисман 1996) и нарушается блокадой рецепторов D1 и D2 (Frey et al. 1990). Ликвидация случайных, но не случайных локальных применений агонистов дофамина и допамина увеличивает разрыв нейронов в срезах гиппокампа (Stein et al. 1994). В сетчатке рыб активация дофаминовых рецепторов D2 вызывает движение фоторецепторов внутри или вне пигментного эпителия (Рогавский 1987). Послеродовые инъекции агонистов амфетамина и дофамина в хвостатое ядро ​​крысы улучшают производительность в задачах памяти (Паккард и Белый 1991). Денервации дофамина в стриатуме уменьшают количество дендритных шипиков (Арбутнотт и Ингам 1993; Anglade et al. 1996; Ингам и соавт. 1993), предполагая, что иннервация дофамина оказывает стойкое влияние на кортикостриатальные синапсы.

ОБРАБОТКА В СТРИАТАЛЬНЫХ НЕЙРОНАХ.

По оценкам, кортикальные окончания 10,000 и варикозные расширения допамина 1,000 связываются с дендритными шипами каждого стриатального нейрона (Doucet et al. 1986; Groves et al. 1995; Wilson 1995). Густая дофаминовая иннервация становится видимой в виде корзинок, очерчивающих индивидуальную перикарию в голубином палеостриатуме (Винн и Гюнтюркюн 1995). Варикозное расширение вен допамина образует синапсы на тех же дендритных шипиках стриатальных нейронов, которые контактируют с корковыми глютаматными афферентами (рис. 8) (Bouyer et al. 1984; Freund et al. 1984; Pickel et al. 1981; Смит и соавт. 1994), а некоторые дофаминовые рецепторы расположены внутри кортикостриатальных синапсов (Levey et al. 1993; Юнг и соавт. 1995). Большое количество корковых входов в стриатальные нейроны, конвергенция допаминовых и глутаматных входов в шипах стриатальных нейронов и в значительной степени гомогенный дофаминовый сигнал, достигающий, вероятно, все стриатальные нейроны, являются идеальными субстратами для допамин-зависимых синаптических изменений в шипах стриатальных нейронов. , Это также может иметь место для коры головного мозга, где дендритные шипики связываются синаптическими входами как дофаминовых, так и корковых нейронов (Goldman-Rakic ​​et al. 1989), хотя дофамин, вероятно, не влияет на каждый кортикальный нейрон.

Базальные ганглии связаны открытыми и закрытыми петлями с корой и с подкорковыми лимбическими структурами. Стриатум в различной степени получает входные данные из всех областей коры. Выходы базальных ганглиев направлены преимущественно в области лобной коры, но также достигают височной доли (Миддлтон и Стрик 1996). Многие входы из функционально неоднородных областей коры в стриатуму организованы в виде отдельных параллельных каналов, как и выходы из внутреннего паллидума, направленные в различные области моторных корковых сосудов (Александр и др. 1986; Гувер и Стрик 1993). Однако афференты из функционально связанных, но анатомически разных областей коры могут сходиться на стриатальных нейронах. Например, проекции из соматотопически связанных областей первичной соматосенсорной и моторной коры проецируются на общие полосатые области (Флаэрти и Грейбиль 1993, 1994). Кортикостриатальные проекции расходятся в отдельные полосатые «матрисомы» и вновь сходятся в паллидуме, увеличивая таким образом синаптическую «поверхность» для модулирующих взаимодействий и ассоциаций (Graybiel et al. 1994). Такое анатомическое расположение позволило бы дофаминовому сигналу определять эффективность высоко структурированных, специфичных для задачи корковых входов в стриатальные нейроны и оказывать широкое влияние на центры переднего мозга, участвующие в контроле поведенческих действий.

ИСПОЛЬЗОВАНИЕ СИГНАЛА ОШИБКИ ПРОГНОЗА ПРЕДВАРИТЕЛЬНОГО ДОПАМИНА

По-видимому, дофаминовые нейроны сообщают об аппетитных событиях в соответствии с ошибкой прогнозаУравнения. 1 и 2 ). Современные теории обучения и нейрональные модели демонстрируют исключительную важность ошибок прогнозирования для обучения.

Теории обучения

RESCORLA-WAGNER MODEL.

Поведенческие теории обучения формализуют приобретение ассоциаций между произвольными стимулами и первичными мотивирующими событиями в классических парадигмах обусловленности. Стимулы приобретают ассоциативную силу по сравнению с последовательными испытаниями, будучи неоднократно в паре с основным мотивирующим событием

ΔV=αβ(λ-V)

Уравнение 3where V текущая ассоциативная сила стимула, λ - максимальная ассоциативная сила, возможно, поддерживаемая первичным мотивирующим событием, α и β - константы, отражающие значимость условных и безусловных стимулов, соответственно (Дикинсон 1980; Mackintosh 1975; Пирс и Холл 1980; Rescorla и Wagner 1972). (Λ-V) термин обозначает степень, в которой первичное мотивирующее событие происходит непредсказуемо, и представляет ошибку в прогнозировании подкрепления. Он определяет скорость обучения, так как ассоциативная сила увеличивается, когда член ошибки положителен, а условный стимул не полностью предсказывает подкрепление. когда V = λ, условный стимул полностью предсказывает усилитель, и V больше не будет увеличиваться. Таким образом, обучение происходит только тогда, когда первичное мотивирующее событие не полностью предсказывается условным стимулом. Эта интерпретация подтверждается феноменом блокирования, согласно которому стимул не может получить ассоциативную силу, когда он представлен вместе с другим стимулом, который сам по себе полностью предсказывает усилитель (Камин 1969). (Λ-V) термин ошибки становится отрицательным, когда предсказанный усилитель не может произойти, что приводит к потере ассоциативной силы условного раздражителя (вымирание). Обратите внимание, что эти модели используют термин «подкрепление» в широком смысле увеличения частоты и интенсивности конкретного поведения и не относятся к какому-либо конкретному типу обучения.

ДЕЛЬТА ПРАВИЛО.

Модель Rescorla-Wagner относится к общему принципу обучения, основанному на ошибках между желаемым и фактическим результатом, таким как процедура наименьших квадратов ошибок (Кальман 1960; Уидроу и Стернс 1985). Этот принцип был применен к моделям нейронных сетей в правиле дельты, согласно которому синаптические веса (ω) регулируются с помощью

Δω=η(t-a)x

Уравнение 4where t желаемый (целевой) выход сети, a фактический объем производства, а η и x скорость обучения и входной активация, соответственно (Rumelhart et al. 1986; Уидроу и Хофф 1960). Желаемый вывод (t) аналогичен результату (λ), фактическому выходу (a) аналогично предсказанию, измененному в процессе обучения (V) и член дельта-ошибки (δ = t - a) эквивалентен члену ошибки подкрепления (λ-V) правила Rescorla-Wagner (Eq. 3) (Саттон и Барто 1981).

Общая зависимость от непредсказуемости результатов интуитивно связана с самой сущностью обучения. Если обучение включает в себя получение или изменение предсказаний результата, никаких изменений в предсказаниях и, следовательно, никакого обучения не произойдет, когда результат будет совершенно хорошо предсказан. Это ограничивает обучение стимулами и поведенческими реакциями, которые приводят к неожиданным или измененным результатам, а избыточные стимулы, предшествующие результатам, уже предсказанным другими событиями, не изучаются. Помимо своей роли в обеспечении обучения, у подкрепителей есть и другая, совершенно другая функция. Когда обучение завершено, полностью предсказанные подкрепления имеют решающее значение для поддержания изученного поведения и предотвращения вымирания.

Многие формы обучения могут включать уменьшение ошибок прогнозирования. В общем смысле эти системы обрабатывают внешнее событие, генерируют прогнозы этого события, вычисляют ошибку между событием и его прогнозом и модифицируют как производительность, так и прогноз в соответствии с ошибкой прогнозирования. Это может не ограничиваться системами обучения, имеющими дело с биологическими усилителями, но касается гораздо большего разнообразия нейронных операций, таких как визуальное распознавание в коре головного мозга (Рао и Баллард 1997).

Алгоритмы армирования

НЕОБЫЧНАЯ Укрепление.

Модели нейронных сетей можно обучить с помощью прямых сигналов усиления, которые испускают независимый от прогноза сигнал, когда поведенческая реакция выполнена правильно, но нет сигнала с ошибочной реакцией. Обучение в этих в основном инструментальных моделях обучения заключается в изменении синаптических весов (ω) модельных нейронов в соответствии с

Δω=ɛгху

Уравнение 5 где ɛ - это скорость обучения, r это подкрепление, и x и y являются активациями пре- и постсинаптических нейронов, соответственно, гарантируя, что модифицируются только синапсы, участвующие в усиленном поведении. Популярным примером является ассоциативная модель вознаграждения-штрафа (Барто и Анандан 1985). Эти модели получают скелетные или глазодвигательные ответы, изучают последовательности и выполняют тест сортировки карт Висконсина (Арбиб и Домини 1995; Dehaene and Changeux 1991; Домини и др. 1995; Фэг и Арбиб 1992). Процессорные единицы в этих моделях приобретают свойства, аналогичные нейронам в теменной ассоциации коры головного мозга (Mazzoni et al. 1991).

Тем не менее, постоянство обучающего сигнала после обучения требует дополнительных алгоритмов предотвращения сильных синаптических сил (Монтегю и Сейновски 1994) и для избежания приобретения избыточных стимулов, представленных вместе с предсказывающими стимулы стимулами. Ранее изученное поведение сохраняется, когда непредвиденные обстоятельства изменяются, поскольку опущенное подкрепление не может вызвать отрицательный сигнал. Скорость обучения может быть увеличена путем добавления внешней информации от учителя (Баллард 1997) и путем включения информации о прошлых результатах (МакКаллум 1995).

ВРЕМЕННОЕ РАЗНОЕ ОБУЧЕНИЕ.

В особенно эффективном классе алгоритмов подкрепления (Sutton 1988; Саттон и Барто 1981), синаптические веса изменяются в соответствии с ошибкой в ​​прогнозировании подкрепления, вычисленной по последовательным временным шагам (t) в каждом испытании

rˆ(t)=r(t)+P(t)-P(t-l)

Уравнение 6where r это подкрепление и P это прогноз подкрепления. Р (т) обычно умножается на коэффициент дисконтирования γ, где 0 ≤ γ <1, чтобы учесть уменьшение влияния все более отдаленных вознаграждений. Для простоты γ здесь установлено равным 1. В случае одного стимула, предсказывающего одно подкрепление, предсказание P(t - 1) существует раньше времени t подкрепления, но заканчивается во время подкрепления [Р (т) = 0]. Это приводит к эффективному усилению сигнала в то время (Т) подкрепления

rˆ (t)=r(t)-P(t-l)

Уравнение 6aАссоциация р(t) термин указывает на разницу между фактическим и прогнозируемым усилением. Во время обучения подкрепление не полностью предсказано, термин ошибки является положительным, когда происходит подкрепление, и веса синапсов увеличиваются. После обучения подкрепление полностью предсказывается предшествующим стимулом [P(t - 1) = r(t)], при правильном поведении термин ошибки равен нулю, а синаптические веса остаются неизменными. Когда подкрепление опускается из-за неадекватной производительности или измененных непредвиденных обстоятельств, ошибка является отрицательной, и синаптические веса уменьшаются. р(t) является аналогом (λ-V) погрешность модели Rescorla-Wagner (Eq. 4 ). Однако это касается отдельных временных шагов (t) внутри каждого испытания, а не прогнозы, развивающиеся в течение последовательных испытаний. Эти временные модели подкрепления основаны на том факте, что полученные прогнозы включают точное время подкрепления (Dickinson et al. 1976; Галлистель 1990; Смит 1968).

Алгоритмы временного различия (TD) также используют полученные прогнозы для изменения синаптических весов. В случае непредсказуемого, единственного условного стимула, предсказывающего единственное подкрепление, предсказание Р (т) начинается во время (Т), нет предыдущего прогноза [P(t - 1) = 0], а усиление еще не произошло [r(t) = 0]. В соответствии с Eq. 6, модель излучает чисто прогнозирующий эффективный сигнал подкрепления в то время (t) прогноза

rˆ=P(t)

Уравнение 6b В случае нескольких последовательных предсказательных стимулов, опять же с отсутствием подкрепления во время предсказаний, эффективный сигнал подкрепления во время (Т) прогноза отражает разницу между текущим прогнозом Р (т) и предыдущий прогноз P(t - 1)

rˆ=P(t)-P(t-l)

Уравнение 6cЭто является ошибочным условием усиления более высокого порядка. Подобно полностью предсказанным усилителям, все предсказывающие стимулы, которые полностью предсказаны сами, отменяются [P(t - 1) = P(t)], в результате чего р = 0 в разы (Т) из этих стимулов. Только самый ранний прогностический стимул способствует эффективному сигналу подкрепления, так как этот стимул Р (т) не стимулируется другим стимулом [P(t - 1) = 0]. Это приводит к тому же р = Р (т) в то время (Т) первого прогноза, как в случае одного прогноза (Eq. 6b).

Рис. 9. 

Базовые архитектуры моделей нейронных сетей, реализующие алгоритмы временных разностей по сравнению с базальной связностью ганглиев. A: в оригинальной реализации эффективный обучающий сигнал yȳ вычисляется в модели нейрона A и отправлены на пресинаптические терминалы входов x нейрону B, таким образом влияя xB обработка и изменение синаптических весов на xB синапс. нейрон B влияет на поведенческий вывод через аксона y и в то же время способствует адаптивным свойствам нейрона A, а именно его ответ на стимулы предсказания стимула. Более поздние реализации этой простой архитектуры используют нейрон A а не нейрон B для выдачи выхода O модели (Montague et al. 1996; Schultz et al. 1997). Перепечатано из Саттон и Барто (1981) с разрешения Американской психологической ассоциации. B: недавняя реализация отделяет учебный компонент A, называется критик (Справа), из выходного компонента, состоящего из нескольких блоков обработки B, называется актером (оставил). Эффективный сигнал усиления р(t) вычисляется путем вычитания временной разницы в прогнозе взвешенного усилителя γP(t) - P(t - 1) из первичной арматуры r(t) получены из окружающей среды (γ - коэффициент дисконтирования, уменьшающий ценность более отдаленных усилителей). Прогноз Reinforcer вычисляется в отдельной единице прогнозирования C, который является частью критики и образует замкнутый цикл с элементом обучения Aтогда как первичное подкрепление поступает к критику через отдельный вход rt. Эффективный сигнал подкрепления влияет на синаптические веса на входящих аксонах в актере, который опосредует вывод и в блоке адаптивного прогнозирования критика. Перепечатано из Барто (1995) с разрешения MIT Press. CОсновная связь базальных ганглиев обнаруживает поразительное сходство с архитектурой актера-критика. Проекция дофамина излучает сигнал усиления в стриатуме и сравнима с единицей A по частям A и B, лимбический стриатум (или стриосома-патч) занимает позицию прогнозирующей единицы C в критике, а сенсомоторный стриатум (или матрица) напоминает актерские единицы B. В оригинальной модели (А), единственное серьезное отклонение от установленной анатомии базальных ганглиев заключается в влиянии нейрона A направленный на пресинаптические терминалы, тогда как дофаминовые синапсы расположены на постсинаптических дендритах стриатальных нейронов (Freund et al. 1984). Перепечатано из Смит и Болам (1990) с разрешения Elsevier Press.

Взятый вместе, эффективный сигнал усиления (Eq. 6 ) состоит из основного подкрепления, которое уменьшается с появлением прогнозов (Eq. 6a) и постепенно заменяется полученными прогнозами (Уравнения. 6b и 6c). При последовательных прогнозирующих стимулах эффективный сигнал подкрепления перемещается во времени назад от основного усилителя к самому раннему стимулу, прогнозирующему усилитель. Ретроградный перенос приводит к более конкретному присвоению кредита вовлеченным синапсам, так как предсказания происходят ближе по времени к стимулирующим и поведенческим реакциям, которые должны быть обусловлены, по сравнению с подкреплением в конце испытания (Саттон и Барто 1981).

Реализации алгоритмов обучения с подкреплением используют ошибку предсказания двумя способами: для изменения синаптических весов для поведенческого выхода и для получения самих предсказаний для непрерывного вычисления ошибки предсказания (рис. 9 A) (McLaren 1989; Саттон и Барто 1981). Эти две функции разделены в недавних реализациях, в которых ошибка предсказания вычисляется в компоненте адаптивной критики и изменяет синаптические веса в компоненте актора, опосредуя поведенческий вывод (рис. 9 B) (Barto 1995). Положительная ошибка увеличивает предсказание подкрепления критика, тогда как отрицательная ошибка от пропущенного подкрепления уменьшает предсказание. Это делает эффективный сигнал усиления очень адаптивным.

Нейробиологические реализации обучения разнице во времени

СРАВНЕНИЕ ОТВЕТА ДОФАМИНА С МОДЕЛЯМИ Укрепления.

Ответ допамина, кодирующий ошибку в прогнозе вознаграждения (Eq. 1 ) очень напоминает эффективный термин ошибки правил обучения животных (λ-V; Eq. 4 ) и эффективный сигнал усиления алгоритмов TD в то время (t) арматуры [r(t) - P(t - 1); Eq. 6a], как отмечалось ранее (Montague et al. 1996). Точно так же ошибка предсказания аппетитного события допамина (Eq. 2 ) напоминает ошибку подкрепления TD высшего порядка [P(t) - P(t - 1); Eq. 6c]. Природа широко распространенных расходящихся проекций дофаминовых нейронов, вероятно, на все нейроны в стриатуме и на многие нейроны в лобной коре совместима с представлением о глобальном сигнале усиления TD, который излучается критиком для воздействия на все модельные нейроны в актере (сравните рис. 7 с рис. 9 B). Архитектура критика-актер особенно привлекательна для нейробиологии из-за ее отдельных модулей обучения и работы. В частности, он очень похож на связность базальных ганглиев, включая взаимность стриатонигральных проекций (рис. 9 C), как впервые отмечено Houk et al. (1995), Критик симулирует дофаминовые нейроны, предсказание вознаграждения поступает из стриосомальных стриатонигральных проекций, а актер напоминает нейроны стриатального матрикса с допамин-зависимой пластичностью. Интересно, что и допаминовый ответ, и термины теоретической ошибки зависят от знака. Они отличаются от ошибочных терминов абсолютными значениями, которые не делают различий между приобретением и исчезновением и должны иметь преимущественно эффекты внимания.

ПРИМЕНЕНИЕ ДЛЯ НЕЙРОБИОЛОГИЧЕСКИХ ПРОБЛЕМ.

Хотя первоначально они были разработаны на основе модели классической обусловленности Rescorla-Wagner, модели, использующие алгоритмы TD, изучают широкий спектр поведенческих задач с помощью в основном инструментальных форм кондиционирования. Эти задачи достигаются от балансировки полюса на колесе тележки (Барто и соавт. 1983) играть в нарды мирового класса (Tesauro 1994). Роботы, использующие алгоритмы TD, учатся перемещаться по двумерному пространству и избегают препятствий, достигают и захватывают (Fagg 1993) или вставьте колышек в отверстие (Gullapalli et al. 1994). Использование сигнала усиления TD для непосредственного влияния и выбора поведения (рис. 9 A), Модели ТД воспроизводят пищевое поведение медоносных пчел (Montague et al. 1995) и имитировать принятие решений человеком (Montague et al. 1996). Модели TD с явной архитектурой критика-актер представляют собой очень мощные модели, которые эффективно учат движения глаз (Friston et al. 1994; Montague et al. 1993), последовательные движения (рис. 10) и ориентировочные реакции (Контрерас-Видаль и Шульц 1996). Недавняя модель добавила активирующие-подавляющие сигналы новизны для улучшения обучающего сигнала, использовала следы стимулов и действий в критике и актере и использовала правила «победитель получает все» для улучшения обучающего сигнала и для выбора нейронов актеров с наибольшей активацией. Это очень подробно воспроизвело как ответы дофаминовых нейронов, так и обучающее поведение животных в задачах с задержкой ответа (Сури и Шульц 1996). Особенно интересно видеть, что обучающие сигналы, использующие ошибки прогнозирования, приводят к более быстрому и более полному обучению по сравнению с безусловными сигналами подкрепления (рис. 10) (Friston et al. 1994).

Рис. 10. 

Преимущество прогнозирующих сигналов подкрепления для обучения. Временная разностная модель с архитектурой критик-актера и трассой соответствия требованиям актера была обучена в последовательной задаче выбора 2 step-3 (вставка вверху слева). Обучение развивалось быстрее и достигало более высокой производительности, когда в качестве обучающего сигнала использовался прогнозирующий подкрепляющий сигнал (адаптивный критик, топ) по сравнению с использованием безусловного сигнала усиления в конце испытания (нижний). Этот эффект становится все более выраженным с более длинными последовательностями. Сопоставимые характеристики с сигналом безусловного подкрепления потребовали бы гораздо более продолжительной трассы соответствия. Данные были получены из моделирования 10 (R. Suri и W. Schultz, неопубликованные наблюдения). Аналогичное улучшение в обучении с прогнозирующим усилением было обнаружено в модели глазодвигательного поведения (Friston et al. 1994).

Возможные механизмы обучения с использованием допаминового сигнала

В предыдущем разделе показано, что формальный сигнал ошибки предсказания, излучаемый реакцией допамина, может представлять собой особенно подходящий обучающий сигнал для обучения модели. В следующих разделах описывается, как биологический ответ на дофамин может потенциально использоваться для обучения структурами базальных ганглиев, и предлагаются проверяемые гипотезы.

ПОСТСИНАПТИЧЕСКАЯ ПЛАСТИЧНОСТЬ, ОСОБЕННАЯ СИГНАЛОМ ПРОГНОЗА НАГРАД.

Обучение будет проходить в два этапа. Первый шаг включает получение ответа на прогнозирование допаминового вознаграждения. В последующих испытаниях прогнозирующий допаминовый сигнал определенно усиливал бы синаптические веса (ω) кортикостриатальных синапсов Hebbian-типа, которые активны во время стимулирующего предсказание стимула, тогда как неактивные кортикостриатальные синапсы остаются неизменными. Это приводит к трехфакторному правилу обучения

Δω=ɛ rˆ i o

Уравнение 8where р является сигналом усиления допамина, i входная активность, o является выходной активностью, а ɛ является скоростью обучения.

В упрощенной модели четыре кортикальных входа (i1 – i4) контактируют с дендритными шипами трех колючих стриатальных нейронов среднего размера (o1 – o3; рис. 11). Корковые входы сходятся на стриатальных нейронах, каждый вход соприкасается с отдельным позвоночником. Те же шипы неселективно связываются общим вводом допамина R. Активация ввода допамина R указывает на то, что непредсказуемый стимул, предсказывающий награду, произошел в окружающей среде, не предоставляя дополнительных деталей (сигнал благости). Предположим, что кортикальный ввод i2 активируется одновременно с дофаминовыми нейронами и кодирует один из нескольких конкретных параметров одного и того же предсказывающего награду стимула, например его сенсорную модальность, сторону тела, цвет, текстуру и положение, или определенный параметр движения вызвано стимулом. Набор параметров этого события будет кодироваться набором кортикальных входов i2. Корковые входы i1, i3 и i4, не связанные с текущими стимулами и движениями, неактивны. Реакция допамина приводит к неселективному высвобождению допамина при всех варикозах, но селективно усиливает только активные кортикостриатальные синапсы i2 – o1 и i2 – o2, при условии, что корковые входы достаточно сильны для активации стриатальных нейронов o1 и o2.

Рис. 11. 

Дифференциальные влияния глобального сигнала усиления дофамина на селективную кортикостриатальную активность. Дендритные шипы средних колючих стриатальных нейронов среднего размера 3 o1, o2 и o3 связываются с помощью кортикальных входов 4 i1, i2, i3 и i4, а также варикозных расширений аксонов от одной популяции гомогенов нейрона или нейрона, активированного нейроном или нейронами R ( ). Каждый стриальный нейрон получает кортикальный ввод N10,000 и допамин 1,000. В отдельных дендритных шипиках разные корковые входы сходятся с допаминовым входом. В версии модели 1 допаминовый сигнал одновременно усиливает активную кортикостриатальную передачу по сравнению с неактивной передачей. Например, ввод допамина R активен одновременно с вводом коры i2, тогда как i1, i3, i4 неактивны. Это приводит к изменению передачи i2 → o1 и i2 → o2, но оставляет передачи i1 → o1, i3 → o2, i3 → o3 и i4 → o3 неизменными. В версии модели, использующей пластичность, синаптические веса кортикостриатальных синапсов длительно изменяются сигналом допамина в соответствии с тем же правилом. Это может произойти, когда дофаминовые ответы на условный раздражитель действуют на кортикостриатальные синапсы, которые также активируются этим раздражителем. В другой версии, использующей пластичность, дофаминовые ответы на первичное вознаграждение могут воздействовать во времени на кортикостриатальные синапсы, которые ранее были активными. Эти синапсы могут быть модифицированы гипотетическим постсинаптическим нейронным следом, оставленным после этой активности. При сравнении структуры базальных ганглиев с последней моделью TD на рис. 9 B, вход допамина R копирует критик с нейроном A, стриатум с нейронами o1 – o3 копирует актера с нейроном B, кортикальные входы i1 – i4 копируют вход актера, а расходящаяся проекция нейронов допамина R на множественные шипы множественных стриатных нейронов o1 – o3 повторяет глобальное влияние критика на актера. Аналогичное сравнение было сделано Houk et al. (1995), Этот рисунок основан на анатомических данных Freund et al. (1984), Смит и Болам (1990), Флаэрти и Грейбиль (1993)качества Smith et al. (1994).

Этот механизм обучения использует полученный дофаминовый ответ во время предсказывающего вознаграждение стимула в качестве обучающего сигнала для индукции длительных синаптических изменений (рис. 12 A). Изучение прогнозирующего стимула или вызванного движения основано на продемонстрированном приобретении дофаминового ответа на стимулирующий прогноз стимул вместе с дофамин-зависимой пластичностью в стриатуме. Изменения пластичности альтернативно могут происходить в корковых или подкорковых структурах ниже по потоку от полосатого тела после допамин-опосредованного кратковременного усиления синаптической передачи в полосатом теле. Ретроактивные эффекты вознаграждения на стимулы и движения, предшествующие вознаграждению, опосредованы передачей ответа на самый ранний стимул, предсказывающий вознаграждение. Реакция допамина на прогнозируемое или пропущенное первичное вознаграждение не используется для изменений пластичности в стриатуме, поскольку она не происходит одновременно с событиями, которые должны быть обусловлены, хотя она может участвовать в вычислении реакции дофамина на прогнозирующий вознаграждение стимул по аналогии с архитектура и механизм моделей ТД.

Рис. 12. 

Влияние допамина на усиление сигнала на возможные механизмы обучения в стриатуме. AПрогнозирующий ответ на допаминовое вознаграждение на условный стимул (CS) оказывает прямое усиление или пластичность на стриальную нейротрансмиссию, связанную с этим стимулом. BРеакция допамина на первичное вознаграждение оказывает эффект ретроградной пластичности в отношении стриатальной нейротрансмиссии, связанной с предшествующим условным раздражителем. Этот механизм обеспечивается опосредованной стриальной активностью. Сплошные стрелки указывают на прямое влияние сигнала допамина на стриатальную нейротрансмиссию (A) или трасса соответствия (В), маленькая стрелка в B указывает на косвенное влияние на полосатую нейротрансмиссию через след приемлемости.

ПОСТСИНАПТИЧЕСКАЯ ПЛАСТИЧНОСТЬ ВМЕСТЕ С СИНАПТИЧЕСКИМ ПОСЛЕДОВАТЕЛЬНОСТЬЮ

Обучение может происходить за один шаг, если сигнал вознаграждения за дофамин оказывает ретроактивное действие на стриатальные синапсы. Это требует гипотетических следов синаптической активности, которая продолжается до тех пор, пока не произойдет подкрепление, и делает эти синапсы пригодными для модификации с помощью обучающего сигнала, который был активен до подкрепления (Корпус 1943; Klopf 1982; Саттон и Барто 19811). Синаптические веса (ω) изменяются в соответствии с

Δω=ɛ rˆ h (i,o)

Уравнение 9where р является сигналом усиления допамина, ч (я, о) является трассой приемлемости совместной деятельности ввода и вывода, а and является скоростью обучения. Потенциальные физиологические субстраты следов приемлемости состоят в длительных изменениях концентрации кальция (Wickens и Kötter 1995), образование кальмодулин-зависимой протеинкиназы II (Houk et al. 1995) или устойчивая нейрональная активность, часто обнаруживаемая в стриатуме (Шульц и соавт. 1995a) и кора.

Допамин-зависимая пластичность, включающая в себя следы соответствия, представляет собой элегантный механизм для изучения последовательностей назад во времени (Саттон и Барто 1981). Для начала, дофаминовая реакция на непредсказуемое первичное вознаграждение опосредует поведенческое обучение непосредственно предшествующему событию путем изменения кортикостриатальной синаптической эффективности (рис. 11). В то же время ответ допамина переходит к событию, предсказывающему награду. Депрессия во время пропущенного вознаграждения предотвращает обучение ошибочных реакций. На следующем этапе реакция допамина на непредсказуемое событие, предсказывающее вознаграждение, опосредует изучение непосредственно предшествующего прогнозирующего события, и реакция допамина также переносится обратно на это событие. Поскольку это происходит многократно, ответ допамина перемещается назад во времени, пока никакие дальнейшие события не предшествуют, позволяя на каждом шаге предыдущему событию приобретать предсказание вознаграждения. Этот механизм идеально подходит для формирования поведенческих последовательностей, ведущих к окончательному вознаграждению.

Этот механизм обучения полностью использует допаминовую ошибку в прогнозировании аппетитных событий в качестве ретроактивного обучающего сигнала, вызывающего длительные синаптические изменения (рис. 12 B). Он использует допамин-зависимую пластичность вместе со следами полосатой подвижности, биологическая пригодность которых к обучению еще предстоит изучить. Это приводит к непосредственному обучению по результату, по существу совместимому с влиянием обучающего сигнала на актера моделей ТД. Продемонстрированное ретроградное движение дофаминового ответа используется для изучения более ранних и более ранних стимулов.

АЛЬТЕРНАТИВНЫЙ МЕХАНИЗМ: ЭФФЕКТИВНОЕ ВЛИЯНИЕ ПРОГНОЗНОГО ДОФАМИННОГО СИГНАЛА.

Оба механизма, описанные выше, используют ответ допамина в качестве обучающего сигнала для модификации нейротрансмиссии в полосатом теле. Поскольку вклад дофаминзависимой стриатальной пластичности в обучение не до конца понятен, другой механизм может быть основан на продемонстрированной пластичности дофаминового ответа, не требуя стриатальной пластичности. На первом этапе дофаминовые нейроны приобретают ответы на стимулирующие предсказания стимулы. На следующем этапе прогнозирующие ответы могут быть использованы для увеличения влияния корковых входов, которые происходят одновременно в тех же дендритных шипах стриатальных нейронов. Постсинаптическая активность будет меняться в зависимости от

Δдеятельность=δrˆ i

Уравнение 10where р является сигналом усиления допамина, i является входной активностью, а δ является константой усиления. Вместо того, чтобы образовывать обучающий сигнал, прогнозирующий дофаминовый ответ обеспечивает усиливающий или мотивирующий сигнал для стриатальной нейротрансмиссии во время стимулирующего предсказание стимула. При конкурирующих стимулах нейрональные входные сигналы, возникающие одновременно с предсказывающим награду сигналом дофамина, будут обрабатываться преимущественно. Поведенческие реакции извлекут выгоду из предварительной информации и станут более частыми, быстрыми и более точными. Способствующее влияние предварительной информации демонстрируется в поведенческих экспериментах путем сочетания условного раздражителя с нажатием рычага (Ловибонд 1983).

Возможный механизм может использовать фокусирующий эффект дофамина. В упрощенной модели рис. 11Дофамин в глобальном масштабе уменьшает все корковые воздействия. Это позволяет только самым сильным входным сигналам проходить к стриатальным нейронам, тогда как другие, более слабые входные данные становятся неэффективными. Это требует нелинейного, усиливающего контраст механизма, такого как порог для генерации потенциалов действия. Сравнимое усиление наиболее сильных входных сигналов может происходить в нейронах, которые будут преимущественно возбуждены дофамином.

В этом механизме используется полученный прогнозирующий вознаграждение допаминный ответ в качестве сигнала смещения или выбора для воздействия на постсинаптическую обработку (рис. 12 A). Улучшение производительности полностью основано на продемонстрированной пластичности дофаминовых ответов и не требует дофамин-зависимой пластичности в стриатальных нейронах. Реакции на непредсказуемое или пропущенное вознаграждение происходят слишком поздно, чтобы повлиять на обработку полосатого тела, но могут помочь вычислить прогнозирующий ответ дофамина по аналогии с моделями TD.

Электростимуляция дофаминовых нейронов как безусловный стимул

Электрическая стимуляция ограниченных областей мозга надежно служит в качестве подкрепления для приобретения и поддержания поведения подхода (Олдс и Милнер 1954). Некоторые очень эффективные сайты самостимуляции совпадают с телами допаминовых клеток и пучками аксонов в среднем мозге (Корбетт и Мудрый 1980), прилежащее ядро ​​(Phillips et al. 1975), стриатум (Phillips et al. 1976) и префронтальная кора (Мора и Майерс 1977; Phillips et al. 1979), но также встречаются в структурах, не связанных с дофаминовыми системами (Белый и Милнер 1992). Электрическая самостимуляция включает активацию дофаминовых нейронов (Фибигер и Филлипс 1986; Wise и Rompré 1989) и уменьшаются вызванными 6-гидроксидопамином повреждениями дофаминовых аксонов (Fibiger et al. 1987; Филлипс и Фибигер 1978), ингибирование синтеза дофамина (Эдмондс и Галлистель 1977) деполяризационная инактивация дофаминовых нейронов (Ромпре и Мудрый 1989) и антагонисты дофаминовых рецепторов, вводимые системно (Furiezos и Wise 1976) или в прилежащее ядро ​​(Могенсон и соавт. 1979). Самостимуляция облегчается с помощью кокаина или амфетамина, вызванного увеличением внеклеточного дофамина (Колле и Мудрый 1980; Stein 1964; Wauquier 1976). Самостимуляция напрямую увеличивает утилизацию дофамина в прилежащем ядре, полосатом теле и лобной коре (Fibiger et al. 1987; Мора и Майерс 1977).

Интересно представить, что вызванные электрическим током импульсы допамина и высвобождение могут служить безусловным стимулом в ассоциативном обучении, подобно стимуляции нейронов октопамина у медоносных пчел, изучающих рефлекс хоботка (Молот 1993). Однако связанная с допамином самостимуляция отличается по меньшей мере в трех важных аспектах от естественной активации дофаминовых нейронов. Вместо того, чтобы активировать только дофаминовые нейроны, естественные награды обычно активируют несколько нейронных систем параллельно и позволяют распределенное кодирование различных компонентов вознаграждения (см. Дальнейший текст). Во-вторых, электростимуляция применяется в качестве безусловного подкрепления без отражения ошибки в прогнозировании вознаграждения. В-третьих, электрическая стимуляция доставляется только как вознаграждение после поведенческой реакции, а не во время стимулирующего предсказание стимула. Было бы интересно применить электрическую самостимуляцию точно так же, как дофаминовые нейроны испускают свой сигнал.

Дефицит обучения при нарушенной нейротрансмиссии дофамина

Во многих исследованиях изучалось поведение животных с нарушенной нейротрансмиссией дофамина после локального или системного применения антагонистов дофаминовых рецепторов или разрушения аксонов дофамина в вентральном среднем мозге, прилежащем ядре или стриатуме. Помимо наблюдения за двигательными и когнитивными нарушениями, напоминающими о паркинсонизме, эти исследования выявили нарушения в обработке информации о вознаграждении. Самые ранние исследования приводили доводы в пользу дефицита субъективного, гедонистического восприятия вознаграждений (Мудрый 1982; Мудрый и соавт. 1978). Дальнейшие эксперименты выявили нарушение использования первичных наград и обусловленных аппетитных стимулов для подхода и непоследовательного поведения (Beninger et al. 1987; Эттенберг 1989; Miller et al. 1990; Salamone 1987; Ungerstedt 1971; Мудрый и Коллектив 1984; Мудрый и Ромпре 1989). Во многих исследованиях описаны нарушения мотивационных и концентрационных процессов, лежащих в основе аппетитного обучения (Beninger 1983, 1989; Бенингер и Хан 1983; Фибигер и Филлипс 1986; ЛеМоал и Саймон 1991; Роббинс и Эверитт 1992, 1996; Белый и Милнер 1992; Мудрый 1982). Большинство нарушений в обучении связаны с нарушением нейротрансмиссии дофамина в прилежащем ядре, в то время как нарушение дорсального полосатого тела приводит к сенсомоторным нарушениям (Амальрик и Кооб 1987; Роббинс и Эверитт 1992; Белый 1989). Тем не менее, изучение инструментальных задач в целом и дискриминационных свойств стимула в частности, кажется, часто экономится, и не совсем решено, могут ли некоторые из очевидных недостатков обучения быть смешаны с дефицитом двигательной активности (Salamone 1992).

Дегенерация дофаминовых нейронов при болезни Паркинсона также приводит к ряду декларативных и процедурных нарушений обучения, включая ассоциативное обучение (Linden et al. 1990; Sprengelmeyer et al. 1995). Недостатки присутствуют в обучении методом проб и ошибок с немедленным усилением (Вризен и Москович 1990) и при ассоциировании явных стимулов с разными исходами (Knowlton et al. 1996), даже на ранних стадиях болезни Паркинсона без корковой атрофии (Canavan et al. 1989). Пациенты с болезнью Паркинсона также имеют нарушения восприятия времени (Пастор и соавт. 1992). Все эти дефициты возникают в присутствии лечения L-допой, которое восстанавливает уровни тонического стриатального дофамина без восстановления фазальных сигналов дофамина.

Эти исследования показывают, что нейротрансмиссия дофамина играет важную роль в обработке вознаграждений за подход к поведению и в формах обучения, включающих ассоциации между стимулами и вознаграждениями, тогда как участие в более инструментальных формах обучения может быть поставлено под сомнение. Неясно, отражают ли эти недостатки более общую поведенческую инактивацию из-за тонически сниженной стимуляции дофаминового рецептора, а не из-за отсутствия фазового сигнала вознаграждения за дофамин. Чтобы решить этот вопрос, а также более конкретно выяснить роль дофамина в различных формах обучения, было бы полезно изучить обучение в тех ситуациях, в которых фактически наблюдается фазовый ответ дофамина на аппетитные стимулы.

Формы обучения, возможно, опосредованы сигналом допамина

Характеристики реакции дофамина и потенциальное влияние дофамина на стриатальные нейроны могут помочь определить некоторые формы обучения, в которых могут участвовать дофаминовые нейроны. Предпочтительные ответы на аппетит, а не на неприятные события, будут способствовать участию в изучении поведения подхода и опосредовать положительные эффекты подкрепления, а не уходу и наказанию. Ответы на первичное вознаграждение за пределами заданий и учебных условий позволят нейронам дофамина играть роль в относительно широком спектре обучения, включающем первичные вознаграждения, как в классическом, так и в инструментальном обеспечении. Ответы на стимулирующие предсказание стимулы отражают ассоциации стимул-вознаграждение и будут совместимы с участием в ожидании вознаграждения, лежащем в основе общего стимулирующего обучения (Биндра 1968). Напротив, ответы допамина явно не кодируют награды как объекты цели, поскольку они только сообщают об ошибках в прогнозировании вознаграждения. Они также, кажется, нечувствительны к мотивационным состояниям, таким образом, отрицают определенную роль в зависимом от государства стимулирующем обучении целенаправленным действиям (Дикинсон и Баллейн 1994). Отсутствие четких взаимосвязей с движениями рук и глаз могло бы отрицательно сказаться на роли непосредственного опосредования поведенческих реакций, которые следуют за стимулирующими стимулами. Однако сравнение между разрядами отдельных нейронов и изучением целых организмов само по себе сложно. На синаптическом уровне фазально высвобождаемый дофамин достигает многих дендритов, вероятно, на каждом стриатальном нейроне и, таким образом, может оказывать пластическое воздействие на большое разнообразие поведенческих компонентов, включая стриатум, что может включать в себя изучение движений.

Конкретные условия, в которых фазовые сигналы допамина могут играть роль в обучении, определяются типами стимулов, которые эффективно индуцируют реакцию допамина. В лаборатории животных, дофаминовые ответы требуют поэтапного появления аппетитных, новых или особенно значимых стимулов, включая первичные питательные вознаграждения и предсказывающие вознаграждение стимулы, тогда как отвращающие стимулы не играют главной роли. Ответы дофамина могут возникать во всех поведенческих ситуациях, контролируемых фазовыми и явными исходами, хотя условные раздражители более высокого порядка и вторичные усилители еще не были протестированы. Фазовые ответы дофамина, вероятно, не будут играть роль в формах обучения, не опосредованных фазово возникающими результатами, и прогнозирующий ответ не сможет способствовать обучению в ситуациях, в которых не возникают фазальные прогностические стимулы, такие как относительно медленные изменения контекста , Это приводит к интересному вопросу о том, может ли сохранение некоторых форм обучения из-за повреждений допамина или нейролептиков просто отражать отсутствие фазальных ответов дофамина в первую очередь потому, что эффективные стимулы, вызывающие их, не использовались.

Участие допаминовых сигналов в обучении может быть проиллюстрировано теоретическим примером. Представьте себе ответы дофамина во время получения задания на время последовательной реакции, когда правильная реакция внезапно приводит к вознаграждению за питательные вещества. Ответ вознаграждения впоследствии переносится на прогрессивно более ранние предсказывающие вознаграждение стимулы. Время реакции улучшается с продолжительной практикой, поскольку пространственные положения целей становятся все более предсказуемыми. Хотя дофаминовые нейроны продолжают реагировать на стимулирующие предсказания стимулы, дальнейшее улучшение поведения может быть связано, главным образом, с приобретением прогностической обработки пространственных положений другими нейронными системами. Таким образом, ответы допамина будут происходить во время начальной, стимулирующей части обучения, в которой предметы приходят к объектам и получают явные первичные, и, возможно, обусловленные, вознаграждения. Они были бы менее вовлечены в ситуации, в которых прогресс в обучении выходит за рамки индуктивного поведения. Это не ограничит роль дофамина начальными этапами обучения, так как во многих ситуациях требуется сначала учиться на примерах, а лишь позже - учиться с явными результатами.

СОТРУДНИЧЕСТВО МЕЖДУ НАГРАДНЫМИ СИГНАЛАМИ

Ошибка прогноза

Сигнал ошибки предсказания нейронов допамина был бы отличным индикатором аппетитной ценности событий окружающей среды по отношению к предсказанию, но не мог различить пищу, жидкости и стимулы, предсказывающие награду, и между визуальными, слуховыми и соматосенсорными модальностями. Этот сигнал может представлять собой предупреждающее сообщение о вознаграждении, с помощью которого постсинаптические нейроны информируются о неожиданном появлении или пропуске полезного или потенциально полезного события без указания его дальнейшей идентичности. Он обладает всеми формальными характеристиками мощного подкрепляющего сигнала для обучения. Однако информация о конкретном характере вознаграждений имеет решающее значение для определения того, к какому объекту следует подходить и каким образом. Например, голодное животное должно прежде всего приближаться к еде, а не к жидкости. Чтобы отличить релевантное от несущественного вознаграждения, допаминовый сигнал должен быть дополнен дополнительной информацией. Недавние эксперименты по диализу in vivo показали более высокое пищевое высвобождение дофамина у голодных, чем у сытых крыс (Уилсон и соавт. 1995). Эта зависимость от высвобождения дофамина в двигателе может не включать импульсные реакции, поскольку нам не удалось найти четкую зависимость влечения от реакций дофамина при сравнении ранних и поздних периодов отдельных экспериментальных сеансов, во время которых животные насыщались жидкостью (JL Contreras-Vidal и W. Шульц, неопубликованные данные).

Особенности вознаграждения

Информация о жидких и пищевых продуктах также обрабатывается в структурах мозга, отличных от дофаминовых нейронов, таких как дорсальный и вентральный стриатум, субталамическое ядро, миндалина, дорсолатеральная префронтальная кора, орбитофронтальная кора и передняя поясная извилина. Однако эти структуры, по-видимому, не излучают сигнал ошибки предсказания глобального вознаграждения, подобный дофаминовым нейронам. У приматов эти структуры обрабатывают награды как 1) переходные ответы после доставки вознаграждения (Apicella et al. 1991a,b, 1997; Bowman et al. 1996; Хикосака и соавт. 1989; Ники и Ватанабэ 1979; Nishijo et al. 1988; Тремблей и Шульц 1995; Watanabe 1989), 2) переходные реакции на сигналы прогнозирования наград (Aosaki et al. 1994; Apicella et al. 1991b; 1996; Hollerman et al. 1994; Nishijo et al. 1988; Торп и соавт. 1983; Тремблей и Шульц 1995; Williams et al. 1993), 3) устойчивые активации в ожидании немедленных наград (Apicella et al. 1992; Хикосака и соавт. 1989; Мацумура и соавт. 1992; Schultz et al. 1992; Тремблей и Шульц 1995), а также расширение 4) модуляции связанных с поведением активаций с помощью предсказанного вознаграждения (Hollerman et al. 1994; Watanabe 1990, 1996). Многие из этих нейронов хорошо различают разные награды за еду и разные награды за жидкость. Таким образом, они обрабатывают специфическую природу поощрительного события и могут служить восприятию наград. Некоторые из ответов на вознаграждение зависят от непредсказуемости вознаграждения и уменьшаются или отсутствуют, когда вознаграждение прогнозируется условным стимулом (Apicella et al. 1997; Мацумото и соавт. 1995; Л. Тремблей и В. Шульц, неопубликованные данные). Они могут обрабатывать прогнозы для конкретных вознаграждений, хотя неясно, сигнализируют ли они об ошибках предсказания, поскольку их ответы на пропущенные вознаграждения неизвестны.

Поддержание установленной производительности

Три нейрональных механизма, по-видимому, важны для поддержания установленных поведенческих характеристик, а именно: обнаружение пропущенных вознаграждений, обнаружение стимулов, предсказывающих вознаграждение, и обнаружение предсказанных вознаграждений. Дофаминовые нейроны угнетены, когда предсказанные награды опущены. Этот сигнал может снизить синаптическую эффективность, связанную с ошибочными поведенческими реакциями, и предотвратить их повторение. Реакция допамина на стимулирующие предсказание стимулы сохраняется в течение установленного поведения и, таким образом, продолжает служить предварительной информацией. Хотя полностью предсказанные награды не обнаруживаются дофаминовыми нейронами, они обрабатываются недопаминергическими кортикальными и подкорковыми системами, упомянутыми выше. Это было бы важно для предотвращения вымирания научного поведения.

Взятые вместе, кажется, что обработка специфических наград за обучение и поддержание поведения подхода сильно выиграет от сотрудничества между дофаминовыми нейронами, сигнализирующими о непредсказуемом возникновении или пропуске награды и нейронах в других структурах одновременно, что указывает на специфическую природу награды.

СРАВНЕНИЯ С ДРУГИМИ СИСТЕМАМИ ПРОЕКЦИИ

Норадреналиновые нейроны

Почти вся популяция норадреналиновых нейронов в locus coeruleus у крыс, кошек и обезьян демонстрирует довольно однородные, двухфазные активационно-депрессивные реакции на зрительные, слуховые и соматосенсорные стимулы, вызывающие ориентирующие реакции (Aston-Jones и Bloom 1981; Foote et al. 1980; Расмуссен и др. 1986). Особенно эффективными являются редкие события, на которые обращают внимание животные, такие как зрительные стимулы в задаче различенияАстон-Джонс и соавт. 1994). Норадреналиновые нейроны очень хорошо различают возбуждающие или мотивирующие и нейтральные события. Они быстро получают ответы на новые целевые стимулы во время реверсирования и теряют ответы на предыдущие мишени до того, как поведенческое изменение завершено (Астон-Джонс и соавт. 1997). Реакции происходят на свободную жидкость вне какой-либо задачи и переходят к целевым стимулам, предсказывающим награду в рамках задачи, а также к первичным и условным отрицательным стимулам (Астон-Джонс и соавт. 1994; Foote et al. 1980; Расмуссен и Джейкобс 1986; Сара и Сигал 1991). Ответы часто являются временными и, по-видимому, отражают изменения в возникновении или значении стимула. Активации могут произойти только для нескольких испытаний с повторными представлениями объектов питания (Ванков и др. 1995) или с условными слуховыми стимулами, связанными с жидким вознаграждением, отвращением воздуха или электрическим шоком (Расмуссен и Джейкобс 1986; Сара и Сигал 1991). Во время обусловливания реакции происходят на первые несколько презентаций новых стимулов и периодически появляются всякий раз, когда непредвиденные обстоятельства подкрепления изменяются во время приобретения, изменения и исчезновения (Сара и Сигал 1991).

Взятые вместе, ответы норадреналиновых нейронов напоминают ответы дофаминовых нейронов в нескольких отношениях, будучи активированными первичными наградами, предсказывающими награду стимулами и новыми стимулами и передающими ответ от первичных к условным аппетитным событиям. Тем не менее, норадреналиновые нейроны отличаются от дофаминовых нейронов тем, что реагируют на гораздо большее разнообразие возбуждающих стимулов, хорошо реагируя на первичные и условные аверсивные стимулы, хорошо различая нейтральные стимулы, быстро следуя поведенческим изменениям и показывая уменьшающиеся реакции с повторным стимулом презентация, которая может потребовать испытаний 100 для твердых аппетитных ответов (Астон-Джонс и соавт. 1994). Норадреналиновые реакции тесно связаны с возбуждающими или привлекающими внимание свойствами стимулов, вызывающих ориентирующие реакции, и в то же время гораздо менее сфокусированными на свойствах аппетитного стимула, как большинство дофаминовых нейронов. Вероятно, ими движет больше внимания, чем мотивация компонентов аппетита.

Серотониновые нейроны

Активность в разных ядрах шва облегчает моторную выработку, устанавливая мышечный тонус и стереотипную двигательную активность (Джейкобс и Форнал 1993). Спинные нейроны у кошек проявляют фазовые, не обитающие реакции на зрительные и слуховые раздражители, не имеющие никакого специфического поведенческого значения (Heym et al. 1982; LeMoal и Olds 1979). Эти ответы напоминают ответы дофаминовых нейронов на новые и особенно существенные стимулы. Дальнейшие сравнения потребуют более подробных экспериментов.

Ядро базалис Мейнерт

Базальные нейроны переднего мозга приматов активируются фазами с помощью большого разнообразия поведенческих событий, включая обусловленные, предсказывающие вознаграждение стимулы и первичные вознаграждения. Многие активации зависят от памяти и ассоциаций с усилением дискриминации и отложенными ответными задачами. Активации отражают знакомство стимулов (Уилсон и Роллс 1990a), становятся более важными с стимулами и движениями, происходящими ближе ко времени вознаграждения (Ричардсон и Делонг 1990), хорошо различать зрительные стимулы на основе аппетитных и отвращающих ассоциаций (Уилсон и Роллс 1990b) и изменить в течение нескольких попыток во время разворота (Уилсон и Роллс 1990c). Нейроны также активируются отвращающими стимулами, предсказанными визуальными и слуховыми стимулами и движениями. Они часто отвечают на полностью предсказуемые награды в хорошо установленных поведенческих задачах (Mitchell et al. 1987; Ричардсон и Делонг 1986, 1990), хотя ответы на непредсказуемые награды более распространены в некоторых исследованиях (Ричардсон и Делонг 1990) но не в других (Уилсон и Роллс 1990ac). По сравнению с дофаминовыми нейронами они активируются гораздо более широким спектром стимулов и событий, включая аверсивные события, и не показывают довольно однородную реакцию популяции на непредсказуемые награды и ее передачу на стимулы, предсказывающие награды.

Церебеллярные лазалки

Вероятно, первый обучающий сигнал в мозге, основанный на ошибках, был предположительно связан с проекцией лазания волокон от нижней оливы к нейронам Пуркинье в коре мозжечка (Марр 1969), и многие исследования по обучению мозжечка основаны на этой концепции (Houk et al. 1996; Ито 1989; Кавато и Гоми 1992; Llinas и валлийский 1993). Восхождение волоконно-оптических входов в нейроны Пуркинье временно меняет их активность, когда изменяются нагрузки для движений или усиления между движениями и визуальной обратной связью, и обезьяны адаптируются к новой ситуации (Гилберт и Тач 1977; Оякангас и Эбнер 1992). Большинство из этих изменений состоят в увеличении активности, а не реакции активации и депрессии, наблюдаемой с ошибками в противоположных направлениях в дофаминовых нейронах. Если активация альпинистского волокна должна была служить обучающим сигналом, совместная активация альпинистского волокна и параллельного волокна должна приводить к изменениям параллельного ввода волокна в нейроны Пуркинье. Это действительно происходит при длительном снижении параллельного ввода волокон, главным образом в препаратах in vitro (Ито 1989). Тем не менее, сопоставимые параллельные изменения волокна труднее найти в поведенческих ситуациях обучения (Оякангас и Эбнер 1992), оставляя открытыми последствия потенциальных обучающих сигналов для лазания.

Вторым аргументом в пользу роли лазания по волокну в обучении является отвращение к классической обусловленности. Фракция вьющихся волокон активируется отвращением надувания роговицы. Эти ответы теряются после кондиционирования век при использовании слухового раздражителя (Sears и Steinmetz 1991), предполагая связь с непредсказуемостью первичных аверсивных событий. После кондиционирования нейроны в межпозитном ядре мозжечка отвечают на условный раздражитель (Бертье и Мур 1990; Маккормик и Томпсон 1984). Поражения этого ядра или инъекции антагониста ГАМК бикукуллина в нижнюю оливку предотвращают потерю откликов воздушной струи нижней оливковой оливки после кондиционирования, подтверждая, что моносинаптическое или полисинаптическое ингибирование межпозвоночной артерии нижней оливы подавляет реакции после кондиционирования (Томпсон и Глюк 1991). Это может привести к депрессии нижних оливковых нейронов в отсутствие прогнозируемых аверсивных стимулов и, таким образом, сообщать об отрицательной ошибке в прогнозировании аверсивных событий, сходной с дофаминовыми нейронами.

Таким образом, лазание по волокнам может сообщать об ошибках в двигательной активности и ошибках в прогнозировании аверсивных событий, хотя это не всегда может включать двунаправленные изменения, как в случае с дофаминовыми нейронами. Восхождение на волокна, по-видимому, не вызывает ответных реакций на условные аверсивные раздражители, но такие ответы обнаруживаются в межпозвоночном ядре. Вычисление аверсивных ошибок предсказания может включать нисходящие тормозные сигналы для нижних оливковых нейронов, по аналогии с полосатыми проекциями на дофаминовые нейроны. Таким образом, мозжечковые контуры обрабатывают сигналы об ошибках, хотя и по-разному, чем дофаминовые нейроны и модели TD, и они могут реализовывать правила обучения ошибкам, такие как правило Rescorla-Wagner (Томпсон и Глюк 1991) или формально эквивалентное правило Видроу-Хоффа (Кавато и Гоми 1992).

СИГНАЛ НАГРАДЫ ДОФАМИНОВ ПРОТИВ ПАРКИНСОНЯНСКИХ ЛЮДЕЙ

Нарушение нейротрансмиссии дофамина при болезни Паркинсона, экспериментальных поражениях или нейролептическом лечении связано со многими поведенческими нарушениями в движении (акинезия, тремор, ригидность), когнитивных способностях (внимание, брадифрения, планирование, обучение) и мотивации (снижение эмоциональных реакций, депрессия). Диапазон дефицита кажется слишком широким, чтобы его можно было просто объяснить неисправным сигналом вознаграждения дофамина. Большинство дефицитов значительно уменьшаются с помощью системной терапии предшественниками дофамина или агонистами рецепторов, хотя это не может простым способом восстановить фазовую передачу информации нейронными импульсами. Однако многие нарушения аппетита не восстанавливаются этой терапией, например, фармакологически индуцированный дефицит дискриминации (Алениус 1974) и паркинсонический дефицит обучения (Canavan et al. 1989; Knowlton et al. 1996; Linden et al. 1990; Sprengelmeyer et al. 1995; Вризен и Москович 1990).

Исходя из этих соображений, очевидно, что нейротрансмиссия дофамина выполняет две отдельные функции в головном мозге: фазовую обработку информации, связанной с аппетитом и предупреждением, и тонизирующее включение широкого спектра поведения без временного кодирования. Дефицит схожей двойной функции дофамина может лежать в основе патофизиологии шизофрении (Грейс 1991). Интересно отметить, что фазовые изменения активности дофамина могут происходить в разных временных масштабах. В то время как отклики вознаграждения следуют по ходу времени порядка десятков и сотен миллисекунд, исследования высвобождения дофамина с вольтамперометрией и микродиализом касаются временных шкал минут и показывают гораздо более широкий спектр функций дофамина, включая обработку вознаграждений, кормление, питье, наказания, стресс и социальное поведение (Abercrombie et al. 1989; Черч и др. 1987b; Доэрти и Граттон 1992; Louilot et al. 1986; Young et al. 1992, 1993). Похоже, что нейротрансмиссия дофамина следует по меньшей мере трем временным шкалам с все более широкими ролями в поведении, от быстрой, довольно ограниченной функции сигнализации вознаграждений и оповещения о стимулах посредством более медленной функции обработки значительного диапазона позитивно и негативно мотивирующих событий для тонической функции. обеспечения большого разнообразия двигательных, когнитивных и мотивационных процессов.

Функция тонического дофамина основана на низких, устойчивых, внеклеточных концентрациях дофамина в полосатом теле (5 – 10 нМ) и других областях, иннервируемых дофамином, которые достаточны для стимуляции экстрасинаптических, главным образом дофаминовых рецепторов типа D2 в их состоянии высокой аффинности (9 – 74 нМ; рис. 8) (Ричфилд и др. 1989). Эта концентрация локально регулируется в узком диапазоне с помощью синаптического переполнения и высвобождения допсинаптического дофамина, вызванного спонтанной импульсной активностью тонуса, обратного захвата, метаболизма, ауторецептор-опосредованного выделения и контроля синтеза, а также влияния пресинаптического глутамата на высвобождение дофамина (Chesselet 1984). Важность концентраций допамина в окружающей среде экспериментально подтверждается вредными эффектами нефизиологических уровней стимуляции рецепторов. Снижение стимуляции дофаминовых рецепторов после поражения афферентов дофамина или местного введения антагонистов дофамина в префронтальную кору приводят к ухудшению выполнения задач пространственного замедленного ответа у крыс и обезьян (Брозоски и соавт. 1979; Савагути и Гольдман-Ракич 1991; Simon et al. 1980). Интересно, что увеличение префронтального оборота допамина вызывает аналогичные нарушения (Эллиотт и соавт. 1997; Мерфи и соавт. 1996). Очевидно, что тоническая стимуляция дофаминовых рецепторов не должна быть ни слишком низкой, ни слишком высокой, чтобы обеспечить оптимальную функцию данной области мозга. Изменение влияния хорошо регулируемого окружающего дофамина может поставить под угрозу правильное функционирование нейронов стриаты и коры. Различные области мозга могут требовать определенных уровней дофамина для обеспечения определенных поведенческих функций. Можно предположить, что концентрации дофамина в окружающей среде также необходимы для поддержания стриатальной синаптической пластичности, вызванной сигналом вознаграждения за дофамин. Роль тонического дофамина в синаптической пластичности подтверждается вредными эффектами блокады дофаминовых рецепторов или нокаутом рецепторов D2 на посттетаническую депрессию (Calabresi et al. 1992a, 1997).

Многие другие нейротрансмиттеры существуют также в низких концентрациях в окружающей среде во внеклеточной жидкости, таких как глутамат в стриатуме (0.9 мкМ) и коре (0.6 мкМ) (Herrera-Marschitz et al. 1996). Этого может быть достаточно для стимуляции высокочувствительных рецепторов NMDA (Пески и Бариш 1989) но не другие типы рецепторов глутамата (Кискин и соавт. 1986). Окружающий глютамат способствует активности потенциала действия посредством стимуляции рецептора NMDA в гиппокампе (Сах и соавт. 1989) и активирует рецепторы NMDA в коре головного мозга (Блантон и Кригштейн 1992). Уровни тонического глутамата регулируются поглощением в мозжечке и повышаются во время филогенеза, влияя на миграцию нейронов посредством стимуляции рецептора NMDA (Росси и Слэйтер 1993). Другие нейротрансмиттеры существуют также в низких концентрациях в окружающей среде, такие как аспартат и ГАМК в стриатуме и лобной коре (0.1 мкМ и 20 нМ соответственно) (Herrera-Marschitz et al. 1996) и аденозин в гиппокампе, где он участвует в пресинаптическом торможении (Manzoni et al. 1994). Хотя этот список неполон, он предполагает, что нейроны во многих структурах мозга постоянно купаются в супе нейротрансмиттеров, который оказывает мощное, специфическое, физиологическое воздействие на возбудимость нейронов.

Принимая во внимание общую важность тонических внеклеточных концентраций нейротрансмиттеров, представляется, что широкий спектр симптомов паркинсонизма не был бы обусловлен недостаточной передачей информации о наградах дофаминовыми нейронами, но отражал бы сбой в работе стриатальных и корковых нейронов из-за нарушений, вызванных снижением уровня допамина в окружающей среде. , Дофаминовые нейроны не будут активно участвовать в широком спектре процессов, дефицитных при паркинсонизме, а просто обеспечат фоновую концентрацию дофамина, необходимую для поддержания надлежащего функционирования стриатальных и корковых нейронов, участвующих в этих процессах.

Благодарности

Я благодарю доктора. Дана Баллард, Энтони Дикинсон, Франсуа Гонон, Дэвид Д. Поттер, Траверс Слэйтер, Роланд Э. Сури, Ричард С. Саттон и Р. Марк Уайтман за содержательные обсуждения и комментарии, а также два анонимных рецензента за подробные комментарии.

Экспериментальная работа была поддержана Швейцарским национальным научным фондом (в настоящее время 31.43331.95), программами Human Capital and Mobility и Biomed 2 Европейского сообщества через Швейцарское управление образования и науки (CHRX-CT94 – 0463 через 93.0121 и BMH4-CT95. –0608 через 95.0313 – 1), Фонд Джеймса Макдоннелла, Фонд исследований Роша, Фонд Объединенного Паркинсона (Чикаго) и Британский Совет.

Ссылки

    1. Abercrombie ED,
    2. Киф К.А.,
    3. DiFrischia DS,
    4. Зигмонд МДж

    (1989) Дифференциальное влияние стресса на высвобождение дофамина in vivo в стриатуме, прилежащем ядре и медиальной лобной коре. J. Neurochem. 52: 1655-1658.

    1. Алениус С.

    (1974) Влияние низких и высоких доз L-допы на подавление поведения, вызванное тетрабеназином или α-метилтирозином, в последовательной задаче различения. Psychopharmacologia 39: 199-212.

    1. Александр Г.Е.,
    2. Делонг М.Р.,
    3. Стрик П.Л.

    (1986) Параллельная организация функционально разделенных цепей, связывающих базальные ганглии и кору. Annu. Rev. Neurosci. 9: 357-381.

    1. Амальрик М.,
    2. Кооб Г.Ф.

    (1987) Истощение дофамина в хвостатом ядре, но не в прилежащем ядре, ухудшает характеристики времени реакции. J. Neurosci. 7: 2129-2134.

    1. Анден Н.Е.,
    2. Фьюкс К.,
    3. Хамбергер Б.,
    4. Хекфельт Т. А

    (1966) количественное исследование нейро-неостриатальных дофаминовых нейронов. Acta Physiol. Сканд. 67: 306-312.

    1. Англад П.,
    2. Муат-Прижент А.,
    3. Agid Y.,
    4. Hirsch EC

    (1996) Синаптическая пластичность в хвостатом ядре пациентов с болезнью Паркинсона. нейродегенерации 5: 121-128.

    1. Аосаки Т.,
    2. Цубокава Х.,
    3. Исида А.,
    4. Ватанабэ К.,
    5. Грейбиль А.М.,
    6. Кимура М.

    (1994) Ответы тонически активных нейронов полосатого тела приматов подвергаются систематическим изменениям во время поведенческой сенсомоторной обусловленности. J. Neurosci. 14: 3969-3984.

    1. Apicella P.,
    2. Легаллет Э.,
    3. Trouche E.

    (1996) Реакции тонически разряжающихся нейронов в полосатом теле обезьяны на визуальные стимулы, представленные в пассивных условиях и во время выполнения задачи. Neurosci. Lett. 203: 147-150.

    1. Apicella P.,
    2. Легаллет Э.,
    3. Trouche E.

    (1997) Реакции тонически разряжающихся нейронов в полосатом теле обезьяны на первичные награды, доставляемые во время различных поведенческих состояний. Exp. Brain Res. 116: 456-466.

    1. Apicella P.,
    2. Юнгберг Т.,
    3. Скарнати Э.,
    4. Шульц В.

    (1991a) Реакция на вознаграждение в спинном и вентральном стриатуме обезьяны. Exp. Brain Res. 85: 491-500.

    1. Apicella P.,
    2. Скарнати Э.,
    3. Юнгберг Т.,
    4. Шульц В.

    (1992) Активность нейронов в полосатом теле обезьяны, связанная с ожиданием предсказуемых экологических событий. J. Neurophysiol. 68: 945-960.

    1. Apicella P.,
    2. Скарнати Э.,
    3. Шульц В.

    (1991b) Тонически разряжающиеся нейроны стриатума обезьяны отвечают на подготовительные и полезные стимулы. Exp. Brain Res. 84: 672-675.

    1. Арбиб М.А.,
    2. Домини ПФ

    (1995) Моделирование роли базальных ганглиев в определении времени и последовательности саккадических движений глаз. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Кембридж, Массачусетс), стр. 149-162.

    1. Арбутнотт Г.В.,
    2. Ингам CA

    (1993) Сложная проблема того, что допамин делает при психиатрических заболеваниях. Prog. Brain Res. 99: 341-350.

    1. Астон-Джонс Г.,
    2. Блум ИП

    (1981) Содержащие норэпинефрин нейроны локуса coeruleus у поведенческих крыс проявляют выраженную реакцию на вредные раздражители окружающей среды. J. Neurosci. 1: 887-900.

    1. Астон-Джонс Г.,
    2. Райковски Ю.,
    3. Кубиак П.

    (1997) Условные ответы нейронов локуса обыкновенного coeruleus предвосхищают приобретение различительного поведения в задаче бдительности. неврология 80: 697-716.

    1. Астон-Джонс Г.,
    2. Райковски Ю.,
    3. Кубяк П.,
    4. Алексинский Т.

    (1994) Нейроны Locus coeruleus у обезьян избирательно активируются присутствующими сигналами в задаче бдительности. J. Neurosci. 14: 4467-4480.

    1. Баллард Д.Х.

    (1997) Введение в нейронные вычисления. (MIT Press, Кембридж, Массачусетс).

    1. Barto AG

    (1995) Адаптивные критики и базальные ганглии. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Кембридж, Массачусетс), стр. 215-232.

    1. Barto AG,
    2. Анандан П.

    (1985) Стохастические автоматы распознавания образов. IEEE Trasnact. Сист. Человек Киберн. 15: 360-375.

    1. Barto AG,
    2. Саттон Р.С.,
    3. Андерсон CW

    (1983) Нейроноподобные адаптивные элементы, которые могут решать сложные задачи обучения. IEEE Trans Syst. Человек Кибернет. 13: 834-846.

    1. Beninger RJ

    (1983) Роль дофамина в двигательной активности и обучении. Brain Res. Rev. 6: 173-196.

    1. Beninger RJ

    (1989) Диссоциация влияния измененной дофаминергической функции на производительность и обучение. Brain Res. Bull. 23: 365-371.

    1. Beninger RJ,
    2. Ченг М.,
    3. Хан Б.Л.,
    4. Хоффман, округ Колумбия,
    5. Мазурский Е.Ю.

    (1987) Эффекты вымирания, пимозида, SCH 23390 и метоклопрамида на операндное реагирование крыс, получающее пищу. Психофармакология 92: 343-349.

    1. Beninger RJ,
    2. Хан Б.Л.

    (1983) Пимозид блокирует образование, но не экспрессию амфетаминовой среды, специфичной для окружающей среды. Наука 220: 1304-1306.

    1. Берендсе HW,
    2. Groenewegen HJ,
    3. Lohman AHM

    (1992) Распределение по частям вентральных полосатых нейронов, выступающих в средний мозг у крысы. J. Neurosci. 12: 2079-2103.

    1. Бергер Б.,
    2. Троттье С.,
    3. Верни С.,
    4. Гаспар П.,
    5. Альварез С.

    (1988) Региональное и ламинарное распределение иннервации дофамина и серотонина в коре головного мозга макака: радиоавтографическое исследование. J. Comp. Neurol. 273: 99-119.

    1. Бергсон С.,
    2. Мрзляк Л.,
    3. Smiley JF,
    4. Паппи М.,
    5. Левенсон Р.,
    6. Гольдман-Ракич П.С.

    (1995) Региональные, клеточные и субклеточные вариации в распределении D1 и D5 дофаминовые рецепторы в мозгу приматов. J. Neurosci. 15: 7821-7836.

    1. Бертье NE,
    2. Мур Дж. В.

    (1990) Активность глубоких ядерных клеток мозжечка при классическом кондиционировании удлинения никтирующей мембраны у кроликов. Exp. Brain Res. 83: 44-54.

    1. Биндра Д.

    (1968) Нейропсихологическая интерпретация влияния драйва и побудительной мотивации на общую активность и инструментальное поведение. Psychol. Rev. 75: 1-22.

    1. Блантон М.Г.,
    2. Кригштейн А.Р.

    (1992) Свойства рецепторов аминокислотных нейротрансмиттеров эмбриональных корковых нейронов при активации экзогенными и эндогенными агонистами. J. Neurophysiol. 67: 1185-1200.

    1. Boeijinga PH,
    2. Малдер А.Б.,
    3. Pennartz CMA,
    4. Мансханден И.,
    5. Лопес да Силва ФХ

    (1993) Ответы прилежащего ядра после стимуляции свода / фимбрии у крысы. Выявление и долговременное потенцирование моно- и полисинаптических путей. неврология 53: 1049-1058.

    1. Болам Дж.П.,
    2. Фрэнсис СМ,
    3. Хендерсон З.

    (1991) Холинергический вклад в дофаминовые нейроны черной субстанции: двойное иммуноцитохимическое исследование. неврология 41: 483-494.

    1. Боллес RC

    (1972) Укрепление, ожидание и обучение. Psychol. Rev. 79: 394-409.

    1. Боуман Э.М.,
    2. Эгнер Т.Г.,
    3. Ричмонд Б.Дж.

    (1996) Нервные сигналы в вентральном стриатуме обезьяны, связанные с мотивацией для получения сока и кокаина. J. Neurophysiol. 75: 1061-1073.

    1. Bouyer JJ,
    2. Парк DH,
    3. Джо TH,
    4. Пикель В.М.

    (1984) Химический и структурный анализ связи между входами коры и содержащими тирозин гидроксилазу терминалами в неостриатуме крыс. Brain Res. 302: 267-275.

    1. Браун JR,
    2. Арбутнотт Г.В.

    (1983) Электрофизиология дофамина (D2) рецепторы: исследование действия дофамина на кортикостриатальную передачу. неврология 10: 349-355.

    1. Брозоски TJ,
    2. Браун РМ,
    3. Росволд ОН,
    4. Goldman PS

    (1979) Когнитивный дефицит, вызванный региональным истощением дофамина в префронтальной коре макаки-резуса. Наука 205: 929-932.

    1. Caillé I.,
    2. Думартин Б.,
    3. Блох Б.

    (1996). Ультраструктурная локализация иммунореактивности рецептора дофаминового рецептора D1 в крысиных стриатонимических нейронах и его связь с дофаминергической иннервацией. Brain Res. 730: 17-31.

    1. Калабрези П.,
    2. Майор Р.,
    3. Пизани А.,
    4. Mercuri NB,
    5. Бернарди Г.

    (1992a) Длительная синаптическая депрессия в стриатуме: физиологическая и фармакологическая характеристика. J. Neurosci. 12: 4224-4233.

    1. Калабрези П.,
    2. Пизани А.,
    3. Mercuri NB,
    4. Бернарди Г.

    (1992b) Длительное потенцирование в полосатом теле снимается с помощью снятия зависящего от напряжения магниевого блока каналов рецептора NMDA. Евро. J. Neurosci. 4: 929-935.

    1. Калабрези П.,
    2. Сайарди А.,
    3. Пизани А.,
    4. Baik JH,
    5. Центонце Д.,
    6. Mercuri NB,
    7. Бернарди Г.,
    8. Борелли Э.

    (1997) Аномальная синаптическая пластичность в полосатом теле мышей, лишенных дофаминовых рецепторов D2. J. Neurosci. 17: 4536-4544.

    1. Canavan AGM,
    2. Passingham RE,
    3. Марсден CD,
    4. Куинн Н.,
    5. Wyke M.,
    6. Polkey CE

    (1989) Выполнение учебных заданий пациентов на ранних стадиях болезни Паркинсона. Neuropsychologia 27: 141-156.

    1. Cepeda C.,
    2. Бухвальд Н.А.,
    3. Левин М.С.

    (1993) Нейромодулирующее действие дофамина в неостриатуме зависит от активированных подтипов возбуждающего рецептора аминокислоты. Proc. Natl. Акад. Sci. Соединенные Штаты Америки 90: 9576-9580.

    1. Cepeda C.,
    2. Чендлер СХ,
    3. Шумате Л.В.,
    4. Левин М.С.

    (1995) Постоянный Na+ проводимость в неостриатальных нейронах среднего размера: характеристика с использованием инфракрасной видеомикроскопии и цельноклеточных патч-фиксаций. J. Neurophysiol. 74: 1343-1348.

    1. Cepeda C.,
    2. Colwell CS,
    3. Итри Дж. Н.,
    4. Чендлер СХ,
    5. Левин М.С.

    (1998) Дофаминергическая модуляция NMDA-индуцированных токов цельных клеток в неостриатальных нейронах в срезах: вклад проводимости кальция. J. Neurophysiol. 79: 82-94.

    1. Черги К.,
    2. Су-Шаньи М.Ф.,
    3. Гонон Ф.

    (1994) Нелинейная связь между импульсным потоком, высвобождением дофамина и элиминацией дофамина в мозге крысы in vivo. Neurocience 62: 641-645.

    1. Чесселет М.Ф.

    (1984) Пресинаптическая регуляция высвобождения нейротрансмиттера в мозге: факты и гипотеза. неврология 12: 347-375.

    1. Церковь WH,
    2. Судья младший,
    3. Берд Л.Д.

    (1987) Внеклеточный дофамин в полосатом теле крысы после ингибирования поглощения кокаином, номифензином и бензтропином. Евро. J. Pharmacol. 139: 345-348.

    1. Церковь WH,
    2. Судья младший,
    3. Neill DB

    (1987) Выявление поведенческих изменений внеклеточного дофамина с помощью микродиализа. Brain Res. 412: 397-399.

    1. Кларк PBS,
    2. Хоммер DW,
    3. Перт А.,
    4. Скирболл ЛР

    (1987) Иннервация нейронов черной субстанции холинергическими афферентами из ядра педункулопонтина у крыс: нейроанатомические и электрофизиологические данные. неврология 23: 1011-1019.

    1. Colle WM,
    2. Мудрый РА

    (1980) Влияние ядра accumbens амфетамина на вознаграждение за стимуляцию мозга латеральным гипоталамусом. Brain Res. 459: 356-360.

    1. Контрерас-Видаль JL,
    2. Шульц В.А.

    (1996) модель нейронной сети обучения, мотивации и ориентирующего поведения, связанных с вознаграждением. Soc. Neurosci. Тез. 22: 2029.

    1. Корбетт Д.,
    2. Мудрый РА

    (1980) Внутричерепная самостимуляция в отношении восходящих дофаминергических систем среднего мозга: исследование подвижных микроэлектродов. Brain Res. 185: 1-15.

    1. Корвая Н.,
    2. Дусет Г.,
    3. Болам Дж. П.

    (1993) Ультраструктурные и синаптические мишени шейно-чёрной проекции у крысы. неврология 55: 417-427.

    1. Дехене С.,
    2. Changeux J.-P.

    (1991) Тест сортировки карт Висконсина: теоретический анализ и моделирование в нейронной сети. Cerebr. кора головного мозга 1: 62-79.

    1. Делани К.,
    2. Гельперин А.

    (1986) Постингулярное обучение отвращению к пище с дефицитом аминокислот с помощью наземного слизняка Limax maximus. J. Comp. Physiol. [А] 159: 281-295.

    1. Делонг М.Р.,
    2. Crutcher MD,
    3. Георгопулос А.П.

    (1983) Отношения между движением и выделением отдельных клеток в черной субстанции поведения обезьяны. J. Neurosci. 3: 1599-1606.

    1. Ди Кьяра Г.

    (1995) Роль дофамина в злоупотреблении наркотиками рассматривается с точки зрения его роли в мотивации. Наркотик Алкоголь. 38: 95-137.

    1. Дикинсон А.

    (1980) Современная теория обучения животных. (Cambridge Univ. Press, Cambridge, UK).

    1. Дикинсон А.,
    2. Баллин Б.

    (1994) Мотивационный контроль целенаправленных действий. Anim. Учить. Behav. 22: 1-18.

    1. Дикинсон А.,
    2. Холл Г.,
    3. Макинтош, Нью-Джерси

    (1976) Сюрприз и ослабление блокировки. J. Эксп. Psychol. Anim. Behav. Proc. 2: 313-322.

    1. Доэрти MD,
    2. Граттон А.

    (1992) Высокоскоростные хроноамперометрические измерения мезолимбического и нигростриатального высвобождения дофамина, связанного с многократным ежедневным стрессом. Brain Res. 586: 295-302.

    1. Домини П.,
    2. Арбиб М.,
    3. Джозеф Ж.-П.

    (1995) модель кортикостриатальной пластичности для изучения глазодвигательных ассоциаций и последовательностей. J. Cognit. Neurosci. 7: 311-336.

    1. Дусет Г.,
    2. Descarries L.,
    3. Гарсия С.

    (1986) Количественная оценка иннервации дофамина в неостриатуме взрослых крыс. неврология 19: 427-445.

    1. Дугаст С.,
    2. Су-Шаньи М.Ф.,
    3. Гонон Ф.

    (1994) Непрерывный мониторинг in vivo вызванного высвобождения дофамина в прилежащем ядре крысы с помощью амперометрии. неврология 62: 647-654.

    1. Эдмондс DE,
    2. Галлистел ЧР

    (1977) Соотношение вознаграждения и производительности при самостимуляции: специфическое для электродов влияние α-метил-п-тирозина на вознаграждение у крысы. J. Comp. Physiol. Psychol. 91: 962-974.

    1. Эллиотт Р.,
    2. Саакян Б.Я.,
    3. Мэтьюз К.,
    4. Bannerjea A.,
    5. Риммер Дж.,
    6. Роббинс Т.В.

    (1997) Влияние метилфенидата на пространственную рабочую память и планирование у здоровых молодых людей. Психофармакология 131: 196-206.

    1. Эттенберг А.

    (1989) Дофамин, нейролептики и усиленное поведение. Neurosci. Biobehav. Rev. 13: 105-111.

    1. Fagg AH

    (1993) Обучение усилению для достижения и захвата роботов. в «Новые перспективы в контроле за движением к цели», ред. Беннет К.М.Б., Кастиелло У. (Северная Голландия, Амстердам), стр. 281 – 308.

    1. Fagg AH,
    2. Арбиб МА А

    (1992) модель зрительно-моторного условного обучения приматов. Врет. Behav. 1: 3-37.

    1. Fibiger HC,
    2. LePiane FG,
    3. Якубович А.,
    4. Филлипс АГ

    (1987) Роль дофамина во внутричерепной самостимуляции вентральной области. J. Neurosci. 7: 3888-3896.

    1. Fibiger HC,
    2. Миллер Джей Джей

    (1977) Анатомическое и электрофизиологическое исследование серотонинергической проекции от дорсального ядра рафа до черной субстанции у крысы. неврология 2: 975-987.

    1. Fibiger HC,
    2. Филлипс АГ

    Награда, мотивация, познание: психобиология мезотелентальной системы дофамина. Справочник по физиологии. Нервная Система. Внутренние регуляторные системы мозга. 1986Am. Physiol. Soc.Bethesda, MA, сект. 1, вып. IV, р. 647-675.

    1. Филион М.,
    2. Тремблай Л.,
    3. Bédard PJ

    (1988) Аномальные влияния пассивного движения конечности на активность нейронов глобуса бледного у паркинсонической обезьяны. Brain Res. 444: 165-176.

    1. Flaherty AW,
    2. Грейбиль А.

    (1993) Две входные системы для представлений о теле в стриатальной матрице приматов: экспериментальное доказательство на белке обезьяны. J. Neurosci. 13: 1120-1137.

    1. Flaherty AW,
    2. Грейбиль А.

    (1994) Организация ввода-вывода сенсомоторного стриатума у ​​белки обезьяны. J. Neurosci. 14: 599-610.

    1. Цветы К.,
    2. Даунинг AC

    (1978) Прогнозирующий контроль движений глаз при болезни Паркинсона. Энн. Neurol. 4: 63-66.

    1. Фут SL,
    2. Астон-Джонс Г.,
    3. Блум ИП

    (1980) Импульсная активность нейронов locus coeruleus у бодрствующих крыс и обезьян является функцией сенсорной стимуляции и возбуждения. Proc. Natl. Акад. Sci. Соединенные Штаты Америки 77: 3033-3037.

    1. Freund TF,
    2. Пауэлл Дж. Ф.,
    3. Смит нашей эры

    (1984) Тирозин-гидроксилаза-иммунореактивные бутоны в синаптическом контакте с идентифицированными стриатонигральными нейронами, с особой ссылкой на дендритные шипы. неврология 13: 1189-1215.

    1. Фрей У.,
    2. Шредер Х.,
    3. Матиес Х.

    (1990) Дофаминергические антагонисты предотвращают длительное поддержание посттетанического LTP в области CA1 срезов гиппокампа. Brain Res. 522: 69-75.

    1. Фристон К.Дж.,
    2. Тонони Г.,
    3. Reeke GN Jr.,
    4. Спорнс О.,
    5. Эдельман Г.М.

    (1994) Ценностно-зависимый отбор в мозге: моделирование в синтетической нейронной модели. неврология 59: 229-243.

    1. Фудзита К.

    (1987) Распознавание видов пятью обезьянами макаками. Приматы 28: 353-366.

    1. Фурьезос Г.,
    2. Мудрый РА

    (1976) Пимозид-индуцированное угнетение внутричерепной самостимуляции: паттерны реакции исключают двигательные или функциональные нарушения. Brain Res. 103: 377-380.

    1. Футами Т.,
    2. Такакусаки К.,
    3. Китай ST

    (1995) Глутаматергические и холинергические входы от сегментарного ядра педункулопонтина до дофаминовых нейронов в черной субстанции nigra pars compacta. Neurosci. Местожительство 21: 331-342.

    1. Галлистел ЧР

    (1990) Организация обучения. (MIT Press, Кембридж, Массачусетс).

    1. Гарсия CE,
    2. Претт Д.М.,
    3. Морари М.

    (1989) Модель прогнозного контроля: теория и практика - опрос. Автоматика 25: 335-348.

    1. Гарсия-Муньос М.,
    2. Молодой SJ,
    3. Гровс П.

    (1992) Пресинаптические долговременные изменения возбудимости кортикостриатального пути. Neuroreport 3: 357-360.

    1. Гариано Р.Ф.,
    2. Groves PM

    (1988) Внезапное срабатывание в дофаминовых нейронах среднего мозга путем стимуляции медиальной префронтальной и передней поясной извилины коры. Brain Res. 462: 194-198.

    1. Гаррис П.А.,
    2. Чолковский Е.Л.,
    3. Пасторе П.,
    4. Вайтман Р.М.

    (1994a) Отток дофамина из синаптической щели в прилежащее ядро ​​мозга крысы. J. Neurosci. 14: 6084-6093.

    1. Гаррис П.А.,
    2. Чолковский Е.Л.,
    3. Вайтман Р.М.

    (1994b) Неоднородность вызванного переполнения допамина в полосатых и стриатоамигдалоидных областях. неврология 59: 417-427.

    1. Гаррис П.А.,
    2. Вайтман Р.М.

    (1994) Различные кинетики управляют передачей дофаминергического вещества в миндалине, префронтальной коре и стриатуме: вольтамперометрическое исследование in vivo. J. Neurosci. 14: 442-450.

    1. Герфен ЧР

    (1984) Неостриатальная мозаика: компартментализация кортикостриатальных входных и стриатонигральных выходных систем. природа 311: 461-464.

    1. Герфен ЧР,
    2. Энгбер ТМ,
    3. Махан ЛК,
    4. Susel Z.,
    5. Чейз Т.Н.,
    6. Monsma FJ Jr.,
    7. Сибли Д.Р.

    (1990) D1 и D2, регулируемые дофаминовым рецептором, экспрессируют гены стриатонигральных и стриатопаллидных нейронов. Наука 250: 1429-1432.

    1. Немецкий округ Колумбия,
    2. Дубач М.,
    3. Аскари С.,
    4. Speciale SG,
    5. Боуден Д.М.

    (1988) 1-метил-4-фенил-1,2,3,6-тетрагидропиридин (MPTP) -индуцированный паркинсонический синдром при фасции макаки: какие допаминергические нейроны среднего мозга потеряны? неврология 24: 161-174.

    1. Гилберт ПФК,
    2. Thach WT

    (1977) Активность клеток Пуркинье во время моторного обучения. Brain Res. 128: 309-328.

    1. Гирос Б.,
    2. Джабер М.,
    3. Джонс С.Р.,
    4. Вайтман Р.М.,
    5. Карон М.Г.

    (1996) Гиперлокомпозиция и безразличие к кокаину и амфетамину у мышей, у которых отсутствует переносчик дофамина. природа 379: 606-612.

    1. Гольдман-Ракич П.С.,
    2. Лерант С.,
    3. Уильямс М.С.,
    4. Монс Н.,
    5. Джеффард М.

    (1989) Дофамин синаптический комплекс с пирамидными нейронами в коре головного мозга приматов. Proc. Natl. Акад. Sci. Соединенные Штаты Америки 86: 9015-9019.

    1. Гонон Ф.

    (1988) Нелинейная взаимосвязь между импульсным потоком и дофамином, высвобождаемым дофаминергическими нейронами среднего мозга крыс, как изучено электрохимией in vivo неврология 24: 19-28.

    1. Гонон Ф.

    (1997) Длительное и экстрасинаптическое возбуждающее действие дофамина, опосредованное рецепторами D1 в стриатуме крысы in vivo. J. Neurosci. 17: 5972-5978.

    1. Гонзалес С.,
    2. Чесселет М.-Ф.

    (1990) миндалонигральный путь: антероградное исследование на крысе с Phaseolus vulgaris Лейкоагглютинин (PHA-L). J. Comp. Neurol. 297: 182-200.

    1. Грейс А.А.

    (1991) Фазовое и тоническое высвобождение дофамина и модуляция чувствительности дофаминовой системы: гипотеза для этиологии шизофрении. неврология 41: 1-24.

    1. Грейс А.А.,
    2. Банни Б.С.

    (1985) Противоположные эффекты стриатонигральных путей обратной связи на активность дофаминовых клеток среднего мозга. Brain Res. 333: 271-284.

    1. Грейбиль А.М.,
    2. Аосаки Т.,
    3. Flaherty AW,
    4. Кимура М.

    (1994) Базальные ганглии и адаптивное управление двигателем. Наука 265: 1826-1831.

    1. Groves PM,
    2. Гарсия-Муньос М.,
    3. Линдер JC,
    4. Мэнли М.С.,
    5. Мартоне М.Е.,
    6. Young SJ

    (1995) Элементы внутренней организации и обработки информации в неостриатуме. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Кембридж, штат Массачусетс), стр. 51-96.

  • Гуллапалли, В., Барто, А. Г. и Групен, Р. А. Изучение картографирования допуска при сборке с принудительным управлением. В: Материалы 1994 Международной конференции по робототехнике и автоматизации. Los Alamitos, CA: издательство Computer Society, 1994, с. 2633-2638.
    1. Хабер С.Н.,
    2. Линд Э.,
    3. Кляйн С.,
    4. Groenewegen HJ

    (1990) Топографическая организация эфферентных проекций вентрального стриата у макаки-резуса: исследование авторадиографической трассировки. J. Comp. Neurol. 293: 282-298.

    1. Хабер С.,
    2. Линд-Балта Е.,
    3. Митчелл С.Дж.

    (1993) Организация нисходящих вентральных паллидных проекций у обезьяны. J. Comp. Neurol. 329: 111-128.

    1. Хаммер М.

    (1993) Идентифицированный нейрон опосредует безусловный стимул в ассоциативном обонятельном обучении у пчел. природа 366: 59-63.

    1. Хаммонд С.,
    2. Шибазаки Т.,
    3. Rouzaire-Dubois B.

    (1983) Разветвленные выходные нейроны субталамического ядра крысы: электрофизиологическое исследование синаптических эффектов на идентифицированные клетки в двух основных ядрах-мишенях, энтопедункулярном ядре и черной субстанции. неврология 9: 511-520.

    1. Хаттори Т.,
    2. Fibiger HC,
    3. McGeer PL

    (1975) Демонстрация паллидо-нигральной проекции, иннервирующей дофаминергические нейроны. J. Comp. Neurol. 162: 487-504.

    1. Hedreen JC,
    2. Делонг М.Р.

    (1991) Организация стриатопаллидальных, стриатонигральных и нигростриатальных проекций у макак. J. Comp. Neurol. 304: 569-595.

    1. Эрнандес-Лопес С.,
    2. Баргас Дж.,
    3. Surmeier DJ,
    4. Рейес А.,
    5. Галаррага Э.

    (1997) Активация рецептора D1 усиливает вызванные выделения в колючих нейронах неостриатальной среды, модулируя Ca L-типа2+ Проводимость. J. Neurosci. 17: 3334-3342.

    1. Эррера-Маршиц М.,
    2. Вы ЗБ,
    3. Гойны М.,
    4. Meana JJ,
    5. Сильвейра Р.,
    6. Годухин О.В.,
    7. Чен Я.,
    8. Эспиноза С.,
    9. Петтерссон Э.,
    10. Loidl CF,
    11. Любец Г.,
    12. Андерссон К.,
    13. Ниландер И.,
    14. Терениус Л.,
    15. Унгерштедт У.

    (1996) О происхождении уровней внеклеточного глутамата, отслеживаемых в базальных ганглиях крысы с помощью микродиализа in vivo. J. Neurochem. 66: 1726-1735.

    1. Герш С.М.,
    2. Ciliax BJ,
    3. Гутекунст С.-А.,
    4. Рис HD,
    5. Хейлман CJ,
    6. Юнг ККЛ,
    7. Болам Дж.П.,
    8. Инс Э.,
    9. Йи Х.,
    10. Леви А.И.

    (1995) Электронно-микроскопический анализ D1 и D2 рецепторов дофаминовых рецепторов в дорсальном полосатом теле и их синаптических отношениях с моторными кортикостриальными афферентами. J. Neurosci. 15: 5222-5237.

    1. Хейм Дж.,
    2. Трулсон М.Е.,
    3. Джейкобс Б.Л.

    (1982) Активность единицы Raphe у свободно движущихся кошек: эффекты фазальных слуховых и зрительных стимулов. Brain Res. 232: 29-39.

    1. Хикосака О.,
    2. Сакамото М.,
    3. Усуи С.

    (1989) Функциональные свойства хвостатых нейронов обезьян. III. Деятельность, связанная с ожиданием цели и вознаграждения. J. Neurophysiol. 61: 814-832.

    1. Холлерман JR,
    2. Шульц В.

    (1996) Активность дофаминовых нейронов во время обучения в привычном контексте задачи. Soc. Neurosci. Тез. 22: 1388.

    1. Холлерман JR,
    2. Тремблай Л.,
    3. Шульц В.

    (1994) Вознаграждение зависимости нескольких типов нейронной активности в полосатом теле приматов. Soc. Neurosci. Тез. 20: 780.

    1. Гольштейн Г.Р.,
    2. Пасик П.,
    3. Хамори Дж.

    (1986) Синапсы между GABA-иммунореактивными аксональными и дендритными элементами в черной субстанции обезьяны. Neurosci. Lett. 66: 316-322.

    1. Пылесос JE,
    2. Стрик П.Л.

    (1993) Несколько выходных каналов в базальных ганглиях. Наука 259: 819-821.

    1. Хорвиц Ю.С.,
    2. Стюарт Т.,
    3. Джейкобс Б.Л.

    (1997) Взрывная активность вентральных сегментарных дофаминовых нейронов вызывается сенсорными стимулами у бодрствующего кота. Brain Res. 759: 251-258.

    1. Houk JC,
    2. Adams JL,
    3. Barto AG A

    (1995) модель того, как базальные ганглии генерируют и используют нейронные сигналы, которые предсказывают усиление. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Кембридж, штат Массачусетс), стр. 249-270.

    1. Houk JC,
    2. Buckingham JT,
    3. Barto AG

    (1996) Модели мозжечка и моторного обучения. Behav. Мозг. 19: 368-383.

    1. Hrupka BJ,
    2. Лин Ю.М.,
    3. Гитцен Д.В.,
    4. Роджерс QR

    (1997) Небольшие изменения в концентрациях незаменимых аминокислот влияют на выбор рациона у крыс с дефицитом аминокислот. J. Nutr. 127: 777-784.

    1. Халл CL

    (1943) Принципы поведения. (Appleton-Century-Crofts, Нью-Йорк).

    1. Ингам CA,
    2. Капот ш,
    3. Венинк А.,
    4. Ван Малдегем Б.,
    5. Арбутнотт Г.В.

    (1993) Морфологические изменения в неостриатуме крысы после односторонних инъекций 6-гидроксидопамина в нигростриатальный путь. Exp. Brain Res. 93: 17-27.

    1. Ито М.

    (1989) Долгосрочная депрессия. Annu. Rev. Neurosci. 12: 85-102.

    1. Джейкобс Б.Л.,
    2. Fornal CA

    (1993) 5-HT и управление двигателем: гипотеза. Тенденции Neurosci. 16: 346-352.

    1. Хименес-Кастелланос J.,
    2. Грейбиль А.М.

    (1989) Свидетельство того, что гистохимически различные зоны субстанции nigra pars compacta приматов связаны с узорным распределением нейростриатальных проекционных нейронов и стриатонигральных волокон. Exp. Brain Res. 74: 227-238.

    1. Kalman RE A

    (1960) новый подход к задачам линейной фильтрации и прогнозирования. J. Basic Eng. Сделка КАК Я 82: 35-45.

  • Kamin, L.J. Избирательное объединение и обусловливание. В: Фундаментальные проблемы инструментального обучения, под редакцией Н. Дж. Макинтоша и В. К. Хониг. Галифакс, Канада: издательство университета Далхаузи, 1969, с. 42-64.
    1. Kawagoe KT,
    2. Гаррис П.А.,
    3. Wiedemann DJ,
    4. Вайтман Р.М.

    (1992) Регуляция временных градиентов концентрации дофамина в микроокружении, окружающем нервные окончания в полосатом теле крысы. неврология 51: 55-64.

    1. Кавагути Ю.,
    2. Уилсон CJ,
    3. Emson PC

    (1989) Внутриклеточная регистрация идентифицированных неостриатических пластырей и колючих клеток матрикса в препарате среза, сохраняющем корковые входы. J. Neurophysiol. 62: 1052-1068.

    1. Кавато М.,
    2. Гоми Х.

    (1992) Модели обучения мозжечка и VOR / OKR. Тенденции Neurosci. 15: 445-453.

    1. Кискин Н.И.,
    2. Кришталь О.А.,
    3. Цындренко А.Ю.

    (1986) Возбуждающие аминокислотные рецепторы в нейронах гиппокампа: каинат не способен их десенсибилизировать. Neurosci. Lett. 63: 225-230.

    1. Клопф А.Х.

    (1982) Гедонистический нейрон: теория памяти, обучения и интеллекта. (Полушарие, Вашингтон, округ Колумбия).

    1. Knowlton BJ,
    2. Мангельс Ю.А.,
    3. Сквайр LR A

    (1996) система обучения неостриатальной привычке у человека. Наука 273: 1399-1402.

    1. Кюнцле Х.

    (1978) Авторадиографический анализ эфферентных связей премоторной и смежных префронтальных областей (областей 6 и 9) в Macaca flavicularis. Поведение мозга. Evol. 15: 185-234.

    1. ЛеМоал М.,
    2. Olds ME

    (1979) Периферический слуховой вклад в область лимба среднего мозга и связанные структуры. Brain Res. 167: 1-17.

    1. ЛеМоал М.,
    2. Саймон Х.

    (1991) Мезокортиколимбическая дофаминергическая сеть: функциональные и регуляторные роли. Physiol. Rev. 71: 155-234.

    1. Леви А.И.,
    2. Герш С.М.,
    3. Рожь дб,
    4. Сунахара Р.К.,
    5. Низник Х.Б.,
    6. Китт CA,
    7. Цена DL,
    8. Маджо Р.,
    9. Бранн М.Р.,
    10. Ciliax BJ

    (1993) Локализация дофаминовых рецепторов D1 и D2 в мозге подтип-специфическими антителами. Proc. Natl. Акад. Sci. Соединенные Штаты Америки 90: 8861-8865.

    1. Линден А.,
    2. Браке-Толкмитт Р.,
    3. Люценбергер В.,
    4. Canavan AGM,
    5. Шольц Э.,
    6. Diener HC,
    7. Бирбаумер Н.

    (1990) Медленные корковые потенциалы у пациентов с паркинсонизмом в ходе задачи ассоциативного обучения. J. Psychophysiol. 4: 145-162.

    1. Юнгберг Т.,
    2. Apicella P.,
    3. Шульц В.

    (1991) Реакции дофаминовых нейронов среднего мозга обезьян во время замедленного чередования. Brain Res. 586: 337-341.

    1. Юнгберг Т.,
    2. Apicella P.,
    3. Шульц В.

    (1992) Ответы нейронов дофамина обезьяны во время изучения поведенческих реакций. J. Neurophysiol. 67: 145-163.

    1. Ллинас Р.,
    2. Валлийский JP

    (1993) О мозжечке и моторном обучении. Тек. ОПИН. Neurobiol. 3: 958-965.

    1. Lohman AHM,
    2. Ван Вурден-Веркли И.

    (1978) Восходящие соединения с передним мозгом у ящерицы. J. Comp. Neurol. 182: 555-594.

    1. Луилот А.,
    2. ЛеМоал М.,
    3. Саймон Х.

    (1986) Дифференциальная реактивность дофаминергических нейронов в прилежащем ядре в ответ на различные поведенческие ситуации. Вольтамперометрическое исследование in vivo у свободно движущихся крыс. Brain Res. 397: 395-400.

    1. Ловибонд П.Ф.

    (1983) Облегчение инструментального поведения с помощью павловского аппетитного условного раздражителя. J. Эксп. Psychol. Anim. Behav. Proc. 9: 225-247.

    1. Ловингер Д.М.,
    2. Тайлер Е.С.,
    3. Мерритт А.

    (1993) Краткосрочная и долгосрочная синаптическая депрессия в неостриатуме крыс. J. Neurophysiol. 70: 1937-1949.

    1. Линд-Балта Е.,
    2. Хабер С.Н.

    (1994) Стриатонигральные проекции приматов: сравнение сенсомоторного стриатума и вентрального стриатума. J. Comp. Neurol. 345: 562-578.

    1. Макинтош, Нью-Джерси

    (1975) теория внимания: вариации в ассоциации стимула с подкреплением. Psychol. Rev. 82: 276-298.

    1. Мандзони О.Ю.,
    2. Манабэ Т.,
    3. Николл РА

    (1994) Высвобождение аденозина путем активации рецепторов NMDA в гиппокампе. Наука 265: 2098-2101.

    1. Марр Д. А

    (1969) теория коры мозжечка. J. Physiol. (Лонд.) 202: 437-470.

    1. Маршалл Дж. Ф.,
    2. О'Делл SJ,
    3. Наваррете Р.,
    4. Розенштейн А.Ю.

    (1990) Топография высокоаффинного сайта дофамина в мозге крысы: основные различия между дорсальным и вентральным стриатом. неврология 37: 11-21.

  • Мацумото К., Накамура К., Миками А. и Кубота К. Реакция на непредсказуемую доставку воды в рот визуально чувствительных нейронов в орбитофонтальной коре обезьян. Тез. Спутник Symp. Встреча IBR в честь профессора Куботы, Инуяма, Япония, P-14, 1995.
    1. Мацумура М.,
    2. Кодзима Дж.,
    3. Гардинер TW,
    4. Хикосака О.

    (1992) Зрительные и глазодвигательные функции субталамического ядра обезьяны. J. Neurophysiol. 67: 1615-1632.

    1. Maunsell JHR,
    2. Gibson JR

    (1992) Задержки визуального ответа в полосатой коре головного мозга макаки. J. Neurophysiol. 68: 1332-1344.

    1. Маззони П.,
    2. Андерсен Р.А.,
    3. Джордан М.И.

    (1991) более биологически правдоподобное правило обучения, чем обратное распространение, применяемое к сетевой модели кортикальной области 7. Cereb. кора головного мозга 1: 293-307.

  • МакКаллум, А. К. Усиленное обучение с избирательным восприятием и скрытыми состояниями (Кандидатская диссертация). Рочестер, Нью-Йорк: Univ. Рочестер, 1995.
    1. Маккормик Д.А.,
    2. Томпсон РФ

    (1984) Нейронные ответы мозжечка кролика во время приобретения и выполнения классически обусловленного отклика мембранного века на мембрану. J. Neurosci. 4: 2811-2822.

    1. Макларен И.

    (1989) Вычислительная единица как совокупность нейронов: реализация алгоритма обучения с исправлением ошибок. в Computing Neuron, eds Durbin R., Miall C., Mitchison G. (Addison-Wesley, Amsterdam), стр. 160 – 178.

    1. Майкл А.С.,
    2. Судья младший,
    3. Neill DB

    (1985) In vivo вольтамперометрическое определение кинетики метаболизма дофамина у крысы. Neurosci. Lett. 56: 365-369.

    1. Мидлтон Ф.А.,
    2. Стрик П.Л.

    (1996) Височная доля является целью выхода из базальных ганглиев. Proc. Natl. Акад. Sci. Соединенные Штаты Америки 93: 8683-8687.

    1. Миллер Е.К.,
    2. Ли Л.,
    3. Дезимон Р.

    (1993) Активность нейронов в передней нижней височной коре во время краткосрочной задачи памяти. J. Neurosci. 13: 1460-1478.

    1. Миллер Д.Д.,
    2. Сангера М.К.,
    3. Немецкий округ Колумбия

    (1981) Активность мезэнцефальной дофаминергической единицы у поведенчески обусловленной крысы. Life Sci. 29: 1255-1263.

    1. Миллер Р.,
    2. Wickens JR,
    3. Beninger RJ

    (1990) Рецепторы допамина D-1 и D-2 в отношении вознаграждения и эффективности: случай с рецептором D-1 в качестве основного сайта терапевтического действия нейролептических препаратов. Prog. Neurobiol. 34: 143-183.

    1. Mirenowicz J.,
    2. Шульц В.

    (1994) Важность непредсказуемости для ответных реакций в дофаминовых нейронах приматов. J. Neurophysiol. 72: 1024-1027.

    1. Mirenowicz J.,
    2. Шульц В.

    (1996) Преимущественная активация дофаминовых нейронов среднего мозга с помощью аппетитных, а не аверсивных стимулов. природа 379: 449-451.

    1. Митчелл С.Дж.,
    2. Ричардсон Р.Т.,
    3. Бейкер ФХ,
    4. Делонг М.Р.

    (1987) Глобус бледного шара приматов: активность нейронов, связанная с направлением движения. Exp. Brain Res. 68: 491-505.

    1. Могенсон Г.Дж.,
    2. Такигава М.,
    3. Робертсон А.,
    4. У М.

    (1979) Самостимуляция прилежащего ядра и вентрального сегмента Цай, ослабленного микроинъекциями спироперидола в прилежащее ядро. Brain Res. 171: 247-259.

    1. Монтегю пиар,
    2. Даян П.,
    3. Nowlan SJ,
    4. Пуге А.,
    5. Сейновский TJ

    (1993) Использование апериодического усиления для направленной самоорганизации в процессе развития. в нейронных системах обработки информации 5, ред. Хансон С.Дж., Коуэн Д.Д., Джайлс К.Л. (Морган Кауфманн, Сан-Матео, Калифорния), стр. 969 – 976.

    1. Монтегю пиар,
    2. Даян П.,
    3. Человек С.,
    4. Сейновский TJ

    (1995) Пчела добывает пищу в неопределенных условиях, используя интеллектуальное изучение иврита природа 377: 725-728.

    1. Монтегю пиар,
    2. Даян П.,
    3. Сейновски TJ A

    (1996) основа для мезэнцефальных дофаминовых систем, основанная на прогнозном обучении ивриту. J. Neurosci. 16: 1936-1947.

    1. Монтегю пиар,
    2. Сейновский TJ

    (1994) Предиктивный мозг: временное совпадение и временной порядок в механизмах синаптического обучения. Учить. объем памяти 1: 1-33.

    1. Мора Ф.,
    2. Майерс Р.Д.

    (1977) Самостимуляция мозга: прямое доказательство участия дофамина в префронтальной коре. Наука 197: 1387-1389.

    1. Мерфи Б.Л.,
    2. Арнстен А.Ф.,
    3. Гольдман-Ракич П.С.,
    4. Roth RH

    (1996) Увеличение оборота дофамина в префронтальной коре ухудшает производительность пространственной рабочей памяти у крыс и обезьян. Proc. Natl. Акад. Sci. Соединенные Штаты Америки 93: 1325-1329.

    1. Накамура К.,
    2. Миками А.,
    3. Кубота К.

    (1992) Активность одиночных нейронов миндалины обезьяны во время выполнения задачи визуальной дискриминации. J. Neurophysiol. 67: 1447-1463.

    1. Недергаард С.,
    2. Болам Дж.П.,
    3. Гринфилд С.А.

    (1988) Облегчение дендритной кальциевой проводимости с помощью 5-гидрокситриптамина в черной субстанции. природа 333: 174-177.

    1. Ниидзима К.,
    2. Ёсида М.

    (1988) Активация мезэнцефальных дофаминовых нейронов путем химической стимуляции ядра tegmenti pedunculopontinus pars compacta. Brain Res. 451: 163-171.

    1. Ники Х.,
    2. Ватанабэ М.

    (1979) Префронтальная и поясная активность юнитов во время хронометрирования у обезьяны. Brain Res. 171: 213-224.

    1. Ниренберг М.Дж.,
    2. Вон Р.А.,
    3. Уль ГР,
    4. Кухар М.Дж.,
    5. Пикель В.М.

    (1996) Транспортер допамина локализуется на дендритных и аксональных плазматических мембранах нигростриатальных дофаминергических нейронов. J. Neurosci. 16: 436-447.

    1. Нисидзё Х.,
    2. Оно Т.,
    3. Нишино Х.

    (1988) Топографическое распределение модально-специфических миндалевидных нейронов у бдительной обезьяны. J. Neurosci. 8: 3556-3569.

    1. Нишино Х.,
    2. Оно Т.,
    3. Мурамото К.И.,
    4. Фукуда М.,
    5. Сасаки К.

    (1987) Нейрональная активность в вентральной области (VTA) во время поведения кормления пресса по мотивированной полосе у обезьяны. Brain Res. 413: 302-313.

    1. Ojakangas CL,
    2. Эбнер Т.Дж.

    (1992) Комплекс клеток Пуркинье и простой шип изменяются во время произвольной задачи по обучению движению рук у обезьяны. J. Neurophysiol. 68: 2222-2236.

    1. Олдс Дж.,
    2. Милнер П.

    (1954) Положительное подкрепление, вызванное электростимуляцией области перегородки и других областей мозга крысы. J. Comp. Physiol. Psychol. 47: 419-427.

    1. Отмахова Н.А.,
    2. Лисман Д.Е.

    (1996) Активация рецептора допамина D1 / D5 увеличивает величину раннего долгосрочного потенцирования в синапсах гиппокампа CA1. J. Neurosci. 16: 7478-7486.

    1. Packard MG,
    2. Белый Н.М.

    (1991) Диссоциация систем памяти гиппокампа и хвостатого ядра путем посттренинговой интрацеребральной инъекции агонистов дофамина. Behav. Neurosci. 105: 295-306.

    1. Пастор М.А.,
    2. Артьеда Дж.,
    3. Джаханшахи М.,
    4. Обезо JA

    (1992) Оценка времени и воспроизведение аномальны при болезни Паркинсона. Мозг 115: 211-225.

    1. Пирс JM,
    2. Зал Г. А

    (1980) модель для обусловленности Павлова: изменения в эффективности условных, но не безусловных стимулов. Psychol. Rev. 87: 532-552.

    1. Pennartz CMA,
    2. Амерун Р.Ф.,
    3. Groenewegen HJ,
    4. Лопес да Силва ФХ

    (1993) Синаптическая пластичность в препарате среза in vitro прилежащего ядра крысы. Евро. J. Neurosci. 5: 107-117.

  • Percheron G., Francois C., Yelnik J. и Fenelon G. Система приматов нигро-стриато-паллидо-ниграль. Не простая петля. В: Нейронные механизмы при расстройствах движения, под редакцией А. Р. Кроссмана и М. А. Самбрука. Лондон: Джон Либби, 1989, с. 103-109.
    1. Филлипс АГ,
    2. Брук С.М.,
    3. Fibiger HC

    (1975) Влияние изомеров амфетаминов и нейролептиков на самостимуляцию от прилежащего ядра и дорсального норадренергического пучка. Brain Res. 85: 13-22.

    1. Филлипс АГ,
    2. Картер Д.А.,
    3. Fibiger HC

    (1976) Дофаминергические субстраты внутричерепной самостимуляции в хвостатом ядре. Brain Res. 104: 221-232.

    1. Филлипс АГ,
    2. Fibiger HC

    (1978) Роль дофамина в обеспечении самостимуляции в вентральном сегментате, прилежащем ядре и медиальной префронтальной коре. Можно. J. Psychol. 32: 58-66.

    1. Филлипс АГ,
    2. Мора Ф.,
    3. Rolls ET

    (1979) Внутричерепная самостимуляция в орбитофронтальной коре и хвостатом ядре макаки-резуса: эффекты апоморфина, пимозида и спироперидола. Психофармакология 62: 79-82.

    1. Пикель В.М.,
    2. Beckley SC,
    3. Джо TH,
    4. Рейс диджей

    (1981) Ультраструктурная иммуноцитохимическая локализация тирозингидроксилазы в неостриатуме. Brain Res. 225: 373-385.

    1. Цена JL,
    2. Амарал Д.Г.

    (1981) Авторадиографическое исследование проекций центрального ядра миндалины обезьяны. J. Neurosci. 1: 1242-1259.

    1. Рао РПН,
    2. Баллард Д.Х.

    (1997) Динамическая модель визуального распознавания предсказывает свойства нервного ответа в зрительной коре. Нейронный компьютер. 9: 721-763.

    1. Расмуссен К.,
    2. Джейкобс Б.Л.

    (1986) Активность единичных единиц локусных нейронов у свободно движущихся кошек. II. Кондиционирование и фармакологические исследования. Brain Res. 371: 335-344.

    1. Расмуссен К.,
    2. Морилак Д.А.,
    3. Джейкобс Б.Л.

    (1986) Активность единичных единиц локусных нейронов у свободно движущихся кошек. I. Во время натуралистического поведения и в ответ на простые и сложные стимулы. Brain Res. 371: 324-334.

    1. Rescorla RA,
    2. Вагнер А.Р.

    (1972) теория обусловленности Павлова: вариации эффективности подкрепления и неармирования. Классическая подготовка II: Современные исследования и теория, ред. Блэк А.Х., Прокаси В.Ф. (Appleton Century Crofts, Нью-Йорк), стр. 64 – 99.

    1. Ричардсон Р.Т.,
    2. Делонг М.Р.

    (1986) Nucleus basalis активности нейронов Мейнерта во время задачи с задержкой ответа у обезьяны. Brain Res. 399: 364-368.

    1. Ричардсон Р.Т.,
    2. Делонг М.Р.

    (1990) Контекстно-зависимые ответы нейронов базального ядра приматов в задаче «идти / не идти». J. Neurosci. 10: 2528-2540.

    1. Ричфилд Е.К.,
    2. Пенни Дж. Б.,
    3. Young AB

    (1989) Сравнение анатомического и аффинного состояний между рецепторами допамина D1 и D2 в центральной нервной системе крысы. неврология 30: 767-777.

    1. Роббинс Т.В.,
    2. Эверитт БиДжей

    (1992) Функции дофамина в дорсальном и вентральном стриатуме. Семин. Neurosci. 4: 119-128.

    1. Роббинс Т.В.,
    2. Эверитт БиДжей

    (1996) Neurobehavioural механизмы вознаграждения и мотивации. Тек. ОПИН. Neurobiol. 6: 228-236.

    1. Робинсон Т.Е.,
    2. Berridge KC

    (1993) Нейронная основа тяги к наркотикам: теория склонности стимула-сенсибилизации. Brain Res. Rev. 18: 247-291.

    1. Рогавский М.А.

    (1987) Новые направления в действии нейротрансмиттеров: дофамин дает некоторые важные подсказки. Тенденции Neurosci. 10: 200-205.

    1. Роджерс QR,
    2. Харпер А.Е.

    (1970) Выбор раствора, содержащего гистидин, крысами, получавшими сбалансированную гистидином диету J. Comp. Physiol. Psychol. 72: 66-71.

    1. Rolls ET,
    2. Кричли HD,
    3. Мейсон Р.,
    4. Wakeman EA

    (1996) Нейроны орбитофронтальной коры: роль в изучении обонятельных и зрительных ассоциаций. J. Neurophysiol. 75: 1970-1981.

    1. Ромо Р.,
    2. Скарнати Э.,
    3. Шульц В.

    (1992) Роль базальных ганглиев приматов и лобной коры во внутренней генерации движений: сравнение в стриатальных нейронах, активируемых во время инициирования и выполнения движений, вызванных стимулом. Exp. Brain Res. 91: 385-395.

    1. Ромо Р.,
    2. Шульц В.

    (1990) Дофаминовые нейроны среднего мозга обезьян: непредвиденные реакции на активное прикосновение во время самостоятельных движений рук. J. Neurophysiol. 63: 592-606.

    1. Rompré P.-P.,
    2. Мудрый РА

    (1989) Поведенческие доказательства инактивации деполяризации допамина в среднем мозге. Brain Res. 477: 152-156.

    1. Rossi DJ,
    2. Слейтер Н.Т.

    (1993) Начало развития активности рецепторного канала NMDA во время миграции нейронов. Нейрофармакология 32: 1239-1248.

    1. Rumelhart DE,
    2. Хинтон Г.Е.,
    3. Уильямс RJ

    (1986) Изучение внутренних представлений путем распространения ошибок. в параллельной распределенной обработке I, ред. Rumelhart DE, McClelland JL (MIT Press, Cambridge, MA), стр. 318 – 362.

    1. Сах П.,
    2. Хестрин С.,
    3. Николл РА

    (1989) Тоническая активация NMDA-рецепторов окружающим глутаматом усиливает возбудимость нейронов. Наука 246: 815-818.

    1. Саламон JD

    (1987) Действие нейролептических препаратов на аппетитное инструментальное поведение. в Справочник по психофармакологии, ред. Иверсен Л.Л., Иверсен С.Д., Снайдер С.Х. (Пленум, Нью-Йорк), 19: 576 – 608.

    1. Саламон JD

    (1992) Сложные моторные и сенсомоторные функции стриатального и прилежащего дофамина: участие в инструментальных процессах поведения. Психофармакология 107: 160-174.

    1. Пески СБ,
    2. Barish ME A

    (1989) количественное описание ответов нейротрансмиттеров возбуждающих аминокислот на культивируемые амбриональные нейроны Yenopus. Brain Res. 502: 375-386.

    1. Сара SJ,
    2. Сегал М.

    (1991) Пластичность сенсорных ответов нейронов locus coeruleus у крысы-поводыря: значение для познания. Prog. Brain Res. 88: 571-585.

    1. Савагути Т.,
    2. Гольдман-Ракич П.С.

    (1991) D1 Рецепторы допамина в префронтальной коре: вовлечение в рабочую память. Наука 251: 947-950.

    1. Скарнати Э.,
    2. Пройа А.,
    3. Кампана Е.,
    4. Pacitti C. A

    (1986) микроионофоретическое исследование природы предполагаемого синаптического нейротрансмиттера, участвующего в возбуждающем пути крысы у педункулопонтин-субстанции нигра парс компакта. Exp. Brain Res. 62: 470-478.

    1. Шульц В.

    (1986) Реакция допаминовых нейронов среднего мозга на поведенческие триггерные стимулы у обезьяны. J. Neurophysiol. 56: 1439-1462.

    1. Шульц В.,
    2. Apicella P.,
    3. Юнгберг Т.

    (1993) Реакция нейронов дофамина обезьяны на поощрительные и условные стимулы во время последовательных этапов обучения задаче с задержкой ответа J. Neurosci. 13: 900-913.

    1. Шульц В.,
    2. Apicella P.,
    3. Ромо Р.,
    4. Скарнати Э.

    (1995a) Контекстно-зависимая активность в полосатом теле приматов, отражающая прошлые и будущие поведенческие события. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Кембридж, штат Массачусетс), стр. 11-28.

    1. Шульц В.,
    2. Apicella P.,
    3. Скарнати Э.,
    4. Юнгберг Т.

    (1992) Нейрональная активность в вентральном стриатуме обезьяны, связанная с ожиданием вознаграждения. J. Neurosci. 12: 4595-4610.

    1. Шульц В.,
    2. Даян П.,
    3. Монтегю RR A

    (1997) нейронный субстрат предсказания и вознаграждения. Наука 275: 1593-1599.

    1. Шульц В.,
    2. Ромо Р.

    (1987) Реакция нигростриатальных дофаминовых нейронов на интенсивную соматосенсорную стимуляцию у анестезированной обезьяны. J. Neurophysiol. 57: 201-217.

    1. Шульц В.,
    2. Ромо Р.

    (1990) Дофаминовые нейроны среднего мозга обезьян: непредвиденные реакции на раздражители, вызывающие немедленные поведенческие реакции. J. Neurophysiol. 63: 607-624.

    1. Шульц В.,
    2. Ромо Р.,
    3. Юнгберг Т.,
    4. Mirenowicz J.,
    5. Холлерман JR,
    6. Дикинсон А.

    (1995b) Сигналы, связанные с вознаграждением, переносимые дофаминовыми нейронами. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Cambrdige, MA), стр. 233-248.

    1. Шульц В.,
    2. Ruffieux A.,
    3. Эбишер П.

    (1983) Активность pars compacta нейронов черной субстанции обезьяны в отношении моторной активации. Exp. Brain Res. 51: 377-387.

    1. Sears LL,
    2. Steinmetz JE

    (1991) Спинная принадлежность нижней оливковой активности уменьшается во время приобретения у кролика классически обусловленной реакции век. Brain Res. 545: 114-122.

    1. Селемон Л.Д.,
    2. Гольдман-Ракич П.С.

    (1990) Топографическое смешение стриатонигральных и стриатопаллидных нейронов у макаки-резуса. J. Comp. Neurol. 297: 359-376.

    1. Сесак С.Р.,
    2. Аоки С.,
    3. Пикель В.М.

    (1994) Ультраструктурная локализация D2-подобной иммунореактивности в дофаминовых нейронах среднего мозга и их полосатых мишенях. J. Neurosci. 14: 88-106.

    1. Сесак С.Р.,
    2. Пикель В.М.

    (1992) Префронтальные корковые эфференты в синапсе крысы на немеченых нейронах-мишенях катехоламиновых терминалов в ядре accumbens septi и на дофаминовых нейронах в вентральной области тегмента. J. Comp. Neurol. 320: 145-160.

    1. Саймон Х.,
    2. Скаттон Б.,
    3. ЛеМоал М.

    (1980) Дофаминергические A10 нейроны участвуют в когнитивных функциях. природа 286: 150-151.

    1. Смит нашей эры,
    2. Болам Дж. П.

    (1990) Нейронная сеть базальных ганглиев, выявленная при исследовании синаптических связей идентифицированных нейронов. Тенденции Neurosci. 13: 259-265.

    1. Удостоверение личности Смита,
    2. Грейс А.А.

    (1992) Роль субталамического ядра в регуляции активности дофаминовых нейронов. Synapse 12: 287-303.

    1. Смит MC

    (1968) Интервал CS-US и интенсивность US в классическом формировании реакции мигательной мембраны кролика. J. Comp. Physiol. Psychol. 66: 679-687.

    1. Смит Ю.,
    2. Беннетт Б.Д.,
    3. Болам Дж.П.,
    4. Родитель А.,
    5. Садикот А.Ф.

    (1994) Синаптические отношения между дофаминергическими афферентами и корковым или таламическим вводом в сенсомоторную территорию стриатума у ​​обезьяны. J. Comp. Neurol. 344: 1-19.

    1. Смит Ю.,
    2. Болам Дж. П.

    (1990) Выходные нейроны и дофаминергические нейроны черной субстанции получают ГАМК-содержащий ввод от бледного шара у крысы. J. Comp. Neurol. 296: 47-64.

    1. Смит Ю.,
    2. Болам Дж. П.

    (1991) Сходимость синаптических входных сигналов от полосатого тела и бледного шара к идентифицированным нигроколликулярным клеткам у крысы: исследование мечения двойной антероградной области. неврология 44: 45-73.

    1. Смит Ю.,
    2. Хазрати Л.-Н.,
    3. Родитель А.

    (1990) Эфферентные проекции субтальмального ядра у белки обезьяны, как изучено методом отслеживания антероградного PHA-L. J. Comp. Neurol. 294: 306-323.

    1. Шомогий П.,
    2. Болам Дж.П.,
    3. Тоттерделл С.,
    4. Смит нашей эры

    (1981) Моносинаптический ввод от прилежащего ядра - вентральная полосатая область к ретроградно меченным нигростриатальным нейронам. Brain Res. 217: 245-263.

    1. Шпренгельмейер Р.,
    2. Canavan AGM,
    3. Lange HW,
    4. Хемберг В.

    (1995) Ассоциативное обучение при дегенеративных неостриатальных расстройствах: контрасты в явном и неявном воспоминании между пациентами с болезнью Паркинсона и Хантингтона. Mov. Disord. 10: 85-91.

    1. Surmeier DJ,
    2. Эбервайн Дж.,
    3. Уилсон CJ,
    4. Стефани А.,
    5. Китай ST

    (1992) Подтипы дофаминовых рецепторов колокализуются в стриатонигральных нейронах крыс. Proc. Natl. Акад. Sci. Соединенные Штаты Америки 89: 10178-10182.

    1. Стэмфорд Дж. А.,
    2. Крук З.Л.,
    3. Палий П.,
    4. Миллар Дж.

    (1988) Диффузия и поглощение дофамина в хвостатом и крысином ядре крыс по сравнению с использованием быстрой циклической вольтамперометрии. Brain Res. 448: 381-385.

    1. Штейн Л.

    (1964) Самостимуляция мозга и центральное стимулирующее действие амфетамина. Федерация Proc. 23: 836-841.

    1. Штейн Л.,
    2. Сюэ Б.Г.,
    3. Беллуцци Д.Д.

    (1994) In vitro подкрепление разрыва гиппокампа: поиск атомов поведения Скиннера. J. Exp. Анальный. Behav. 61: 155-168.

    1. Штейнфельс Г.Ф.,
    2. Хейм Дж.,
    3. Штрекер Р.Е.,
    4. Джейкобс Б.Л.

    (1983) Поведенческие корреляты активности дофаминергических единиц у свободно движущихся кошек. Brain Res. 258: 217-228.

    1. Су-Шаньи М.Ф.,
    2. Дугаст С.,
    3. Черги К.,
    4. Мшгина М.,
    5. Гонон Ф.

    (1995) Поглощение дофамина, высвобождаемого импульсным потоком, в мезолимбической и стриатальной системе крысы in vivo. J. Neurochem. 65: 2603-2611.

    1. Сури RE,
    2. Шульц В.А.

    (1996) модель нейронного обучения, основанная на активности приматов допаминовых нейронов. Soc. Neurosci. Тез. 22: 1389.

    1. Саттон Р.С.

    (1988) Обучение прогнозированию методом временной разницы. Машина учиться. 3: 9-44.

    1. Саттон Р.С.,
    2. Barto AG

    (1981) На пути к современной теории адаптивных сетей: ожидание и прогноз. Psychol. Rev. 88: 135-170.

    1. Теппер Дж. М,
    2. Martin LP,
    3. Андерсон Д.Р.

    (1995) ГАБАA рецептор-опосредованное ингибирование дофаминергических нейронов черной субстанции крысы проекционными нейронами pars reticulata. J. Neurosci. 15: 3092-3103.

    1. Тесауро Г.

    (1994) TD-Gammon, самообучающаяся программа по нардам, позволяет играть на уровне мастера. Нейронный Комп. 6: 215-219.

    1. Томпсон РФ,
    2. Глюк М.А.

    (1991) Мозговые субстраты базового ассоциативного обучения и памяти. в Перспективах Когнитивной Нейронауки, ред. Листер Р.Г., Вайнгартнер Х.Дж. (Оксфорд Юнив. Пресс, Нью-Йорк), стр. 25 – 45.

    1. Торндайк Э.Л.

    (1911) Интеллект животных: экспериментальные исследования. (Макмиллан, Нью-Йорк).

    1. Торп SJ,
    2. Rolls ET,
    3. Мэддисон С.

    (1983) Орбитофронтальная кора головного мозга: нейрональная активность у обезьян. Exp. Brain Res. 49: 93-115.

    1. Тоан Д.Л.,
    2. Шульц В.

    (1985) Ответы клеток крысиного паллидума на стимуляцию коры и эффекты измененной дофаминергической активности. неврология 15: 683-694.

    1. Тремблай Л.,
    2. Шульц В.

    (1995) Обработка информации, связанной с вознаграждением, в орбитофронтальных нейронах приматов. Soc. Neurosci. Тез. 21: 952.

    1. Трент Ф.,
    2. Теппер JM

    (1991) Стимуляция дорсального рафа модифицирует вызванную стриатом антидромную инвазию нейронов дофамина ниграла in vivo. Exp. Brain Res. 84: 620-630.

  • Унгерштедт, У. Адипсия и афагия после 6-гидроксидофамина индуцировали дегенерацию нигро-стриатальной дофаминовой системы. Acta Physiol. Сканд. Дополн. 367: 95 – 117, 1971.
    1. Ванков А.,
    2. Эрве-Минвель А.,
    3. Сара SJ

    (1995) Ответ на новизну и ее быстрое привыкание в локусных нейронах свободно исследуемой крысы. Евро. J. Neurosci. 7: 1180-1187.

    1. Вризен Э.Р.,
    2. Москович М.

    (1990) Память для временного порядка и условное ассоциативное обучение у пациентов с болезнью Паркинсона. Neuropsychologia 28: 1283-1293.

    1. Уолш Дж. П.

    (1993) Депрессия возбуждающего синаптического входа в стриатальных нейронах крысы. Brain Res. 608: 123-128.

    1. Ван Я.,
    2. Каммингс SL,
    3. Гитцен Д.В.

    (1996) Временно-пространственный паттерн экспрессии c-fos в мозге крысы в ​​ответ на необходимый дефицит аминокислот. I. Начальная фаза распознавания. Mol. Brain Res. 40: 27-34.

    1. Ватанабэ М.

    (1989) Уместность поведенческих реакций, закодированных в постпробной активности префронтальных единиц приматов. Neurosci. Lett. 101: 113-117.

    1. Ватанабэ М.

    (1990) Префронтальная активность юнитов во время ассоциативного обучения у обезьян. Exp. Brain Res. 80: 296-309.

    1. Ватанабэ М.

    (1996) Ожидаемая награда в префронтальных нейронах приматов. природа 382: 629-632.

    1. Вокер А.

    (1976) Влияние психоактивных препаратов на самостимуляцию мозга у крыс: обзор. в книге «Вознаграждение за стимуляцию мозга», ред. Вокье А., Роллс Э.Т. (Эльзевир, Нью-Йорк), стр. 123 – 170.

    1. Белый Н.М.

    (1989) Награда или подкрепление: в чем разница? Neurosci. Biobehav. Rev. 13: 181-186.

    1. Белый СЗ,
    2. Мильнер PM

    (1992) Психобиология усилителей. Annu. Преподобный психол. 43: 443-471.

    1. Вайтман Р.М.,
    2. Циммерман Дж. Б.

    (1990) Контроль внеклеточной концентрации дофамина в полосатом теле крысы с помощью импульсного потока и поглощения. Brain Res. Rev. 15: 135-144.

    1. Wickens JR,
    2. Бегг AJ,
    3. Арбутнотт Г.В.

    (1996) Дофамин обращает вспять депрессию кортикостриатальных синапсов крыс, которая обычно следует за высокочастотной стимуляцией коры головного мозга in vitro. неврология 70: 1-5.

    1. Викенс Дж.,
    2. Кёттер Р.

    (1995) Сотовые модели армирования. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Кембридж, штат Массачусетс), стр. 187-214.

  • Уидроу Г. и Хофф М. Э. Адаптивные коммутационные цепи. IRE Western Electronic Show Конвен., Конв. Rec. часть 4: 96 – 104, 1960.
  • Видроу Г. и Стернс С.Д. Адаптивная обработка сигналов. Энглвудские Утесы, Нью-Джерси: Прентис-Холл, 1985.
    1. Уильямс С.М.,
    2. Гольдман-Ракич П.С.

    (1993) Характеристика дофаминергической иннервации лобной коры приматов с использованием дофамин-специфического антитела. Cereb. кора головного мозга 3: 199-222.

    1. Уильямс Г.В.,
    2. Миллар Дж.

    (1990) Зависимое от концентрации действие стимулированного высвобождения допамина на активность нейронов в полосатом теле крысы. неврология 39: 1-16.

    1. Уильямс Г.В.,
    2. Rolls ET,
    3. Леонард СМ,
    4. Стерн С.

    (1993) Нейронные ответы в вентральном стриатуме обезьяны-поводыря. Behav. Brain Res. 55: 243-252.

    1. Уилсон С.,
    2. Номикос Г.Г.,
    3. Коллу М.,
    4. Fibiger HC

    (1995) Допаминергические корреляты мотивированного поведения: важность привода. J. Neurosci. 15: 5169-5178.

    1. Уилсон CJ

    (1995) Вклад нейронов коры головного мозга в паттерн запуска полосатых колючих нейронов. в Модели обработки информации в базальных ганглиях, ред. Хоук JC, Дэвис JL, Бейзер DG (MIT Press, Кембридж, штат Массачусетс), стр. 29-50.

    1. Уилсон FAW,
    2. Rolls ET

    (1990a) Нейронные ответы, связанные с новизной и знакомством зрительных стимулов в innominata вещества, диагональной полосе Брока и перивентрикулярной области переднего мозга приматов. Exp. Brain Res. 80: 104-120.

    1. Уилсон FAW,
    2. Rolls ET

    (1990b) Нейронные ответы, связанные с усилением базального переднего мозга приматов. Brain Res. 509: 213-231.

    1. Уилсон FAW,
    2. Rolls ET

    (1990c) Обучение и память отражаются в реакциях нейронов, связанных с подкреплением, в базальном переднем мозге приматов. J. Neurosci. 10: 1254-1267.

    1. Мудрый РА

    (1982) Нейролептики и оперантное поведение: гипотеза ангедонии. Behav. Мозг. 5: 39-87.

    1. Мудрый РА

    (1996) Нейробиология наркомании. Тек. ОПИН. Neurobiol. 6: 243-251.

    1. Мудрый РА,
    2. Colle L.

    (1984) Пимозид ослабляет бесплатное кормление: анализ «лучших показателей» выявляет мотивационный дефицит. Psychopharmacologia 84: 446-451.

    1. Мудрый РА,
    2. Хоффман, округ Колумбия

    (1992) Локализация механизмов поощрения лекарств путем внутричерепных инъекций. Synapse 10: 247-263.

    1. Мудрый РА,
    2. Ромпре П.-П.

    (1989) Мозг допамина и вознаграждение. Annu. Преподобный психол. 40: 191-225.

    1. Мудрый РА,
    2. Шпиндлер Дж.,
    3. де Вит Х.,
    4. Гербер Г.Дж.

    (1978) Нейролептическая «ангедония» у крыс: пимозид блокирует качество пищи. Наука 201: 262-264.

    1. Винн Б.,
    2. Гюнтюркюн О.

    (1995) Дофаминергическая иннервация конечного мозга голубя (Колумба лива): исследование с антителами против тирозингидроксилазы и дофамина. J. Comp. Neurol. 357: 446-464.

    1. Ян З.,
    2. Песня WJ,
    3. Surmeier DJ

    (1997) D2 дофаминовые рецепторы восстанавливают Са N-типа2+ токи в неостриатальных холинергических интернейронах крыс через мембранно-разделенный, протеинкиназно-C-нечувствительный путь. J. Neurophysiol. 77: 1003-1015.

    1. Yim CY,
    2. Могенсон Г.Дж.

    (1982) Реакция ядра прилежащих нейронов на стимуляцию миндалины и ее модификацию допамином. Brain Res. 239: 401-415.

    1. Молодой AMJ,
    2. Джозеф М.Х.,
    3. Грей Джа

    (1992) Повышенное высвобождение дофамина in vivo в прилежащем ядре и хвостатом ядре крысы во время питья: исследование микродиализа. неврология 48: 871-876.

    1. Молодой AMJ,
    2. Джозеф М.Х.,
    3. Грей Джа

    (1993) Скрытое ингибирование условного высвобождения дофамина в прилежащем ядре крысы. неврология 54: 5-9.

    1. Юнг ККЛ,
    2. Болам Дж.П.,
    3. Смит нашей эры,
    4. Герш С.М.,
    5. Ciliax BJ,
    6. Леви А.И.

    (1995) Иммуноцитохимическая локализация дофаминовых рецепторов D1 и D2 в базальных ганглиях крысы: световая и электронная микроскопия. неврология 65: 709-730.

  •