Предсказуемость модулирует реакцию человеческого мозга на вознаграждение (2001)

КОММЕНТАРИИ: Непредсказуемые награды приводят к увеличению пиков допамина. Это то, что делает высокая скорость интернет-порно отличается от порно прошлого
 
J Neurosci. 2001 Apr 15;21(8):2793-8.
 

Источник

Департамент психиатрии и поведенческих наук, Медицинский факультет Университета Эмори, Атланта, штат Джорджия, 30322, США. [электронная почта защищена]

Абстрактные

Определенные классы стимулов, таких как еда и наркотики, очень эффективны для активации регионов награды. Мы показываем на людях, что активность в этих регионах может быть модулирована предсказуемостью секвенированной доставки двух умеренно приятных стимулов, устно доставляемых фруктовых соков и воды. Используя функциональную магнитно-резонансную томографию, активность для полезных стимулов как в ядре, так и в медиальной орбитофронтальной коре была наибольшей, когда раздражители были непредсказуемыми. Более того, заявленное предпочтение испытуемыми соку или воде не коррелировало напрямую с активностью в областях вознаграждения, а вместо этого коррелировало с активностью сенсомоторной коры головного мозга. Для приятных стимулов эти данные свидетельствуют о том, что предсказуемость модулирует реакцию регионов вознаграждения человека, и субъективные предпочтения могут быть отделены от этого ответа.

Введение

Стремление к природным наградам, таким как еда, питье и секс, является основным внешним воздействием на поведение человека. Тем не менее вопрос о том, как вознаграждение влияет на поведение человека, остается в основном неразрешенным. Есть много факторов, которые способствуют этому разрыву в наших знаниях; тем не менее, одним препятствием было сложность определения и измерения отдельных эффектов вознаграждения за поведение человека или активацию мозга. У животных вознаграждение определяется как операционная концепция: стимул считается полезным, если он положительно усиливает поведение (Халл, 1943; Rescorla and Wagner, 1972; Роббинс и Эверитт, 1996), то есть надежно увеличивает вероятность поведения. Та же концепция применима к людям; тем не менее, люди обладают способностью осуществлять всевозможный исполнительный контроль над своими действиями, и поэтому одни лишь поведенческие анализы - неполный способ исследовать процесс обработки вознаграждения. Точно так же явные сообщения о симпатиях и антипатиях, то есть о предпочтениях, смешиваются с субъективным восприятием человеком того, что им нравится и о чем они хотят сообщить. Чтобы преодолеть эти экспериментальные трудности, нужно одновременно отслеживать поведенческий результат, субъективные предпочтения и реакцию мозга во время четко определенной задачи. Используя такой подход, мы сообщаем здесь, что активность в области человеческого вознаграждения более тесно коррелирует с предсказуемостью последовательности приятных стимулов, чем с явно заявленными предпочтениями.

У людей активация областей награды может быть визуализирована с помощью функциональной магнитно-резонансной томографии (fMRI) после введения лекарств, таких как кокаин (Breiter et al., 1997); однако такие вливания не могут быть типичными для нормальной обработки вознаграждения из-за прямого и косвенного фармакологического воздействия кокаина. Кроме того, такие наркотики, как кокаин, могут действовать в разных частях системы вознаграждения, чем так называемые природные награды, такие как еда и вода (Bradberry et al., 2000; Carelli и др., 2000). Условные вознаграждения, например, деньги, могут также действовать в разных частях системы вознаграждения (Thut и др., 1997; Elliott et al., 2000; Кнутсон и др., 2000) и не может быть подходящим зондом первичных схем вознаграждения у людей. Альтернативный подход предлагается экспериментами, которые демонстрируют, что предсказуемость преимущественно полезного стимула является критическим параметром для активации путей вознаграждения (Schultz и др., 1992, 1997; Шульц, 1998; Garris et al., 1999). Физиологические записи у нечеловеческих приматов продемонстрировали, что нейроны в таких областях, как вентральная тегментальная область (VTA), ядро ​​приступов и вентральный стриатум, адаптивно адаптируются к полезным стимулам, таким как фруктовый сок или вода (Shidara et al., 1998). Таким образом, предсказуемость последовательности стимулов может сама набирать связанные с вознаграждением нейронные структуры способом, который обнаруживается с помощью МРТ. Более того, теоретические модели выпуска дофамина свидетельствуют о том, что непредсказуемые награды должны проявлять большую активность в этих регионах (Schultz и др., 1997). Мы попытались проверить эту гипотезу с помощью fMRI, чтобы измерить влияние предсказуемости на реакцию человеческого мозга на последовательности точечных, приятных стимулов.

МАТЕРИАЛЫ И МЕТОДЫ

Предметы. Двадцать пять нормальных взрослых подверглись МРТ-сканированию, в то время как им вводили небольшое количество либо орального фруктового сока, либо воды. Субъекты варьировались в возрасте от 18 до 43, и все субъекты дали информированное согласие на протокол, одобренный Комитетом по расследованию человеческих ресурсов Университета Эмори.

Экспериментальная задача. В то время как в сканере испытуемые получали небольшое количество устно доставленных фруктовых соков и воды либо предсказуемым, либо непредсказуемым образом. Мы выбрали последовательную поставку фруктового сока и воды по трем причинам: (1) люди находят, что сок и вода являются субъективно приятными; (2) оба стимула обычно используются в качестве усиливающих стимулов при обучении нечеловеческих приматов по поведенческим задачам; и (3) дофаминергических нейронов среднего мозга и, предположительно, нейронов, к которым они проецируют, показывают фазовые изменения скорости стрельбы в зависимости от временной предсказуемости последовательных стимулов (Schultz и др., 1992). Участники получили как сок, так и воду либо предсказуемым, либо непредсказуемым образом в двух сканирующих трассах (рис. 1). Во время предсказуемого пробега болюсы сока и воды чередовались с фиксированным интервалом 10 сек. Во время непредсказуемого пробега порядок сока и воды был рандомизирован, а интервал стимула был также рандомизирован путем отбора пуассоновского интервального распределения со средним значением 10 сек. Каждый прогон длился 5 мин, а порядок двух прогонов (предсказуемый или непредсказуемый) был рандомизирован по предметам. Поскольку время для адаптации к предсказуемости или непредсказуемости было неизвестным, и поскольку частое переключение условий может вызвать взаимодействие друг с другом, т. Е. «Предсказуемость предсказуемости», мы решили отделить условия от сканирования, а не использовать блоки с более слабыми условиями в рамках сканирования. Поскольку все аспекты эксперимента зависели от манипулирования предсказуемостью, мы решили не повторять условия внутри предметов и вместо этого сосредоточились на изучении большего числа предметов.

Рис. 1.  

Рис. 1.  

Дизайн эксперимента ФМР. Использовался факториал 2 × 2 с коэффициентами предпочтения (сок или вода) и предсказуемость (предсказуемая или непредсказуемая). Субъекты получали 0.8 мл болюсы сока и воды в предсказуемой или непредсказуемой последовательности. Используя связанный с событиями fMRI, активация мозга анализировалась с точки зрения предпочтения и предсказуемости, а также взаимодействия между ними.

Субъекты получали 0.8 мл оральных болюсов как фруктового сока, так и воды через две пластиковые трубки. Мундштук держал концы трубки на месте над языком, с фруктовым соком, наполненным с левой стороны мундштука и водой справа. Трубки имели длину ~10 м и были подключены к компьютеру с двойным шприцевым насосом (Harvard Apparatus, Holliston, MA) за пределами комнаты сканера. Субъекты не выполняли никаких других задач во время сканирования, и им было поручено просто проглотить жидкость каждый раз, когда она была введена. После сеанса сканирования испытуемые были проинтервьюированы по их жидкому предпочтению.

Приобретение данных МРТ. Сканирование выполнялось на сканере 1.5 Tesla Philips NT. После получения анатомического сканирования с высоким разрешением T1, испытуемым подверглись два функциональных прогона 150 с полным мозгом в каждом (эхо-планарное изображение, эхо-сигнал с градиентом, время повторения, 2000 мс, время эха, 40 мсек, угол поворота, 90 °, матрица 64 × 64, осевые срезы 24 5 мм, полученные параллельно переднезадней комиссуральной линии) для измерения уровня кислородосодержания (BOLD)Kwong et al., 1992; Ogawa et al., 1992). Движение головы было сведено к минимуму с помощью дополнений и ограничений.

Анализ. Данные были проанализированы с использованием статистического параметрического картографирования (SPM99; Wellcome Department of Cognitive Neurology, London, UK) (Friston и др., 1995b). Коррекция движения к первому функциональному сканированию была выполнена внутри субъектов с использованием шестипараметрического преобразования твердого тела. Поскольку глотание неизбежно вызывает значительное движение головы, параметры коррекции движения также использовались для определения значительных различий в движении головы в разных условиях. Среднее значение изображений с коррекцией движения затем регистрировалось на структурной МРТ человека с 24 срезами с использованием 12-параметрического аффинного преобразования. Затем изображения были нормализованы в пространстве по шаблону Монреальского неврологического института (MNI) (Talairach и Tournoux, 1988), применяя аффинное преобразование параметра 12 с последующим нелинейным деформированием с использованием базисных функций (Эшбурнер и Фристон, 1999). Затем изображения были сглажены изотропным гауссовым ядром 8 мм и полосовой фильтр, фильтрованный во временной области. Статистический анализ случайных эффектов, связанных с событиями, выполнялся с помощью SPM99 (Friston et al., 1995a, 1999). Эксперимент был проанализирован как факториал 2 × 2. Во-первых, для каждого испытуемого была задана отдельная общая линейная модель (GLM) с четырьмя условиями, представляющими четыре возможных типа событий: предсказуемая предпочтительная жидкость, предсказуемая, непредусмотренная жидкость, непредсказуемая предпочтительная жидкость и непредсказуемая-неподдерживаемая жидкость. Для каждого из четырех условий были созданы четыре вектора дельта-функций со временем, соответствующим каждому событию. Они были свернуты с помощью общей функции гемодинамического ответа и вошли в матрицу с четырьмя столбцами. Среднее значение каждого прогона сканирования было удалено на вокселе. Мы рассчитали три двухсторонних контрастных изображения, которые соответствовали основным эффектам предпочтения [контрастный вектор (1-11-1)], предсказуемость [контрастный вектор (11-1-1)] и термин взаимодействия [контрастный вектор (1 -1-11)]. Взаимодействие описывает, как предсказуемость модулирует эффект предпочтения. Эти индивидуальные контрастные изображения были введены в анализ второго уровня, используя отдельный образец t test (df = 24) для каждой стороны каждого члена в GLM (всего шесть контрастов). Мы породили эти сводные статистические карты в p <0.001 (без поправки на множественные сравнения). Эти карты были наложены на структурное изображение с высоким разрешением в ориентации MNI.

Теоретическая модель. В качестве инструмента как для проектирования, так и для интерпретации эксперимента FMRI мы использовали существующую модель нейронной сети выпуска допамина для моделирования реакции мозга на различные временные образцы полезных стимулов (рис.2). Эта модель была основана на методе временных различий (TD), который постулирует, что синаптически усиливающее вещество, например допамин, высвобождается в ответ на ошибки в прогнозировании вознаграждения (Schultz и др., 1997). Эта модель использовалась в самых разнообразных приложениях, включая сложные обучающие задачи, такие как нарды (Саттон, 1988; Тесауро и Сейновски, 1989), а также успешно предсказывает активность нейронов допамина в многочисленных парадигмах кондиционирования (Houk et al., 1995; Montague et al., 1995) и задачи последовательности чередования (Бернс и Сейновски, 1998).

Рис. 2.  

Рис. 2.  

Модель нейронной сети эксперимента и области мозга, связанные с обработкой информации. A, Диаграмма указывает на нашу гипотезу о том, как последовательность стимулов может влиять на дофаминергический выход. В этой гипотезе мы указали, что изменения дофаминергического выхода могут влиять на целевые нейронные структуры способом, определяемым при измерении fMRI BOLD. Показано, что сок и вода обладают как сенсорными (проекция из конечного временинаружный ящик для растений) и вознаграждение ( r путей) в их влиянии на дофаминергическую активность. Чтобы генерировать ожидаемый гемодинамический ответ из этой гипотезы, мы сделали конечное временное окно (небольшие ящики для сока и воды), что определило ценность немедленного вознагражденияr(t) (1, если сок произошел, 0.5, если вода произошла, и 0, если не произошло никакого раздражения). Этот маневр произвольно устанавливает сок в два раза больше воды. Это не важно для основного ожидания, генерируемого моделью.B, Предсказанный эффект допамина для предсказуемых и непредсказуемых последовательностей доставки соков и воды. Горизонтальная ось - номер сканирования. Вертикальная ось является ожидаемым гемодинамическим ответом, предсказанным временной вариационной моделью. Шкала на вертикальная ось произвольно. Важно отметить, что прогнозируемый пробег продвигается до 0, тогда как непредсказуемый пробег по-прежнему является высокоамплитудным. Трассировки были получены путем свертывания ядра гемодинамического ответа с выходом временной модели. Это показало, что средний BOLD-ответ был бы больше, если стимулы были непредсказуемыми.

Вкратце, изучение ТД зависит от двух первичных предположений. Во-первых, краткосрочная адаптация в данной нейронной цепи происходит с целью предсказания дисконтированной суммы всех будущих вознаграждений. Определение вознаграждения зависит от контекста, в котором оно получено. Если предполагаемое вознаграждение увеличивает возникновение определенного поведения, то оно считается положительным подкреплением. В зависимости от внутреннего состояния животного одна и та же награда не может усилить поведение, например, когда животное насыщается. В контексте эксперимента FMRI, который обычно неестественен, знакомое аппетитное вещество, такое как вода или фруктовый сок, субъективно воспринимается как приятное и, следовательно, полезное. Во-вторых, прогнозы вознаграждения зависят только от текущего представления набора стимулов. Представление стимула несколько произвольно в модели и включает некоторое представление назад во времени, т. Е. Трассировку стимула. Для таких веществ, как вода или фруктовый сок, существуют как сенсорные размеры (например, температура и тактильное ощущение на языке), так и фактическое вознаграждение, которое субъективно ощущается как удовольствие. Поэтому разумно рассматривать тактильные размеры доставки жидкости как нейтральные и отличные от полезного измерения. Подобным образом, эти различные размеры, как предполагается, обрабатываются различными схемами головного мозга, которые могут быть отображены с помощью МРТ. Чтобы отобразить выход модели на измерение, аналогичное измерению, полученному с помощью МРТ, мы суммировали результаты как нейтрального, так и полезного путей, которые, как мы предполагали, сходились в брюшном полосатом теле и ядре. Мы признаем, что для этого нет прямых доказательств, и в зависимости от конкретного рецептора допамин может иметь переменное воздействие на активность нейронов. Точная экспериментальная конструкция была введена в модель, которая была смоделирована Matlab 5.3 (MathWorks, Natick, MA). Вычисления, соответствующие как предполагаемым дофаминовым нейронам, так и их проекционным сайтам, были рассчитаны для прогнозируемых и непредсказуемых прогонов (рис. 2).

Мы должны быть осторожны, чтобы указать читателям, что наше использование временной разностной модели для объяснения нашего дизайна и последующей интерпретации (см. Ниже) основано на его предыдущем успехе в описании изменений в выпуске спайка в дофаминергических нейронах у приматов, испытывающих связанные поведенческие задачи. Есть и другие правдоподобные вычислительные описания, которые также могут быть достаточными.

РЕЗУЛЬТАТЫ

После сканирования были опрошены субъекты по поводу их предпочтения для двух стимулов. Восемнадцать субъектов 25 (72%) предпочитают сок, а остальные предпочитают воду. У большинства испытуемых было особое предпочтение одному или другому, хотя мы не просили их количественно оценить это. Несмотря на то, что во время сканирования наблюдалось значительное движение головы, все переводы и вращения вокруг каждого стимула были обычно небольшими и не отличались друг от друга ни в одном из условий. Например, средний сдвиг ± SD, связанный с каждым стимулом, был 0.041 ± 0.069 мм в предсказуемом состоянии и 0.044 ± 0.069 мм в непредсказуемом состоянии (в паре t тестовое задание;p = 0.853).

Реакция головного мозга на предпочтительную жидкость показала удивительно небольшую дифференциальную активность относительно неподтвержденной жидкости (таблица1). Мы не наблюдали значительных различий в активности в классических областях вознаграждения, таких как прилежащее ядро, гиппокамп или медиальная префронтальная кора. Первичное изменение активности для предпочтительных> нежелательных произошло в соматосенсорной коре в области около рта и языка (t = 4.19, MNI-координаты, -60, -12, 16).

Просмотрите эту таблицу:  

Таблица 1.  

Области мозга, демонстрирующие значительные изменения в измеренной активности (p <0.001 без исправлений; размер кластера> 10 вокселей, если не указано иное)

Основной эффект предсказуемости был существенно больше основного эффекта предпочтения (рис. 3). Для непредсказуемого пробега относительно предсказуемого пробега двусторонняя активация наблюдалась на большом пространстве медиальной орбитофронтальной коры, которая включала ядро ​​accumbens (Таблица 1). Дополнительные области активации включали большую площадь теменной коры двухсторонней и парацентральной и малой фокальной активации как в левом медиоральном ядре таламуса, так и в правом мозжечке. Поскольку ни один из этих регионов не перекрывал основной эффект предпочтения, они были максимально активированы непредсказуемыми стимулами, независимо от предпочтений. Для предсказуемого пробега относительно непредсказуемого пробега была активирована область правой верхней височной извилины, а также фокальные активации в левой предцентральной извилине и правой боковой орбитофронтальной коре.

Рис. 3.  

Рис. 3.  

Основной эффект предсказуемости показал, что районы, связанные с наградами, имели более высокий ответ BOLD на непредсказуемые стимулы. A, Planes с центром в (0, 4, -4) показывают, что двустороннее ядро ​​accumbens / вентральный стриатум (НАК) и двусторонняя верхняя теменная кора более активны в предсказуемом состоянии. B, Небольшая область в правой верхней височной извилине была относительно более активирована предсказуемыми стимулами. Значение было пороговымp <0.001 и степень> 10 смежных вокселов.

Взаимодействие между предпочтением и предсказуемостью выявило области, в которых один эффект модулировал другой независимо от обоих основных эффектов. Правая изоляция, левый задний зубец и правый мозжечок показали значительное взаимодействие для контраста (предпочтительное - неподтвержденное) × (предсказуемое-непредсказуемое). Противоположный контраст (предпочтительный-неподтвержденный) × (непредсказуемо-предсказуемый) не выявил никаких активаций, значимых на p <0.001 уровень; однако небольшая область в левой верхней височной извилине (координаты MNI, -48, -4, -16) была значимой на p <0.01 уровень (t = 3.15).

Компьютерное моделирование предполагало, что непредсказуемые вознаграждения должны вызывать большее количество допамина, чем предсказуемые (рис.2 B). Когда вознаграждения предсказуемы, каждый стимул прекрасно предсказывает последующий, и сигнал ошибки, который предположительно опосредуется дофамином, постепенно уменьшается. Когда вознаграждения непредсказуемы, у системы нет возможности учиться, а ответ на каждый стимул больше.

ОБСУЖДЕНИЕ

Наши результаты продемонстрировали интересное разделение ответа мозга на предсказуемость и субъективные сообщения о предпочтениях. Реакция мозга на предпочтение была исключительно кортикальной, но ответ на предсказуемость показал определенную активацию систем вознаграждения, также известных как цель дофаминергических нейронов среднего мозга. Если мы исходим из того, что активация этих областей вознаграждения является приятной для людей, то этот вывод предполагает, что субъективный отчет о предпочтении может быть отделен от нейронных цепей, известных как мощные детерминанты условного поведения.

Как вода, так и фруктовый сок вызывали значительные активизации во всем мозге, и хотя некоторые из этих ответов были связаны с двигательными аспектами задачи, конкретные подмножества этих регионов были разложены на размеры предпочтений и предсказуемости. Эффект предпочтения ограничивался корковыми областями, связанными с сенсорной обработкой, и предпочтительный стимул приводил к большей активации в этих областях. Эти области лежат вблизи сенсомоторной коры, которая, как известно, активируется во время движения языка (Corfield и др., 1999) и глотания (Hamdy et al., 1999). В предыдущей работе, посвященной реакции мозга на движение языка, наблюдалась существенная активация мозжечка, что было заметно отсутствовало в основном эффекте предпочтения. Дифференциальный ответ головного мозга, т. Е. Предпочтительный-непредоставленный, удаляет общие области активации; поэтому отсутствие активации мозжечка указывает на то, что дифференциальные движения языка вряд ли будут причиной картины активации коры для субъективного предпочтения. Тот факт, что соматосенсорная область коррелирует с указанным предпочтением, наводит на мысль о том, что для двух стимулов произошла некоторая дифференциальная нейронная обработка. Удивительно, что это проявилось в области первичной сенсорной обработки, а не в классических областях награды. Хотя субъекты были вынуждены назначать одно вещество по сравнению с другим в качестве предпочтения, обе жидкости были выбраны специально для того, чтобы быть приятными, в отличие от того, что один из них был отвратительным. Поскольку обе жидкости были в целом приятными, эффект предпочтения, возможно, не был достаточно сильным, чтобы привести к значительной разнице в активности в регионах вознаграждения. Это было бы согласуется с выводами о том, что нейроны дофамина среднего мозга предпочтительно активируются аппетитными, а не аверсивными раздражителями (Миренович и Шульц, 1996). Тем не менее, наши находки предполагают системную дифференциацию субъективных предпочтений от простой награды, которая поддерживает предыдущие гипотезы о том, что «желание» - это не то же самое, что «нравится» (Робинсон и Берридж, 1993).

В отличие от эффекта предпочтения, непредсказуемость коррелировала как существенный основной эффект с активностью в ядре accumbens, таламусе и медиальной орбитофронтальной коре, тогда как предсказуемость была соотнесена преимущественно с активностью в правой верхней височной извилине. Бывшие регионы тесно связаны с известными участками проекции допамина (Koob, 1992; Cooper et al., 1996). Было несколько удивительно, что непредсказуемость, а не предпочтение, коррелировала с деятельностью в этих областях вознаграждения. Если бы повышенная активность в этих регионах была связана с удовольствием, то можно было бы сделать вывод, что непредсказуемые награды были более приятными, чем предсказуемые. Однако большинство испытуемых не различало различий между предсказуемыми и непредсказуемыми условиями. Если непредсказуемые награды были более приятными, чем предсказуемые, или наоборот, то это должно происходить на подсознательном уровне. Альтернативное объяснение предполагает, что дофамин высвобождается в увеличенных количествах к неожиданным наградам (Montague et al., 1996; Schultz и др., 1997;Шульц, 1998). Допамин может снижать возбудимость нейронов (Cooper et al., 1996) и может также напрямую сжимать микроциркуляцию (Krimer и др., 1998), но повышенная активность accumbens также была связана с субъективным удовольствием кокаина (Breiter et al., 1997). Эти данные свидетельствуют о том, что наше наблюдаемое увеличение активации с непредсказуемостью может быть связано с увеличением выпуска дофамина либо из-за того, что accumbens проектируется в VTA, либо потому, что он получает прогноз от VTA, любой из которых будет соответствовать результатам модели. Эта интерпретация должна быть смягчена двумя важными фактами: (1), механизмы, которые соединяли бы увеличенную допаминергическую передачу с изменениями сигнала BOLD, неизвестны, и (2) у нас нет независимой меры дофаминергической передачи, только изменения в реакции BOLD. Возможность того, что мы наблюдаем косвенные изменения дофаминергической активности, является захватывающей, но не может быть однозначно определена в эксперименте ФМР. Однако это согласуется с предыдущими выводами с использованием позитронно-эмиссионной томографии, что дофамин высвобождается в брюшную полосатую ткань в условиях денежного стимулирования (Koepp и др., 1998). В сочетании с усиливающим эффектом непредсказуемости он также согласуется с гипотетическими эффектами допамина на «усиление» нейронов (Коэн и Серван-Шрайбер, 1992), в результате чего некоторые регионы будут увеличиваться, а другие уменьшатся.

Конкретные области, активированные относительно непредсказуемостью, соответствовали регионам мозга, связанным с аппетитными функциями. В дополнение к ядру accumbens медиальная орбитофронтальная кора показала основной эффект непредсказуемости. Этот регион был показан у приматов для интеграции как полезных, так и нейтральных аспектов вкусовых ощущений и, как полагают, отражает прежде всего мотивационные значения этих стимулов (Rolls, 2000). Этот регион также содержит нейроны, которые различают относительное предпочтение вознаграждения (Трембле и Шульц, 1999). Орбитофронтальную кору, как правило, трудно изобразить с помощью МРТ из-за артефакта восприимчивости из носовых пазух (Ojemann et al., 1997). Тем не менее, регион, который мы идентифицировали, обычно превосходит и каудально к обычному месту артефакта. Этот регион ранее считался чувствительным к приятным вкусам (Francis et al., 1999). Второй регион в верхней теменной доле, вероятно, не был связан с полезными аспектами задачи, а скорее результатом изменения внимания. Ранее этот регион был вовлечен в визуоскопическое внимание, особенно во время ожиданий (Nobre et al., 1999). Другой регион в левой височной коре показал непредсказуемость пограничной значительной модуляции. В недавних экспериментах FMRI левая височная доля была связана с обработкой предсказуемости последовательных стимулов (Bischoff-Grethe и др., 2000). Здесь мы распространим эти предыдущие выводы от нейтральных стимулов на приятные стимулы, предполагая, что эта область может выполнять общий мониторинг предсказуемости независимо от валидности стимула.

Группы мозга, которые мы идентифицировали как реагирующие на непредсказуемость как прямым, так и модулярным образом, были вовлечены в ряд экспериментов по финансовому вознаграждению. Деньги могут быть полезны людям, но они усиливаются только потому, что они приобрели эти свойства посредством сложного кондиционирования. Подобно обнаружению того, что кокаин воздействует на разные нейроны, чем естественные усилители (Carelli и др., 2000), возможно, что обусловленные усилители, такие как деньги, действуют на разные нейронные системы, чем естественные подкрепления, такие как еда и вода. Активность как в брюшном полосатом теле, так и в среднем мозге коррелировала с абсолютными уровнями финансового вознаграждения (Thut и др., 1997;Delgado et al., 2000; Elliott et al., 2000; Кнутсон и др., 2000), находка заметно отсутствует в наших результатах. Как отмечалось ранее, и сок, и вода были мягко приятными, и, возможно, не было существенной разницы в абсолютной награде, хотя мы предполагали небольшую разницу в теоретической модели. Кроме того, мы не использовали каких-либо отвратительных стимулов или чего-либо, что могло быть истолковано как отрицательная награда, что также может объяснить эту разницу. Интересно, что регионы, которые мы идентифицировали как непосредственно затронутые или усиленные непредсказуемостью, соответствовали регионам, которые ранее считались чувствительными к контекстной зависимости финансового вознаграждения (Роджерс и др., 1999; Elliott et al., 2000). В частности, как субгенный цингулярный, так и медиальный таламус были сопоставлены с непредсказуемостью в нашем исследовании и были признаны зависящими от контекста Elliott et al. (2000).

Поскольку предсказуемость модулировала эффект предпочтения, важно различать потенциальные источники прогнозирования. В классическом эксперименте по кондиционированию нейтральный стимул предшествует награде. После обучения ранее нейтральный стимул становится предиктором или условным раздражителем. Поскольку имеется сравнительно мало данных об использовании оральных стимулов в МРТ, мы решили упростить эксперимент и контроль за двигательными аспектами задачи, используя два разных оральных стимула, воду и фруктовый сок. Таким образом, источник предсказания в нашем эксперименте обязательно исходил из последовательности самих стимулов. В некотором смысле это проще, чем введение другой стимульной модальности, такой как визуальный сигнал, но поскольку оба стимула были полезными, мы не можем делать никаких выводов относительно процесса кондиционирования. И теоретическая модель (Schultz и др., 1997) и нейрофизиологические данные (Schultz и др., 1992, 1993) предполагают, что прогнозы вознаграждения вычисляются в течение интервала, предшествующего доставке вознаграждения. Поскольку мы не знаем временной масштаб, по которому рассчитываются такие прогнозы, мы решили проанализировать эксперимент как просто два условия, предсказуемые и непредсказуемые. Сохраняя психологически разумный интервал между стимулами 10 сек, было недостаточно времени для устранения различий в обработке промежуточного импульса. Предположительно, такая обработка действительно происходит, и это может быть разрешено с помощью другого проекта.

Таким образом, активность в регионах вознаграждения человека может быть модулирована временной предсказуемостью первичных вознаграждений, таких как вода и сок. Эти результаты обеспечивают важную поддержку вычислительных моделей, которые постулируют, что ошибки в предсказании вознаграждения могут влиять на синаптическую модификацию и распространять эти выводы от нечеловеческих приматов к людям. Региональная специфика этой модуляции также указывает на то, что информация, воплощенная относительной предсказуемостью потока стимула, может быть формой нейронной валюты, которая может быть обнаружена с помощью МРТ.

Сноски

    • Полученный Ноябрь 11, 2000.
    • Получено подтверждение Январь 17, 2001.
    • Принятый Январь 26, 2001.
  • Эта работа была поддержана Национальным институтом по борьбе со злоупотреблением наркотиками K08 DA00367 (до GSB) и RO1 DA11723 (до PRM), Национальным альянсом исследований в области шизофрении и депрессии (GSB) и Фондом семьи Кейн (PRM). Мы благодарим Х. Мао, Р. Кинга и М. Мартина за помощь в сборе данных.

    Переписка может быть адресована либо Григорию С. Бернсу, Отделу психиатрии и поведенческих наук, Медицинской школе Университета Эмори, 1639 Pierce Drive, Suite 4000, Atlanta, GA 30322, E-mail:[электронная почта защищена], или P. Read Montague, Отдел неврологии, Медицинский колледж Baylor, 1 Baylor Plaza, Хьюстон, TX 77030, E-mail:[электронная почта защищена].

Статьи, ссылающиеся на эту статью