Передбачуваність модулює реакцію мозку людини на винагороду (2001)

КОМЕНТАРИ: Непередбачувана винагорода призводить до збільшення спаму дофаміну. Саме це робить Інтернет-порно високої швидкості відмінним від порно минулого
 
J Neurosci. 2001 Apr 15;21(8):2793-8.
 

Source

Кафедра психіатрії та поведінкових наук Медицинської школи університету Еморі, Атланта, штат Джорджія, 30322, США. [захищено електронною поштою]

абстрактний

Деякі класи стимулів, такі як їжа та наркотики, є високоефективними для активізації регіонів винагород. Ми показуємо людям, що активність у цих регіонах може бути модульована передбачуваністю послідовної доставки двох м'яко приємних подразників, перорально доставленого фруктового соку та води. Використовуючи функціональну магнітно-резонансну томографію, активність при нагородженні подразників як в ядрах ядра, так і в медіальній орбітофронтальній корі була найбільшою, коли стимули були непередбачуваними. Більше того, заявлена ​​вибором суб'єктів або соку, і води безпосередньо не корелювала з активністю в регіонах винагороди, а натомість корелювала з активністю в сенсомоторній корі. Що стосується приємних стимулів, ці висновки дозволяють припустити, що передбачуваність модулює відповідь областей винагороди людини, і суб'єктивне уподобання може бути відмежоване від цієї відповіді.

Вступ

Домагання природних нагород, таких як їжа, пиття та секс, є головним зовнішнім впливом на поведінку людини. Тим не менш, питання про те, як винагорода впливає на поведінку людини, залишається в першу чергу невирішеним. Є багато факторів, які сприяють цьому розриву в наших знаннях; однак, одна перешкода була складністю визначення та вимірювання поодиноких ефектів винагороди на поведінку людини чи активізацію мозку. У тварин винагорода визначається як операційна концепція: стимул вважається корисним, якщо він позитивно підсилює поведінку (Халл, 1943; Rescorla і Wagner, 1972; Роббінс і Еверітт, 1996), тобто надійно збільшує ймовірність такої поведінки. Те саме поняття стосується і людей; проте люди мають здатність здійснювати всілякий виконавчий контроль за своїми діями, і тому лише поведінкові тести є неповним способом обстеження винагороди. Подібним чином, явні повідомлення про симпатії та антипатії, тобто переваги, змішуються суб'єктивним сприйняттям індивідом того, що йому подобається і про що він вирішує повідомити. Щоб подолати ці експериментальні труднощі, хотілося б одночасно контролювати поведінковий результат, суб'єктивні переваги та реакцію мозку під час чітко визначеного завдання. Вживаючи такий підхід, ми повідомляємо тут, що активність у регіонах винагород людини тісніше корелює з передбачуваністю послідовності приємних стимулів, ніж з явно заявленими уподобаннями.

У людей активацію областей нагородження можна візуалізувати за допомогою функціональної магнітно-резонансної томографії (fMRI) після введення наркотиків, таких як кокаїн (Breiter et al., 1997); однак такі вливання не можуть бути репрезентативними для нормальної обробки винагороди через прямі та непрямі фармакологічні ефекти кокаїну. Крім того, наркотики, такі як кокаїн, можуть діяти на різні частини системи винагород, ніж так звані природні винагороди, такі як їжа та вода (Bradberry et al., 2000; Carelli et al., 2000). Умовні винагороди, наприклад, гроші, можуть також діяти в різних частинах системи винагород (Thut et al., 1997; Elliott et al., 2000; Knutson et al., 2000) і може не бути відповідним зондом первинних схем винагороди у людини. Альтернативний підхід пропонується експериментами, які демонструють, що передбачуваність стимулу, що в основному є корисним, є критичним параметром для активації шляхів винагороди (Schultz et al., 1992, 1997; Шульц, 1998; Garris et al., 1999). Фізіологічні записи на нелюдських приматах продемонстрували, що нейрони в таких регіонах, як вентральна тегментальна зона (VTA), ядерне місце і вентральний стриатум адаптивно реагують на нагородження подразниками, такими як фруктовий сік або вода (Шидара та ін., 1998). Таким чином, передбачуваність послідовності подразників може сама набирати пов'язані з винагородою нейронні структури способом, який можна виявити за допомогою fMRI. Більше того, теоретичні моделі вивільнення дофаміну припускають, що непередбачувана винагорода повинна викликати більшу активність у цих регіонах (Schultz et al., 1997). Ми намагалися перевірити цю гіпотезу, використовуючи fMRI для вимірювання впливу передбачуваності реакцій мозку людини на послідовності пунктату, приємних подразників.

МАТЕРІАЛИ ТА МЕТОДИ

Суб'єкти. Двадцять п’ять нормальних дорослих зробили сканування ФМР під час введення невеликої кількості або орального фруктового соку, або води. Випробувані були у віці від 18 до 43, і всі суб'єкти дали усвідомлену згоду на протокол, затверджений Комітетом розслідувань людини з університету Еморі.

Експериментальне завдання. Перебуваючи в сканері, випробовувані отримували невелику кількість орально доставленого фруктового соку та води або передбачувано, або непередбачувано. Ми вибрали послідовну доставку фруктового соку та води з трьох причин: (1) люди вважають, що і сік, і вода є суб'єктивно приємними; (2) обидва подразника звичайно використовуються як підсилюючі стимули, навчаючи нелюдських приматів на поведінкові завдання; і (3) дофамінергічні нейрони середнього мозку та, імовірно, нейрони, на які вони проектуються, демонструють фазові зміни швидкості стрільби як функції тимчасової передбачуваності послідовних подразників (Schultz et al., 1992). Учасники отримували як сік, так і воду або передбачуваним, або непередбачуваним за два етапи сканування (рис. 1). Під час передбачуваного пробігу болю з соком та водою чергували через фіксований інтервал 10 сек. Під час непередбачуваного циклу порядок отримання соку та води був рандомізований, а інтервал стимулювання також був рандомізований шляхом відбору проб розподілу інтервалу Пуассона із середнім значенням 10 сек. Кожен пробіг тривав 5 хв., І порядок двох прогонів (передбачуваний або непередбачуваний) був рандомізований для всіх суб'єктів. Оскільки час адаптації або до передбачуваності, або до непередбачуваності було невідомим, і тому, що часте переключення умов може спричинити взаємодію між собою, тобто "передбачуваність передбачуваності", ми вирішили розділити умови через прогони сканування, а не використовувати менші блоки умов в межах сканування. Оскільки всі аспекти експерименту залежать від маніпулювання передбачуваністю, ми вирішили не повторювати умови всередині предметів, а натомість зосередилися на вивченні більшої кількості предметів.

Рис. 1.  

Розробка експерименту fMRI. Була використана фабрична конструкція 2 × 2 з факторами уподобання (сік або вода) та передбачуваність (передбачувана або непередбачувана). Суб'єкти отримали бонуси соком і водою 0.8 ml у передбачуваній або непередбачуваній послідовності. Використовуючи пов'язані з подіями fMRI, активізацію мозку аналізували з точки зору переваг та передбачуваності, а також взаємодії між ними.

Суб'єкти отримували оральні болюси 0.8 ml як фруктового соку, так і води через дві пластикові пробірки. Мундштук тримав кінці трубочки на місці над язиком, при цьому фруктовий сік вливався з лівої сторони мундштука, а вода - з правого. Пробірки були довжиною ∼10 м і були з'єднані з комп’ютерним керованим подвійним шприцом насосом (Гарвардський апарат, Холлістон, штат Масачузетс) поза кімнатою сканера. Піддослідні не виконували жодного іншого завдання під час сканування, і йому було доручено просто ковтати рідину кожного разу, коли вона була введена. Після сеансу сканування випробовуваних було проведено ревізію щодо їх переваги з рідиною.

Придбання даних МРТ. Сканування проводилося на сканері 1.5 Tesla Philips NT. Після придбання анатомічного сканування з високою роздільною здатністю T1, випробовувані зробили два функціональних пробіли цілого мозку 150 сканування кожен (ехопланарне зображення, градієнт нагадував ехо; час повторення, 2000 мсек; час ехо, 40 мсек; кут перевертання, 90 °; матриця 64 × 64, осьові зрізи 24 5 мм, придбані паралельно передньозадній коміссуральної лінії) для вимірювання ефекту, що залежить від оксигенації крові (BOLD) (Квонг та ін., 1992; Ogawa et al., 1992). Рух голови було зведено до мінімуму за допомогою прокладки та обмежень.

Аналіз. Дані були проаналізовані за допомогою статистичного параметричного картографування (SPM99; відділ когнітивної неврології Велкома, Лондон, Великобританія) (Фрістон та ін., 1995b). Корекцію руху до першого функціонального сканування виконували у суб'єктів із використанням шестипараметричного перетворення жорсткого тіла. Оскільки ковтання неминуче спричиняє значний рух голови, параметри корекції руху також використовувались, щоб визначити, чи суттєво відрізняється рух голови між умовами. Потім середнє значення зображень, скоригованих на рух, було зареєстровано на 24-зрізному структурному МРТ людини за допомогою афінного перетворення з 12 параметрами. Потім зображення просторово нормалізували за шаблоном Монреальського неврологічного інституту (MNI) (Talairach і Tournoux, 1988) шляхом застосування афінного перетворення параметра 12 з подальшим нелінійним викривленням з використанням базових функцій (Ashburner і Friston, 1999). Потім зображення згладжували ізотропним ядром Гаусса 8 мм і фільтрували смуговий прохід у часовій області. Статистичний аналіз, що стосується випадкових ефектів, пов'язаний з подіями, проводився за допомогою SPM99 (Фрістон та ін., 1995a, 1999). Експеримент аналізували як факторну конструкцію 2 × 2. По-перше, була визначена окрема загальна лінійна модель (GLM) для кожного випробуваного, з чотирма умовами, що представляють чотири можливі типи подій: передбачувана рідина, що бажана, передбачувана –непривітна рідина, непередбачувана - бажана рідина та непередбачувана –непопулярна рідина. Для кожної з чотирьох умов було створено чотири вектори функцій дельти з часом, що відповідають кожній події. Вони були поєднані з загальною функцією гемодинамічного реагування та введені в чотириколонну дизайнерську матрицю. Середнє значення кожного запуску сканування було видалено на основі голосових позначень. Ми обчислили три двосторонні контрастні зображення, які відповідали основним ефектам переваги [контрастний вектор (1-11-1)], передбачуваність [контрастний вектор (11-1-1)] та термін взаємодії [контрастний вектор (1 -1-11)]. Взаємодія описує, як передбачуваність модулює ефект переваги. Ці індивідуальні контрастні зображення були введені в аналіз другого рівня, використовуючи окремий одноразовий зразок t тест (df = 24) для кожної сторони кожного терміна в GLM (загалом шість контрастів). Ми обмежили ці зведені статистичні карти на p <0.001 (не виправлено для кількох порівнянь). Ці карти були накладені на структурні зображення з високою роздільною здатністю в орієнтації MNI.

Теоретична модель. В якості інструменту для розробки та інтерпретації експерименту на fMRI ми використовували існуючу модель нейронної мережі вивільнення дофаміну для імітації реакції мозку на різні часові структури стимулюючих стимулів (рис.2). Ця модель ґрунтувалася на методі тимчасових відмінностей (ТД), який постулює, що синаптично підсилююча речовина, наприклад, дофамін, виділяється у відповідь на помилки в прогнозуванні винагороди (Schultz et al., 1997). Ця модель застосовується в широкому спектрі застосувань, включаючи складні навчальні завдання, наприклад, нарди (Саттон, 1988; Тезауро і Сейновський, 1989), а також успішно прогнозують активність дофамінових нейронів у численних умовних парадигмах (Houk et al., 1995; Montague et al., 1995) і рухові завдання послідовності (Бернс і Сейновський, 1998).

Рис. 2.  

Модель нейронної мережі експерименту та області мозку, пов'язані з обробкою інформації. A, Діаграма вказує на нашу гіпотезу про те, як послідовність подразників може впливати на дофамінергічний вихід. У цій гіпотезі ми вказували, що зміни дофамінергічного виходу можуть впливати на нейронні структури-мішені способом, який можна виявити при вимірюванні СМОЖНОГО ФМРІ. Показано, що сік і вода мають сенсорний характер (проекція з кінцевого часувікно) та винагорода (the r шляхи) уявлення про їх вплив на дофамінергічну активність. Щоб генерувати очікувану гемодинамічну відповідь з цієї гіпотези, ми склали обмежене часове вікно (невеликі ящики для соку та води), що визначало значення негайної винагородиr(t) (1, якщо з’явився сік, 0.5, якщо трапилася вода, і 0, якщо стимулу не було). Цей маневр довільно встановлює сік удвічі більше, ніж вода. Це не важливо для основних очікувань, породжених моделлю.B, Прогнозований ефект дофаміну для передбачуваних та непередбачуваних послідовностей доставки соків та води. Горизонтальна вісь номер сканування. Вертикальна вісь - це очікувана гемодинамічна реакція, що прогнозується часовою різницевою моделлю. Шкала на вертикальна вісь є довільним. Важливим моментом, який слід зазначити, є те, що передбачуваний прогрес прогресує до 0, тоді як непередбачуваний пробіг залишається високою амплітудою протягом усього часу. Сліди були сформовані за допомогою зведення ядра гемодинамічної відповіді з виходом моделі часової різниці. Це свідчило про те, що середній СИЛИЙ відповідь буде більшим, коли стимули будуть непередбачуваними.

Якщо коротко, навчання ТД залежить від двох основних припущень. По-перше, короткочасна адаптація в заданому нейронному ланцюзі відбувається з метою передбачення дисконтованої суми всіх майбутніх винагород. Визначення винагороди залежить від контексту, в якому вона отримується. Якщо передбачувана винагорода збільшує частоту певної поведінки, то це вважається позитивним підкріплювачем. Залежно від внутрішнього стану тварини, однакова винагорода може не посилювати поведінку, наприклад, коли тварина насичується. У контексті експерименту з ММР, який, як правило, неприродний, знайома апетитна речовина, така як вода або фруктовий сік, суб'єктивно сприймається як приємна і тому корисна. По-друге, прогнози винагороди залежать лише від поточного подання набору стимулів. Представлення стимулу є дещо довільним у моделі, і воно включає деяке подання назад через час, тобто слід стимулу. Для таких речовин, як вода або фруктовий сік, існують як сенсорні розміри (наприклад, температура та тактильне відчуття на язиці), так і фактична винагорода, яку суб'єктивно переживають як задоволення. Тому доцільно вважати тактильні розміри подачі рідини як нейтральні, так і відмінні від корисного виміру. Аналогічно, ці чіткі розміри, як вважається, обробляються різними ланцюгами мозку, які можна зобразити за допомогою fMRI. Для відображення модельного виходу на розмірність, аналогічну вимірюванню, отриманому за допомогою fMRI, ми підсумували виходи як нейтральних, так і корисних шляхів, які, як ми вважали, сходилися в вентральній смузі та ядрі. Ми визнаємо, що для цього немає прямих доказів, і залежно від конкретного рецептора дофамін може мати різний вплив на активність нейронів. Точна експериментальна конструкція була введена в модель, яку моделювали за допомогою Matlab 5.3 (MathWorks, Natick, MA). Виходи, що відповідають як передбачуваним дофаміновим нейронам, так і місцям їх проекції, були розраховані для передбачуваних та непередбачуваних пробігів (рис. 2).

Ми повинні бути обережними, щоб зазначити читачам, що наше використання часової різницької моделі для пояснення нашої конструкції та подальшої інтерпретації (нижче) базується на її попередньому успіху в описі змін викиду в дофамінергічних нейронах у приматів, що перебувають у відповідних поведінкових завданнях. Є й інші правдоподібні описи обчислень, яких також може бути достатньо.

РЕЗУЛЬТАТИ

Після сканування випробовуваних запитували про перевагу двох подразників. Вісімнадцять суб'єктів 25 (72%) віддавали перевагу соку, а решта кращі води. Більшість предметів мали чітку перевагу перед тим чи іншим, хоча ми не просили їх оцінити це. Хоча під час сканування було помітно рух голови, всі переклади та обертання навколо кожного подразника були, як правило, невеликими і не суттєво відрізнялися між будь-якими умовами. Наприклад, середній показник ± переклад SD, пов'язаний із кожним стимулом, становив 0.041 ± 0.069 мм у передбачуваному стані та 0.044 ± 0.069 мм у непередбачуваному стані (парні) t тест;p = 0.853).

Реакція мозку на бажану рідину виявляла напрочуд мало диференціальну активність відносно небажаної рідини (табл1). Ми не спостерігали значної різниці в активності в класичних регіонах винагороди, таких як ядро ​​накопичення, гіпокамп чи медіальна префронтальна кора. Первинна зміна активності для переважних> небажаних відбулася в соматосенсорній корі в області поблизу рота та області язика (t = 4.19, координати MNI, −60, −12, 16).

Переглянути цю таблицю:  

Таблиця 1.  

Мозкові регіони, що демонструють значні зміни вимірюваної активності (p <0.001 не виправлено; розмір кластера> 10 вокселів, крім випадків, коли зазначено)

Основний ефект передбачуваності був істотно більшим, ніж основний ефект переваги (рис. 3). Для непередбачуваного пробігу щодо передбачуваного циклу спостерігалася двостороння активація у великій просторі медіальної орбітофронтальної кори, яка включала в себе ядро ​​ядра (табл.) 1). Додаткові ділянки активації включали велику площу тім'яної кори двосторонньо та парацентрально та малі вогнища активації як у лівому медіодорсальному ядрі таламуса, так і в правій мозочку. Оскільки жоден з цих регіонів не перетинався з основним ефектом переваги, вони були максимально активовані непередбачуваними стимулами, незалежно від уподобань. Для передбачуваного пробігу щодо непередбачуваного пробігу було активовано область правої верхньої скроневої звивини, а також вогнища активації у лівій доцентральній звивині та правій бічній орбітофронтальній корі.

Рис. 3.  

Основний ефект передбачуваності показав, що регіони, пов’язані з винагородою, мали більшу СУХУ реакцію на непередбачувані стимули. A, Площини, в центрі яких (0, 4, −4), показують, що двостороннє ядро ​​приєднується / вентральний смуга (NAC) і двостороння верхня тім'яна кора були більш активними в передбачуваному стані. B, Невелика область у правій верхній скроневій звивині була відносно більше активована передбачуваними подразниками. Значення було порогове значення вp <0.001 і ступінь> 10 суміжних вокселів.

Взаємодія між перевагою та передбачуваністю визначила сфери, в яких один ефект модулював інший незалежно від обох основних ефектів. Правий інсул, лівий задній тигр і правий мозочок виявляли значну взаємодію для контрасту (кращий –непривітний) × (передбачуваний – непередбачуваний). Протилежний контраст, (кращий –непривітніший) × (непередбачуваний – передбачуваний), не виявив жодної активації, істотної на p <0.001 рівень; однак невелика область в лівій верхній скроневій звивині (координати MNI, -48, -4, -16) була значною на p <0.01 рівень (t = 3.15).

Комп'ютерне моделювання запропонувало, що непередбачувані винагороди повинні спричинити більше вивільнення дофаміну, ніж передбачувані (рис.2 B). Коли винагорода передбачувана, кожен стимул ідеально передбачає наступний сигнал, і сигнал помилки, який, як вважається, опосередковується дофаміном, поступово зменшується. Коли винагорода непередбачувана, система не може навчитися, і реакція на кожен стимул більша.

ОБГОВОРЕННЯ

Наші результати продемонстрували цікавий поділ у реакції мозку на передбачуваність та на суб’єктивні повідомлення про перевагу. Реакція мозку на перевагу була виключно корковою, але відповідь на передбачуваність показала специфічну активацію систем винагород, які, як відомо, були мішенню дофамінергічних нейронів середнього мозку. Якщо припустити, що активізація цих областей винагородження приємна для людей, то цей висновок говорить про те, що суб'єктивний звіт переваги може бути відмежований від нейронних ланцюгів, які, як відомо, є потужними визначальними умовами поведінки.

І вода, і фруктовий сік викликали значну активацію в усьому мозку, і хоча частина цієї відповіді була пов'язана з руховими аспектами завдання, конкретні підмножини цих регіонів були розкладені на розміри уподобання та передбачуваності. Ефект переваги обмежувався корковими ділянками, пов'язаними з сенсорною обробкою, і кращий стимул призводив до більшої активації в цих регіонах. Ці області лежать поблизу сенсомоторної кори, яка, як відомо, активується під час рухів язиком (Corfield та ін., 1999) і ковтання (Hamdy та ін., 1999). У попередній роботі над реакцією мозку на рух язика спостерігалася істотна активація мозочка, виявлення якого в основному ефект віддати перевагу. Диференціальна реакція мозку, тобто, краща - непопулярна, видаляє загальні області активації; отже, відсутність мозочкової активації говорить про те, що диференційовані рухи язика навряд чи будуть причиною структури кортикальної активації для суб'єктивних переваг. Той факт, що соматосенсорна область була співвіднесена із заявленою перевагою, свідчить про те, що для двох подразників відбулася певна диференціальна нейронна обробка. Дивно, що це проявилося в області первинної сенсорної обробки, а не в класичних областях нагород. Хоча суб'єкти були змушені позначати одну речовину над іншою як свою перевагу, обидві рідини були вибрані цілеспрямовано приємними, всупереч одній, яка є протилежною. Оскільки обидві рідини, як правило, приємні, ефект переваги може бути недостатньо сильним, щоб призвести до значної різниці в активності в регіонах винагороди. Це було б узгоджено з висновками про те, що нейрони дофаміну середнього мозку переважно активуються апетитними, а не аверсивними подразниками (Mirenowicz і Schultz, 1996). Тим не менш, наші висновки говорять про системну диференціацію суб'єктивних переваг від простого винагороди, що підтримує попередні гіпотези про те, що «бажати» - це не те, що «подобається» (Робінсон і Беррідж, 1993).

На відміну від ефекту переваги, непередбачуваність співвідноситься як важливий головний ефект з активністю в ядрах яруса, таламуса та медіальної орбітофронтальної кори, тоді як передбачуваність переважно корелювалася з активністю в правій верхній скроневій звивині. Колишні регіони тісно співпадають з відомими дофаміновими проекційними ділянками (Koob, 1992; Купер та співавт., 1996). Дещо дивно, що непередбачуваність, а не перевага, співвідносилася з активністю в цих областях нагород. Якщо посилена активність у цих регіонах була пов'язана із задоволенням, то можна зробити висновок, що непередбачувані винагороди були приємнішими, ніж передбачувані. Однак більшість досліджуваних не помітили різниці між передбачуваними та непередбачуваними умовами. Якщо непередбачувані винагороди були приємнішими, ніж передбачувані, чи навпаки, то це має відбуватися на підсвідомому рівні. Альтернативне пояснення передбачає, що дофамін вивільняється у збільшеній кількості до несподіваних винагород (Montague et al., 1996; Schultz et al., 1997;Шульц, 1998). Дофамін може знизити збудливість нейронів (Купер та співавт., 1996), а також може безпосередньо звузити мікросудину (Krimer et al., 1998), але підвищена активність населення також пов'язана з суб'єктивним задоволенням від кокаїну (Breiter et al., 1997). Ці висновки дозволяють припустити, що наше спостережуване збільшення активації з непередбачуваністю може бути пов’язане із збільшенням вивільнення дофаміну, або через те, що проекти проектуються на VTA, або через те, що він отримує проекцію від VTA, будь-яка з яких відповідала б результатам моделі. Ця інтерпретація повинна бути загарбована двома важливими фактами: (1) механізми, які б з'єднували посилену передачу дофамінергічного типу на зміни сигналу BOLD, невідомі, і (2) у нас немає незалежного вимірювання дофамінергічної передачі, лише зміни BOLD-відповіді. Можливість того, що ми спостерігаємо опосередковано зміни дофамінергічної активності, є захоплюючою, але не може бути визначено однозначно в експерименті з ММР. Однак, відповідно до попередніх висновків із застосуванням позитронно-емісійної томографії, дофамін вивільняється у вентральну смугу в умовах грошового стимулювання (Koepp et al., 1998). У поєднанні з посилюючим ефектом непередбачуваності це також узгоджується з гіпотезованими ефектами дофаміну на «посилення» нейронів (Коен і Серван-Шрайбер, 1992), з кінцевим результатом, що деякі регіони збільшаться, а інші зменшаться.

Специфічні регіони, активовані відносно непередбачуваністю, відповідали областям мозку, пов'язаним з апетитними функціями. На додаток до ядерних ядер, медіальна орбітофронтальна кора виявляла головний ефект для непередбачуваності. Показано, що цей регіон у приматів інтегрує як корисні, так і нейтральні аспекти смакових відчуттів, і, як вважається, він відображає насамперед мотиваційні цінності цих стимулів (Рулони, 2000). Цей регіон також містить нейрони, які дискримінують відносну перевагу винагороди (Трембле і Шульц, 1999). Орбітофронтальну кору, як правило, важко зобразити за допомогою fMRI через артефакт чутливості з носових пазух (Ojemann et al., 1997). Однак регіон, який ми визначили, як правило, перевершує і каудальний для звичайного місця розташування артефактів. Раніше цей регіон відповідав приємним смакам (Francis et al., 1999). Друга область, у верхній тім'яній долі, ймовірно, не була пов'язана з корисними аспектами завдання, а скоріше результатом змін уваги. Цей регіон раніше був залучений до візуально-просторової уваги, особливо під час порушень очікувань (Nobre та ін., 1999). Інша область, у лівій скроневій корі, виявила прикордонну значну модуляцію непередбачуваністю. В останніх експериментах з ФМРЛ ліва скронева частка була пов'язана з обробкою передбачуваності послідовних подразників (Бішофф-Грет та ін., 2000). Тут ми поширюємо ці попередні результати від нейтральних подразників до приємних подразників, припускаючи, що ця область може здійснювати загальний моніторинг передбачуваності незалежно від валентності подразника.

Регіони мозку, які ми визначили як відповіді на непередбачуваність прямим чи модулюючим способом, були задіяні в ряді експериментів з фінансової винагороди. Гроші можуть бути корисними для людини, але вони підсилюються лише тому, що вони придбали ці властивості за допомогою складного кондиціонування. Подібно до висновку, що кокаїн діє на різні нейрони, ніж природні підсилювачі (Carelli et al., 2000) можливо, що умовні підсилювачі, такі як гроші, діють на різні нейронні системи, ніж природні підсилювачі, такі як їжа та вода. Активність як в вентральній смузі, так і в середньому мозку була пов'язана з абсолютними рівнями фінансової винагороди (Thut et al., 1997;Delgado et al., 2000; Elliott et al., 2000; Knutson et al., 2000), що в наших результатах помітно відсутнє. Як зазначалося раніше, і сік, і вода були м'яко приємними, і тому, можливо, не було суттєвої різниці в абсолютній винагороді, хоча ми припускали незначну різницю в теоретичній моделі. Крім того, ми не використовували жодних неприязних стимулів чи нічого, що можна було б сприймати як негативну винагороду, що також може спричинити цю різницю. Цікаво, що регіони, які ми визначили як безпосередньо впливають, або посилюються непередбачуваністю, відповідають регіонам, які раніше були чутливими до контекстної залежності фінансової винагороди (Rogers et al., 1999; Elliott et al., 2000). Зокрема, і субгеніальний цингулат, і медіальний таламус були співвіднесені з непередбачуваністю в нашому дослідженні і були визнані контекстно залежними від Елліотт та ін. (2000).

Оскільки передбачуваність модулювала ефект переваги, важливо розрізнити потенційні джерела прогнозування. У класичному експерименті з кондиціонуванням нейтральний стимул передує нагороді. Після тренувань раніше нейтральний подразник стає предиктором, або умовним подразником. Оскільки даних щодо використання пероральних подразників у fMRI є порівняно мало, ми вирішили спростити експеримент та контролювати рухові аспекти завдання, використовуючи два різних оральних подразника, воду та фруктовий сік. Таким чином, джерело передбачення в нашому експерименті обов'язково виходило з послідовності самих подразників. У чомусь це простіше, ніж введення іншого способу стимулювання, такого як візуальна сигналізація, але оскільки обидва стимули були корисними, ми не можемо робити жодних висновків щодо процесу кондиціонування. Обидві теоретичні моделі (Schultz et al., 1997) та нейрофізіологічні дані (Schultz et al., 1992, 1993) припускають, що прогнози винагороди обчислюються протягом інтервалу, який передував видачі винагороди Оскільки ми не знаємо часової шкали, за яку обчислюються такі прогнози, ми вирішили проаналізувати експеримент як просто дві умови, передбачувані та непередбачувані. Витримуючи психологічно обґрунтований інтервал між подразниками, 10 сек, не було достатньо часу для усунення відмінностей в обробці інтерстимулу. Імовірно, така обробка відбувається, і це могло б бути вирішено за допомогою іншого експерименту.

Підсумовуючи, діяльність у регіонах винагородження людини може бути модульована часовою передбачуваністю первинних винагород, таких як вода та сік. Ці результати забезпечують важливу підтримку обчислювальних моделей, які постулюють, що помилки в прогнозуванні винагород можуть призвести до синаптичної модифікації та поширити ці висновки від нелюдських приматів до людини. Регіональна специфіка цієї модуляції також говорить про те, що інформація, втілена відносною передбачуваністю стимулюючого потоку, може бути формою нейронної валюти, яку можна виявити за допомогою fMRI.

Виноски

    • Отриманий 11 Листопадa, 2000.
    • Отримано версію 17 Січня, 2001.
    • Прийняті 26 Січня, 2001.
  • Цю роботу підтримали Національний інститут дотацій щодо зловживання наркотиками K08 DA00367 (до GSB) та RO1 DA11723 (до PRM), Національний альянс з досліджень шизофренії та депресії (GSB) та Фонд сім'ї Кейн (PRM). Ми дякуємо Х. Мао, Р. Кінгу та М. Мартіну за допомогу в зборі даних.

    Листування може бути адресоване або Грегорі С. Бернсу, кафедрі психіатрії та поведінкових наук, медичній школі університету Еморі, 1639 Pierce Drive, Suite 4000, Атланта, GA 30322, E-mail:[захищено електронною поштою]або P. Read Montague, відділ нейронауки, Медичний коледж Baylor, 1 Baylor Plaza, Houston, TX 77030, E-mail:[захищено електронною поштою].

Статті з посиланням на цю статтю