Narkotik vasitələrlə ələ keçirilən Dopamin spiralizasiya dövründən çıxan addiktlərdə qeyri-bərabər qərar qəbulu (2013)

Mehdi Keramati E-poçt,
Boris Gutkin

mücərrəd

Açıq şəkildə imtina etmək istəməsinə baxmayaraq, uzun müddətli bağımlılar, narkotik almanın zərərli bir hərəkət yolu ola biləcəyinə baxmayaraq, özlərini narkotikə müqavimət göstərməkdə aciz hesab edirlər. Mənfi nəticələr barədə açıq məlumat və məcburi davranış nümunələri arasındakı bu cür uyğunsuzluq, asılılığın mərkəzi xarakteristikası olan idrak / davranış münaqişəsini təmsil edir. Nörobiyolojik olaraq, fərqli striatal alt bölgələrdə diferensial replikanın səbəb olduğu fəaliyyət, həmçinin ventral striatal bölgələrdən dorsal bölgələrə spiral çəkən dopamin bağlantısı kompulsif dərman axtarışında kritik rol oynayır. Bununla birlikdə, bu nörofarmakoloji müşahidələri yuxarıda göstərilən idrak / davranış münaqişəsi ilə birləşdirən funksional mexanizm məlum deyil. Burada, bağımlıların “özünəməxsus şəkildə izah etdiyi səhv” də görünən dərmanla əlaqəli bilişsel uyğunsuzluğa rəsmi bir hesablama izahı veririk. Bağımlılıq yaradan dərmanların, bu davranışın aşağı mücərrəd bilişsel qiymətləndirməsinə baxmayaraq, tədricən aşağı səviyyəli vərdişli qərar qəbuletmə proseslərində dərman axtarma istiqamətində motivasion bir qərəz yaratdığını göstəririk. Bu patoloji, dərmana xroniki məruz qalma ilə farmakoloji baxımından patoloji davamlı fasik dopamin siqnalları istehsal etdikdə, iyerarxik möhkəmləndirmə öyrənmə çərçivəsində ortaya çıxır. Beləliklə, dərman möhkəmləndirmə siqnallarını ventro-dorsal kortiko-striatal hiyerarşidən aşağıya atan dopaminerjik spiralları qaçırır. Nörobiyolojik olaraq, nəzəriyyəmiz ventral striatumda dərman işarəsi olan dopamin effluksunun sürətli inkişafını və dorsal striatumda gecikmiş reaksiyanı hesab edir. Nəzəriyyəmiz də bu reaksiya nümunəsinin dopamin spiral dövriyyəsindən necə asılı olduğunu göstərir. Davranış olaraq, çərçivəmiz narkotik maddə axtarmağın narkotiklə əlaqəli cəzalara tədricən həssaslığını, narkotik nəticələrinin bloklanması fenomenini və bağımlıların təbii mükafatlardan daha çox narkotikə üstünlük verməsini izah edir. Model, test edilə bilən proqnozlar təklif edir və bunun xaricində asılılığın hiyerarşik qərar qəbuletmə proseslərinin patologiyası kimi görünməsinə zəmin yaradır. Bu baxış asılılığın vərdişli və məqsədyönlü qərar sistemləri arasındakı qarşılıqlı təsir kimi ənənəvi şərhini tamamlayır.

Citation: Keramati M, Gutkin B (2013) Narkotik vasitələrlə ələ keçirilən Dopamin spiralizasiya dövründən çıxan addislərdə qərəzsiz qərar qəbulu. PLoS ONE 8 (4): e61489. doi: 10.1371 / journal.pone.0061489

Redaktor: Allan V. Kalueff, Tulane Universiteti Tibb Məktəbi, Amerika Birləşmiş Ştatları

Alınan: Yanvar 4, 2013; Qəbul edildi: Mart 10, 2013; Tarix: April 24, 2013

Copyright: © 2013 Keramati, Gutkin. Bu, əsl müəllifi və mənbəyi kredit verdiyi halda hər hansı bir mühitdə məhdudiyyətsiz istifadə, bölüşdürmə və bərpaya imkan verən Creative Commons Attribution Lisenziyası şərtlərinə görə paylanmış açıq bir məqalədir.

Maliyyələşdirmə: Bu iş Frontiers du Vivant, Fransız MESR, CNRS, INSERM, ANR, ENP və NERF tərəfindən maliyyələşdirilmişdir. Fondun tədqiqi, məlumatların toplanması və təhlili, nəşr olunması və ya əlyazma hazırlığı barədə qərar qəbul edilməsində rol oynamışdır.

Rəqabət maraqları: Müəlliflər heç bir rəqabət mənsubu olmadığını bəyan etdi.

giriş

Anonim 12 addım proqramı, "Biz, bağımlılığımızdan gücsüz olduğumuzu, həyatlarımızın idarə olunmadığını qəbul etdik" deyir. [1]. Narkotik maddələrin alınması səhv bir hərəkət olduğunu bilməsinə baxmayaraq narkotiklərə qarşı müqavimət göstərərkən gücsüz bağımlıların özlərini necə tapmaqda bu nöqtələr var [2]-[4]. Əslində, asılılığın həssaslığı hətta dərhal mənfi nəticələrə görə narkotik vasitələrin axtarılmasına məcbur olur [5]. Bu patoloji davranışın imzası, bağımlıların xarakterik bir "özünü göstərilən səhv" sergilediği kontrollü təcrübələrində aydın olur: narkotik təsirli seçimlərə güclü davranış müdaxiləsi və narkotik maddə üçün hesabat verən nisbətən aşağı sübjektiv dəyər arasındakı uyğunsuzluq [4], [6], [7]. Davranışa qarşı inhibitor idrak nəzarəti itkisi ilə birləşdirildikdə, uzun müddətli dərmanlara məruz qaldıqdan sonra bilik planları ilə konsolidə edilmiş vərdişlər arasındakı bu fərqlilik təsadüfidən kompulsiv narkotiklə müdaxilə davranışına keçid gətirə bilər [8].

Kognitiv nəzarətin və özünü izah edən səhvlərin itkisi bu günə qədər asılılığın formal modelləri ilə prinsipial bir izahat götürdü [9]-[13]. Narkomaniyaya qarşı əvvəlki hesablama nəzəriyyələri, əsasən gücləndirilmiş öyrənmə çərçivəsi daxilində, vərdiş öyrənmənin (stimul-cavab) sisteminin patoloji vəziyyəti kimi görünüşlü bağımlılığı [9]-[13]. Bütün bu modellərin arxasında dayanan mərkəzi fərziyyə budur ki, dərmanların dopamin siqnalına farmakoloji təsiri, guya stimul-reaksiya tədris siqnalı daşıyır, bu birliklərin tədricən həddindən artıq gücləndirilməsi ilə nəticələnir. Bu təsir öz növbəsində dərman axtarma vərdişlərinə səbəb olur. Bu azalmış bağımlılığa baxış fenomenin bəzi cəhətlərini ələ keçirsə də, bağımlılık ədəbiyyatında artan bir konsensus, bir çox öyrənmə sisteminin patologiyada iştirak etdiyini göstərir. Yalnız beyin idrakını və aşağı səviyyəli vərdiş proseslərini ehtiva edən belə daha mürəkkəb bir mənzərə, asılılıq kimi davranışların müxtəlifliyini izah edə bilər. [8], [14].

Bu yazıda biz hiyerarşik gücləndirici öyrənmə yanaşmasını qəbul edirik [15] qərarlar, fərqli səviyyədə soyudulma səviyyələrində, bilik-motor hiyerarşisində təmsil olunur. Dopamine bağlı öyrənmə sinyallerinin birləşmə hiyerarşisinin səviyyələrini birləşdirdiyini düşünürük [16]. Bundan əlavə, sui-istifadənin dərman vasitələrindən fərqlənmə səviyyələri arasında kommunikasiya mexanizmini farmakoloji cəhətdən qaçırmaq olduğunu düşünürük. Bu fərziyyələrə əsaslanaraq, biz, həssaslıqla əlaqələndirilmiş kognitiv dissonansın, qərarın iyerarxiyasında xroniki dərmana məruz qalma dəyərini öyrənməyi pozduqda, hiyerarxik gücləndirmənin öyrənmə çərçivəsinə daxil olduğunu göstəririk. Bu pozulma, aşağı səviyyədə adi proseslərdə narkotik seçimlərinin patoloji qiymətləndirməsinə gətirib çıxarır və bununla da adi narkotik axtarış davranışlarını idarə edir. Daha sonra "sevilməmiş" amma kompulsiv dərman axtarışını narkotik maddə qaçırdıqları aşağı səviyyəli adi proseslərin üstünlük təşkil etdiyini, üst səviyyədə sağlam bilişsel sistemlərin isə davranış üzərində nəzarəti itirməsini nümayiş etdiririk. Bundan əlavə, biz təklif olunan modelin ventral və ya dorsal striatumda dərmanla əlaqəli dopamin effluxunun gecikməsinin gecikdirilmiş inkişafına dair son sübutların, habelə dopaminin spiralizasiya dövriyyəsindən asılılığının hesablanması mümkündür.

Material və metodlar

Preliminaries

Zəngin bilişsel psixoloji ədəbiyyatı ilə uyğun olaraq, hiyerarşik gücləndirmə öyrənmə [15], [18] Çərçivə "pivə çay" kimi bir abstrakt bilişsel planın aşağı səviyyəli tədbirlər sırasına daxil edilə biləcəyini nəzərdə tutur: qaynar su, çay içərisinə çay qoymaq və s. Bu cür ayrışma, ən aşağı səviyyədə konkret motor səviyyəsinə qədər cavab verir hiyerarşi (Şəkil 1A). Neurobiologically, kognitivdən motor səviyyələrinə qədər qərar hiyerarxiyasının müxtəlif səviyyələri kortiko-bazal ganglion (BG) dövrəsinin rostro-caudal oxunda təmsil olunur [19]-[21]. Bu dövr frontal korteks və bazal ganglion arasında bir neçə paralel qapalı loopdan ibarətdir [22], [23] (Şəkil 1B). Anterior loops, hərəkətlərin daha mücərrəd nümayişinə əsaslanaraq, sensor-motor korteksindən və dorsolateral striatumdan ibarət olan kaudal loops, aşağı səviyyəli vərdişləri kodlayır [19]-[21].

Download:

Şəkil 1. Davamın hiyerarşik təşkilatı və kortiko-BG dövrü.

Aİki alternativ seçim üçün qərar hiyerarşisinin bir nümunəsi: narkotik və ya qida. Hərəkətin hər bir istiqaməti fərqli cortico-BG looplarında kodlanan, fərqli soyutlama səviyyələrində təmsil olunur. Hər iki növ mükafatın hər birini araşdıran bir 16 böyüklüyündə cəza tətbiq oluna bilər. BMüxtəlif prefrontal sahələrdən striatal alt bölgələrə Glutamateriqik əlaqələr və sonra bir neçə paralel döngə meydana gətirən pallidum və talamus vasitəsilə PFC-ə qayıdır. Striato-nigro-striatal dopamin şəbəkəsi sayəsində striatumun ventral bölgələri daha dorsal bölgələrə təsir göstərir. vmPFC, ventral medial prefrontal korteks; OFK, orbital frontal korteks; dACC, dorsal anterior cingulate korteks; SMC, duyğu-motor korteks; VTA, ventral tegmental sahəsi; SNc, əsasən nigra pars compacta. Şəkil 1B Ref 21-dan dəyişildi.

doi: 10.1371 / journal.pone.0061489.g001

Bu dövrədə, striatuma proqnozlaşdırılan midbrain dopaminin (DA) nörozların fasik fəaliyyəti proqnozlaşdırılmış və qəbul edilmiş mükafatların arasında səhv olduğunu göstərir, bununla da stimul cavab tədbirlərini gücləndirir [24]. Bu DAergic proqnozları striatumun daha ventral bölgələrini tədricən daha çox dorsal bölgələrə "spirallaşdırma" əlaqələri ilə əlaqələndirən bir ardıcıl seri keçid təşkil edir [25]-[27] (Şəkil 1B). Funksional olaraq, rostral kaudal kortiko-BG loopları ilə əlaqələndirən belə irəliləyiş təşkilatı, kaba və gözəl görünüşlərdən idarəli birləşməyə imkan verir. Buna görə, DA spiralləri hiyerarşinin yüksək səviyyələri (davranış variantlarının dəyəri haqqında mücərrəd məlumatları kodlaşdırmaq) ilə mükafat proqnozlaşdırılması səhvinin mütərəqqi tənzimlənməsi üçün bir nörobioloji substrat təmin etmək üçün hipotez olunur. Bu səhv daha sonra fəaliyyət səviyyələrini daha ətraflı səviyyələrdə yeniləmək üçün istifadə olunur [16]. Başqa sözlə, DA spirals qiymətləndirmə mücərrədli bilişsel səviyyələrə daha detallı fəaliyyət qiymətləndirmə proseslərində öyrənməyə yönəldir.

Teorik eskiz

Möhkəmləndirmənin öyrənmə nəzəriyyəsi nəzəriyyəsi baxımından [28] (RL) agenti (bizim vəziyyətimizdə bir insana və ya heyvana) əvvəlki təxmin edilən dəyərini yeniləyərək xəbərdarlıq etmə seçimlərini öyrənməyi öyrənir, , hər bir dövlət hərəkəti cütü üçün, bir mükafat aldıqda agent tərəfindən vaxtında alınır bir hərəkət etməsi nəticəsində kontekstli vəziyyətdə (stimul) . Dəyər mükafat proqnozlaşdırılması səhv siqnalının hesablanması ilə yenilənir. Bu siqnal ani qəbul edilən mükafatdan asılı deyil), həm də həmin hərəkətin yerinə yetirildikdən sonra agentin sona çatdığı yeni dövlətin dəyərinə də aiddir. Tərəfindən təyin edilir bu müvəqqəti inkişaf etmiş dəyər funksiyası, heyvanın nəticələnən dövlətdən alacağı gözlənilən gələcək mükafatların məbləğini əks etdirir, İrəli. Proqnozlaşdırma səhvi aşağıdakı tənliklər ilə hesablana bilər:

(1)

Səmimi olaraq, proqnozlaşdırma səhv siqnalı bir hərəkətin gözlənilən və yerinə yetirilən mükafat dəyəri arasındakı ziddiyyətləri hesablayır. Lakin hiyerarşik bir qərar strukturunda, öyrənmədən çox deyil Fərqli səviyyədə müstəqil dəyərlər, daha çox soyuq səviyyələr aşağı səviyyədə hesablanmış tədris sinyalini tənzimləyə bilər. Hiyerarşinin daha yüksək səviyyələri ekoloji fövqəladə halların daha mücərrəd təmsil olunduğundan, bu səviyyədə daha sürətli öyrənmə baş verir. Bu, davranışın mücərrəd təmsilinin nisbətən aşağı ölçülü olması ilə əlaqədardır: bir hərəkət planı, hiyerarşinin ən üst səviyyəsində tək bir addım (bir ölçülü) və aşağı səviyyədə çoxlu ətraflı tədbirlər (birdən çox ölçü) kimi təqdim edilə bilər hiyerarşiyi. Bu fəaliyyət planının yüksək səviyyəli dəyəri, mükafat səhvlərinin bütün detallı addım-addımların geri qaytarılması üçün lazım olan səviyyələrlə müqayisədə tez öyrənilməlidir. Beləliklə, daha yüksək səviyyəli dəyər məlumatları ilə aşağı səviyyədə dəyərlərin ayarlanması bu dəyərlərin yaxınlaşmasını sürətləndirə bilər. Bunu etmək üçün statistik cəhətdən səmərəli bir üsul, proqnozlaşdırma səhv siqnalını hesablamaq üçün nəzərdə tutulur - soyutmanın səviyyəsi, , müvəqqəti inkişaf etmiş dəyər funksiyası, , bir daha yüksək səviyyədə soyutma, [16]:

(2)

Optimallığı qorumaq üçün, 2 tənliyi yalnız bir mücərrəd variantın sonuncu tərkibli primitiv hərəkətinin yerinə yetirildiyi zaman proqnozlaşdırma səhvini hesablamaq üçün istifadə oluna bilər (bax S1-də Şəkil SXNUMX). Fayl S1). Digər hallarda, fərqli səviyyələrdə dəyər öyrənmə, 1 tənlikində olduğu kimi müstəqil olaraq baş verir. Hər iki halda tədris siqnalı müvafiq səviyyədə əvvəlki dəyərlərin yenilənməsi üçün istifadə olunur:

(3)
hara öyrənmə dərəcəsi. Orta səviyyəli informasiya mübadiləsinin bu forması bioloji cəhətdən məqbuldur, çünki DA dövrə sisteminin spiral strukturunu əks etdirir, məlumatları ventro-dorsal istiqamətdə hiyerarşidən aşağı keçir. Eyni zamanda, daha mücərrəd səviyyələrə yönəldilməsi öyrənmə səviyyəsini əhəmiyyətli dərəcədə artırır, yüksək səviyyəli dəyər öyrənmə səviyyələrində [16].

Bu yazıda biz modellərin dəyişdirilmiş versiyası arasında qarşılıqlı təsir göstərdiyini göstərir [16] və dopaminergik sistemdə istifadənin istifadəsinin spesifik farmakoloji təsirləri, radikal olaraq fərqli təhlil ölçüsündə asılılıqla əlaqəli məlumatları tuta bilər: davranış və dövrə səviyyəsində nörobiyoloji. Birincisi, yeni model narkotik maddələrdən asılılıq ilə əlaqəli bir neçə maraqlı xarakteristik cəhətdən (məsələn, özünü açıqlayan səhv [4], [6], [7]). İkincisi, dərmanla uyğundur dopamin azadlığının dinamikası ilə bağlı geniş sübutlar hesab edə bilərik [17].

Biz təqdim olunan modeli dəyişdiririk [16] göstərildiyi kimi. Modelimizi dəyişdirərək işləyən yaddaş tutumu baxımından daha məhsuldar hala gətiririk ilə , 2 tənliyi ilə, iki dəyər eyni sabit səviyyəyə yaxınlaşdığından (bax: Şəkil S2 Fayl S1, hesablama və nörobiyoloji əsasları üçün):

(4)

Burada nisbətən mücərrəd bir seçimdir və bu seçimi tam şəkildə dolduran davranış sıralarında son ibtidai hərəkətdir. Oxşar, mükafatın dəyəridir daxildir (tövsiyə edilən dəyər ).

Əksinə, insanlar tərəfindən istismar edilən müxtəlif dərmanlar striatum içərisində farmakolojik olaraq artan dopamin konsentrasiyasının əsas xüsusiyyətlərini bölüşdürür [29]. Buna görə, dərmanların bu farmakoloji təsirini müsbət yanaşma əlavə edərək, , (həmçinin bax [9]-[12]) dopamin nöronlarla aparılan proqnozlaşdırma səhv siqnalına (bax: Şəkil S3 in Fayl S1, hesablama və nörobiyoloji əsasları üçün):

(5)

Burada dərman vasitəsinin DA sisteminə birbaşa farmakoloji təsiri, və euphorigenic effektlərinə görə onun gücləndirici dəyəri (bax Fayl S1 əlavə məlumat üçün).

3 və 5 tənlikləri birlikdə, modelimizdəki dəyərləri yeniləmək üçün hesablama mexanizmini təyin edərkən, qeyri-müəyyənlik əsaslı rəqabət mexanizmi davranışı nəzarət edən abstraksiyanın səviyyəsini müəyyənləşdirir. Bu, təklif olunan mexanizmdən ilhamlanır [29] adi və məqsədli sistemlər arasında arbitraj üçün. Bu baxımdan, hər bir qərar nöqtəsində, seçimin dəyərini qiymətləndirərkən ən yüksək dəqiqliyi olan soyutmanın səviyyəsi yalnız davranış davranışlarını nəzarət edir. Bu səviyyədə hərəkət etmək qərarına gəldikdən sonra, seçilmiş hərəkətləri ibtidai motor reaksiyalarının ardıcıllığı kimi həyata keçirmək üçün iyerarxiyanın bütün alt səviyyələri bu dominant səviyyədə yerləşdiriləcək (bax Fayl S1 əlavə məlumat üçün; Şəkil S4 in Fayl S1; Şəkil S5 in Fayl S1). Ətrafdakı mükafat geribildirimini aldıqdan sonra, bütün səviyyələrdə olan dəyərlər yenilənir. Bu qeyri-müəyyənlik əsaslı arbitraj mexanizmi mücərrəd proseslər daha çevik olduğundan, öyrənmə prosesinin erkən mərhələlərində üstün dəyər-təxmini qabiliyyətinə malikdir və buna görə də bu mərhələlərdə nəzarət davranışını nəzərdə tutur. Lakin, soyut səviyyələr ətraf mühitin qabaqcadan təmsil olunduğundan (məsələn, nisbətən az sayda əsas funksiyanı ehtiva etdiyinə görə), onların yekun dəyərinin yaxınlaşdırma qabiliyyəti ətraflı səviyyədə olduğu kimi dəqiq deyildir. Başqa sözlə, geniş təlimdən sonra qiymətləndirilmiş dəyərlərlə bağlı müəyyənlik yuxarı səviyyələrlə müqayisədə hiyerarşinin aşağı səviyyələri üçün aşağıdır. Proqressiv öyrənmə ilə, hiyerarxiyanın aşağı səviyyələri onların qeyri-müəyyənliyini tədricən azaldığına görə hərəkətlərin seçilməsi üzərində nəzarəti ələ keçirir. Bu narkotik maddə axtarışında (həm də təbii mükafatların axtarılmasında) ventral striatum üzərində dorsalın mütərəqqi dominantlığını göstərən bir sıra dəlillərlə razılıq verir. [8], [30], [31].

Nəticələr

Hierarchy qiymətləndirmə uyğunsuzluğu dərman vasitəsi ilə yaranır, lakin təbii mükafatlar deyil

Əvvəlki güclənmənin öyrənmə əsaslı hesablama modellərindən fərqli olaraq [9]-[13] tək qərarlı sistem yanaşmasına əsaslanan hesabımız çoxsaylı qarşılıqlı əlaqəli sistemlər çərçivəsinə əsaslanır. Nəticədə, modelləşdirmə dərmanının proqnoz səhv siqnalına təsirinin forması əvvəlki modellərə bənzəsə də [9]-[12], bu, əsasən fərqli nəticələrə gətirib çıxarır. Dərmanla əlaqəli müvəqqəti dopamin artımı, hiyerarşinin hər səviyyəsində dərhal proqnozlaşdırma səhvini artırır və nəticədə bir yanaşma, , məlumatların bir səviyyədə soyudulmasından digərinə köçürülməsi, iyerarxiyanın qaba-to-incə istiqaməti boyunca. Bu yanlışlıq müəyyən bir səviyyədə narkotik maddə axtarışının asimptotik dəyərinə səbəb olur bir ədəd daha mücərrəd qatdan daha çox ədəd (Şəkil 2B). Rostro-kaudal eksen boyunca bu uyğunsuzluqların yığılması tədricən hiyerarşinin yuxarı və aşağı həddləri arasında narkotik axtarış davranışlarının dəyərində əhəmiyyətli fərqlər yaradır. Beləliklə, güclü bir cəzanın ardından da, dərmanla əlaqəli davranışın dəyəri aşağı səviyyəli motor halkalarında pozitif olaraq qalır, bilişsel düzeyde negatif olur. Digər bir deyişlə, model, DA spirallerindən dərman təsirinin biriktirilməsinin motor səviyyəsində alışqanlıq dərəcəsini artırmaq üçün belə yüksək amplitüdə qədər artırdığı qənaətindədir ki, güclü təbii cəza kifayət qədər azalda bilməz. Bunun səbəbi narkotik maddə ilə əlaqəli davranışların bilişsel və aşağı səviyyədə qiymətləndirilməsi arasında asılılığın səbəbsizliyini açıqlayır. Başqa sözlə, kompulsiv dərman axtarışını və əlaqədar xərclərə əhəmiyyətli dərəcədə azalmış elastikliyi qərarın hiyerarşisi səviyyələri arasında məlumatları ötürən dopaminə bağlı mexanizmi qaçırdıqdan dərman preparatının farmakoloji təsirindən gəlir.

Download:

Şəkil 2. Fərqli səviyyədə soyudulma (simulyasiya nəticələrinə) olan qida və narkotik üçün motivasiya.

Heç bir cəzanın mükafatlandırılmadığı ilk 150 sınaqlarında, bütün səviyyələrdə təbii mükafatların axtarılması dəyəri 10 (A). Bununla yanaşı, dərman preparatı üçün dərman preparatının birbaşa farmakoloji effekti, təyin etdi) hər səviyyədə asimptotik dəyər verər bir üst səviyyədə abstraksiyadan daha yüksək olan ədədlər (B). Beləliklə, cəza ilə təqlid edildikdə, bilişsel döngələr dərmana uyğun seçim üçün mənfi bir dəyəri təyin edərkən, motor səviyyəli ilmə dərman axtaran istənilən (müsbət dəyər) tapır. Bu rəqəmdəki əyrilər "bir" simulyasiya edilən heyvanlarda dəyərlərin təkamülünü göstərir və buna görə heç bir statistik analiz tətbiq edilə bilməz.

doi: 10.1371 / journal.pone.0061489.g002

Narkotiklər, bizim modelimizdə səviyyələrdəki balanssız qiymətləndirmə ilə nəticələnsə də, təbii mükafatların dəyəri DA sinyalizmə mexanizminə birbaşa farmakoloji təsirin olmaması səbəbindən bütün səviyyələrdə eyni qiymətə yaxınlaşır). Nəticədə, təbii mükafatların verilməsi üçün nə dərəcədə uyğunsuzluq, nə də ətraflı səviyyədə qiymətləndirilməyəcək (Şəkil 2A). Hiyerarxiyanın aşağı səviyyədə dərmanla mübarizə reaksiyalarına üstünlük verilməsinin təbii mükafatların üzərində narkotiklərin qeyri-adi üstünlükləri və dərmanla əlaqəli fəaliyyətlərdə daha çox məşğul olması lazımdır.

Ventral və dorsal striatumda dərmanla əlaqəli istəklərə cavab verən diferensial dopamin

Neurobiologically, narkotik maddə axtarma davranışının əldə edilməsi və ifadə edilməsində striatal subregionların fərqli rolu addiction tədqiqatında mərkəzi mərhələyə qədəm qoydu. Müxtəlif tədqiqat xəttlərindən bir-birinə qatılan sübutlar, istirahətdən məcburi dərman istifadəsindən davranışa keçidinin ventraldan dorsolateral striatuma qədər qiymətləndirmənin nörobioloji dəyişməsini əks etdirdiyini göstərir [8], [33], [34], modelimizdə bilikdən detallı səviyyələrə keçidlə uyğun gəlir. Bizim modelimizə uyğun olaraq ventralın striatumun tədricən daha dorsal bölgələrinə birləşən DA sarmal şəbəkəsi bu keçiddə əsas rol oynayır [25].

Sonuncu bir araşdırmada Willuhn və ark. [17] üç həftə ərzində kokain yaşanmış siçovulların ventral və dorsolateral striatumunda dərmanla əlaqəli ipuçlarına cavab olaraq dopaminin sərbəst buraxılış modelini qiymətləndirmişdir. Tez-tarama cyclic voltammetry istifadə edərək, tənqidi müşahidə ventral striatumda Cue-induced DA efflux çox məhdud təlim sonra da ortaya çıxdı. Əksinə, dorsolateral striatum geniş tədrisdən sonra təkan tetiklənmiş DA effluxunu göstərdi və ventral striatum ipsilateral yarımkürədə zədələndikdə bu azad modelinin inkişafı itdi.

Tez-tarama voltmetriyasının müvəqqəti həlli konsentrasiyadan aşağı salınan dəyişiklikləri nəzərə alaraq, DA effluxunun müşahidə olunan nümunəsi "phasic" DA sinyalizasiya və beləliklə, dopaminin RL nəzəriyyəsinə əsasən, proqnozlaşdırma səhvinə aid edilməlidir [24]. RL nəzəriyyəsinə əsasən, gözlənilməz stimulun müşahidə olunduğuna dair proqnozlaşdırma səhvləri bu stimulun nəzərdə tutan mükafat dəyərinə bərabərdir. Buna görə də, replika səbəbli DA azadlığı, bu tapşırıq tərəfindən nəzərdə tutulan dəyəri bərabərdir.

Bu baxımdan, hiyerarşik çərçivəmizdə ventral və dorsal striatal DA effluxunun fərqli modelinə dair rəsmi izahat verilir [17]. Hiyerarxiyanın mücərrəd bilişsel səviyyələrində dərmanla əlaqəli tapşırıq tərəfindən öngörülen değer, təlimin erkən mərhələlərində sürətlə artır (Şəkil 2B), yüksək səviyyədə abstraksiyanın öyrənmə probleminin aşağı ölçülü olması səbəbindən. Nəticədə, bizim modelimiz göstərir ki, ventilyasiya striatumunda məhdud təlimdən sonra həqiqi səbəb olan DA effluxu müşahidə edilməlidir (Şəkil 3). Təqdimatın daha ətraflı səviyyələrində isə, öyrənmə prosesi yavaş (Şəkil 2B) problem sahəsinin yüksək ölçülü olması və həmçinin DA spiralləri ilə daha çox mücərrəd səviyyələrdə öyrənmə asılılığının olmasıdır. Nəticə olaraq, dorsolateral striatumda əmələ gələn DA efflux tədricən inkişaf etməlidir və yalnız geniş tədrisdən sonraŞəkil 3).

Download:

Şəkil 3. Dərmanla əlaqəli ipuçlarına cavab olaraq müxtəlif striatal subregionsdə dopamin effluxu (simulyasiya nəticəsi).

Eksperimental məlumatlara uyğun olaraq [17], model (sol sütun) göstərir ki, dərmanla əlaqəli ipuçlarına cavab olaraq, məhdud və geniş təlimdən sonra ventral striatumda dopamin effluxı olacaqdır. Ancaq daha çox dorsolateral alt bölgələrdə öyrənmə zamanı tədricən DA dövrəyə keçid inkişaf edəcəkdir. Modeldən (ikinci sütun sağdan) proqnozlaşdırılır ki, bu dorsal striatumda əvəzedilən DA effluxunun gecikmiş inkişafı ventralni dorsal striatuma bağlayan DA-asılı serial bağlantısına əsaslanır. DA spirallarının kəsilməsi nəticəsində ventilyasiya striatumunda replika səbəb olan DA cavabı qalıb, dorsolateral striatumda əhəmiyyətli dərəcədə azalıb. Bundan başqa, modeli lösedilmiş ventral striatum halda dorsolateral striatumda replika səbəbli DA efflux üçün oxşar nəticələri (sağdan üçüncü sütun) proqnozlaşdırır. Nəhayət, toxunulmaz heyvanlarda geniş dərman-replika eşleşmesinden sonra, bir cəza dərmanı təqib edərsə, modelin (hüququ sütun) proqnozlaşdırdığına görə narkotik maddə ilə əlaqəli tapşırıq məhdud təlimdən sonra DA spirallarının ventral ayağının inhibisyonuna səbəb olur. Daha dorsal bölgələrdə isə, DA efflux öyrənmə zamanı yavaş-yavaş azaldılır, amma geniş miqyasda narkotik-cəza eşleşmesinden sonra da müsbət olaraq qalacaq. Bu rəqəmlə təqdim olunan məlumatlar "bir" simulyasiya edilmiş heyvandan alınır və buna görə statistik təhlil aparılmır.

doi: 10.1371 / journal.pone.0061489.g003

Bundan başqa, modelimiz də dəlilləri izah edir [17] Dorsolateral striatumda şişkinlikdən çıxan DA effluxunun gecikdirilmiş inkişafı ventral striatuma (Şəkil 3). Modelimizde, ventral striatumun simulyasiya edilmiş birtərəfli lezyonu (modeldəki soyut qiymətləndirmə səviyyəsi) ipsilateral yarımkürədə detallı səviyyədə dərman ehtimalı proqnozlaşdırılan dəyərini əhəmiyyətli dərəcədə azaldır və beləliklə replika səbəbli DA efflux səviyyəsini əhəmiyyətli dərəcədə azaldır. Ventral striatumun zədələnməsini modelləşdirmək üçün biz bütün stimulların dəyərini ən yüksək səviyyədə sıfır səviyyəsinə düzəldirik.

Eyni şəkildə, bizim modelimiz, dorsolateral striatumda fasik DA siqnalının inkişafının DA spirallaşdırma dövrünün bütövlüyünəŞəkil 3). Əslində, bizim modeldəki DA spiralizasiya dövründəki bir ayırma abstraksiyanın səviyyələri arasında rabitəni azaldır və bu, öz növbəsində, qərarın iyerarxiyasının səviyyələri boyunca möhkəmləndirici siqnal üzərindəki dərmanla bağlı yanlışlığın yığılmasını maneə törədir. Ventralın dorsal striatuma DA-bağlı serial dövrəsində ayırma modelini modelləşdirmək üçün müvəqqəti inkişaf etmiş dövlətin dəyərini dərhal daha yüksək səviyyədə qəbul etmədən, yerli xarakterli (3 tənlikində) proqnozlaşdırma səhv siqnalını hesablamaq üçün hər bir səviyyədə abstraksiya səviyyəsini bağlayırıq soyuducunun səviyyəsi.

Bundan başqa, model, kokain və kokainlə əlaqəli ipuçları ilə geniş bir təlimdən sonra, yuxarıdakı təcrübədə olduğu kimi, kokain çatdırılmasını güclü bir cəza ilə birləşdirməyə başlayırsa, replika səbəbli DA efflux modelinin dəyişəcəyini proqnozlaşdırır. Kokainlə əlaqəli tapşırıqa cavab olaraq DA effluxunun ventral striatumda başlanğıcdan aşağıda sürətlə azalması lazımdır. Dorsolateral striatumda isə, replika səbəb olan DA sərbəst buraxılış başlanğıcdanŞəkil 3) təxirə salınmış qismən azalma ilə. Bu, bilik səviyyələrində mənfi (aşağı səviyyəli) dəyərlərə baxmayaraq, ətraflı səviyyədə narkotik stimuluna müsbət subyektiv dəyərin təyin edilməsini göstərir. Qeyd edək ki, bu proqnoz cəzanın beynin mənfi bir mükafat kimi qəbul etdiyi fərziyyəsindən asılıdır. Bu fərziyyə bir qədər mübahisəlidir: eksperimental tədqiqatlar tərəfindən aydın şəkildə dəstəklənir [35]hələ başqaları tərəfindən də müzakirə olundu [14], [36]. Bu proqnozdan başqa, modelin digər aspektləri cəzanın dopamin və ya başqa bir sinyalizasiya sistemi ilə kodlaşdırılmasından asılı deyildir.

Willuhn və digərlərinin istifadə etdiyi təlim rejimi. [34] dərmanla əlaqəli cəzaların laqeydliyi ilə xarakterizə edilən kompulsiv dərman axtarış davranışının istehsalına kifayət qədər uzadılıb [37], [38]. Beləliklə, DLS-də replika səbəb olan DA cavabının gecikmiş inkişafı və kompulsif cavab vermənin gec inkişafı arasında əlaqə nədir? Bizim modelimizə görə kompulsiv davranış yalnız hiyerarşinin aşağı səviyyədə dərman seçiminin həddindən artıq qiymətləndirilməsini deyil, həmçinin davranış üzərində nəzarətin soyut bilişdən aşağı səviyyəli adi proseslərə köçürülməsini tələb edir. Bu iki prosesin vaxt miqyası yalnız bir-birinə bağlıdır: aşırı qiymətləndirmə prosesi proqnozlaşdırma səhvinə bağlıdır, davranış nəzarəti isə qiymət qiymətləndirməsində nisbi qeyri-müəyyənliklərdən asılıdır. Beləliklə, hiyerarşiyanın aşağı səviyyədə dərmanla əlaqəli ipuçlarının çox qiymətləndirilməsi davranış üzərində nəzarətin üstdən iyerarxiyanın altına keçməsinə gətirib çıxara bilər. İki prosesin dəqiq vaxt tərəzi, öyrənmə dərəcəsinə və fərqli səviyyələrə xas olan səs-küyə bağlıdır (bax Fayl S1 əlavə məlumat üçün). Başqa sözlə, DLS-də ifrazedici dopamin effluxunun kompulsiv dərman vasitəsi ilə davranışla ifadə edilməzdən əvvəl əhəmiyyətli dərəcədə inkişaf edə biləcəyi ehtimal olunur.

Təbii mükafatlara qarşı dərmanlar üçün uyğunsuz qiymətləndirmənin davranışçı nəticələri

Davamlı olaraq, nümunəmizdə, cəza könüllü narkotik istifadəinin erkən mərhələlərində dərmanla qoşulduqda, dərmanla müdaxilənin mücərrəd dəyəri mülayim hala salınır. Bu erkən mərhələlərdə narkotik dərmanının soyut səviyyələrlə idarə olunduğunu nəzərə alaraq, dərman seçməsinin mənfi mücərrəd qiymətləndirilməsi mövzunu daha çox fəaliyyət planını yaşamağa məcbur edir. Bu zamanla dərmanlara qarşı aşağı səviyyəli güclü üstünlüklərin konsolidasiyasına mane olur. Beləliklə, model dərman istehlakının erkən mərhələlərində xroniki istifadədən sonra deyil, dərman seçimlərinin elastikliyini xərcləməyi izah edir. Asılılıqla heyvan modelləri, dərmanla əlaqəli zərərli nəticələrə qarşı uyuşqanlıqların laqeydliyi yalnız uzun müddətli narkotik özünü idarə etməsindən sonra inkişaf edir, lakin narkotik maddənin məhdudlaşdırılması deyil [37], [38]. Bizim nəzəriyyəmizdən fərqli olaraq əvvəllər hesablama modellərindən asılılıq [9], [10] dərmanların istifadəsini dərhal təqib edən əlamətdar davranış nəticələrinin dərman vasitələrinin baş verməsinin erkən mərhələlərində belə bir motivasiya təsiri olmadığını proqnozlaşdırarkən bu bədən quruluşuyla birbaşa ziddiyyət təşkil edir (bax Fayl S1 əlavə məlumat üçün).

Bizim modelimiz dərman nəticələrinə qarşı blokaj təsirinin yaranmasına səbəb olur [39]. Bloklama, A və B-nin nəticəsini təslim etməzdən əvvəl təqdim edildiyi sonrakı təlim mərhələsində bu nəticə ilə fərqli bir stimul B ilə birləşmənin meydana gəlməsini bloklaşdıran bir stimul A-nın əvvəlcədən birləşməsini kommutasiya edən fenomendir [40]. Pavlovian eksperimental dizaynında modelimizi simulyasiya edən nəticələr (bax Fayl S1 modelin Pavloviya versiyası haqqında əlavə məlumat üçün), təbii mükafatların və narkotiklərin müəyyənləşdirildiyi hiyerarşi müəyyən bir səviyyədə müəyyən bir səviyyədə sabit vəziyyətə çatdıqda (hərtərəfli böyüyəndən daha çox), bu halda heç bir daha öyrənmə olmadığı proqnozlaşdırma səhv siqnalının sıfıra endirildiyiŞəkil 4). Beləliklə, yeni bir stimulun artıq nəzərdə tutulan mükafatla əlaqələndirilməsi məhdudlaşdırılacaq. Narkotik və təbii gücləndiricilərlə əlaqəli bir bloklama təsirini göstərən davranış dəlilləri [39] əvvəldən təklif edilən dopamin əsaslı hesablama modelini tənqid etmək üçün böyük bir əsas kimi istifadə edilmişdir [9]. Burada göstərdikləri hiyerarşik təbiətə və dorsal-ventral spiraling dopamin dövrü quruluşuna odaklanmanın, bu tənqiddən kənarlaşdıran faktiki məlumatları hesablaya biləcəyini göstərdik. Fayl S1 əlavə məlumat üçün).

Download:

Şəkil 4. Təbii və narkotik maddə mükafatlarına qarşı təsirləri məhdudlaşdırır.

Model, təbii mükafatların meydana gəlməsinə mane olurA) və narkotik maddələr (B), yalnız ilk tədris dövrü "geniş" olduğu təqdirdə, ilk stimul tam nəticənin dəyərini nəzərdə tutur. "Orta" təhsildən sonra, daha çevik olan bilişsel səviyyələr dəyərləri tam olaraq proqnozlaşdırır və bundan sonra da daha çox öyrənməyi maneə törədirlər. Lakin ikinci təlim mərhələsi (həm stimulların eyni vaxtda təqdim edilməsi) başlandıqda öyrənmə aşağı səviyyəli proseslərdə fəaldır. Beləliklə, bizim modelimiz təbii mükafatlara mane olan bir bloklama sınaqında mülayim başlanğıc təliminin bilişsel / davranışçı uyğunsuzluğa gətirib çıxaracağını proqnozlaşdırır. Bu rəqəmlə təqdim olunan məlumatlar "bir" simulyasiya edilmiş heyvandan alınır və buna görə statistik təhlil aparılmır.

doi: 10.1371 / journal.pone.0061489.g004

Daha əvvəl də qeyd edildiyi kimi, bir sıra dəlillər, dorsalın ventral striatum üzərində tədris prosesi zamanı davranışın nəzarətində mütərəqqi üstünlüyünü göstərir [8], [31], [32]. Bu sübutların fonunda şərh edilərkən, iyerarxiya boyunca balanssız narkotik axtarma qiymətləndirməsi, narkomanlarla əlaqəli seçimlər üzərində nəzarət idrakdan aşağıya keçdikdə, narkomanlarla uzun müddətli təcrübədən sonra narkotik istifadəsini azaltmaq üçün uğursuz səylərini də izah edir. vərdişli səviyyə. Dərmanların üstünlük təşkil etdiyi proseslərin bu üstünlüyü, təbii olaraq, dərmanla əlaqəli xərclərə (kompulsiv dərman axtarışı) davranış qeyri-elastikliyinə gətirib çıxarır və ehtimal ki, özünün təsvir etdiyi səhvlə müşayiət olunur. Təbii mükafatlar məsələsində isə, modelimiz, öyrənmə müddətində davranış esnekliğinin artmasına baxmayaraq, iyerarxiya səviyyələrində bir qiymətləndirmə uyğunsuzluğunun inkişaf etməməsinə görə mükafatla əlaqəli cəzaların nəticədə mükafat axtarmağı əngəlləyəcəyini təxmin edir.

Modelimiz, "ehtimal olunan" qərarların iyerarxiyasında hərəkətlərin qiymətləndirilməsinə yönəlib və abstrakt variantları və onların müvafiq aşağı səviyyəli proqramlarının əvvəlki inkişaf zamanı necə aşkar edildiyini bir kənara qoyur. Qərar hiyerarşisinin aşkar edilməsi aşağı səviyyəli tədbirlərin ardıcıllıqla bir araya toplanması və daha mücərrəd variantların yaradılması ilə həyata keçirilmiş bir alt-müddətli proses olmağı təklif edilir [41]. Sözsüz dorsaldan ventral striatuma keçən bu proses, burada təklif olunan rəqabət mexanizminin əks istiqamətdə davranış nəzarəti üçündir.

Müzakirə

Müxtəlif striatal subregionların asılılıqda fərqli roluna dair sübutların artan təsiri odur ki, məqsədlərə yönəldilmiş ikili üsulla [8], [14], [34]. Burada istifadə etdiyimiz ierarxik qərar qəbuletmə anlayışı bu ikili sistem hesablarına tamamlanır. İki prosesli yanaşma fərqli alqoritmlər ilə məşğul olur (modelsiz və model bazası [30]) bir problemin həlli üçün hiyerarxik RL çərçivəsi eyni problemin müxtəlif səviyyələrdə müvəqqəti soyuducu səviyyələrində müxtəlif təqdimatlar üzərində dayanır. Teorik olaraq, ya adi və ya hədəf yönümlü bir alqoritm, problemin bu fərqli nümayəndəliklərinin hər birini həll edə bilər. Bizim modelimizdə, DA-spirallardan dərman vasitəsi ilə yaranmış təxminlərin yığılması dəyər-qiymətləndirmə alqoritminin modelsiz (vərdiş öyrənmə) olduğu bir yerdə baş verir. Bununla belə, bu, üst səviyyədə işləyən model bazlı sistemlərin varlığını istisna etmir. Ən yüksək səviyyədə abstraksiyalı hərəkətlərin məqsədli bir sistem tərəfindən qiymətləndirildiyini fərz etsək, sadəcə PFC-ə əsaslanan məqsədə yönəldilmiş qiymətləndirmə və qərar sistemini modelə daxil edə bilərsiniz. Bu mürəkkəblik bu əlyazmada təqdim olunan nəticələrin xarakterini dəyişməzkən, addikasiyanın digər aspektlərini izah etmək üçün əlavə elastiklik gələcək tədqiqatlara ayrılır. Həqiqətən, bizim modelimizdə, hədəf birbaşa sistem mövcud olub-olmamasından asılı olmayaraq, hiyerarşinin iki həddi arasında narkotik maddə axtarışının asimptotik dəyərindəki uyğunsuzluq "adi proses" ilə idarə olunan qərar səviyyələrinə görə artır .

Bizim nəzəriyyəmizin işığında, relapsın bilişsel səviyyələrin üstünlüyü dövründən sonra hərəkətsiz mühərrik səviyyəsində uyuşmazlıq vərdişlərinin canlanması kimi nəzərdən keçirilə bilər. Əslində, idrak-terapiya (insan narkomanları) və ya məcburi tükənmə (soyuqqanlılığın heyvan modellərində) nəticəsində, iyerarxiyanın detallı səviyyəsində narkotik maddə axtarışının yüksək dəyəri nəticəsində söndürülməməsi, nəzarətin idrak səviyyələrinə keçməsi. Dərmanla əlaqəli davranış mücərrəd səviyyələrdəki mənfi nəticələrə həssas olduğu üçün, yüksək səviyyəli bilişsel proseslər davranış nəzarəti hakim olduğu müddətcə dərman axtarışından qaçınmaq olar. Hətta məşhur 12 addım proqramları (məsələn, Anonim Alkoqoliya, Narkotik Anonim və s.) Qismən iştirakçıları dərmanla əlaqəli həyat tərzinin uyğunsuzluğunu etiraf etməsini tələb edərək, qismən işləyib, beləliklə soyqırım idrak səviyyələrini gücləndirmək üçün onların davranış. Stressli şərtlər və ya dərmana yenidən maruz qalma (priming) davranışdan soyuq səviyyələrin üstünlüyünü zəiflədəcək risk faktoru kimi qəbul edilə bilər ki, bu da dərmanla əlaqəli reaksiyaların yenidən ortaya çıxmasına səbəb ola bilər (latent yüksək olmayan bilik dəyərləri ).

Xülasə olaraq, narkotik asılılığına xas olan bir-birindən fərqli, fərqli bir fenomen üçün tutarlı bir hesab təklif edirik. Modelimiz, dərman axtarma əldə etmə və vərdiş performansında ventral və dorsal striatal dövrələrin diferensial rolları, habelə dərmanın təbii möhkəmləndiricilərə qarşı təsiri üçün qabaqcıl DA əlaqəsinin seçici rolu barədə məlumatların normativ hesabını təqdim edir. Ən əsası, ventral-dorsal DA siqnallarında dərmanla əlaqəli patologiyanın, motivasiya məlumatlarını bilişsel təmsil hiyerarşisindən aşağı sızdırmasının, bağımlıların narkotik axtarmağa qarşı mücərrəd münasibətləri ilə əslində etdikləri arasında uyğunsuzluğa səbəb ola biləcəyini göstəririk. Aydındır ki, modelimiz narkotik asılılığı barədə tam məlumat vermir və nəzərdə tutulmur. Bağımlılığın digər izah olunmayan tərəflərini izah etmək, sui-istifadə narkotiklərindən təsirləndiyini göstərən bir çox digər beyin sistemlərini birləşdirməyi tələb edir. [42]. Rəsmi hesablama şəbəkəsi daxilində bu cür sistemi necə birləşdirmək olar?

Məlumatın dəstəklənməsi

Fayl_S1.pdf

Şəkil S1,Beş səviyyəli abstraksiya ilə nümunə bir qərar hiyerarşisi. Şəkil S2, Üç müzakirə edilən dəyər öyrənmə alqoritmləri üçün müvafiq neyron dövrə ierarxik qərar strukturudur. A, Sadə bir TD öyrənmə alqoritmindən (tənlik S7) istifadə edərək, abstraksiyanın hər bir səviyyəsindəki proqnozlaşdırma səhv sinyali digər səviyyələrdən asılı olaraq hesablanır. B, Haruno və Kawato (4) (S8 tənlikliyi) tərəfindən təklif olunan modeldə, müvəqqəti inkişaf etmiş dövlətin dəyəri bir daha yüksək səviyyədə soyutma səviyyəsindən gəlir. C, Bizim modelimizdə (S9 tənliyi) müvəqqəti inkişaf etmiş dövlətin dəyəri mükafat və Q-dəyərinin yüksək səviyyədə soyudulması ilə birləşməsi ilə əvəz edilmişdir. Şəkil S3, Modelimiz, 1-a 3 saytına, mükafat-təlim dövründə dərmanların müxtəlif fəaliyyət sahələrini nəzərdə tutur. 4-ə 6 saytlarına təsir edən dərmanlar, əksinə, modelin simulyasiya üsulu ilə istehsal olunan davranış və nevrobioloji nümunələrə gətirməyəcək, lakin təbii mükafatların vəziyyətinə oxşar nəticələr çıxaracaqdır. Şəkil S4, Xarakterə nəzarət etmək üçün hiyerarşi səviyyələri arasında qeyri-müəyyənlik əsaslı rəqabət mexanizmini simulyasiya etmək üçün istifadə edilən vəzifə. Şəkil S5, Simulyasiya nəticəsi, davranış üzərində nəzarətdən tədricən yüksək səviyyəyə qədər dəyişmə hiyerarşiyasını göstərir. Q (s, a) və ABŞ) sırasıyla dövlət hərəkət cütlərinin təxmin edilən dəyərini və qeyri-müəyyənliyini göstərir.

Şəkil S1,Beş səviyyəli abstraksiya ilə nümunə bir qərar hiyerarşisi. Şəkil S2, Üç müzakirə edilən dəyər öyrənmə alqoritmləri üçün müvafiq neyron dövrə ierarxik qərar strukturudur. A, Sadə bir TD öyrənmə alqoritmindən (tənlik S7) istifadə edərək, abstraksiyanın hər bir səviyyəsindəki proqnozlaşdırma səhv sinyali digər səviyyələrdən asılı olaraq hesablanır. B, Haruno və Kawato (4) (S8 tənlikliyi) tərəfindən təklif olunan modeldə, müvəqqəti inkişaf etmiş dövlətin dəyəri bir daha yüksək səviyyədə soyutma səviyyəsindən gəlir. C, Bizim modelimizdə (S9 tənliyi) müvəqqəti inkişaf etmiş dövlətin dəyəri mükafat və Q-dəyərinin yüksək səviyyədə soyudulması ilə birləşməsi ilə əvəz edilmişdir. Şəkil S3, Modelimiz, 1-a 3 saytına, mükafat-təlim dövründə dərmanların müxtəlif fəaliyyət sahələrini nəzərdə tutur. 4-ə 6 saytlarına təsir edən dərmanlar, əksinə, modelin simulyasiya üsulu ilə istehsal olunan davranış və nevrobioloji nümunələrə gətirməyəcək, lakin təbii mükafatların vəziyyətinə oxşar nəticələr çıxaracaqdır. Şəkil S4, Xarakterə nəzarət etmək üçün hiyerarşi səviyyələri arasında qeyri-müəyyənlik əsaslı rəqabət mexanizmini simulyasiya etmək üçün istifadə edilən vəzifə. Şəkil S5, Simulyasiya nəticəsi, davranış üzərində nəzarətdən tədricən yüksək səviyyəyə qədər dəyişmə hiyerarşiyasını göstərir. Q (s, a) və ABŞ) sırasıyla dövlət hərəkət cütlərinin təxmin edilən dəyərini və qeyri-müəyyənliyini göstərir.

doi: 10.1371 / journal.pone.0061489.s001

(PDF)

Minnətdarlıq

Elmi məqalələri şərh etmək üçün S. Əhməd və P. Dayanı tənqidi müzakirələrə və M. Reinoud, D. Redish, N. Daw, E. Koechlin və A. Dezfouli üçün təşəkkür edirik.

Müəllif iştirakları

Təcrübələri hazırladı və tərtib etdi: MK. Denemeler gerçekleştirildi: MK. Məlumatları təhlil etdi: MK BG. Tərkibli reagentlər / materiallar / analiz vasitələri: MK. Qəzet yazdı: MK BG.

References

1. Anonim Narkotiklər (2008). 6th ed. Dünya Xidmət Bürosu.
2. Goldstein A (2001) Bağımlılığı: Biologiyadan Narkotik Siyasətə. Oxford University Press, ABŞ.
3. Volkow ND, Fowler JS, Wang GJ, Swanson JM (2004) Dopaminin narkotik istismarında və bağımlılığında: görüntüləmə işlərinin və müalicə nəticələrinin nəticəsi. Molekulyar Psixiatriya 9: 557-569. doi: 10.1038 / sj.mp.4001507. Bu məqaləni onlayn tapın
4. Stacy AW, Wiers RW (2010) Bağlı idrak və bağımlılık: paradoksal davranışı izah etmək üçün bir vasitədir. 6 klinik psixologiya illik baxış: 551-575. doi: 10.1146 / annurev.clinpsy.121208.131444. Bu məqaləni onlayn tapın
5. Psixi xəstəliklərin diaqnostikası və statistik əlamətləri (DSM-IV) (2000). 4th ed. Vaşinqton, DC: Amerikan Psixiatriya Assosiasiyası.
6. Quzu RJ, Preston KL, Schindler CW, Meisch RA, Davis F, et al. (1991) Post-addiktlərdə morfinin gücləndirici və subyektiv təsiri: dozada cavab tədqiqatı. 259: 1165-1173 farmakoloji və eksperimental müalicə jurnalı. Bu məqaləni onlayn tapın
7. Goldstein RZ, Woicik PA, Moeller SJ, Telang F, Jayne M və digərləri. (2010) Aktiv kokain istifadəçilərində dərman və qeyri-narkotik mükafatların sevilməsi və istəkləri: STRAP-R sorğusu. Psikofarmakoloji 24 jurnalı: 257-266. doi: 10.1177/0269881108096982. Bu məqaləni onlayn tapın
8. Everitt BJ, Robbins TW (2005) Narkomaniya üçün möhkəmləndirici sinir sistemləri: hərəkətlərdən vərdişlərə məcbur etməyə qədər. Təbiət neuroscience 8: 1481-1489. doi: 10.1038 / nn1579. Bu məqaləni onlayn tapın
9. Redish AD (2004) Bağımlılığı bir hesablama prosesi olaraq qaçırdı. Elm 306: 1944-1947. doi: 10.1126 / science.1102384. Bu məqaləni onlayn tapın
10. Dezfouli A, Piray P, Keramati MM, Ekhtari H, Lucas C, və s. (2009) Kokain asılılığı üçün neyrocomputational model. Sinir Hesablama 21: 2869-2893. doi: 10.1162 / neco.2009.10-08-882. Bu məqaləni onlayn tapın
11. Piray P, Keramati MM, Dezfouli A, Lucas C, Mokri A (2010) Nucleus accumbens dopamin reseptorları fərdi fərqlər asılılıq kimi davranışın inkişafını təxmin edir: bir hesablama yanaşması. Sinir Hesablama 22: 2334-2368. doi: 10.1162 / NECO_a_00009. Bu məqaləni onlayn tapın
12. Dayan P (2009) Dopamin, möhkəmləndirmə öyrənmə və asılılıq. 42: 56-65 farmakopsioqrafiyası. doi: 10.1055 / s-0028-1124107. Bu məqaləni onlayn tapın
13. Takahashi Y, Schoenbaum G, Niv Y (2008) Tənqidçilərin susması: kokain həssaslığının dorsolateral və ventral striatuma təsirini aktyor / tənqidçi modelin kontekstində anlamaq. Nörobilimdə sərhədlər 2: 86-99. doi: 10.3389 / neuro.01.014.2008. Bu məqaləni onlayn tapın
14. Redish AD, Jensen S, Johnson A (2008) Bağımlılıq üçün vahid bir çərçivə: qərar prosesində zəifliklər. Davranış və Brain Bilimleri 31: 415-487. doi: 10.1017 / S0140525X0800472X. Bu məqaləni onlayn tapın
15. Botvinick MM (2008) Hiyerarxik davranış modeli və prefrontal funksiya. Bilişsel elmlərdə trendlər 12: 201-208. doi: 10.1016 / j.tics.2008.02.009. Bu məqaləni onlayn tapın
16. Haruno M, Kawato M (2006) Multipl kortiko-striatal loopların inteqrasiyası üçün heterarxik gücləndirici öyrənmə modeli: stimul-hərəkət-mükafat dərnək öyrənmə fMRI imtahan. Sinir şəbəkələri 19: 1242-1254. doi: 10.1016 / j.neunet.2006.06.007. Bu məqaləni onlayn tapın
17. Willuhn I, Burgeno LM, Everitt BJ, Phillips PEM (2012) Kokainin istifadəsi zamanı striatumda fasik dopamin siqnalının hiyerarxik işə salınması. Milli Elmlər Akademiyasının 109 əsərləri: 20703-20708. doi: 10.1073 / pnas.1213460109. Bu məqaləni onlayn tapın
18. Botvinick MM, Niv Y, Barto AC (2009) Hierarchically təşkil davranış və onun neyron əsasları: gücləndirilmiş bir öyrənmə perspektiv. Cognition 113: 262-280. doi: 10.1016 / j.cognition.2008.08.011. Bu məqaləni onlayn tapın
19. Badre D, D'Esposito M (2009) Frontal lobun rostro-kaudal oxu iyerarxikdirmi? Təbiət İnkişafı Nörobilim 10: 659–669. doi: 10.1038 / nrn2667. Bu məqaləni onlayn tapın
20. Koechlin E, Ody C, Kouneiher F (2003) İnsan prefrontal korteksindəki bilişsel nəzarət mimarisi. Elm 302: 1181-1185. doi: 10.1126 / science.1088545. Bu məqaləni onlayn tapın
21. Badre D, Hoffman J, Cooney JW, D'Esposito M (2009) İnsan frontal lobunun zədələnməsindən sonra iyerarxik idrak nəzarəti kəsirləri. Təbiət nevrologiyası 12: 515-522. doi: 10.1038 / nn.2277. Bu məqaləni onlayn tapın
22. Aleksandr GE, DeLong MR, Strick PL (1986) Bazal ganglionu və korteksləri birləşdirən funksional segregativ sxemlərin paralel təşkilatı. 9 sinirbiliminin illik xülasəsi: 357-381. doi: 10.1146 / annurev.neuro.9.1.357. Bu məqaləni onlayn tapın
23. Aleksandr GE, Crutcher MD, DeLong MR (1990) Bazal gangliyo-talamokortik sxemlər: motor, oculomotor, prefrontal və limbik funksiyalar üçün paralel substratlar. 85: 119-146 Brain Tədqiqatında irəliləyiş. Bu məqaləni onlayn tapın
24. Schultz W, Dayan P, Montague PR (1997) Nəzəriyyə proqnozlaşdırılması və mükafat substrat. Elm 275: 1593-1599. doi: 10.1126 / science.275.5306.1593. Bu məqaləni onlayn tapın
25. Belin D, Everitt BJ (2008) Kokain axtaran vərdişlər ventralın dorsal striatumla əlaqələndirən dopaminə bağlı serial bağlantısına əsaslanır. Neuron 57: 432-441. doi: 10.1016 / j.neuron.2007.12.019. Bu məqaləni onlayn tapın
26. Xəbər SN, Fudge JL, McFarland NR (2000) Primatlarda Striatonigrostriatal Yolları Shell dən Dorsolateral Striatum üçün artan Spiral təşkil edir. 20 sinirbilim jurnalı: 2369-2382. Bu məqaləni onlayn tapın
27. Haber SN (2003) Primat bazal ganglion: paralel və inteqrativ şəbəkələr. Kimyəvi Nöroanatomiya 26 jurnalı: 317-330. doi: 10.1016 / j.jchemneu.2003.10.003. Bu məqaləni onlayn tapın
28. Sutton RS, Barto AG (1998) Təkmilləşdirmə Təlimi: Giriş. Cambridge: MIT Press.
29. Di Chiara G, Imperato A (1988) İnsanlar tərəfindən istifadən dərmanlar sərbəst hərəkət edən siçovulların mesolimbik sistemində sinaptik dopamin konsentrasiyalarını artırır. Amerika Birləşmiş Ştatlarının Milli Elmlər Akademiyasının Təqdimatı 85: 5274-5278. doi: 10.1073 / pnas.85.14.5274. Bu məqaləni onlayn tapın
30. Daw ND, Niv Y, Dayan P (2005) Davranışçı nəzarət üçün prefrontal və dorsolateral striatal sistemlər arasında qeyri-müəyyənlik əsaslı rəqabət. Təbiət neuroscience 8: 1704-1711. doi: 10.1038 / nn1560. Bu məqaləni onlayn tapın
31. Vanderschuren LJMJ, Ciano PD, Everitt BJ (2005) İğneli-nəzarətli kokain axtarışında dorsal striatumun iştirakı. 25 sinirbilim jurnalı: 8665-8670. doi: 10.1523 / JNEUROSCI.0925-05.2005. Bu məqaləni onlayn tapın
32. Volkow ND, Wang GJ, Telang F, Fowler JS, Logan J və digərləri. (2006) Dorsal striatumda kokain istəkləri və dopamin: kokain asılılığında özlem mexanizmi. 26 sinirbilim jurnalı: 6583-6588. doi: 10.1523 / JNEUROSCI.1544-06.2006. Bu məqaləni onlayn tapın
33. Kalivas PW, Volkow ND (2005) Bağımlılığın neyro əsasları: motivasiya və seçim patolojisi. 162: 1403-1413 Psixiatriya Amerika Jurnalı. doi: 10.1176 / appi.ajp.162.8.1403. Bu məqaləni onlayn tapın
34. Belin D, Jonkman S, Dickinson A, Robbins TW, Everitt BJ (2009) Bazal ganglia daxilində paralel və interaktiv öyrənmə prosesləri: asılılığın anlaşılması üçün vacibdir. Davranış Brain Tədqiqatı 199: 89-102. doi: 10.1016 / j.bbr.2008.09.027. Bu məqaləni onlayn tapın
35. Matsumoto M, Hikosaka O (2009) İki növü dopamin nöronu, müsbət və mənfi motivasiya siqnallarını aydın şəkildə çatdırır. Təbiət 459: 837-841. doi: 10.1038 / nature08028. Bu məqaləni onlayn tapın
36. Frank MJ, Surmeier DJ (2009) Nə əhəmiyyətli nigra dopaminergik nöronlar mükafat və cəza arasında fərqlənir? 1 molekulyar hüceyrə biologiyası jurnalı: 15-16. doi: 10.1093 / jmcb / mjp010. Bu məqaləni onlayn tapın
37. Vanderschuren LJMJ, Everitt BJ (2004) Uzun müddətli kokain özünü idarə etdikdən sonra narkotik maddə axtarmaq kompulsif olur. Elm 305: 1017-1019. doi: 10.1126 / science.1098975. Bu məqaləni onlayn tapın
38. Deroche-Gamonet V, Belin D, Piazza PV (2004) Sıçanda asılılıq kimi davranış üçün sübutlar. Elm 305: 1014-1017. doi: 10.1126 / science.1099020. Bu məqaləni onlayn tapın
39. Panlilio LV, Thorndike EB, Schindler CW (2007) Kokainlə əlaqələndirilmiş bir stimul üçün kondisyonu maneə törətmək: kokainin gözləniləndən daha böyük bir siqnal çıxarmasına dair hipotezi test edin. Farmakologiya, Biokimya və Davranış 86: 774-777. doi: 10.1016 / j.pbb.2007.03.005. Bu məqaləni onlayn tapın
40. Kamin L (1969) Proqnozlaşdırma, sürpriz, diqqət və kondisioner. Campbell BA, Church RM, redaktorlar. Cəza və çirkin davranış. New York: Appleton-Century-Crofts. 279-296.
41. Dezfouli A, Balleine BW (2012) Alışkanlıkları, fəaliyyət sıraları və möhkəmləndirmənin öyrənilməsi. 35: 1036-1051 nörobilim jurnalının Avropa jurnalında. doi: 10.1111 / j.1460-9568.2012.08050.x. Bu məqaləni onlayn tapın
42. Koob GF, Le Moal M (2005) Bağımlılık nörobiyolojisi. San Diego: Akademik Press