نشرت على الانترنت 2018 مايو 14. دوى: 10.1038 / s41593-018-0152 ذ
ملخص
الدوبامين هو المغير الحاسم في كل من التعلم والتحفيز. هذا يمثل مشكلة: كيف يمكن للخلايا المستهدفة معرفة ما إذا كانت زيادة الدوبامين هي إشارة للتعلم ، أم للتحرك؟ غالبًا ما يُفترض أن الدافع ينطوي على تغيرات بطيئة ("منشط") الدوبامين ، في حين أن تقلبات الدوبامين السريعة ("الطورية") تنقل أخطاء التنبؤ بالمكافأة للتعلم. ومع ذلك ، فقد أظهرت الدراسات الحديثة أن الدوبامين ينقل قيمة تحفيزية ، ويعزز الحركة ، حتى على فترات زمنية دون الثانية. أصف هنا وصفًا بديلاً لكيفية تنظيم الدوبامين للسلوك المستمر. يتم نحت الإفراج عن الدوبامين المرتبط بالدوافع بسرعة وعلى المستوى المحلي بواسطة مستقبلات على أطراف الدوبامين ، بشكل مستقل عن إطلاق خلايا الدوبامين. تتحول الخلايا العصبية المستهدفة فجأة بين أوضاع التعلم والأداء ، مع توفير الأوعية الدموية الداخلية الكولينية القاتلة آلية تبديل مرشح واحد. يختلف التأثير السلوكي للدوبامين حسب المنطقة دون الإقليمية ، ولكن في كل حالة يوفر الدوبامين تقديرًا حيويًا لما إذا كان الأمر يستحق إنفاق مورد داخلي محدود ، مثل الطاقة أو الاهتمام أو الوقت.
هل الدوبامين إشارة للتعلم أو الدافع أم كليهما؟
لقد تغير فهمنا للدوبامين في الماضي ، وهو يتغير مرة أخرى. واحد التمييز الحاسم هو بين آثار الدوبامين على تيار السلوك (الأداء) ، وتأثير الدوبامين على مستقبل السلوك (التعلم). كلاهما حقيقي وهام ، ولكن في أوقات مختلفة كان أحدهما في صالح والآخر لم يكن كذلك.
عندما أصبح (في '70s) من الممكن إجراء آفات انتقائية كاملة من مسارات الدوبامين ، كانت النتيجة السلوكية الواضحة انخفاض حاد في الحركة1. هذا يتناسب مع الآثار المصاحبة لفقدان الدوبامين في البشر ، والتي تنتج عن مرض باركنسون المتقدم ، أو الأدوية السامة ، أو التهاب الدماغ2. ومع ذلك ، لا تظهر حالات الفئران أو الحالات البشرية عجزًا أساسيًا عن الحركة. تسبح الفئران المصابة بالدوبامين في الماء البارد3، والمرضى الذين يعانون من مرض السكري قد يصابوا بالركض والركض إذا كان صوت إنذار الحريق (كينيسيا "متناقض"). كما لا يوجد عجز أساسي في تقدير المكافآت: فالفئران المصابة بالدوبامين ستستهلك الطعام الموجود في أفواهها وتظهر عليها علامات على التمتع به.4. بدلاً من ذلك ، لن يختاروا بذل جهد للحصول على مكافآت بنشاط. هذه والعديد من النتائج الأخرى أنشأت صلة أساسية بين الدوبامين والدافع5. حتى تباطؤ الحركة الذي لوحظ في الحالات الأقل شدة من مرض الشلل الرعاش يمكن اعتباره عجزًا تحفيزيًا ، مما يعكس قرارات ضمنية مفادها أنه لا يستحق إنفاق الطاقة المطلوبة لحركات أسرع6.
ثم (في '80s) جاءت التسجيلات الرائدة للخلايا العصبية الدوبامين في القرود التي تتصرف (في مناطق الدماغ المتوسط التي تتوقع الدماغ الأمامي: منطقة tegmental البطنية ، VTA / substantia nigra pars compact، SNc). من بين أنماط إطلاق النار التي لوحظت رشقات نارية قصيرة من النشاط للمحفزات التي أدت إلى حركات فورية. تم تفسير إطلاق الدوبامين "المرحلي" في البداية على أنه يدعم "التنشيط السلوكي"7 و "الإثارة التحفيزية"8 - بمعنى آخر ، تنشيط السلوك الحالي للحيوان.
حدث تحول جذري في 90s ، مع إعادة تفسير رشقات الدوبامين المرحلية كترميز مكافأة أخطاء التنبؤ (RPEs9). استند هذا إلى ملاحظة أساسية: تستجيب خلايا الدوبامين للمنبهات غير المتوقعة المرتبطة بالمكافأة في المستقبل ، ولكنها تتوقف في كثير من الأحيان عن الاستجابة إذا أصبحت هذه المنبهات متوقعة10. نشأت فكرة RPE في نظريات التعلم السابقة ، وخاصةً في مجال علوم الكمبيوتر الذي تطور آنذاك لتعلم التعزيز11. الهدف من إشارة RPE هو التحديث القيم(تقديرات المكافآت المستقبلية). يتم استخدام هذه القيم في وقت لاحق ، للمساعدة في اتخاذ الخيارات التي تزيد المكافأة. منذ إطلاق خلايا الدوبامين يشبه RPEs ، وتستخدم RPEs للتعلم ، أصبح من الطبيعي التأكيد على دور الدوبامين في التعلم. أكدت التلاعب البصري في وقت لاحق الهوية الدوبامينية لخلايا ترميز RPE12,13 وأظهرت أنها تعدل بالفعل التعلم14,15.
إن فكرة أن الدوبامين يوفر إشارة تعليمية تتناسب بشكل جميل مع الأدب القائل بأن الدوبامين يعدل اللدونة التشابكية في المخطط ، وهو الهدف الأساسي للدوبامين للدوبامين. على سبيل المثال ، تتسبب الصدمة الثلاثية لتحفيز الغلوتامات في العمود الفقري dendrite ، وإزالة الاستقطاب بعد المشبكي ، وإطلاق الدوبامين في نمو العمود الفقري16. يساعد التعديل الدوباميني لآليات التعلم على المدى الطويل في تفسير الآثار السلوكية المستمرة للعقاقير المسببة للإدمان ، والتي تشترك في خاصية تعزيز إطلاق الدوبامين الهضمي17. حتى الحركات العميقة بفقدان الدوبامين يمكن أن تُعزى جزئياً إلى آليات التعلم هذه18. قد يتم التعامل مع نقص الدوبامين باعتباره RPE سلبي باستمرار ، والذي يقوم بتحديث قيم الإجراءات نحو الصفر تدريجيًا. يمكن أن تنتج تأثيرات مماثلة تدريجيّة تشبه الانقراض على السلوك عن طريق مضادات الدوبامين19,20.
ومع ذلك ، فإن فكرة أن الدوبامين متورط بشكل حاسم في التحفيز المستمر لم تختف أبدًا - بل على العكس ، يعتبرها علماء الأعصاب السلوكي على نطاق واسع أمرًا مفروغًا منه. هذا مناسب نظرًا للأدلة القوية على أن وظائف الدوبامين في التحفيز / الحركة / التنشيط لا يمكن فصلها عن التعلم15,20-23. أقل تقدير على نطاق واسع هو التحدي الذي ينطوي عليه التوفيق بين هذا الدور التحفيزي ونظرية أن DA يوفر إشارة التعلم RPE.
الدافع "يتطلع إلى الأمام": يستخدم التنبؤات بالمكافأة المستقبلية (القيم) لتنشيط السلوك الحالي بشكل مناسب. على النقيض من ذلك ، فإن التعلم "ينظر إلى الوراء" في الحالات والإجراءات في الماضي القريب ، ويقوم بتحديث قيمها. هذه مراحل تكميلية للدورة: يمكن استخدام القيم المحدّثة في اتخاذ القرارات اللاحقة إذا تمت إعادة مواجهة تلك الحالات ، ثم تحديثها مرة أخرى ، وهكذا دواليك. ولكن ما هي المرحلة من الدورة التي يشارك فيها الدوبامين - استخدام القيم لاتخاذ القرارات (الأداء) ، أو تحديث القيم (التعلم)؟
في بعض الحالات ، يكون من السهل تخيل أن يلعب الدوبامين كلا الأدوار في وقت واحد.24الإشارات غير المتوقعة والتنبؤ بالمكافأة هي الأحداث النموذجية لاستحضار إطلاق وإطلاق خلايا الدوبامين ، وهذه الإشارات عادة تنشط السلوك وتثير التعلم (التين 1). في هذه الحالة بالذات ، يزداد كل من توقع المكافأة وأخطاء التنبؤ بالمكافأة في وقت واحد - ولكن هذا ليس هو الحال دائمًا. كمثال واحد فقط ، غالبًا ما يتم تحفيز الأشخاص والحيوانات الأخرى للعمل من أجل المكافآت حتى عندما يحدث القليل أو لا يحدث شيء مفاجئ. قد يعملون بجدية أكبر كلما اقتربوا أكثر فأكثر من المكافأة (تزداد القيمة مع اقتراب المكافآت). النقطة المهمة هي أن التعلم والتحفيز متمايزان من الناحية المفاهيمية والحسابية والسلوكية - ومع ذلك يبدو أن الدوبامين يفعل كلا الأمرين.
فيما يلي أقوم بتقييم الأفكار الحالية بشكل نقدي حول كيفية تمكن الدوبامين من تحقيق وظائف التعلم والتحفيز. أقترح نموذجًا محدثًا ، استنادًا إلى ثلاث حقائق رئيسية: 1) لا ينشأ إطلاق الدوبامين من المحطات الطرفية ببساطة عن إطلاق خلايا الدوبامين ، ولكن يمكن أيضًا التحكم فيه محليًا ؛ 2) يؤثر الدوبامين على كل من اللدونة المشبكية وإثارة الخلايا المستهدفة ، مع عواقب واضحة للتعلم والأداء على التوالي ؛ 3) تأثيرات الدوبامين على اللدونة يمكن تشغيلها أو إيقافها بواسطة عناصر الدائرة القريبة. معًا ، قد تتيح هذه الميزات لدارات الدماغ التبديل بين رسالتين متميزتين من الدوبامين ، للتعلم والتحفيز على التوالي.
هل هناك إشارات الدوبامين "الطورية" و "المنشطة" المنفصلة ، ذات معان مختلفة؟
كثيرا ما يقال إن أدوار الدوبامين في التعلم والدوافع تحدث في نطاقات زمنية مختلفة25. تنطلق خلايا الدوبامين بشكل مستمر ("بشكل تدريجي") عند بضع طفرات في الثانية ، مع رشقات أو فترات توقف مؤقتة ("طورية"). تؤدي الانفجارات ، خاصةً إذا كانت متزامنة بشكل مصطنع عبر خلايا الدوبامين ، إلى حدوث زيادات سريعة مقابلة في الدوبامين الأمامي26 التي هي عابرة للغاية (مدة الثانية الفرعية27). المساهمة المنفصلة لإطلاق خلية الدوبامين منشط لتركيزات الدوبامين في الدماغ الأمامي هي أقل وضوحا. تشير بعض الأدلة إلى أن هذه المساهمة صغيرة جدًا28. قد يكون من الكافي إنتاج تحفيز شبه مستمر لمستقبلات D2 عالية التقارب ، مما يسمح للنظام بإشعار توقف مؤقت قصير في إطلاق خلايا الدوبامين29 واستخدم هذه الإيقاف المؤقت كأخطاء تنبؤ سلبية.
لقد تم استخدام التحليل الدقيق على نطاق واسع لقياس مستويات الدوبامين الدماغية مباشرة مباشرة ، وإن كان ذلك مع دقة زمنية منخفضة (عادة ما يكون متوسطها عبر عدة دقائق). مثل هذه القياسات البطيئة للدوبامين قد تكون صعبة في الارتباط بدقة بالسلوك. على الرغم من ذلك ، يظهر التحليل الجزئي للدوبامين في النواة المتكئة (NAc ؛ المخطط البطني / الإنسي) علاقة إيجابية مع النشاط الحركي30 وغيرها من مؤشرات الدافع5. لقد اتخذ هذا على نطاق واسع ليعني أن هناك تغييرات بطيئة ("منشط") في تركيز الدوبامين ، وأن هذه التغييرات البطيئة تنقل إشارة تحفيزية. وبشكل أكثر تحديداً ، اقترحت النماذج الحسابية أن تتبع مستويات الدوبامين منشط معدل متوسط المكافأة على المدى الطويل31 - متغير تحفيزي مفيد لتخصيص الوقت وقرارات البحث عن الطعام. يجدر التأكيد على أن عددًا قليلاً جدًا من الأوراق يحدد بوضوح مستويات الدوبامين "المنشط" - فهم عادةً ما يفترضون فقط أن تركيز الدوبامين يتغير ببطء على مدار عدة دقائق من غسيل الكلى.
ومع ذلك ، فإن وجهة نظر "الدوبامين المرحلية = RPE / التعلم ، منشط الدوبامين = الدافع" تواجه العديد من المشكلات. أولاً ، لا يوجد دليل مباشر على أن إطلاق خلايا الدوبامين المنشطة يختلف عادةً عن نطاقات زمنية بطيئة. معدلات إطلاق منشط لا تتغير مع تغيير الدافع32,33. وقد قيل أن مستويات الدوبامين منشط تتغير بسبب نسبة متغيرة من خلايا الدوبامين النشطة34,35. لكن عبر العديد من الدراسات التي أجريت على الحيوانات غير المخلوقة ، لم يتم الابلاغ عن خلايا الدوبامين بالتبديل بين الحالات الصامتة والفعالة.
علاوة على ذلك ، فإن حقيقة أن التحليل الجزئي يقيس مستويات الدوبامين ببطء لا يعني أن مستويات الدوبامين تتغير فعليًا ببطء. نحن مؤخرا15 درست الفئران NAc الدوبامين في مهمة مكافأة احتمالية ، وذلك باستخدام كل من microdialysis و voltammetry دوري المسح السريع. أكدنا أن الدوبامين mesolimbic ، كما تم قياسه بواسطة غسيل الكلى ، يرتبط بمعدل المكافأة (مكافآت / دقيقة). ومع ذلك ، حتى مع تحسن تحليل الدوبامين (1min) للدقائق الدقيقة ، تذبذب الدوبامين بالسرعة التي أخذنا بها العينات: لم نر أي دليل على وجود إشارة الدوبامين البطيئة بطبيعتها.
باستخدام الدقة الزمنية الدقيقة التي لا تزال من قياس الجهد ، لاحظنا وجود علاقة وثيقة بين تقلبات الدوبامين دون الثانية والدافع. مع قيام الفئران بتسلسل الإجراءات اللازمة لتحقيق المكافآت ، ارتفع الدوبامين لأعلى وأعلى ، ووصل إلى الذروة مثلما حصلوا على المكافأة (وانخفضوا بسرعة أثناء استهلاكهم لها). لقد أظهرنا أن الدوبامين يرتبط بقوة مع قيمة الحالة الآنية المحددة كمكافأة مستقبلية متوقعة ، مخصومة من الوقت المتوقع اللازم لاستلامها. يمكن لديناميات الدوبامين السريعة هذه أن تفسر أيضًا نتائج غسيل الكلى ، دون استخدام إشارات الدوبامين المنفصلة على نطاقات زمنية مختلفة. كما تواجه الحيوانات المزيد من المكافآت ، فإنها تزيد من توقعاتهم بشأن المكافآت المستقبلية في كل خطوة في التسلسل التجريبي. بدلاً من الإشارة إلى معدل معدل المكافأة ببطء ، فإن العلاقة بين الدوبامين ومعدل المكافأة تفسر بشكل أفضل كمتوسط ، على مدى فترة جمع عينة التحليل الجزئي المطول ، لقيم الحالة المتطورة بسرعة.
يتماشى تفسير القيمة لإطلاق الدوبامين ميزوليمبيك مع نتائج قياس الجهد من مجموعات بحثية أخرى ، والتي وجدت مرارًا وتكرارًا أن إطلاق الدوبامين يتصاعد مع زيادة القرب من المكافأة36-38(التين 2). هذه الإشارة التحفيزية ليست بطيئة بطبيعتها ، ولكن يمكن ملاحظتها عبر مجموعة متواصلة من النطاقات الزمنية. على الرغم من أن منحدرات الدوبامين يمكن أن تستمر عدة ثوان عندما يستمر سلوك النهج أيضًا لعدة ثوانٍ38، وهذا يعكس مسار الوقت للسلوك ، بدلا من ديناميات الدوبامين الجوهرية. تكون العلاقة بين إطلاق الدوبامين mesolimbic والقيمة المتقلبة مرئية بالسرعة التي تسمح بها تقنية التسجيل ، أي على مقياس زمني 100ms ~ مع أقطاب قياس الجهد الحاد15.
تقلبات الدوبامين السريعة لا تعكس الدافع ببساطة ، بل إنها تؤدي أيضًا على الفور إلى تحفيز السلوك. إن الاستجابات المرحلية الأكبر لخلايا الدوبامين لتحفيز الإشارات تتنبأ بأوقات رد فعل أقصر على تلك التجربة ذاتها39. التحفيز البصري لخلايا الدوبامين VTA يجعل الفئران أكثر عرضة للبدء في مهمة المكافأة الاحتمالية15، كما لو كان لديهم توقع أعلى من المكافأة. التحفيز البصري للخلايا العصبية الدوبامين SNc ، أو محاورها في المخطط الظهري ، يزيد من احتمال الحركة40,41. من الأهمية بمكان ، أن هذه الآثار السلوكية واضحة خلال بضع مئات من ميلي ثانية من بداية التحفيز البصري. يبدو أن قدرة الإشارات التنبؤية للمكافأة على زيادة الحافز تتوسط من خلال التعديل الدوباميني السريع للغاية لإثارة الخلايا العصبية الشوكية NAc42. نظرًا لأن الدوبامين يتغير بسرعة ، وتؤثر تغييرات الدوبامين هذه على الحافز بسرعة ، فإن الوظائف التحفيزية للدوبامين توصف بشكل أفضل بأنها سريعة ("طورية") وليست بطيئة ("منشط").
علاوة على ذلك ، فإن استدعاء مقاييس زمنية منفصلة سريعة وبطيئة لا يحل في حد ذاته مشكلة فك التشفير التي تواجهها الخلايا العصبية بمستقبلات الدوبامين. إذا كان الدوبامين يشير إلى التعلم ، فإن تعديل اللدونة المشبكية يبدو استجابة خلوية مناسبة. لكن التأثيرات الفورية على السلوك المحفز تتضمن تأثيرات فورية على الارتفاع المفاجئ - على سبيل المثال من خلال التغيرات السريعة في الاستثارة. يمكن أن يكون للدوبامين كل من هذه التأثيرات بعد المشبكي (وأكثر) ، فهل تركيز الدوبامين المعطى له معنى محدد؟ أم أن هذا المعنى يحتاج إلى البناء - على سبيل المثال عن طريق مقارنة مستويات الدوبامين عبر الزمن ، أو باستخدام إشارات متزامنة أخرى لتحديد الآلية الخلوية التي يجب إشراكها؟ تتم مناقشة هذا الاحتمال بمزيد من التفصيل أدناه.
هل ينقل إطلاق الدوبامين نفس المعلومات مثل إطلاق خلايا الدوبامين؟
تبدو العلاقة بين تقلبات الدوبامين السريعة والقيمة التحفيزية غريبة ، بالنظر إلى أن إطلاق خلايا الدوبامين يشبه RPE. علاوة على ذلك ، أبلغت بعض الدراسات عن إشارات RPE في إطلاق الدوبامين mesolimbic43. من المهم ملاحظة التحدي في تفسير بعض أشكال البيانات العصبية. ترتبط إشارات القيمة و RPEs ببعضها البعض - وليس من المستغرب أن يتم تعريف RPE عادةً على أنه التغيير في القيمة من لحظة إلى أخرى ("الاختلاف الزمني" RPE). بسبب هذا الارتباط ، من الأهمية بمكان استخدام التصاميم والتحليلات التجريبية التي تميز القيمة عن حسابات RPE. تتفاقم المشكلة عند استخدام مقياس عصبي يعتمد على تغييرات إشارة نسبية وليست مطلقة. عادةً ما تقارن تحليلات قياس الفولتاميتري الدوبامين في نقطة زمنية معينة مع حقبة "خط الأساس" في وقت سابق من كل تجربة (لإزالة مكونات الإشارة التي لا تعتمد على الدوبامين ، بما في ذلك شحن القطب عند كل اكتساح للجهد وانجراف على مدى زمني من الدقائق). لكن طرح خط الأساس بعيدًا يمكن أن يجعل إشارة القيمة تشبه إشارة RPE. هذا ما لاحظناه في بيانات قياس الجهد الخاصة بنا (الشكل. 2e). تنعكس التغييرات في توقع المكافأة في التغييرات في تركيز الدوبامين في بداية كل تجربة ، وهذه التغييرات مفقودة إذا افترض المرء مجرد خط أساس ثابت عبر التجارب15. وبالتالي يجب النظر إلى الاستنتاجات حول إطلاق الدوبامين وتشفير RPE بحذر. لا ينطبق خطر تفسير البيانات هذا على قياس الجهد فحسب ، بل على أي تحليل يعتمد على التغييرات النسبية - من المحتمل أن تشمل بعض التصوير بالرنين المغناطيسي الوظيفي والقياس الضوئي44.
ومع ذلك ، ما زلنا بحاجة إلى التوفيق بين إطلاق الدوبامين ذي الصلة بالقيمة في مركز NAc مع الغياب المتسق للتشنج المرتبط بالقيمة بواسطة خلايا الدوبامين13، حتى داخل منطقة VTA الجانبية التي توفر الدوبامين إلى NAc core45. يتمثل أحد العوامل المحتملة في تسجيل خلايا الدوبامين عادة في الحيوانات المقيدة للرأس التي تؤدي مهام تكييف كلاسيكية ، بينما يقاس إطلاق الدوبامين عادة في الحيوانات غير المقيدة التي تتحرك بنشاط في بيئتها. اقترحنا أن الدوبامين mesolimbic قد يشير بالتحديد إلى قيمة "العمل"15 - أن يعكس شرط تكريس الوقت والجهد للحصول على المكافأة. تمشيا مع هذا ، يزيد الدوبامين مع الإشارات التي توجه الحركة ، ولكن ليس مع الإشارات التي توجه السكون ، حتى عندما تشير إلى مكافأة مستقبلية مماثلة46. إذا - كما هو الحال في العديد من مهام التكييف الكلاسيكية - لا فائدة من "العمل" النشط ، فإن تغييرات الدوبامين التي تشير إلى قيمة العمل قد تكون أقل وضوحًا.
والأهم من ذلك هو حقيقة أن إطلاق الدوبامين يمكن السيطرة عليه محليا في المحطات الطرفية نفسها ، وبالتالي تظهر أنماط المكانية والزمانية مستقلة عن الطفرة في جسم الخلية. على سبيل المثال ، يمكن أن تؤثر اللوزة الجانبية السفلية (BLA) على إطلاق الدوبامين NAc حتى عندما يكون VTA غير نشط47. على العكس من ذلك ، يؤدي تعطيل BLA إلى تقليل إطلاق الدوبامين NAc والسلوك المحفّز المقابل ، دون التأثير على ما يبدو على إطلاق VTA48. تحتوي محطات الدوبامين على مستقبلات لمجموعة من الناقلات العصبية ، بما في ذلك الغلوتامات والأفيونيات والأستيل كولين. تسمح مستقبلات الأسيتيل كولين للنيكوتين بامتصاص الأوعية الدموية الداخلية الكوليني (CIN) للتحكم السريع في إطلاق الدوبامين49,50. رغم أنه لوحظ منذ فترة طويلة أن السيطرة المحلية على إطلاق الدوبامين مهمة7,51، لم يتم تضمينه في الحسابات الحسابية لوظيفة الدوبامين. أقترح أن ديناميكيات إطلاق الدوبامين المتعلقة بترميز القيمة تنشأ إلى حد كبير من خلال محلي السيطرة ، حتى عندما يوفر إطلاق خلايا الدوبامين إشارات مهمة تشبه RPE للتعلم.
كيف يمكن أن يعني الدوبامين كلاً من التعلم والتحفيز دون لبس؟
من حيث المبدأ ، تكون إشارة القيمة كافية لنقل RPE أيضًا ، نظرًا لأن RPEs للفرق الزمني هي مجرد تغييرات سريعة في القيمة (الشكل. 2B). على سبيل المثال ، قد تكون المسارات المميزة داخل الخلايا في الخلايا العصبية المستهدفة حساسة بشكل مختلف للتركيز المطلق للدوبامين (يمثل القيمة) مقابل التغيرات النسبية السريعة في التركيز (تمثل RPE). يبدو هذا المخطط معقولًا ، نظرًا لتعديل الدوبامين المعقد لفيزيولوجيا الخلايا العصبية الشوكية52 وحساسيتها للأنماط الزمنية لتركيز الكالسيوم53. ومع ذلك يبدو هذا زائداً إلى حد ما. إذا كانت هناك إشارة تشبه RPE موجودة بالفعل في طفرة خلية الدوبامين ، فيجب أن يكون من الممكن استخدامها بدلاً من إعادة اشتقاق RPE من إشارة قيمة.
لاستخدام إشارة RPE وقيمة مميزة بشكل مناسب ، قد تعمل دارات المستلم الدوبامين بنشاط على تبديل طريقة تفسير الدوبامين. هناك أدلة مثيرة للاهتمام على أن الأستيل كولين قد يخدم دور التبديل هذا أيضًا. في نفس الوقت الذي تقوم فيه خلايا الدوبامين بإطلاق رشقات نارية إلى إشارات غير متوقعة ، تظهر CINs وجيزة (~ 150ms) فواصل في إطلاق النار ، والتي لا مقياس مع RPEs54. يمكن أن تكون مدفوعة مؤقتا هذه CIN بواسطة الخلايا العصبية VTA GABAergic55 وكذلك الخلايا ذات الصلة "المفاجئة" في المهاد البطاني الرحمي ، وقد تم اقتراحها لتكون بمثابة إشارة قابلية للتشجيع على التعلم56. اقترح موريس وبيرجمان54 أن توقف الكوليني يعرّف النوافذ الزمنية لللدونة المميتة ، والتي يمكن خلالها استخدام الدوبامين كإشارة تعليمية. يتم قمع اللدونة التي تعتمد على الدوبامين بشكل مستمر من خلال آليات تشمل مستقبلات m4 المسكارينية على الخلايا العصبية المميتة ذات المسار المباشر57. تشير نماذج الإشارات داخل الخلايا إلى أنه خلال توقف CIN مؤقتًا ، قد يتسبب غياب الربط m4 في التآزر مع رشقات الدوبامين المرحلية لتعزيز تنشيط PKA58، وبالتالي تشجيع التغيير متشابك.
وبالتالي تكون خلايا الكوليني القاتلة في وضع جيد لتبديل معنى رسالة الدوبامين المضاعفة ديناميكيًا. أثناء توقف CIN ، فإن تخفيف كتلة المسكارينية على اللدونة العصبية سيسمح باستخدام الدوبامين للتعلم. في أوقات أخرى ، يكون النحت محليا لإطلاق سراحهم من محطات الدوبامين للتأثير على الأداء السلوكي المستمر. حاليا ، هذا الاقتراح هو كل من المضاربة وغير مكتملة. لقد تم اقتراح أن CINs تدمج المعلومات من العديد من الخلايا العصبية الشوكية المحيطة لاستخراج إشارات مفيدة على مستوى الشبكة مثل إنتروبي59,60. ولكن ليس من الواضح على الإطلاق أنه يمكن استخدام ديناميات نشاط CIN لإنشاء إشارات قيمة الدوبامين61، وكذلك إلى بوابة الدوبامين إشارات التعلم.
هل الدوبامين يعني نفس الشيء في جميع أجزاء الدماغ الأمامي؟
عندما ترسخت فكرة RPE ، كان من المتصور أن الدوبامين كان إشارة عالمية ، حيث يبث رسالة خطأ عبر الأهداف القشرية المميتة والجبهة. أكد شولتز أن خلايا الدوبامين القرد في VTA و SNc لها استجابات متشابهة للغاية62. كما وجدت الدراسات التي أجريت على خلايا الدوبامين التي تم تحديدها استجابات متشابهة تمامًا للـ RPE في القوارض ، على الأقل للخلايا العصبية VTA الجانبية ضمن سياقات التكييف الكلاسيكية13. بعد خلايا الدوبامين هي الجزيئية والفسيولوجية متنوعة63-65 وهناك الآن العديد من التقارير التي تظهر أنماط إطلاق النار المتنوعة في سلوك الحيوانات. وتشمل هذه الزيادات التدريجية في إطلاق النار على الأحداث الشريرة66 وتحريك العظة67 التي تتناسب بشكل سيء مع حساب RPE القياسي. تُظهر العديد من خلايا الدوبامين استجابة أولية قصيرة الكمون للأحداث الحسية التي تعكس المفاجأة أو "التنبيه" أكثر من تشفير RPE المحدد68,69. هذا الجانب التنبيه هو أكثر وضوحا في SNc69، حيث تقوم خلايا الدوبامين بعرض المزيد على المخطط الحسي / الظهري (DLS)45,63). كما تم الإبلاغ عن زيادة عدد السكان من خلايا الدوبامين SNc41 أو نقصان70 إطلاق النار بالتزامن مع الحركات العفوية ، حتى بدون إشارات خارجية.
استخدمت عدة مجموعات القياس الضوئي للألياف ومؤشر الكالسيوم GCaMP لدراسة النشاط الأكبر لسكان الخلايا العصبية الدوبامين.71,72. أظهرت خلايا الدوبامين التي تظهر على المخطط الظهري / الإنسي (DMS) نشاطًا مكتئبًا عابرًا لصدمات قصيرة غير متوقعة ، في حين أظهرت الخلايا المسقطة لـ DLS نشاطًا متزايدًا71- أكثر اتساقًا مع الاستجابة التنبيهية. كما لوحظت استجابات الدوبامين المتميزة في مناطق فرعية مختلفة من الدماغ الأمامي باستخدام GCaMP لفحص نشاط محاور الدوبامين والمحطات الطرفية40,72,73. باستخدام التصوير ثنائي الفوتون في الفئران المقيدة للرأس ، هاو ودومبيك40 تم الإبلاغ عن نشاط الدوبامين المرحلي المرتبط بالحركات التلقائية. وقد شوهد هذا في الغالب في محاور الدوبامين الفردية من SNC التي انتهت في المخطط الظهري ، في حين استجابت محاور الدوبامين VTA في NAc أكثر من أجل تسليم المكافأة. ووجد آخرون أيضًا نشاط الدوبامين المرتبط بالمكافأة في NAc ، مع ارتباط DMS بدلاً من ذلك بالأفعال المقابلة72 والذيل الخلفي من المخطط يستجيب للمنبهات كره ورواية74.
تكشف التدابير المباشرة لإطلاق الدوبامين عن عدم التجانس بين المناطق دون الإقليمية30,75. مع التحليل الجزئي ، وجدنا أن الدوبامين مرتبط بالقيمة على وجه التحديد في قشرة NAc الأساسية والقشرة الأمامية البطنية ، وليس في الأجزاء الأخرى من المخطط (قذيفة NAc ، DMS) أو القشرة الأمامية. هذا مثير للفضول لأنه يبدو أنه يعين جيدًا "نقطتين ساخنتين" لتشفير القيمة يشاهدان باستمرار في دراسات دراسات الرنين المغناطيسي الوظيفي البشري76,77. على وجه الخصوص إشارة NAc BOLD ، التي لها علاقة وثيقة بإشارات الدوبامين78، تزداد مع توقع المكافأة (القيمة) - أكثر من RPE76.
سواء كانت هذه الأنماط المكانية لإطلاق الدوبامين تنشأ عن إطلاق مجموعات سكانية فرعية مميزة من الدوبامين ، أو السيطرة المحلية على إطلاق الدوبامين ، أو كليهما ، فإنها تتحدى فكرة وجود رسالة عالمية للدوبامين. يمكن للمرء أن يستنتج أن هناك العديد من وظائف الدوبامين المختلفة ، مع (على سبيل المثال) الدوبامين في المخطط الظهري يشير إلى "الحركة" والدوبامين في المخطط البطني يشير إلى "المكافأة"40. ومع ذلك ، أنا أؤيد نهج مفاهيمي آخر. تحصل المناطق الفرعية المهاجرة المختلفة على مدخلات من مناطق قشرية مختلفة ، وبالتالي ستقوم بمعالجة أنواع مختلفة من المعلومات. ومع ذلك ، تشترك كل منطقة دون إقليمية جارية في بنية دوائر متناهية الصغر شائعة ، بما في ذلك مستقبلات D1 منفصلة مقابل D2 تحمل خلايا عصبية شوكيّة79و CINs وما إلى ذلك. على الرغم من أنه من الشائع الإشارة إلى مختلف المناطق الفرعية المميتة (مثل DLS ، DMS ، NAc core) كما لو كانت مناطق منفصلة ، لا توجد حدود تشريحية حادة بينها (قذيفة NAc مختلفة قليلاً عن الكيمياء العصبية). بدلاً من ذلك ، هناك فقط تدرجات لطيفة في كثافة المستقبلات ، ونسب interneuron وما إلى ذلك ، والتي تبدو أشبه بتعديل معلمات خوارزمية حسابية مشتركة. بالنظر إلى هذه البنية المشتركة ، هل يمكننا وصف وظيفة الدوبامين الشائعة ، المستخرجة من المعلومات المحددة التي تتعامل معها كل منطقة دون إقليمية؟
الدوبامين Striatal وتخصيص موارد محدودة.
أقترح أن مجموعة متنوعة من تأثيرات الدوبامين المتباينة على السلوك المستمر يمكن فهمها على أنها تعديل قرارات تخصيص الموارد. على وجه التحديد ، يقدم الدوبامين تقديرات لمدى جدوى إنفاق مورد داخلي محدود ، مع اختلاف المورد الخاص بين المناطق دون الإقليمية المهاجمة. بالنسبة إلى المخطط "الحركي" (~ DLS) ، يكون المورد عبارة عن حركة ، وهي محدودة بسبب تحريك تكاليف الطاقة ، ولأن العديد من الإجراءات لا تتوافق مع بعضها البعض80. زيادة الدوبامين تجعل من المرجح أن يقرر حيوان ما أنه يستحق إنفاق الطاقة على الحركة ، أو التحرك بشكل أسرع6,40,81. لاحظ أن إشارة الدوبامين التي تشفر "الحركة جديرة بالاهتمام" ستنتج روابط بين الدوبامين والحركة ، حتى بدون ترميز الدوبامين "الحركة" في حد ذاته.
بالنسبة إلى المخطط "الإدراكي" (~ DMS) ، فإن الموارد عبارة عن عمليات إدراكية تشمل الانتباه (وهو قدرة محدودة بحكم التعريف82) والذاكرة العاملة83. بدون الدوبامين ، يتم إهمال الإشارات الخارجية البارزة التي عادة ما تثير حركات توجيهية ، كما لو أنها تعتبر أقل جدارة بالاهتمام3. علاوة على ذلك ، فإن حشد عمليات التحكم المعرفي عن عمد أمر مكلف (مكلف84). الدوبامين - وخاصة في DMS85 - يلعب دورًا رئيسيًا في تقرير ما إذا كان الأمر يستحق بذل هذا الجهد86,87. يمكن أن يشمل ذلك ما إذا كان يجب استخدام استراتيجيات قرارات أكثر تطوراً من الناحية المعرفية ("المستندة إلى النموذج")88.
بالنسبة إلى المخطط "التحفيزي" (~ NAc) ، قد يكون وقت المورد هو مورد واحد محدود. الدوبامين Mesolimbic غير مطلوب عندما تقوم الحيوانات بعمل بسيط وثابت للحصول بسرعة على المكافآت89. ولكن لا يمكن الحصول على العديد من أشكال المكافأة إلا من خلال العمل المطول: تسلسلات طويلة من الإجراءات غير المكافئة ، مثل البحث عن العلف. إن اختيار الانخراط في العمل يعني أنه يجب التغاضي عن الطرق المفيدة الأخرى لقضاء الوقت. يشير ارتفاع الدوبامين mesolimbic إلى أن الانخراط في عمل ممتد مؤقتًا ومجهد أمر يستحق العناء ، ولكن نظرًا لأن الدوبامين منخفض ، لا تهتم الحيوانات ، وقد تستعد للنوم فقط90.
ضمن كل حلقة من حلقات الكورتيكو - الحلقية ، تكون مساهمة الدوبامين في السلوك المستمر هي اقتصادية (معنية بتخصيص الموارد) وتحفيزية (سواء كانت جدير بالاهتمام لإنفاق الموارد81). هذه الدوائر ليست مستقلة تمامًا ، ولكنها تمتلك تنظيمًا هرميًا لولبيًا: فالكثير من الأجزاء البطنية من المخطط تؤثر على خلايا الدوبامين التي تظهر على أجزاء أكثر ظهريًا5,91. وبهذه الطريقة ، قد تساعد قرارات الانخراط في العمل أيضًا في تنشيط الحركات المحددة والموجزة المطلوبة. ولكن بشكل عام ، يوفر الدوبامين إشارات "تنشيطية" - مما يزيد من احتمال اتخاذ بعض القرارات - بدلاً من الإشارات "الاتجاهية" التي تحدد كيف يجب أن تنفق الموارد5.
ما هو الدور الحسابي للدوبامين عند اتخاذ القرارات؟
تتمثل إحدى طرق التفكير في هذا الدور التنشيطي في "عتبات" صنع القرار. في بعض النماذج الرياضية ، تزداد عمليات اتخاذ القرار حتى تصل إلى مستوى عتبة ، عندما يصبح النظام ملتزمًا بإجراء ما92. سيكون الدوبامين الأعلى معادلاً لمسافة أقل إلى الحد الأدنى ، بحيث يتم الوصول إلى القرارات بسرعة أكبر. هذه الفكرة مبسطة ، لكنها تقوم بالتنبؤات الكمية التي تم تأكيدها. إن تخفيض عتبات الحركة من شأنه أن يتسبب في تغيير معين في شكل توزيع وقت رد الفعل ، تمامًا ما يحدث عندما يتم إدخال الأمفيتامين في مخطط الحواس20.
بدلاً من العتبات الثابتة ، قد تكون البيانات السلوكية والعصبية مناسبة بشكل أفضل إذا انخفضت العتبات بمرور الوقت ، كما لو أصبحت القرارات ملحة بشكل متزايد. تم اقتراح مخرجات العقد القاعدية لتوفير إشارة عاجلة تتطور ديناميكيًا ، والتي تعمل على تنشيط آليات الاختيار في القشرة93. كان الإلحاح أكبر أيضًا عندما كانت المكافآت المستقبلية أقرب في الوقت المناسب ، مما يجعل هذا المفهوم مشابهًا لترميز القيمة ، والدور التنشيطي للدوبامين.
هل هذا الدور التنشيطي كافٍ لوصف تأثيرات تعديل الأداء للدوبامين الهابط؟ يرتبط هذا بالسؤال الذي طال أمده حول ما إذا كانت دوائر العقد القاعدية تختار مباشرة بين الإجراءات المستفادة80 أو مجرد تنشيط الخيارات التي اتخذت في أي مكان آخر93,94. هناك طريقتان على الأقل يمكن أن يبدو أن الدوبامين لهما تأثير "اتجاهي" أكثر. الأول هو عندما يتصرف الدوبامين داخل منطقة دماغية دون إقليمية تقوم بمعالجة معلومات الاتجاه بطبيعتها. لدوائر العقد القاعدية دور مهم وجزئي في التوجه نحو المكافآت المحتملة والتعامل معها. وتشارك caudate الرئيسيات (~ DMS) في قيادة حركات العين نحو الحقول المكانية المقابلة95. قد تشير إشارة الدوبامين إلى أن شيئًا ما في الفضاء المقابل يستحق التوجيه صوب الارتباط الملحوظ بين نشاط الدوبامين في DMS والحركات المقابلة72وكذلك السلوك الدوراني الناتج عن التلاعب بالدوبامين96. يتضح تأثير الدوبامين "الاتجاهي" الثاني عندما تحيز آفات الدوبامين (الثنائية) الجرذان نحو خيارات منخفضة الجهد / منخفضة المكافأة ، بدلاً من البدائل عالية الجهد / عالية المكافأة97. قد يعكس هذا حقيقة أن بعض القرارات تكون متسلسلة أكثر من كونها متوازية ، مع تقييم الفئران (والبشر) الخيارات مرة واحدة في كل مرة98. في سياقات القرار هذه ، قد لا يزال الدوبامين يلعب دورًا أساسيًا في التفعيل من خلال نقل قيمة الخيار المدروس حاليًا ، والذي يمكن بعد ذلك قبوله أم لا24.
تتخذ الحيوانات النشطة قرارات على مستويات متعددة ، وغالبًا ما تكون بمعدلات عالية. بالإضافة إلى التفكير في القرارات الفردية ، قد يكون من المفيد التفكير في مسار شامل من خلال سلسلة من الحالات (التين 1). من خلال تسهيل الانتقال من حالة إلى أخرى ، قد يسرع الدوبامين في التدفق على طول المسارات المستفادة99. قد يرتبط هذا بالتأثير الهام للدوبامين على توقيت السلوك44,100. تتمثل إحدى الحدود الرئيسية للعمل في المستقبل في اكتساب فهم أعمق لكيفية ظهور تأثيرات الدوبامين على السلوك المستمر بشكل ميكانيكي ، عن طريق تغيير معالجة المعلومات داخل الخلايا المفردة ، والدوائر الدقيقة ، وحلقات العقد القشرية القاعدية على نطاق واسع. أيضًا ، أكدت على الأدوار الحسابية الشائعة للدوبامين عبر مجموعة من الأهداف القاتلة ، ولكن الأهداف القشرية المهملة إلى حد كبير ، ويبقى أن نرى ما إذا كان يمكن وصف وظائف الدوبامين في كلا الهيكلين في نفس الإطار.
في ملخصإن وصف الدوبامين الكافي يمكن أن يفسر كيف يمكن للدوبامين أن يشير إلى كل من التعلم والتحفيز ، في نفس المقاييس الزمنية السريعة ، دون خلط. وهذا يفسر السبب في إطلاق الدوبامين في الأهداف الرئيسية في المختبر مع توقع المكافأة على الرغم من عدم إطلاق خلايا الدوبامين. وسيوفر حسابًا حسابيًا موحدًا لأعمال الدوبامين في جميع أنحاء المخطط وفي أي مكان آخر ، وهو ما يفسر التأثيرات السلوكية المختلفة على الحركة والإدراك والتوقيت. بعض الأفكار المحددة المقدمة هنا هي تخمينية ، ولكن الغرض منها هو تنشيط النقاش المتجدد والنمذجة والتجارب الجديدة الواضحة.
شكر وتقدير.
أشكر الزملاء العديدين الذين قدموا تعليقات ثاقبة على المسودات النصية السابقة ، بما في ذلك Kent Berridge و Peter Dayan و Brian Knutson و Jeff Beeler و Peter Redgrave و John Lisman و Jesse Goldberg والحكام المجهولون. يؤسفني أن قيود المساحة حالت دون مناقشة العديد من الدراسات السابقة الهامة. تم توفير الدعم الأساسي من قبل المعهد الوطني للاضطرابات العصبية والسكتة الدماغية ، والمعهد الوطني للصحة العقلية ، والمعهد الوطني لتعاطي المخدرات.