Suficiencia de la estimulación de la neurona de dopamina mesolímbica para la progresión a la adicción (2015)

 

Vincent Pascoli3,Jean terrier3,Agnès Hiver

,Christian Lüscher'Correspondencia información sobre el autor Christian Lüscher.http://www.cell.com/templates/jsp/_style2/_marlin/images/icon_email.pngEnviar un correo electrónico al autor Christian Lüscher

DOI: http://dx.doi.org/10.1016/j.neuron.2015.10.017

Destacados

• La autoestimulación neuronal de la dopamina evoca plasticidad sináptica en el NAc, conduciendo la recaída

• La dopamina es suficiente para desencadenar la toma compulsiva

• Las neuronas en la corteza orbitofrontal son hiperexcitables en ratones resistentes al castigo

• La inhibición quimiogenética de la OFC reduce la autoestimulación compulsiva

Resumen

Los factores que causan la transición del consumo de drogas recreativas a la adicción siguen siendo en gran parte desconocidos. No se ha probado si la dopamina (DA) es suficiente para desencadenar este proceso. Aquí utilizamos la autoestimulación optogenética de las neuronas DA del área tegmental ventral (VTA) para imitar selectivamente la característica común definitoria de las drogas adictivas. Todos los ratones adquirieron fácilmente la autoestimulación. Después de semanas de abstinencia, se observó una recaída inducida por señales en paralelo con una potenciación de las aferencias excitadoras en las neuronas del núcleo accumbens (NAc) que expresan el receptor D1. Cuando los ratones tuvieron que soportar una leve descarga eléctrica en el pie para obtener una estimulación, algunos se detuvieron mientras que otros perseveraron. La resistencia al castigo se asoció con una mayor actividad neuronal en la corteza orbitofrontal (OFC), mientras que la inhibición quimiogenética de la OFC redujo la compulsividad. Juntos, estos resultados muestran que la estimulación de las neuronas VTA DA induce las características celulares y conductuales de la adicción, lo que indica suficiencia para la inducción y progresión de la enfermedad.

Introducción

La adicción es una enfermedad que evoluciona en varios pasos (Everitt et al., 2008, George et al., 2014). El diagnóstico se realiza cuando el uso recreativo se vuelve compulsivo, persistiendo a pesar de las consecuencias negativas. Si bien una de las principales hipótesis de adicción postula que las drogas de abuso causan la enfermedad porque aumentan excesivamente la concentración de dopamina (DA) en el cerebro, no está claro si activar este sistema es suficiente para impulsar las transiciones del uso recreativo a la adicción (Di Chiara y Bassareo, 2007, Volkow y Morales, 2015). La evidencia que respalda la hipótesis de la DA para el refuerzo de las drogas se ha acumulado durante varias décadas y se basa en el efecto inicial de las drogas. Por ejemplo, las drogas adictivas reducen el umbral de autoestimulación intracraneal (ICSS) del haz del prosencéfalo medial, un tracto de fibras que contiene, entre otros, la proyección ascendente de DA del mesencéfalo (Stein, 1964, Crow, 1970, Kornetsky et al., 1979). Los estudios de farmacología y lesiones identificaron luego el sistema DA mesocorticolímbico como el origen de este circuito (Wise y Bozarth, 1982). A finales de la década de 1980, una medida directa de la concentración extracelular de DA con microdiálisis confirmó que las drogas adictivas compartían la propiedad de provocar un aumento de DA en el NAc (Di Chiara e Imperato, 1988). Esto llevó a la propuesta de una clasificación mecanicista de las drogas adictivas (Lüscher y Ungless, 2006).

Se sabe mucho menos de cómo estos efectos iniciales del consumo de drogas facilitan la transición a la adicción. Se han considerado mecanismos independientes de DA porque las drogas adictivas tienen otros objetivos farmacológicos. Por ejemplo, la cocaína, además de inhibir el transportador de DA (DAT), también se une a SERT (transportador de serotonina) y NET (transportador de norepinefrina) para disminuir la recaptación de serotonina y norepinefrina, respectivamente, aumentando así la concentración de todas las principales monoaminas (Han y Gu, 2006, Tassin, 2008). Pueden aplicarse preocupaciones similares a otros psicoestimulantes. Además, se afirma que los opiáceos son, al menos en la fase inicial, independientes de la DA (Badiani et al., 2011, Ting-A-Kee y van der Kooy, 2012). La hipótesis de la DA también ha sido cuestionada sobre la base de modelos genéticos de ratones, donde, después de la interferencia con el sistema DA, todavía eran evidentes algunas formas de comportamiento adaptativo a las drogas. Por ejemplo, los ratones knockout para DAT se autoadministran cocaína (Rocha et al., 1998), y la abolición de la síntesis de DA ya sea farmacológicamente (Pettit et al., 1984) o genéticamente (Hnasko et al., 2007) no pudo prevenir la autoadministración de drogas. o preferencia de lugar condicionada. Si bien una mejor caracterización de estos ratones transgénicos y la generación de nocaut de transportadores dobles de monoamina han resuelto algunos de estos problemas (Rocha, 2003, Thomsen et al., 2009), se desconoce la suficiencia de DA para desencadenar características cardinales de la adicción. Por lo tanto, para evitar problemas de no especificidad, hemos decidido permitir que los ratones autoestimulen las neuronas VTA DA mediante un enfoque optogenético.

Estudios recientes han demostrado que la activación de neuronas DA en el mesencéfalo puede inducir preferencia de lugar (Tsai et al., 2009) o reforzar el comportamiento instrumental (Adamantidis et al., 2011, Witten et al., 2011, Kim et al., 2012, Rossi et al., 2013, McDevitt et al., 2014, Ilango et al., 2014). Si bien esta activación selectiva de las vías de DA confirma los estudios de autoestimulación intracraneal (ICSS) llevados a cabo hace más de 30 años para delinear el sistema de recompensa (Fouriezos et al., 1978), no demuestran la inducción de la conducta adaptativa en etapa tardía que define la adicción, ni identificaron las adaptaciones neuronales subyacentes. Aquí utilizamos la manipulación optogenética no solo para permitir la prueba directa del criterio de suficiencia para la señalización fásica de DA al iniciar el refuerzo, sino también para probar la transición a la adicción.

Una observación sorprendente de las últimas etapas de la enfermedad es que incluso con las drogas más adictivas, solo una fracción de los consumidores se vuelve adicta (Warner et al., 1995, O'Brien, 1997). Los adictos humanos continuarán consumiendo drogas a pesar de las consecuencias negativas (consulte la “Definición de adicción” de la Sociedad Estadounidense de Medicina de Adicciones, DSM5, Asociación Estadounidense de Psiquiatría, 2013), generalmente relacionadas con derrotas sociales y psicológicas que a menudo se retrasan en el tiempo. De manera similar, en los roedores aproximadamente uno de cada cinco animales que adquieren la autoadministración de cocaína finalmente se clasifica como adicto (Deroche-Gamonet et al., 2004, Kasanetz et al., 2010; pero ver George et al., 2014). La perseverancia de la ingesta de drogas a pesar de las consecuencias negativas también se puede modelar en roedores introduciendo un simple estímulo aversivo al horario de consumo. Si bien la enfermedad humana es más compleja, asociar el castigo con el consumo es un modelo sencillo de un componente central de la adicción.

Aquí, utilizamos un choque leve en el pie para evaluar su consecuencia en la autoadministración de cocaína, sacarosa y autoestimulación optogenética. Investigamos más a fondo si la autoestimulación de las neuronas DA puede inducir dos conductas relacionadas con la adicción (búsqueda de recompensa asociada a la señal y la compulsividad asociadas con el consumo a pesar de las consecuencias negativas) y caracterizar la plasticidad neuronal asociada con estas conductas.

Resultados

Adquisición de VTA DA Neuron Self-Stulation

 

Para controlar la actividad de las neuronas DA, inyectamos un virus adenoasociado inducible por Cre (AAV) con un marco de lectura abierto invertido (DIO) de doble flujo que contiene ChR2 fusionado con proteína fluorescente amarilla mejorada (eYFP) (Atasoy et al., 2008, Brown et al., 2010) en el VTA de ratones DAT-Cre. Además, se colocó una fibra óptica para apuntar al VTA (ChR2, consulte nuestra página, Procedimientos experimentales). Especificidad de la ChR2 la expresión fue confirmada por la co-localización de eYFP con la tirosina hidroxilasa (TH), una enzima requerida para la síntesis de DA (Figura 1LA). 

Primero, para establecer el protocolo de estimulación láser, los ratones se colocaron en una caja operante donde podían presionar una palanca activa, lo que desencadenaba una serie de estimulaciones láser que variaban (1, 2, 8, 32, 60 o 120 ráfagas) cada dos sesiones. Para emular el patrón de disparo fásico (Hyland et al., 2002, Mameli-Engvall et al., 2006, Zhang et al., 2009) típicamente inducido por recompensa natural (Schultz, 1998), usamos estimulación por ráfagas. Una ráfaga consistió en cinco pulsos de láser de 4 ms, a 20 Hz, y se repitió dos veces por segundo. Descubrimos que los ratones adaptaron su comportamiento de presión de palanca en función de ráfagas por estimulación láser, controlando así el número total de ráfagas recibidas (Figura 1SEGUNDO). Este comportamiento recuerda a la autoadministración de drogas adictivas, cuando se variaba la dosis por infusión (Piazza et al., 2000). Para los experimentos posteriores, optamos por administrar 30 ráfagas por pulsación de palanca, lo que arroja un número medio máximo de ráfagas (Figura 1SEGUNDO). Para imitar el retraso en el aumento de DA que se observa normalmente cuando se administran fármacos por vía intravenosa (Aragona et al., 2008), retrasamos la estimulación láser en 5 sy agregamos una luz indicadora intermitente durante 10 s (Figura 1C).

Durante 12 días consecutivos, se permitió que los ratones se autoestimularan un máximo de 80 veces en 2 h. Los ratones aumentaron rápidamente la tasa de estimulación con láser, alcanzando 80 estimulaciones con láser (LS) antes del final de la primera hora de una sesión (Figuras 1D y 1E). La distinción entre la palanca activa e inactiva se adquirió rápidamente y el número de presiones de palanca activa aumentó en consecuencia con el aumento de los horarios de relación fija (FR1, 2, 3) (Figuras 1F y 1G). En los experimentos de control que utilizaron ratones DAT-Cre® o ratones que expresaban ChR2 en neuronas de ácido γ-aminobutírico (GABA) (ratones GAD-Cre +, dirigidos a las neuronas inhibitorias del VTA), las tasas de autoestimulación fueron bajas y disminuyeron continuamente sesiones Esto también se aplicó a dos animales Cre + donde la validación post hoc mostró que el VTA no estaba infectado con ChR2-eYFP (no se muestra). Por otra parte, no se detectó discriminación entre la palanca activa e inactiva (Figuras S1A y S1B).

Observamos que los ratones DAT-Cre + presionaban más a menudo en la palanca activa que lo requerido para la estimulación con láser. De hecho, tales prensas de palanca activas "inútiles" representaron más del 30% de todas las presiones de palanca activas (Figura S2A) y ocurrió (a medida que avanzaban las sesiones), principalmente entre el inicio de estimulación de señal y láser (Figuras S2B y S2C). Este comportamiento singular se desarrolló durante la adquisición y puede reflejar respuestas impulsivas.

En conjunto, la actividad de ráfaga en las neuronas VTA DA refuerza fuertemente la respuesta de la palanca.

 

Oclusión de auto estimulación neuronal VTA DA por la cocaína

Para probar si la autoestimulación de la neurona VTA DA depende de los mismos circuitos cerebrales que son el objetivo de las drogas adictivas para reforzar el comportamiento, inyectamos cocaína por vía intraperitoneal (ip) inmediatamente antes de las sesiones de autoestimulación (acceso gratuito al láser durante 45 minutos, Figura 2UN). En la línea de base, los animales bien entrenados presionaron aproximadamente 400 veces para obtener 85 LS en 45 minutos según el programa FR3. Después de la inyección de cocaína, el rendimiento disminuyó significativamente de una manera dependiente de la dosis a aproximadamente 30 LS para 100 presiones de palanca con la dosis más alta (Figura 2SEGUNDO). Esta oclusión fue más pronunciada durante los primeros 30 min de la sesión, reflejando la farmacocinética del fármaco (Figura 2DO). Este experimento indica que el refuerzo mediante la autoestimulación optogenética y el refuerzo por la cocaína comparten circuitos neuronales subyacentes.

Plasticidad sináptica asociada con la búsqueda después de la retirada

Para comparar aún más la autoestimulación optogenética con las drogas adictivas, a continuación preguntamos si los ratones recaerían en la autoestimulación de las neuronas VTA DA después de varias semanas de abstinencia. Dado que la búsqueda de fármacos asociada a señales es un modelo establecido de recaída (Epstein et al., 2006, Soria et al., 2008, Bossert et al., 2013), volvimos a colocar a los ratones en la cámara operante 30 días después de la última autodestrucción. sesión de estimulación, donde la presión activa de la palanca ahora activaba la luz de señal sin estimulación láser (Figura 3UNA). El robusto comportamiento de búsqueda asociado con la señal, demostrado por una alta tasa de prensas de palanca activa, solo fue evidente en ratones con expresión de eYFPChR2 en las neuronas VTA DA (ratones DAT-Cre + pero no DAT-Cre−, Figura 3B).

Estudios anteriores han demostrado el vínculo causal entre la recaída asociada a señales y la plasticidad sináptica evocada por la cocaína en un subtipo de neuronas NAc que expresan el DA D1R (Pascoli, Terrier et al., 2014). Por lo tanto, para evaluar esta plasticidad sináptica, generamos ratones DAT-Cre cruzados con Drd1a-tdTomato ratones para identificar el subtipo de neuronas espinosas de tamaño mediano (MSN) en el NAc. En lugar de la prueba de búsqueda, se prepararon rodajas de NAc donde D1R-MSN eran rojas, contrastando con las fibras verdes de las neuronas VTA DA infectadas con flox-ChR2-eYFP (Figura 3C). Los registros de pinza-parche de células enteras ex vivo revelaron una relación de voltaje de corriente rectificadora para las corrientes postsinápticas evocadas por AMPAR (AMPAR-EPSC) y una relación AMPAR / NMDAR aumentada (Figuras 3D y 3E), en los D1R-MSN pero no en los D2R-MSN. Se demostró que hallazgos similares obtenidos previamente después de la abstinencia de la autoadministración de cocaína indican la inserción combinada de AMPAR que carecen de GluA2 y que contienen GluA2, en entradas separadas en D1R-MSN (Pascoli, Terrier et al., 2014).

 

 

 

Autoestimulación a pesar del castigo

El consumo de sustancias a pesar de las consecuencias negativas es otra característica fundamental que define la adicción (véase la definición del DSM5, Asociación Estadounidense de Psiquiatría, 2013). Se han establecido modelos de rata (Deroche-Gamonet et al., 2004, Pelloux et al., 2007, Pelloux et al., 2015, Chen et al., 2013) donde una descarga eléctrica introducida en el programa de autoadministración de cocaína suprime la cocaína consumo en algunos animales. Después de 12 días de exposición inicial (adquisición), se permitió a los ratones tener tres sesiones adicionales en FR3 pero con un corte de sesión reducido (60 min o 40 recompensas como máximo). Estas tres sesiones sirvieron como base para las cuatro sesiones siguientes, en las que una de cada tres estimulaciones con láser se combinó con una descarga en el pie (500 ms; 0.2 mA) predicha por una nueva señal (Figura 4UNA). La intensidad y la duración del choque del pie se ajustaron para suprimir completamente la presión de la palanca para obtener una recompensa de sacarosa (consulte también los datos a continuación). El programa de castigos condujo a dos respuestas de comportamiento opuestas (Figura 4SEGUNDO). Algunos ratones dejaron de responder rápidamente cuando se introdujo el castigo (llamado "sensible"), mientras que otros continuaron respondiendo para obtener el máximo número de estimulaciones con láser y pueden considerarse "resistentes" al castigo. Los dos grupos de animales emergieron completamente al final de las cuatro sesiones de castigo (Figura 4DO). Los "ratones resistentes" mantuvieron el número de estimulaciones con láser (menos del 20% de reducción) mientras que los "ratones sensibles" redujeron la autoestimulación en más del 80%. Con estos criterios, solo se pudo asignar un animal (puntos grises). Esta observación demuestra que la actividad de explosión forzada provocada por la autoestimulación de las neuronas VTA DA es suficiente para inducir la perseverancia del consumo a pesar de las consecuencias negativas en una fracción de ratones. Como control, en un grupo independiente de ratones que habían establecido resistencia o sensibilidad al castigo asociado con la autoestimulación, se evaluó la nocicepción utilizando el ensayo de sacudida de la cola. No se detectó diferencia en la latencia para retirar la cola sumergida en agua caliente entre sensible y resistente (Figura S3).

Luego preguntamos, post hoc, si alguna característica particular durante la fase de adquisición de la autoestimulación podría haber predicho la resistencia al castigo. Los ratones sensibles y resistentes realizaron un número idéntico de presiones de palanca activas e inactivas durante las sesiones de referencia, y todos los ratones alcanzaron el máximo de 80 LS (Figuras S4A y S4B), en una cantidad de tiempo similar (Figuras S4A y S4C). Mientras que la fracción de presión de palanca activa inútil no fue de nuevo diferente en las dos subpoblaciones (Figuras 4D y S4D), el número de presiones inútiles de palanca antes del inicio de la estimulación con láser aumentó significativamente en ratones resistentes al final de las sesiones de adquisición (Figuras 4E y S4MI). A medida que este comportamiento se desarrolló durante la adquisición, puede contribuir, junto con la impulsividad innata (Economidou et al., 2009, Broos et al., 2012, Jentsch et al., 2014), a establecer la resistencia al castigo. Además, se realizó una prueba de proporción progresiva el día 11 para cuantificar la motivación para la estimulación optogenética (Richardson y Roberts, 1996). Los ratones resistentes exhibieron un punto de ruptura no estadísticamente diferente al de los ratones sensibles (Figura S4F).

Resistencia al castigo por la cocaína pero no por la sacarosa

Para probar si el paradigma del consumo a pesar de las consecuencias dañinas junto con la presión de la palanca de impulso también podría predecir la ingesta compulsiva de una droga adictiva, una nueva cohorte de ratones se sometió a 12 días de autoadministración de cocaína. Los parámetros experimentales para la adquisición de la autoadministración de cocaína se establecieron en un máximo de 80 infusiones de cocaína dentro de las 4 horas durante la adquisición y en 40 infusiones dentro de las 2 horas durante las tres sesiones iniciales que preceden a las cuatro sesiones de castigo (Figuras 5A y S5UNA). Nuevamente, dos grupos emergieron después de combinar la recompensa de cocaína con descargas eléctricas. De hecho, 5 de los ratones 22 se clasificaron como resistentes (menos del 20% de disminución con respecto al valor basal), mientras que 17 calificó como sensible (más del 80% de disminución) y un animal cayó entre (infusiones de 13 en el día 19) (Figura 5SEGUNDO). Luego buscamos predictores de comportamiento de resistencia al castigo. Entre los dos grupos, el número de infusiones, la velocidad de infusión y el número de presiones de palanca activas o inactivas no fueron diferentes (Figuras S5B – S5D), y los puntos de ruptura fueron similares (Figura S5MI). Lo que difería era la evolución de la distribución en el tiempo de las inútiles prensas en la palanca activa. En las primeras cuatro sesiones, las presiones inútiles de palanca disminuyeron regularmente durante los periodos de tiempo de espera tanto en ratones resistentes como sensibles, mientras que al final de la adquisición, solo los ratones sensibles mantuvieron este comportamiento (Figuras 5C y 5D y S5F). Por el contrario, los ratones resistentes tendieron a aumentar su número total de inútiles presiones de palanca (Figuras 5C y S5D), especialmente en el último trimestre del período de tiempo de espera (Figura 5RE). Si bien es cualitativamente similar a la observación realizada previamente con la estimulación optogenética de las neuronas DA (ver más arriba), el agrupamiento de las inútiles prensas durante el primer periodo de tiempo de espera no se observó con la cocaína, probablemente debido a la cinética más lenta con la que se administra la droga. aumento de los niveles de DA. Sin embargo, se pueden extraer conclusiones similares basadas en esta evolución singular de la distribución inútil de la presión de palanca durante el corto período de tiempo que precede a "la detección interna de la oleada DA". Por lo tanto, nuestras observaciones sugieren que la distribución de las presiones de palanca activa inútil predice el uso de drogas A pesar de las consecuencias negativas.

Finalmente, repetimos el experimento con ratones alimentados a voluntad que podían presionar con la palanca para obtener una recompensa de sacarosa. Una vez que se introdujo el castigo, todos los ratones dejaron de autoadministrarse la sacarosa (Figura 5E), demostrando que este programa suprimió la ingesta de una recompensa natural no esencial, pero permitió la detección de la ingesta compulsiva de una droga adictiva o una fuerte estimulación de la neurona DA.

En conjunto, estos resultados demuestran que la autoestimulación VTA DA es suficiente para inducir la compulsividad, como lo demuestra la resistencia al castigo en un subconjunto de ratones (68%). De manera similar, después de la cocaína SA, algunos ratones se volvieron resistentes al castigo (23%), que nunca fue el caso después de la sacarosa SA (Figura 5F).

 

 

 

Un correlato celular de la resistencia al castigo  

Para identificar el área del cerebro que puede controlar la decisión de perseverar en la autoadministración a pesar de las consecuencias negativas, primero monitoreamos la "actividad neuronal" genérica contando el número de neuronas en las que la sesión de castigo desencadenó la expresión del gen temprano inmediato cFos en 15 diferentes regiones. Los ratones fueron perfundidos intracardialmente con PFA 90 min después del final de la última sesión de castigo. Los grupos de control incluyeron animales sin tratamiento previo, así como ratones unidos a ratones sensibles o resistentes para controlar el posible efecto de confusión del número de descargas recibidas.

Mientras que en la mayoría de las regiones elegidas, el número de neuronas positivas para cFos fue mayor en los cortes de ratones resistentes en comparación con los cortes de ratones ingenuos, surgieron dos tipos de respuestas, de las cuales la corteza prelímbica (PL) y la OFC lateral son ejemplos. En el PL encontramos un aumento similar de células positivas para cFos en ratones resistentes y sus controles en yugo, mientras que en el OFC este aumento solo fue evidente en los ratones con yugo resistentes y no en los correspondientes (Figuras 6A y 6B). Para cuantificar esta diferencia, todos los datos se normalizaron primero a los niveles de expresión en animales ingenuos. Luego, la relación se calculó entre la resistencia sobre la sensibilidad dividida por el yugo a la resistencia sobre el yugo a la sensibilidad (Relacióncfos = (R / S) / (YR / YS), Figura 6SEGUNDO). Este procedimiento identificó la corteza cingulada, el OFC y el VTA como las regiones que se activan en ratones resistentes pero no en ratones sensibles y donde había poca diferencia en ambos grupos de controles en yugo (de hecho, neuronas positivas de bajo cFos similares en yugo, de hecho) . Encontrar el VTA no es sorprendente, ya que es la región de las neuronas estimuladas por láser. Esto está en línea con un informe anterior que muestra que la estimulación de ChR2 desencadena la activación de cFos (Lobo et al., 2010, Van den Oever et al., 2013). Una proporción bajacfos se encontró en regiones donde la activación fue similar en sensibilidad y resistencia (como CeA y PAG). El radiocfos también fue baja cuando la activación fue paralela a una gran diferencia en los controles enlazados (como el PL, Figura 6C para la relación resumidacfos datos). Por lo tanto, una expresión similar de cFos en ratones resistentes y con yugo resistente fue impulsada por la cantidad de choques en los pies y tuvo poco que ver con la resistencia al castigo. En conjunto, la alta relacióncfos La OFC sugiere que la actividad neuronal en esta región está asociada con la resistencia al castigo y, por lo tanto, puede favorecer la transición a la adicción.

 

 

 

La plasticidad de la resistencia al castigo.  

Para identificar el sustrato del aumento de la actividad neuronal en el OFC en los ratones que resisten el castigo, preparamos porciones de PL y L-OFC 24 horas después de la última sesión de castigo para probar la excitabilidad intrínseca. Las dos regiones se eligieron debido a su patrón muy distinto de expresión de c-Fos en los experimentos anteriores. La excitabilidad neuronal se cuantificó contando el número de potenciales de acción (AP) provocados por la inyección de cantidades crecientes de corriente (de 0 a 600 pA) en registros de células completas. Estas grabaciones revelaron una hipoexcitabilidad sostenida en las neuronas piramidales del PL de ratones resistentes (y su control en yugo) en comparación con ratones sensibles o ingenuos (Figura 7UNA). El potencial de membrana en reposo (RMP) de las neuronas registradas no fue diferente entre los grupos experimentales (Figura 7SEGUNDO). Estos resultados sugieren fuertemente que la excitabilidad de las neuronas en el PL se correlaciona directamente con el número de descargas recibidas, y tal vez no con la decisión de resistir el castigo. Esto probablemente refleja una adaptación de retroalimentación negativa provocada por la excitación neuronal provocada por los choques en los pies el día anterior. Por el contrario, las neuronas de L-OFC fueron más excitables solo en ratones resistentes. La excitabilidad de las neuronas de ratones con yugo no fue diferente a la excitabilidad de las neuronas de ratones ingenuos, descartando un efecto del shock del pie en sí mismo (Figuras 7C y 7D). Este aumento de la actividad de las neuronas OFC probablemente subyace a la expresión de cFos y puede impulsar la resistencia al castigo.

 

Reducción de la compulsividad con la inhibición quimiogenética de la OFC 

Para probar la causalidad entre la excitabilidad mejorada de la neurona OFC y la resistencia al castigo, expresamos el inhibidor DREADD (receptores de diseño activados exclusivamente por fármacos de diseño: CamKIIα-hM4D) en neuronas piramidales de la OFC de ratones DAT-Cre + (Figura 8UNA). En cortes agudos de la OFC, la aplicación en baño de CNO (clozapina-N-óxido) indujo una corriente lenta hacia el exterior, muy probablemente mediada por los canales GIRK, que se invirtió por bario (Ba2+), un bloqueador no específico de los canales de potasio (Figura 8SEGUNDO). El CNO también cambió la curva de entrada / salida a la derecha (Figura 8DO). Los ratones DAT-Cre + infectados con AAV1 / CamKIIα-hM4D-mCherry en la OFC (Figura 8D) paradigma de autoestimulación de la neurona DA adquirida seguido de dos bloques sucesivos con el horario de castigo, el primero en presencia de CNO y el segundo sin CNO. Los dos bloques fueron interrumpidos por 6 días sin castigo (Figura 8MI). Al final del primer bloque de castigo, en presencia de CNO, solo 5 de ratones 16 eran resistentes (Figura 8F, panel izquierdo). En contraste, sin inhibición de OFC, durante el segundo período de castigo, 14 de 16 se clasificó como "resistente" (Figuras 8F, panel derecho, y 8SOL). En otras palabras, la fracción de ratones resistentes fue significativamente menor en presencia de CNO en comparación con la primera cohorte de ratones 34 probados previamente en las mismas condiciones (comparación entre grupos, Figura 8H) y se volvió similar a la primera cohorte sin CNO (comparación dentro del grupo). Finalmente, para los nueve ratones que cambiaron de sensibles a resistentes, el CNO no modificó la latencia de la cola al sumergirse en agua caliente (Figura 8I).

En conjunto, este experimento demuestra que la actividad de las neuronas piramidales de la OFC impulsa la decisión de continuar la autoestimulación a pesar de las consecuencias negativas que representan una característica clave de la transición a la adicción en roedores.

Discusión 

Un modelo de adicción propuesto recientemente distingue tres pasos en la progresión de la enfermedad: el uso esporádico de drogas recreativas, seguido por el uso intensificado, sostenido y escalado de drogas y, finalmente, el uso compulsivo asociado con la pérdida de control (Piazza y Deroche-Gamonet, 2013; pero ver George et al., 2014). Nuestro estudio demuestra que la estimulación de las neuronas VTA DA es suficiente para impulsar esta progresión con un curso de tiempo relativamente rápido.

Al imitar un patrón de disparo de ráfagas que ocurre naturalmente, se evoca una liberación eficiente de DA en las regiones objetivo del VTA, como el NAc (Bass et al., 2010). Por lo tanto, los niveles de DA en el NAc probablemente gobiernan la autoestimulación, al igual que los roedores se autoadministran la siguiente infusión de cocaína o heroína una vez que la concentración de DA cae por debajo del umbral (Wise et al., 1995). Esto también está respaldado por nuestra observación de que la cocaína, inyectada por vía ip, puede ocluir la autoestimulación. Por lo tanto, la autoestimulación de la neurona DA se parece mucho a la autoadministración de drogas, aunque su cinética es ciertamente más rápida que la de cualquier sustancia farmacológica, incluida la cocaína, como sugiere la diferente tasa de respuesta observada en el presente estudio.

Si bien nos dirigimos selectivamente a las neuronas DA del VTA, su autoestimulación optogenética puede haber activado grupos de células con diferentes funciones fisiológicas. Por ejemplo, recientemente se ha sugerido que algunas neuronas DA codifican estímulos aversivos (Lammel et al., 2012, Gunaydin et al., 2014). Estas células se proyectan a mPFC, mientras que las neuronas VTA DA que se proyectan a la capa lateral de NAc median el refuerzo positivo (Lammel et al., 2012). Sería interesante evaluar la autoestimulación y la progresión con orientación selectiva (Gunaydin et al., 2014). Dado que nuestra manipulación activó todas las neuronas VTA DA, al igual que la cocaína actúa sobre todas las neuronas que expresan DAT, es concebible que algunas neuronas DA impulsarían el aprendizaje por refuerzo mientras que otras neuronas DA impulsarían el aprendizaje por aversión. El efecto neto aún sería un refuerzo del comportamiento; sin embargo, las “neuronas de aversión” podrían contribuir a la inducción de un proceso oponente (Koob, 2013, Wise y Koob, 2014).

Después de la abstinencia forzada, la reexposición al contexto indujo la búsqueda de la autoestimulación, un modelo establecido de recaída de drogas en roedores. Sorprendentemente, la plasticidad neuronal subyacente es indistinguible de la observada después de la abstinencia de la autoadministración de cocaína (Pascoli, Terrier et al., 2014). Esto se suma a un estudio que reportó previamente una plasticidad sináptica idéntica en las neuronas VTA DA evocadas por una sola sesión de estimulación óptica o una primera inyección de una droga adictiva (Brown et al., 2010). Está surgiendo un patrón de adaptaciones sinápticas que c comportamiento adaptativo común a todas las drogas adictivas.

Una característica sorprendente de nuestro estudio es la dicotomía en la respuesta a un estímulo aversivo que es lo suficientemente fuerte como para interrumpir el consumo de recompensas naturales no esenciales en todos los animales. En nuestro medio, los ratones resistentes no mostraron una motivación significativamente mayor para la autoentrega de recompensas, lo que contrasta con un estudio con cocaína en ratas (Pelloux et al., 2007). El predictor conductual de la resistencia al castigo en ratones, sin embargo, fue una inútil presión de la palanca durante los 5 s anteriores al inicio de la estimulación de la neurona DA. Por lo tanto, la incapacidad de esperar hasta la entrega de la recompensa puede verse como un marcador de impulsividad (Dalley et al., 2011, Olmstead, 2006, Everitt et al., 2008, Winstanley, 2011, Leyton y Vezina, 2014). Nos intrigó la observación de que la toma impulsiva solo se desarrolló después de varias sesiones de autoestimulación. Esto plantea la posibilidad de que la resistencia al castigo (y por extensión la vulnerabilidad a la adicción) no sea completamente innata, pero se desarrolle durante las fases iniciales hacia la adicción. Si este es el caso, entonces la dicotomía observada por nosotros y otros (Deroche-Gamonet et al., 2004) puede no estar determinada únicamente por factores genéticos. Esto también explicaría que una fracción similar de individuos se vuelve adicta a cepas de ratón genéticamente relativamente homogéneas y poblaciones humanas genéticamente más diversas.

Si la resistencia al castigo revela la vulnerabilidad individual a la adicción, estimada en un 20% superior en humanos incluso con cocaína (Warner et al., 1995, O'Brien, 1997, George et al., 2014), entonces la proporción mucho mayor encontrada aquí podría reflejar el poder de la estimulación neuronal DA directa y selectiva. En otras palabras, la estimulación selectiva de neuronas DA puede ser mucho más adictiva que cualquier droga. Esto puede explicarse por la acción no selectiva de sustancias farmacológicas. En el caso de la cocaína, por ejemplo, las monoaminas distintas del DA pueden retrasar la inducción de la adicción. De hecho, la serotonina puede oponerse a las conductas adaptativas dependientes de DA, como responder a la recompensa condicionada, la autoestimulación y la preferencia de lugar condicionada (Wang et al., 1995, Fletcher y Korth, 1999, Fletcher et al., 2002) al facilitar la asociación de señales de estímulos aversivos (Bauer, 2015, Hindi Attar et al., 2012). Alternativamente, la diferencia puede residir en la diferencia de cinética entre la autoestimulación optogenética y la inducción farmacológica del aumento de DA extracelular. Tal variación de la potencia adictiva también puede existir entre diferentes drogas de abuso (George et al., 2014).

Si bien no podemos excluir formalmente las diferencias en la liberación de DA y / o la señalización relativa para contribuir al establecimiento de la resistencia al castigo, este escenario es poco probable porque la validación histológica de la infección de los animales incluidos en el estudio mostró eYFP-ChR2 Expresión en todo el VTA. Además, el protocolo de estimulación optogenética diseñado para saturar la liberación de DA condujo a la autoestimulación que culminó en valores distribuidos de manera inimodal para el punto de ruptura, lo que refleja la motivación de incentivo.

Otro resultado sorprendente es que el número de descargas eléctricas en el pie se correlacionó con la excitabilidad de las neuronas en el PL. Se ha observado una disminución de la excitabilidad de las neuronas piramidales y un aumento de la relación AMPAR / NMDAR en las neuronas piramidales de las mismas células en "ratas adictas", pero estos estudios no controlaron el efecto de las descargas eléctricas per se (Kasanetz et al., 2010, Kasanetz et al., 2013, Chen et al., 2013). Por tanto, la no disociación puede explicarse por el doble papel de la mPFC tanto en los procesos de decisión como en la integración del miedo (Peters et al., 2009). Por el contrario, el cambio en la excitabilidad de las neuronas piramidales en la corteza infralímbica se correlaciona con los golpes del pie (Santini et al., 2008). Esta evidencia no excluye la posibilidad de que la mPFC desempeñe un papel destacado en la decisión de seguimiento de la ingesta. Sin embargo, nuestro análisis de cFos y las observaciones de la excitabilidad intrínseca apuntan a la OFC y la corteza cingulada. Además, la inhibición de la excitabilidad neuronal en el OFC con DREADD evitó la resistencia al castigo. Este vínculo causal representa un paso importante en la comprensión de los mecanismos celulares responsables de la transición a la adicción. Se necesitarán estudios futuros para probar si esto también se aplica a toda la gama de drogas adictivas.

Nuestros hallazgos están en línea con las observaciones de que una disfunción de la OFC puede afectar la toma de decisiones de costo-beneficio (Seo y Lee, 2010, Walton et al., 2010, Fellows, 2011) y puede impulsar comportamientos compulsivos (Burguière et al., 2013 ). En los seres humanos, el abuso de drogas se ha relacionado con una toma de decisiones deficiente y una función OFC alterada (Lucantonio et al., 2012, Gowin et al., 2013). En conjunto, la actividad de las neuronas OFC surge como un determinante clave para la transición al uso compulsivo de drogas (Everitt et al., 2007). Esto no excluye un papel de la plasticidad evocada por fármacos en las aferencias excitadoras en los MSN observados aquí y en otros estudios (Kasanetz et al., 2010). Será interesante evaluar si las manipulaciones destinadas a controlar la excitabilidad de la OFC afectan la motivación en los adictos.

Aquí proponemos la autoestimulación de las neuronas DA como un modelo poderoso para estudiar las etapas que conducen a la adicción. Reproducimos componentes centrales de la adicción a las drogas, como la recaída, la plasticidad sináptica y la perseverancia en el consumo a pesar de las consecuencias negativas. Si bien el modelo ciertamente no es adecuado para estudiar los efectos específicos de un fármaco dado (por ejemplo, comparar opioides con psicoestimulantes), tiene varias ventajas. Permite un control temporal preciso de la entrega de la recompensa, activa muy específicamente solo las neuronas VTA DA y, por último, pero no menos importante, brinda la posibilidad de estudiar ratones durante mucho más tiempo que con la autoadministración de fármacos. Al centrarse en la definición común de las drogas adictivas, la esperanza es desentrañar los mecanismos neuronales subyacentes también a las formas de adicción no dependientes de sustancias (Alavi et al., 2012, Robbins y Clark, 2015) y así contribuir a una teoría general de la enfermedad. Los modelos de enfermedades optogenéticas permiten así un paso decisivo para una comprensión profunda de la disfunción neuronal involucrada en las etapas tardías de la adicción y guiarán tratamientos novedosos y racionales para una enfermedad que actualmente no tiene cura.

Contribuciones de autor  

VP, JT y AH llevaron a cabo los experimentos de comportamiento, mientras que VP hizo los registros electrofisiológicos y coordinó el análisis. El estudio fue diseñado y escrito por todos los autores.

AGRADECIMIENTOS  

El trabajo fue apoyado por subvenciones de la Fundación Nacional Suiza y la subvención ERC avanzada (MeSSI), Carigest SA, la Sociedad Académica de Ginebra y la Fundación Privada de los Hopitaux Universitaires de Genève. JT es un estudiante de MD-PhD pagado por la Confederación Suiza.

 

Información suplementaria 

Documento S1. Procedimientos y figuras experimentales suplementarios S1 – S6

Tabla S1. Análisis estadístico