Suficiência da estimulação neuronal de dopamina mesolímbica para a progressão para a dependência (2015)

 

Vincent Pascoli3,Jean Terrier3,Agnès Hiver

,Christian Lüscher'Correspondência informações sobre o autor Christian Lüscherhttp://www.cell.com/templates/jsp/_style2/_marlin/images/icon_email.pngEmail o autor Christian Lüscher

DOI: http://dx.doi.org/10.1016/j.neuron.2015.10.017

Destaques

• A autoestimulação de neurônios dopaminérgicos evoca plasticidade sináptica no NAc, causando recaída

• A dopamina é suficiente para desencadear a ingestão compulsiva

• Neurônios no córtex orbitofrontal são hiperexcitáveis ​​em camundongos resistentes à punição

• A inibição quimiogenética do OFC reduz a autoestimulação compulsiva

Resumo

Os fatores que causam a transição do consumo de drogas recreativas para o vício permanecem amplamente desconhecidos. Não foi testado se a dopamina (DA) é suficiente para desencadear este processo. Aqui, usamos a autoestimulação optogenética de neurônios DA da área tegmental ventral (VTA) para imitar seletivamente a definição comum de drogas aditivas. Todos os ratos adquiriram autoestimulação prontamente. Após semanas de abstinência, a recaída induzida por sugestão foi observada em paralelo com uma potenciação de aferentes excitatórios em neurônios que expressam o receptor D1 do núcleo accumbens (NAc). Quando os ratos tiveram que suportar um leve choque elétrico nas patas para obter um estímulo, alguns pararam enquanto outros perseveraram. A resistência à punição foi associada ao aumento da atividade neural no córtex orbitofrontal (OFC), enquanto a inibição quimiogenética da OFC reduziu a compulsividade. Juntos, esses resultados mostram que a estimulação dos neurônios VTA DA induz características comportamentais e celulares de adição, indicando suficiência para a indução e progressão da doença.

Introdução

O vício é uma doença que evolui em várias etapas (Everitt et al., 2008, George et al., 2014). O diagnóstico é feito quando o uso recreativo se torna compulsivo, persistindo apesar das consequências negativas. Embora uma das principais hipóteses do vício postule que as drogas de abuso causam a doença porque aumentam excessivamente a concentração de dopamina (DA) no cérebro, não está claro se o acionamento desse sistema é suficiente para conduzir a transição do uso recreativo para o vício (Di Chiara e Bassareo, 2007, Volkow e Morales, 2015). A evidência de apoio para a hipótese DA para reforço de drogas tem se acumulado ao longo de várias décadas e depende do efeito inicial das drogas. Por exemplo, drogas aditivas reduzem o limiar para autoestimulação intracraniana (ICSS) do feixe prosencéfalo medial, um trato de fibra contendo, entre outros, projeção ascendente de DA do mesencéfalo (Stein, 1964, Crow, 1970, Kornetsky et al., 1979). Os estudos de farmacologia e lesão identificaram então o sistema DA mesocorticolímbico como a origem deste circuito (Wise e Bozarth, 1982). No final da década de 1980, uma medida direta da concentração extracelular de DA com microdiálise confirmou que as drogas aditivas compartilhavam a propriedade de evocar um pico de DA no NAc (Di Chiara e Imperato, 1988). Isso levou à proposta de uma classificação mecanicista das drogas aditivas (Lüscher e Ungless, 2006).

Muito menos se sabe sobre como esses efeitos iniciais do uso de drogas facilitam a transição para o vício. Mecanismos independentes de DA foram considerados porque drogas aditivas têm outros alvos farmacológicos. Por exemplo, a cocaína, além de inibir o transportador DA (DAT), também se liga a SERT (transportador de serotonina) e NET (transportador de norepinefrina) para diminuir a recaptação de serotonina e norepinefrina, respectivamente, aumentando assim a concentração de todas as principais monoaminas (Han e Gu, 2006, Tassin, 2008). Preocupações semelhantes podem se aplicar a outros psicoestimulantes. Além disso, há uma alegação de que os opiáceos são, pelo menos na fase inicial, independentes de DA (Badiani et al., 2011, Ting-A-Kee e van der Kooy, 2012). A hipótese DA também foi questionada com base em modelos genéticos de camundongos, onde, após interferência com o sistema DA, algumas formas de comportamento adaptativo a drogas ainda eram aparentes. Por exemplo, camundongos knockout para DAT auto-administram cocaína (Rocha et al., 1998), e abolindo a síntese de DA farmacologicamente (Pettit et al., 1984) ou geneticamente (Hnasko et al., 2007) falhou em prevenir a auto-administração de drogas ou preferência de lugar condicionado. Embora a melhor caracterização desses camundongos transgênicos e a geração de nocautes para transportadores de monoamina duplas tenham resolvido alguns desses problemas (Rocha, 2003, Thomsen et al., 2009), a suficiência de DA para desencadear características cardinais do vício é desconhecida. Para contornar questões de não especificidade, decidimos permitir que camundongos auto-estimulem neurônios VTA DA usando uma abordagem optogenética.

Estudos recentes mostraram que a ativação de neurônios DA no mesencéfalo pode induzir preferência de lugar (Tsai et al., 2009) ou reforçar o comportamento instrumental (Adamantidis et al., 2011, Witten et al., 2011, Kim et al., 2012, Rossi et al., 2013, McDevitt et al., 2014, Ilango et al., 2014). Embora esta ativação seletiva das vias DA confirme estudos de autoestimulação intracraniana (ICSS) realizados há mais de 30 anos no delineamento do sistema de recompensa (Fouriezos et al., 1978), eles falham em demonstrar a indução de comportamento adaptativo de estágio final que define o vício, nem identificou as adaptações neuronais subjacentes. Aqui, usamos a manipulação optogenética não apenas para permitir o teste direto do critério de suficiência para a sinalização DA fásica na iniciação do reforço, mas também para testar a transição para o vício.

Uma observação surpreendente sobre os estágios posteriores da doença é que mesmo com as drogas mais viciantes, apenas uma fração dos usuários torna-se viciada (Warner et al., 1995, O'Brien, 1997). Os viciados em humanos continuarão a consumir drogas apesar das consequências negativas (ver “Definição de Vício” da American Society for Addiction Medicine, DSM5, American Psychiatric Association, 2013), tipicamente relacionado a derrotas sociais e psicológicas que costumam demorar. Da mesma forma, em roedores, cerca de um em cada cinco animais que adquirem a autoadministração de cocaína são eventualmente classificados como viciados (Deroche-Gamonet et al., 2004, Kasanetz et al., 2010; mas ver George et al., 2014). A perseverança da ingestão da droga apesar das consequências negativas também pode ser modelada em roedores pela introdução de um estímulo aversivo simples na programação de consumo. Embora a doença humana seja mais complexa, associar a punição ao consumo é um modelo direto de um componente central do vício.

Aqui, usamos um leve choque nos pés para avaliar sua consequência na autoadministração de cocaína, sacarose e autoestimulação optogenética. Investigamos, ainda, se a auto-estimulação do neurônio DA pode induzir dois comportamentos relacionados à dependência - busca de recompensa associada à sugestão e compulsividade associada ao consumo, apesar de consequências negativas - e caracterizar a plasticidade neural associada a esses comportamentos.

Resultados

Aquisição da Auto-Estimulação VTA DA Neuron

 

Para controlar a atividade do neurônio DA, injetamos um vírus adeno-associado (AAV) induzível por cremação, com uma estrutura de leitura aberta invertida (DIO) com dupla flox, contendo ChR2 fundido com a proteína fluorescente amarela intensificada (eYFP) (Atasoy et al., 2008, Brown et al., 2010) no VTA de camundongos DAT-Cre. Além disso, uma fibra óptica foi colocada para direcionar o VTA (ChR2, Ver Procedimentos experimentais). Especificidade do ChR2 a expressão foi confirmada pela co-localização de eYFP com Tirosina Hidroxilase (TH), uma enzima necessária para a síntese de DA (figura 1UMA). 

Primeiro, para estabelecer o protocolo de estimulação a laser, os camundongos foram colocados em uma caixa operante onde poderiam pressionar uma alavanca ativa, que acionou uma série de estímulos a laser que foram variados (1, 2, 8, 32, 60 ou 120 rajadas) a cada duas sessões. Para emular o padrão de disparo fásico (Hyland et al., 2002, Mameli-Engvall et al., 2006, Zhang et al., 2009) tipicamente induzido por recompensa natural (Schultz, 1998), usamos a estimulação de explosão. Uma rajada consistia em cinco pulsos de laser de 4 ms, a 20 Hz, e era repetida duas vezes por segundo. Descobrimos que os ratos adaptaram seu comportamento de pressionar a alavanca em função de rajadas por estimulação a laser, controlando assim o número total de rajadas recebidas (figura 1B). Esse comportamento lembrava a autoadministração de drogas aditivas, quando a dose por infusão era variada (Piazza et al., 2000). Para os experimentos subsequentes, optamos por administrar 30 rajadas por pressão de alavanca, produzindo metade do número máximo de rajadas (figura 1B). Para imitar o atraso no aumento de DA tipicamente observado quando os medicamentos são administrados por via intravenosa (Aragona et al., 2008), atrasamos a estimulação do laser em 5 se adicionamos uma luz indicadora piscante por 10 s (figura 1C).

Durante 12 dias consecutivos, os camundongos foram autorizados a se auto-estimular um máximo de 80 vezes em 2 horas. Os camundongos aumentaram rapidamente a taxa de estimulação a laser, atingindo 80 estimulações a laser (LS) antes do final da primeira hora de uma sessão (Figuras 1D e 1E). A distinção entre a alavanca ativa e inativa foi rapidamente adquirida e o número de pressões de alavancas ativas aumentou de acordo com os crescentes cronogramas de razão fixa (FR1, 2, 3) (Figuras 1F e 1G). Em experimentos de controle usando camundongos DAT-Cre- ou camundongos que expressaram ChR2 em neurônios do ácido γ-aminobutírico (GABA) (camundongos GAD-Cre +, para atingir os neurônios inibitórios da VTA), as taxas de auto-estimulação foram baixas e continuamente diminuídas sessões. Isto também se aplicou a dois animais Cre + nos quais a validação post hoc mostrou que o VTA não estava infectado com ChR2-eYFP (não mostrado). Além disso, nenhuma discriminação entre a alavanca ativa e inativa foi detectada (Figuras S1A e S1B).

Observamos que os camundongos DAT-Cre + pressionavam mais freqüentemente na alavanca ativa do que a necessária para a estimulação do laser. Na verdade, essas prensas de alavanca ativas “fúteis” representavam mais de 30% de todas as prensas de alavancas ativas (Figura S2A) e ocorreu - conforme as sessões progrediram - principalmente entre o estímulo e o início da estimulação do laser (Figuras S2B e S2C). Este comportamento singular desenvolvido durante a aquisição e pode refletir respostas impulsivas.

Em conjunto, a atividade de burst nos neurônios VTA DA reforça fortemente a resposta da alavanca.

 

Oclusão da autoestimulação do VTA DA Neuron por cocaína

Para testar se a autoestimulação do neurônio VTA DA depende dos mesmos circuitos cerebrais que são direcionados por drogas viciantes para reforçar o comportamento, injetamos cocaína por via intraperitoneal (ip) imediatamente antes das sessões de autoestimulação (acesso gratuito ao laser por 45 min, figura 2UMA). No início do estudo, animais bem treinados pressionaram cerca de 400 vezes para obter 85 LS em 45 min sob o esquema FR3. Após a injeção de cocaína, o desempenho diminuiu significativamente de uma forma dependente da dose para cerca de 30 LS para 100 pressões de alavanca com a dose mais alta (figura 2B). Esta oclusão foi mais pronunciada durante os primeiros 30 minutos da sessão, refletindo a farmacocinética da droga (figura 2C). Este experimento indica que o reforço por autoestimulação optogenética e reforço por cocaína compartilham circuitos neurais subjacentes.

Plasticidade sináptica associada à busca após a retirada

Para comparar ainda mais a autoestimulação optogenética com drogas aditivas, perguntamos a seguir se os camundongos teriam recaída para a autoestimulação de neurônios VTA DA após várias semanas de abstinência. Uma vez que a busca de drogas associadas a sugestões é um modelo estabelecido de recaída (Epstein et al., 2006, Soria et al., 2008, Bossert et al., 2013), colocamos os ratos de volta na câmara operante 30 dias após a última auto- sessão de estimulação, onde pressionar a alavanca ativa agora acionou a luz indicadora sem estimulação por laser (figura 3UMA). O comportamento robusto de busca associado à sugestão, demonstrado por uma alta taxa de pressões de alavancas ativas, só foi aparente em camundongos com expressão de eYFP-ChR2 em neurônios VTA DA (ratos DAT-Cre +, mas não DAT-Cre−, figura 3B).

Estudos anteriores mostraram a ligação causal entre a recaída associada ao sinal e a plasticidade sináptica evocada pela cocaína em um subtipo de neurônios NAc que expressam o DA D1R (Pascoli, Terrier et al., 2014). Portanto, para avaliar essa plasticidade sináptica, geramos camundongos DAT-Cre cruzados com Drd1a-tdTomato ratos para identificar o subtipo de neurônios espinhosos (MSNs) de tamanho médio no NAc. Em vez do teste de busca, fatias do NAc foram preparadas onde os D1R-MSNs eram vermelhos, contrastando com fibras verdes de neurônios VTA DA infectados com flox-ChR2-eYFP (figura 3C). As gravações de patch-clamp de células inteiras ex vivo revelaram uma relação de tensão de corrente retificadora para correntes pós-sinápticas evocadas por AMPAR (AMPAR-EPSCs) e uma razão AMPAR / NMDAR aumentada (Figuras 3D e 3E), nos D1R-MSNs mas não nos D2R-MSNs. Descobertas semelhantes obtidas anteriormente após a retirada da autoadministração de cocaína mostraram indicar a inserção combinada de GluA2 sem e GluA2 contendo AMPARs, em entradas separadas em D1R-MSNs (Pascoli, Terrier et al., 2014).

 

 

 

Auto-estimulação apesar da punição

O uso de substâncias apesar das consequências negativas é outra característica definidora crucial do vício (ver definição do DSM5, American Psychiatric Association, 2013). Modelos de ratos foram estabelecidos (Deroche-Gamonet et al., 2004, Pelloux et al., 2007, Pelloux et al., 2015, Chen et al., 2013), onde um choque elétrico introduzido no esquema de autoadministração de cocaína suprime a cocaína consumo em alguns animais. Após 12 dias de exposição inicial (aquisição), os camundongos foram autorizados a ter três sessões adicionais no FR3, mas com um corte de sessão reduzido (60 min ou 40 recompensas no máximo). Essas três sessões serviram como base para as quatro sessões subsequentes, onde cada terceira estimulação a laser foi emparelhada com um choque no pé (500 ms; 0.2 mA) previsto por um novo sinal (figura 4UMA). A intensidade e a duração do choque do pé foram ajustadas para suprimir completamente a pressão da alavanca para recompensar a sacarose (ver também os dados abaixo). O cronograma de punição levou a duas respostas comportamentais opostas (figura 4B). Alguns ratos rapidamente pararam de responder quando a punição foi introduzida (chamada de “sensível”), enquanto outros continuaram a responder para obter o número máximo de estímulos a laser e podem ser considerados “resistentes” à punição. Os dois grupos de animais emergiram plenamente no final das quatro sessões de punição (figura 4C). “Ratos resistentes” mantiveram o número de estímulos a laser (redução menor que 20%), enquanto “camundongos sensíveis” diminuíram a autoestimulação em mais de 80%. Com estes critérios, apenas um animal (pontos cinzentos) não pode ser atribuído. Esta observação demonstra que a atividade de explosão forçada evocada pela autoestimulação de neurônios VTA DA é suficiente para induzir a perseverança do consumo, apesar das conseqüências negativas em uma fração de camundongos. Como controle, em um grupo independente de camundongos que havia estabelecido resistência ou sensibilidade ao castigo associado à autoestimulação, a nocicepção foi avaliada usando o ensaio de retirada da cauda. Não foi detectada diferença na latência para retirar a cauda imersa em água quente entre sensível e resistente (Figura S3).

Em seguida, perguntamos, post hoc, se alguma característica específica durante a fase de aquisição da autoestimulação poderia ter predito a resistência à punição. Camundongos sensíveis e resistentes fizeram um número idêntico de alavancas ativas e inativas durante as sessões de linha de base, e todos os ratos atingiram o máximo de 80 LS (Figuras S4A e S4B), em um período de tempo semelhante (Figuras S4A e S4C). Enquanto a fração da supérflua alavanca ativa fútil não foi novamente diferente nas duas sub-populações (Figuras 4D e S4D), o número de pressões de alavanca fúteis antes do início da estimulação a laser tornou-se significativamente maior em camundongos resistentes até o final das sessões de aquisição (Figuras 4E e S4E). Como esse comportamento se desenvolveu durante a aquisição, pode contribuir, juntamente com a impulsividade inata (Economidou et al., 2009, Broos et al., 2012, Jentsch et al., 2014), no estabelecimento da resistência à punição. Além disso, um ensaio de proporção progressiva foi realizado no dia 11 para quantificar a motivação para a estimulação optogenética (Richardson e Roberts, 1996). Os camundongos resistentes exibiram um ponto de interrupção não estatisticamente diferente dos camundongos sensíveis (Figura S4F).

Resistência à punição por cocaína, mas não por sacarose

Para testar se o paradigma do consumo, apesar das consequências prejudiciais, juntamente com a pressão na alavanca de impulso também poderia prever a ingestão compulsiva de uma droga viciante, uma nova coorte de camundongos passou por 12 dias de auto-administração de cocaína. Os parâmetros experimentais para aquisição de autoadministração de cocaína foram definidos para um máximo de 80 infusões de cocaína dentro de 4 horas durante a aquisição e para 40 infusões dentro de 2 horas durante as três sessões de linha de base anteriores às quatro sessões de punição (Figuras 5A e S5UMA). Mais uma vez, dois grupos surgiram depois de emparelhar a recompensa de cocaína com choques elétricos. De facto, os ratos 5 fora 22 foram classificados como resistentes (menos de 20% decréscimo da linha de base), enquanto 17 qualificado como sensível (mais de 80% diminuição) e um animal caiu entre (13 infusões no dia 19) (figura 5B). Em seguida, procuramos preditores comportamentais de resistência à punição. Entre os dois grupos, o número de infusões, a taxa de infusão e o número de alavancas ativas ou inativas não foram diferentes (Figuras S5B-S5D), e os pontos de quebra foram semelhantes (Figura S5E) O que diferiu foi a evolução da distribuição no tempo das prensas fúteis na alavanca ativa. Nas primeiras quatro sessões, as prensas de alavanca fúteis diminuíram regularmente durante os períodos de tempo limite em ambos os ratos resistentes e sensíveis, enquanto no final da aquisição, apenas os ratos sensíveis mantiveram este comportamento (Figuras 5C e 5D e S5F). Em contraste, os ratos resistentes tenderam a aumentar o número total de prensas de alavanca fúteis (Figuras 5C e S5D), especialmente no último trimestre do período de time-out (figura 5D). Embora qualitativamente semelhante à observação feita anteriormente com a estimulação optogenética de neurônios DA (ver acima), o agrupamento das prensas fúteis durante o período de tempo limite não foi visto com cocaína, provavelmente devido à cinética mais lenta com a qual a droga aumento dos níveis de DA. No entanto, conclusões similares poderiam ser tiradas com base nesta evolução singular da distribuição de imprensa de alavanca fútil durante o curto período de tempo precedendo “a detecção interna do surto de DA”. Nossas observações sugerem assim que a distribuição das pressões de alavanca ativa fúteis prediz o uso de drogas apesar das consequências negativas.

Por fim, repetimos o experimento com camundongos alimentados com ad libitum que poderiam pressionar a alavanca por uma recompensa de sacarose. Uma vez que a punição foi introduzida, todos os camundongos pararam de auto-administrar a sacarose (figura 5E), demonstrando que esta programação suprimiu a ingestão de uma recompensa natural não essencial, mas permitiu a detecção da ingestão compulsiva de uma droga aditiva ou forte estimulação do neurônio DA.

Em conjunto, esses resultados demonstram que a autoestimulação de VTA DA é suficiente para induzir a compulsividade, como mostrado pela resistência à punição em um subgrupo de camundongos (68%). Da mesma forma, após a cocaína SA, alguns ratos tornaram-se resistentes à punição (23%), o que nunca foi o caso após a sacarose SA (figura 5F).

 

 

 

Um Correlato Celular de Resistência à Punição  

Para localizar a área do cérebro que pode controlar a decisão de perseverar na autoadministração apesar das consequências negativas, primeiro monitoramos a "atividade neuronal" genérica contando o número de neurônios em que a sessão de punição desencadeou a expressão do gene precoce cFos imediato em 15 diferentes regiões. Os camundongos foram perfundidos intracardialmente com PFA 90 min após o final da última sessão de punição. Os grupos de controle incluíram animais ingênuos, bem como camundongos acasalados com camundongos sensíveis ou resistentes para controlar o possível efeito de confusão do número de choques recebidos.

Enquanto na maioria das regiões escolhidas, o número de neurônios positivos para cFos foi maior em cortes de camundongos resistentes em comparação com fatias de camundongos ingênuos, dois tipos de respostas emergiram, dos quais o córtex pré-límbico (PL) e OFC lateral são exemplos. No PL, encontramos um aumento similar de células positivas para cFos em camundongos resistentes e seus controles, enquanto que no OFC esse aumento foi aparente apenas nos camundongos resistentes e não nos correspondentes (Figuras 6A e 6B). Para quantificar essa diferença, todos os dados foram primeiramente normalizados para os níveis de expressão em animais ingênuos. Em seguida, calculou-se a razão entre a resistência super-sensível dividida pelo jusante ao resistente ao jugo ao sensível (Razãocfos = (R / S) / (YR / YS), figura 6B). Este procedimento identificou o córtex cingulado, o OFC e o VTA como as regiões que são ativadas em camundongos resistentes, mas não em camundongos sensíveis, e onde havia pouca diferença em ambos os grupos de controles em yoked (neurônios cFos-positivos semelhantes em yoked) . Encontrar o VTA não é surpreendente, pois é a região dos neurônios estimulados por laser. Isso está de acordo com um relatório anterior mostrando que a estimulação de ChR2 desencadeia a ativação de cFos (Lobo et al., 2010, Van den Oever et al., 2013). Uma proporção baixacfos foi encontrado em regiões onde a ativação foi semelhante em sensível e resistente (como CeA e PAG). O ráciocfos também foi baixo quando a ativação foi acompanhada por uma alta diferença nos controles yoked (como o PL, figura 6C por razão resumidacfos dados). Uma expressão similar de cFos em camundongos resistentes e resistentes a jugo foi, portanto, provavelmente impulsionada pelo número de choques de pé e teve pouco a ver com a resistência à punição. Em conjunto, a alta proporçãocfos no OFC sugere que a atividade neural nessa região está associada à resistência à punição e pode, assim, favorecer a transição para o vício.

 

 

 

Plasticidade para Resistência à Punição  

Para identificar o substrato do aumento da atividade neuronal no OFC nos camundongos resistindo à punição, preparamos fatias de PL e L-OFC 24 horas após a última sessão de punição para testar a excitabilidade intrínseca. As duas regiões foram escolhidas devido ao seu padrão muito distinto de expressão de c-Fos nas experiências anteriores. A excitabilidade neuronal foi quantificada pela contagem do número de potenciais de ação (APs) eliciados pela injeção de quantidades crescentes de corrente (de 0 a 600 pA) em registros de células inteiras. Essas gravações revelaram uma hipo-excitabilidade sustentada em neurônios piramidais do PL de camundongos resistentes (e seu controle em jugo) quando comparados a camundongos sensíveis ou ingênuos (figura 7UMA). O potencial de membrana em repouso (RMP) dos neurônios registrados não foi diferente entre os grupos experimentais (figura 7B). Esses resultados sugerem fortemente que a excitabilidade dos neurônios no LP está diretamente correlacionada com o número de choques recebidos, e talvez não com a decisão de resistir à punição. Isso provavelmente reflete uma adaptação de feedback negativo desencadeada pela excitação neuronal provocada pelos choques do pé no dia anterior. Por outro lado, os neurônios da L-OFC eram mais excitáveis ​​apenas em camundongos resistentes. A excitabilidade dos neurônios de ratos não foi diferente da excitabilidade dos neurônios de camundongos ingênuos, descartando um efeito do próprio choque do pé (Figuras 7C e 7D). Esta atividade aumentada de neurônios OFC provavelmente está por trás da expressão cFos e pode levar à resistência à punição.

 

Redução da Compulsividade com Inibição Quimiogenética de OFC 

Para testar a causalidade entre a excitabilidade aumentada dos neurônios OFC e a resistência à punição, expressamos o DREADD inibitório (receptores projetados exclusivamente ativados por drogas planejadas: CamKIIα-hM4D) em neurônios piramidais do OFC de camundongos DAT-Cre + (figura 8UMA). Em fatias agudas do OFC, a aplicação do CNO no banho (clozapina-N-óxido) induziu uma corrente de saída lenta, provavelmente mediada pelos canais GIRK, que foi revertida pelo bário (Ba2+), um bloqueador inespecífico de canais de potássio (figura 8B). O CNO também mudou a curva de entrada / saída para a direita (figura 8C). Os camundongos DAT-Cre + infectados com AAV1 / CamKIIα-hM4D-mCherry na OFC (figura 8D) paradigma de autoestimulação do neurônio DA adquirido seguido de dois blocos sucessivos com o esquema de punição, o primeiro na presença de CNO e o segundo sem CNO. Os dois blocos foram interrompidos por 6 dias sem punição (figura 8E) No final do primeiro bloqueio de punição, na presença de CNO, apenas os ratos 5 16 eram resistentes (figura 8F, painel esquerdo). Em contraste, sem inibição de OFC, durante o segundo período de punição, 14 fora de 16 foram classificados como “resistentes” (Figuras 8F, painel direito e 8G). Em outras palavras, a fração de camundongos resistentes foi significativamente menor na presença de CNO em comparação com a primeira coorte de camundongos 34 testados anteriormente nas mesmas condições (comparação entre grupos, figura 8H) e tornou-se semelhante à primeira coorte sem CNO (comparação dentro do grupo). Finalmente, para os nove ratos que mudaram de sensíveis para resistentes, o CNO não modificou a latência do movimento da cauda após a imersão em água quente (figura 8I).

Em conjunto, este experimento demonstra que a atividade dos neurônios piramidais do OFC impulsiona a decisão de continuar a autoestimulação, apesar das consequências negativas que representam uma característica fundamental da transição para o vício em roedores.

Discussão 

Um modelo de vício proposto recentemente distingue três etapas na progressão da doença: uso esporádico de drogas recreativas, seguido por uso intensivo, sustentado e escalonado de drogas e, eventualmente, uso compulsivo associado à perda de controle (Piazza e Deroche-Gamonet, 2013; mas veja George et al., 2014). Nosso estudo demonstra que a estimulação dos neurônios VTA DA é suficiente para conduzir essa progressão com um curso de tempo relativamente rápido.

Ao simular um padrão de disparo intermitente que ocorre naturalmente, uma liberação eficiente de DA é evocada em regiões-alvo do VTA, como o NAc (Bass et al., 2010). Os níveis de DA no NAc, portanto, provavelmente governam a autoestimulação, assim como os roedores auto-administram a próxima infusão de cocaína ou heroína assim que a concentração de DA cai abaixo do limite (Wise et al., 1995). Isso também é corroborado por nossa observação de que a cocaína, injetada ip, pode obstruir a autoestimulação. Assim, a autoestimulação do neurônio DA se assemelha muito à autoadministração de drogas, embora sua cinética seja certamente mais rápida do que qualquer substância farmacológica, incluindo a cocaína, conforme sugerido pelas diferentes taxas de respostas observadas no presente estudo.

Embora tenhamos direcionado seletivamente os neurônios DA do VTA, sua autoestimulação optogenética pode ter ativado grupos de células com diferentes funções fisiológicas. Por exemplo, recentemente foi sugerido que alguns neurônios DA codificam para estímulos aversivos (Lammel et al., 2012, Gunaydin et al., 2014). Essas células se projetam para mPFC, enquanto os neurônios VTA DA se projetam para a camada NAc lateral medeiam o reforço positivo (Lammel et al., 2012). Seria interessante avaliar a autoestimulação e progressão com direcionamento seletivo (Gunaydin et al., 2014). Uma vez que nossa manipulação ativou todos os neurônios VTA DA, assim como a cocaína atua em todos os neurônios que expressam DAT, é concebível que alguns neurônios DA conduzam o aprendizado por reforço, enquanto outros neurônios DA impulsionam o aprendizado de aversão. O efeito líquido ainda seria um reforço do comportamento; entretanto, os “neurônios de aversão” poderiam contribuir para a indução de um processo adversário (Koob, 2013, Wise e Koob, 2014).

Após a abstinência forçada, a reexposição ao contexto induziu a busca da autoestimulação, um modelo roedor estabelecido de recaída da droga. Notavelmente, a plasticidade neural subjacente é indistinguível daquela observada após a retirada da autoadministração de cocaína (Pascoli, Terrier et al., 2014). Isso se soma a um estudo que relatou anteriormente plasticidade sináptica idêntica em neurônios VTA DA evocados por uma única sessão de estimulação óptica ou uma primeira injeção de uma droga aditiva (Brown et al., 2010). Está surgindo um padrão de adaptações sinápticas que c um comportamento adaptativo comum a todas as drogas que causam dependência.

Uma característica marcante de nosso estudo é a dicotomia na resposta a um estímulo aversivo que é forte o suficiente para interromper o consumo de recompensa natural não essencial em todos os animais. Em nosso meio, camundongos resistentes não mostraram uma motivação significativamente maior para a auto-entrega de recompensa, o que contrasta com um estudo com cocaína em ratos (Pelloux et al., 2007). O preditor comportamental para resistência à punição em camundongos, no entanto, foi inútil pressionar a alavanca durante os 5 s anteriores ao início da estimulação do neurônio DA. A incapacidade de esperar até a entrega da recompensa pode, portanto, ser vista como um marcador de impulsividade (Dalley et al., 2011, Olmstead, 2006, Everitt et al., 2008, Winstanley, 2011, Leyton e Vezina, 2014). Ficamos intrigados com a observação de que a tomada impulsiva só se desenvolveu após várias sessões de autoestimulação. Isso levanta a possibilidade de que a resistência à punição (e, por extensão, a vulnerabilidade ao vício) pode não ser totalmente inata, mas se desenvolve durante as fases iniciais em direção ao vício. Se for esse o caso, então a dicotomia observada por nós e outros (Deroche-Gamonet et al., 2004) pode não ser determinada apenas por fatores genéticos. Isso também explicaria que uma fração semelhante de indivíduos torna-se viciada em linhagens de camundongos geneticamente relativamente homogêneas e em populações humanas geneticamente mais diversas.

Se a resistência à punição revela a vulnerabilidade individual ao vício, estimada em 20% em humanos, mesmo com cocaína (Warner et al., 1995, O'Brien, 1997, George et al., 2014), então a proporção muito maior encontrada aqui poderia refletir o poder da estimulação de neurônios DA direta e seletiva. Em outras palavras, a estimulação seletiva do neurônio DA pode ser muito mais viciante do que qualquer droga. Isso pode ser explicado pela ação não seletiva de substâncias farmacológicas. No caso da cocaína, por exemplo, outras monoaminas além da DA podem, na verdade, retardar a indução do vício. Na verdade, a serotonina pode se opor a comportamentos adaptativos dependentes de DA, como responder por recompensa condicionada, autoestimulação e preferência de lugar condicionada (Wang et al., 1995, Fletcher e Korth, 1999, Fletcher et al., 2002), facilitando a associação de pistas para estímulos aversivos (Bauer, 2015, Hindi Attar et al., 2012). Alternativamente, a diferença pode residir na diferença de cinética entre a autoestimulação optogenética e a indução farmacológica do aumento de DA extracelular. Essa variação da potência viciante também pode existir entre diferentes drogas de abuso (George et al., 2014).

Embora não possamos excluir formalmente as diferenças na liberação do DA e / ou sinalização relativa para contribuir para o estabelecimento da resistência à punição, esse cenário é improvável porque a validação histológica da infecção dos animais incluídos no estudo mostrou eYFP-ChR2 expressão em todo o VTA. Além disso, o protocolo de estimulação optogenética projetado para saturar a liberação de DA levou à autoestimulação que culminou em valores distribuídos unimodalmente para o ponto de ruptura, refletindo a motivação de incentivo.

Outro resultado surpreendente é que o número de choques elétricos no pé se correlacionou com a excitabilidade dos neurônios no LP. A diminuição da excitabilidade dos neurônios piramidais e o aumento da razão AMPAR / NMDAR em neurônios piramidais das mesmas células foram observados em "ratos viciados", mas esses estudos não controlaram o efeito dos choques elétricos per se (Kasanetz et al., 2010, Kasanetz et al., 2013, Chen et al., 2013). A não dissociação pode, portanto, ser explicada pelo papel duplo do mPFC tanto nos processos de decisão quanto na integração do medo (Peters et al., 2009). Pelo contrário, a mudança na excitabilidade dos neurônios piramidais no córtex infralímbico se correlaciona com choques nos pés (Santini et al., 2008). Esta evidência não exclui a possibilidade de que o mPFC desempenhe um papel proeminente na decisão de busca de entrada. No entanto, nossa análise cFos e observações de excitabilidade intrínseca apontam para a OFC e o córtex cingulado. Além disso, a inibição da excitabilidade neuronal na OFC com DREADD impediu a resistência à punição. Esta ligação causal representa um passo importante na compreensão dos mecanismos celulares responsáveis ​​pela transição para o vício. Estudos futuros serão necessários para testar se isso também se aplica a toda a gama de drogas que causam dependência.

Nossos resultados estão de acordo com as observações de que uma disfunção do OFC pode prejudicar a tomada de decisão de custo-benefício (Seo e Lee, 2010, Walton et al., 2010, Fellows, 2011) e pode conduzir a comportamentos compulsivos (Burguière et al., 2013 ) Em humanos, o abuso de drogas tem sido associado à tomada de decisão prejudicada e à função OFC alterada (Lucantonio et al., 2012, Gowin et al., 2013). Tomados em conjunto, a atividade dos neurônios OFC emerge como um determinante chave para a transição para o uso compulsivo de drogas (Everitt et al., 2007). Isso não exclui um papel para a plasticidade evocada por drogas em aferentes excitatórios em MSNs observada aqui e em outros estudos (Kasanetz et al., 2010). Será interessante avaliar se as manipulações com o objetivo de controlar a excitabilidade da OFC afetam a motivação em adictos.

Aqui, propomos a autoestimulação do neurônio DA como um modelo poderoso para estudar os estágios que levam ao vício. Reproduzimos os principais componentes do vício em drogas, como recaída, plasticidade sináptica e perseverança no consumo, apesar das consequências negativas. Embora o modelo certamente não seja adequado para estudar os efeitos específicos de uma determinada droga (por exemplo, comparar opióides a psicoestimulantes), ele tem várias vantagens. Permite um controle temporal preciso da entrega da recompensa, ativa muito especificamente apenas os neurônios VTA DA e, por último, mas não menos importante, dá a possibilidade de estudar camundongos por muito mais tempo do que com a autoadministração de fármacos. Ao focar na definição de comunalidade de drogas aditivas, a esperança é desvendar os mecanismos neurais subjacentes também às formas de dependência não dependentes de substâncias (Alavi et al., 2012, Robbins e Clark, 2015) e, assim, contribuir para uma teoria geral de a doença. Modelos de doenças optogenéticas, portanto, permitem um passo decisivo para uma compreensão completa da disfunção neuronal envolvida nos estágios finais da adição e irão guiar novos tratamentos racionais para uma doença atualmente sem cura.

Contribuições do autor  

VP, JT e AH realizaram os experimentos comportamentais enquanto VP fez os registros eletrofisiológicos e coordenou a análise. O estudo foi projetado e escrito por todos os autores.

Agradecimentos  

O trabalho foi apoiado por doações da Fundação Nacional da Suíça e do subsídio avançado do ERC (MeSSI), da Carigest SA, da Sociedade Acadêmica de Genebra e da Fondation Privée des Hopitaux Universitaires de Genève. JT é um estudante de MD-PhD pago pela Confederação Suíça.

 

Informação complementar 

Documento S1. Procedimentos Experimentais Suplementares e Figuras S1-S6

Tabela S1. Análise estatística