As misteriosas funções motivacionais da dopamina mesolímbica (2012)

John D. Salamone, Mercè Correa

Neuron - 8 de novembro de 2012 (Vol. 76, Edição 3, pp. 470-485)

Resumo

Sabe-se que o Nucleus accumbens dopamine desempenha um papel nos processos motivacionais, e as disfunções da dopamina mesolímbica podem contribuir para os sintomas motivacionais da depressão e outros distúrbios, bem como para as características do abuso de substâncias. Embora tenha se tornado tradicional rotular os neurônios dopaminérgicos como neurônios de "recompensa", isso é uma supergeneralização, e é importante distinguir entre os aspectos da motivação que são diferencialmente afetados pelas manipulações dopaminérgicas. Por exemplo, a dopamina accumbens não medeia a motivação ou apetite alimentar primário, mas está envolvida em processos motivacionais apetitivos e aversivos, incluindo ativação comportamental, esforço de esforço, comportamento de abordagem, envolvimento contínuo de tarefa, processos pavlovianos e aprendizado instrumental. Nesta revisão, discutimos os papéis complexos da dopamina nas funções comportamentais relacionadas à motivação.

Texto principal

Nucleus accumbens dopamine (DA) tem sido implicado em várias funções comportamentais relacionadas à motivação. No entanto, as especificidades desse envolvimento são complexas e, às vezes, podem ser difíceis de serem desenredadas. Uma consideração importante na interpretação desses achados é a capacidade de distinguir entre diversos aspectos da função motivacional que são diferencialmente afetados por manipulações dopaminérgicas. Embora os neurônios tegmentares ventrais tenham sido tradicionalmente rotulados como neurônios de recompensa e DA mesolímbica, referido como sistema de recompensa, essa generalização vaga não é correspondida pelos achados específicos que foram observados. O significado científico do termo “recompensa” não é claro, e sua relação com conceitos como reforço e motivação é freqüentemente mal definida. Estudos farmacológicos e de depleção de DA demonstram que o DA mesolímbico é crítico para alguns aspectos da função motivacional, mas de pouca ou nenhuma importância para outros. Algumas das funções motivacionais da AD mesolímbica representam áreas de sobreposição entre aspectos da motivação e características do controle motor, o que é consistente com o conhecido envolvimento do nucleus accumbens na locomoção e processos relacionados. Além disso, apesar de uma enorme literatura ligando a DA mesolímbica a aspectos de motivação e aprendizagem aversivas, uma literatura que remonta a várias décadas (por exemplo, Salamone et al., 1994), a tendência estabelecida tem sido enfatizar o envolvimento dopaminérgico em recompensa, prazer, vício e aprendizagem relacionada à recompensa, com menor consideração do envolvimento da DA mesolímbica em processos aversivos. A presente revisão discutirá o envolvimento da DA mesolímbica em diversos aspectos da motivação, com ênfase em experimentos que interferem na transmissão da DA, particularmente no nucleus accumbens.

DA Mesolímbica e Motivação: A Mudança do Cenário Teórico

Se nada mais, os humanos são contadores de histórias inveterados; afinal de contas, somos descendentes de pessoas que se sentavam ao redor do fogo à noite, sendo regaladas por vívidos mitos, contos e histórias orais. A memória humana é mais eficaz se fatos ou eventos aleatórios podem ser tecidos na tapeçaria significativa de uma história coerente. Os cientistas não são diferentes. Uma palestra universitária eficaz, ou um seminário científico, costuma ser chamada de "uma boa história" O mesmo ocorre com as hipóteses e teorias científicas. Nosso cérebro parece almejar a ordem e a coerência do pensamento oferecidas por uma hipótese científica simples e clara, apoiada apenas por evidências suficientes para torná-la plausível. O problema é: e se a coerência da história estiver sendo aprimorada pela interpretação exagerada de algumas descobertas e pela ignorância de outras? Gradualmente, as peças do quebra-cabeça que não se encaixam continuam a corroer o todo, eventualmente tornando toda a história lamentavelmente inadequada.

Pode-se argumentar que esse tipo de evolução ocorreu no que diz respeito à hipótese DA de "recompensa". Uma “história” poderia ser construída, que ocorreria da seguinte forma: o principal sintoma da depressão é a anedonia, e como a DA é um “transmissor de recompensa” que medeia as reações hedônicas, então a depressão se deve a uma redução da experiência de prazer regulada pela DA . Da mesma forma, foi sugerido que o vício em drogas depende da experiência de prazer induzida por drogas que sequestram o "sistema de recompensa" do cérebro, que é mediado pela transmissão de DA e evoluiu para transmitir o prazer produzido por estímulos naturais, como comida. Isso até sugeriria que o bloqueio dos receptores DA poderia oferecer um tratamento eficaz para o vício. Finalmente, pode-se também oferecer uma “história” construída com base na premissa de que os neurônios DA respondem exclusivamente a estímulos prazerosos, como alimentos, e que essa atividade medeia a resposta emocional a esses estímulos, que por sua vez está subjacente ao apetite para o consumo alimentar. Essas histórias não são “espantalhos” artificialmente construídos para essas passagens. Mas, infelizmente, apesar de sua popularidade, nenhuma dessas idéias é totalmente apoiada por um exame atento da literatura.

Para tomar o exemplo do envolvimento dopaminérgico na depressão, pode-se começar a desconstruir essa idéia apontando que a “anedonia” na depressão é freqüentemente mal interpretada ou rotulada erroneamente pelos clínicos (Treadway e Zald, 2011). Vários estudos mostram que as pessoas deprimidas geralmente têm uma experiência auto-avaliada relativamente normal de encontros com estímulos prazerosos e que, acima de qualquer problema com a experiência do prazer, as pessoas deprimidas parecem ter prejuízos na ativação comportamental, comportamento de busca de recompensa e esforço de esforço (Treadway e Zald, 2011). De fato, a maioria das pessoas deprimidas sofre de uma constelação incapacitante de deficiências motivacionais que incluem retardo psicomotor, anergia e fadiga (Demyttenaere et al., 2005; Salamone et al., 2006) e evidências consideráveis ​​implicam DA nesses sintomas (Salamone et al., 2006, Salamone et al., 2007). Estas observações, juntamente com a literatura indicando que não há uma correspondência simples entre a atividade DA e a experiência hedônica (por exemplo, Smith et al., 2011) e os estudos relacionando DA à ativação comportamental e ao esforço (Salamone et al., 2007; ver discussão abaixo), levar a concluir que o envolvimento dopaminérgico na depressão parece ser mais complicado do que a simples história teria permitido.

Da mesma forma, é claro que um corpo substancial de pesquisas sobre dependência e dependência de drogas não está de acordo com os princípios tradicionais da hipótese de recompensa da AD. Vários estudos demonstraram que o bloqueio dos receptores DA ou a inibição da síntese de DA não atenua consistentemente a euforia autorreferida ou “alta” induzida por drogas de abuso (Gawin, 1986; Brauer e De Wit, 1997; Haney et al., 2001; Nann-Vernotica et al., 2001; Wachtel et al., 2002; Leyton et al., 2005; Venugopalan et al., 2011). Pesquisas recentes identificaram diferenças individuais nos padrões comportamentais demonstrados por ratos durante o condicionamento da abordagem pavloviana, que estão relacionados à propensão de se autoadministrar drogas. Ratos que mostram maior resposta a estímulos condicionados (rastreadores de sinais) exibem diferentes padrões de adaptação dopaminérgica ao treinamento em comparação com animais que são mais responsivos ao reforçador primário (rastreadores de objetivo; Flagel et al., 2007). Curiosamente, os ratos que apresentam maior abordagem pavloviana condicionada a um estímulo apetitivo e demonstram maior condicionamento de incentivo a estímulos de drogas, também tendem a mostrar maior medo em resposta a pistas que predizem o choque e maior condicionamento contextual ao medo (Morrow et al., 2011). Pesquisas adicionais desafiaram algumas visões de longa data sobre os mecanismos neurais subjacentes ao vício, em oposição às características iniciais de reforço das drogas. Tornou-se mais comum ver o vício em termos de mecanismos de formação de hábito neostriatais construídos após a extensa toma de drogas, que pode ser relativamente independente das contingências de reforço instrumental ou das características motivacionais iniciais dos reforçadores de drogas (Kalivas, 2008; Belin et al., 2009). Essas visões emergentes sobre a base neural da dependência de drogas, e seu tratamento potencial, foram muito além da história original oferecida pela hipótese DA de “recompensa”.

Após décadas de pesquisa e desenvolvimentos teóricos contínuos, houve uma substancial reestruturação conceitual no campo da pesquisa da AD. Evidências consideráveis ​​indicam que a interferência na transmissão de DA mesolímbica deixa aspectos fundamentais da resposta motivacional e hedônica a alimentos intactos (Berridge, 2007; Berridge e Kringelbach, 2008; Salamone et al., 2007). Medidas comportamentais, como pontos de quebra da relação progressiva e limiares de autoestimulação, que antes eram considerados úteis como marcadores das funções de “recompensa” ou “hedonia” da DA, são agora considerados como refletindo processos que envolvem esforço, percepção de esforço. relacionados ou custos de oportunidade, e tomada de decisão (Salamone, 2006; Hernandez et al., 2010). Vários trabalhos recentes de eletrofisiologia demonstraram capacidade de resposta de neurônios DA tegmentares ventrais presumidos ou identificados a estímulos aversivos (Anstrom e Woodward, 2005; Brischoux et al., 2009; Matsumoto e Hikosaka, 2009; Bromberg-Martin et al., 2010; Schultz, 2010; Lammel et al., 2011). Muitos investigadores agora enfatizam o envolvimento de DA mesolímbico e nigrostriatal na aprendizagem de reforço ou formação de hábito (Sábio, 2004; Yin et al., 2008; Belin et al., 2009), ao invés de hedonia per se. Todas essas tendências contribuíram para uma reescrita dramática da história do envolvimento dopaminérgico na motivação.

Processos Motivacionais: Antecedentes Históricos e Conceituais

O termo motivação refere-se a um constructo amplamente utilizado em psicologia, psiquiatria e neurociência. Como é o caso de muitos conceitos psicológicos, a discussão sobre motivação teve suas origens na filosofia. Ao descrever os fatores causais que controlam o comportamento, o filósofo alemão Schopenhauer, 1999 discutimos o conceito de motivação em relação à maneira como os organismos devem estar em posição de “escolher, aproveitar e até buscar os meios de satisfação”. A motivação também foi uma área vital de interesse durante o desenvolvimento inicial da psicologia. Os primeiros psicólogos científicos, incluindo Wundt e James, incluíram a motivação como assunto em seus livros didáticos. Neocomportamentalistas, como Hull e Spence, frequentemente empregavam conceitos motivacionais, como incentivo e motivação. Jovem, 1961 definiu motivação como “o processo de despertar ações, sustentar a atividade em andamento e regular o padrão de atividade”. De acordo com uma definição mais recente, motivação é “o conjunto de processos pelos quais os organismos regulam a probabilidade, proximidade e disponibilidade de estímulos. ”(Salamone, 1992). De um modo geral, o moderno construto psicológico de motivação refere-se aos processos comportamentalmente relevantes que permitem aos organismos regular seu ambiente externo e interno (Salamone, 2010).

Talvez a principal utilidade do construto da motivação é que ele fornece um resumo conveniente e estrutura organizacional para características observáveis ​​de comportamento (Salamone, 2010). Comportamento é direcionado para ou longe de estímulos específicos, bem como atividades que envolvem a interação com esses estímulos. Os organismos buscam o acesso a algumas condições de estímulo (ou seja, comida, água, sexo) e evitam outros (isto é, dor, desconforto), tanto de maneira ativa quanto passiva. Além disso, o comportamento motivado geralmente ocorre em fases (Tabela 1). O estágio terminal do comportamento motivado, que reflete a interação direta com o objetivo do estímulo, é comumente referido como a fase consumatória. A palavra “consumador” (Craig, 1918) não se refere a “consumo”, mas sim a “consumação”, que significa “completar” ou “terminar”. Em vista do fato de que os estímulos motivacionais geralmente estão disponíveis em alguma distância física ou psicológica do organismo, A única maneira de obter acesso a esses estímulos é se envolver em comportamentos que os aproximem ou tornem sua ocorrência mais provável. Esta fase do comportamento motivado é muitas vezes referida como “apetitiva”, “preparatória”, “instrumental”, “abordagem” ou “busca”. Assim, os pesquisadores às vezes distinguem entre “pegar” versus “buscar” um estímulo natural como comida (por exemplo, Foltin, 2001) ou de um reforçador de drogas; de fato, o termo “comportamento de busca de drogas” se tornou uma expressão comum na linguagem da psicofarmacologia. Como discutido abaixo, esse conjunto de distinções (por exemplo, instrumental versus consumatório ou busca versus aceitação) é importante para entender os efeitos das manipulações dopaminérgicas na motivação para estímulos naturais, como alimentos.

Além dos aspectos “direcionais” da motivação (isto é, que o comportamento é direcionado para ou longe de estímulos), o comportamento motivado também é dito ter aspectos “ativistas” (Cofer e Appley, 1964; Salamone, 1988, Salamone, 2010; Parkinson et al., 2002; Tabela 1). Como os organismos são geralmente separados de estímulos motivacionais por uma longa distância, ou por vários obstáculos ou custos de resposta, envolver-se em comportamento instrumental geralmente envolve trabalho (por exemplo, forrageamento, corrida de labirinto, pressionar a alavanca). Os animais devem alocar recursos consideráveis ​​para o comportamento de busca de estímulo, que, portanto, pode ser caracterizado por um esforço substancial, ou seja, velocidade, persistência e altos níveis de produção de trabalho. Embora o esforço desse esforço possa às vezes ser relativamente breve (por exemplo, um predador atacando sua presa), sob muitas circunstâncias ele deve ser mantido por longos períodos de tempo. As capacidades relacionadas aos esforços são altamente adaptáveis, porque no ambiente natural a sobrevivência pode depender da medida em que um organismo supera os custos de resposta relacionados ao tempo ou ao trabalho. Por essas razões, a ativação comportamental tem sido considerada um aspecto fundamental da motivação há várias décadas. Os psicólogos há muito utilizam os conceitos de impulso e incentivo para enfatizar os efeitos energizantes das condições motivacionais nas medidas de comportamento instrumental, como a velocidade de corrida em um labirinto. Cofer e Appley, 1964 sugeriu que havia um mecanismo de antecipação-revigoramento que poderia ser ativado por estímulos condicionados e que funcionava para revigorar o comportamento instrumental. A apresentação não contingente programada de estímulos motivacionais primários, como pelotas de reforço alimentar, pode induzir várias atividades, incluindo bebida, locomoção e corrida de roda (Robbins e Koob, 1980; Salamone, 1988). Vários pesquisadores estudaram o impacto dos requisitos de trabalho no desempenho de tarefas instrumentais, o que, em última análise, ajudou a estabelecer as bases para o desenvolvimento de modelos econômicos de comportamento operante (por exemplo, Hursh et al., 1988). Os etologistas também empregaram conceitos semelhantes. Animais forrageiros precisam gastar energia para ter acesso a comida, água ou material de nidificação, e a teoria ótima de forrageamento descreve como a quantidade de esforço ou tempo gasto para obter esses estímulos é um importante determinante do comportamento de escolha.

Existe um grau considerável de sobreposição conceitual entre os processos de controle motor e os aspectos ativacionais da motivação. Por exemplo, a privação de comida pode acelerar a velocidade de corrida em um labirinto. Isso reflete as condições que são motivacionais, motoras ou alguma combinação das duas? A atividade locomotora está claramente sob o controle dos sistemas neurais que regulam o movimento. No entanto, a atividade locomotora em roedores também é muito sensível ao impacto de condições motivacionais, como novidades, privação de comida ou apresentação periódica de pequenos grânulos de comida. Além disso, se um organismo enfrenta um desafio relacionado ao trabalho durante a execução instrumental, ele geralmente responde a esse desafio exercendo um maior esforço. O aumento dos requisitos de razão nos esquemas operantes, até certo ponto, pode criar pressões ascendentes substanciais nas taxas de resposta. Enfrentar um obstáculo, como uma barreira em um labirinto, pode fazer com que os roedores aumentem o esforço e pule a barreira. Além disso, a apresentação de um estímulo condicionado pavloviano associado a um estímulo motivacional primário, como comida, pode servir para instigar a abordagem ou amplificar a atividade instrumental, um efeito conhecido como transferência pavloviana para instrumental (Colwill e Rescorla, 1988). Assim, os sistemas neurais que regulam a saída do motor parecem operar sob o comando daqueles sistemas neurais que direcionam o comportamento para ou fora de estímulos particulares (Salamone, 2010). É claro que os termos “controle motor” e “motivação” não significam exatamente a mesma coisa, e é fácil encontrar pontos de não-sobreposição. No entanto, é evidente que também existe uma sobreposição fundamental (Salamone, 1992, Salamone, 2010). À luz desta observação, é informativo considerar que as palavras inglesas motivação e movimento são derivadas da palavra latina. movere, para mover (isto é, moti é o particípio passado de movere). Assim como na distinção entre comportamento instrumental versus comportamento consu- midor (ou busca versus aceitação), a diferenciação entre aspectos ativi- ciais e direcionais da motivação é amplamente usada para descrever os efeitos das manipulações dopaminérgicas (Tabela 1). A natureza diversa dos processos motivacionais é uma característica importante da literatura que discute os efeitos comportamentais das manipulações dopaminérgicas, bem como o enfoque na atividade dinâmica dos neurônios mesolímbicos DA.

Natureza Dissociativa dos Efeitos da Interferência na Transmissão do Nucleus Accumbens DA

Ao tentar entender a literatura sobre as funções motivacionais do accumbens DA, devemos considerar vários dos princípios conceituais destacados acima. Por um lado, devemos reconhecer que os processos motivacionais são dissociáveis ​​em partes componentes, e que as manipulações da transmissão accumbens DA às vezes são capazes de clivar esses componentes como a aplicação de um cortador de diamante, alterando substancialmente alguns, enquanto outros não são afetados.Salamone e Correa, 2002; Berridge e Robinson, 2003; Smith et al., 2011) Por outro lado, também devemos perceber que os processos motivacionais interagem com mecanismos relacionados à emoção, aprendizagem e outras funções, e que não existe um mapeamento ponto a ponto preciso entre os processos comportamentais e os sistemas neurais. Assim, alguns dos efeitos das manipulações dopaminérgicas podem ser mais efetivamente compreendidos em termos de ações sobre aspectos específicos da motivação, função motora ou aprendizagem, enquanto outros efeitos podem ser mais diretamente em áreas de sobreposição entre essas funções. Finalmente, deve-se também considerar que é altamente improvável que o accumbens DA execute apenas uma função muito específica; é difícil conceber uma máquina complexa como o cérebro de um mamífero operando de maneira tão simples. Assim, accumbens DA provavelmente desempenha várias funções, e qualquer método comportamental ou neurocientífico particular pode ser adequado para caracterizar algumas dessas funções, mas pouco adequado para outras. Em vista disso, pode ser um desafio montar uma visão coerente.

Manipulações cerebrais podem alterar subcomponentes de um processo comportamental de uma maneira altamente específica. Esse princípio tem sido muito útil na neurociência cognitiva e levou a distinções importantes em termos de processos de memória dissociáveis ​​(isto é, memória declarativa versus procedural, memória operacional versus memória de referência, processos dependentes do hipocampo versus independentes). Em contraste, a tendência em grande parte da literatura que discute as funções comportamentais do accumbens DA tem sido usar instrumentos conceituais bastante contundentes, isto é, termos muito gerais e vagos como “recompensa”, para resumir as ações de drogas ou outras manipulações. De fato, o termo “recompensa” foi criticado em detalhes em outros lugares (Canhão e Bseikri, 2004; Salamone, 2006; Yin et al., 2008; Salamone et al., 2012). Embora o termo recompensa tenha significado como sinônimo de “reforçador”, não há um significado científico consistente de “recompensa” quando usado para descrever um processo neurocomportamental; alguns o empregam como sinônimo de “reforço”, enquanto outros o usam para significar “motivação primária” ou “apetite”, ou como um sinônimo mal disfarçado de “prazer” ou “hedonia” (para uma visão histórica da “hipótese da anedonia”). ," Vejo Sábio, 2008). Em muitos casos, a palavra “recompensa” parece ser usada como um termo geral que se refere a todos os aspectos da aprendizagem, motivação e emoção apetitiva, incluindo aspectos condicionados e incondicionados; esse uso é tão amplo que é essencialmente sem sentido. Pode-se argumentar que o uso excessivo do termo “recompensa” é uma fonte de tremenda confusão nessa área. Enquanto um artigo pode usar recompensa para significar prazer, outro pode empregar o termo para se referir ao aprendizado de reforço, mas não ao prazer, e um terceiro pode estar se referindo à motivação apetitiva de uma maneira muito geral. Estes são três significados muito diferentes da palavra, que ofusca a discussão das funções comportamentais da DA mesolímbica. Além disso, rotular a DA mesolímbica como um “sistema de recompensa” serve para minimizar seu papel na motivação aversiva. Talvez o maior problema com o termo “recompensa” é que ele evoca o conceito de prazer ou hedonia em muitos leitores, mesmo que isso não seja intencional pelo autor.

A presente revisão está focada no envolvimento do DA accumbens em características de motivação para reforçadores naturais, como alimentos. Em geral, há pouca dúvida de que o accumbens DA está envolvido em alguns aspectos da motivação alimentar; mas quais aspectos? Como veremos a seguir, os efeitos da interferência na transmissão do accumbens DA são altamente seletivos ou dissociativos por natureza, prejudicando alguns aspectos da motivação e deixando os outros intactos. O restante desta seção enfocará os resultados de experimentos nos quais drogas dopaminérgicas ou agentes neurotóxicos são usados ​​para alterar a função comportamental.

Embora seja geralmente reconhecido que os depleções do cérebro anterior do cérebro podem prejudicar a alimentação, este efeito está intimamente ligado a depleções ou antagonismo de DA nas áreas sensório-motoras ou motoras do neostriatum lateral ou ventrolateral, mas não do núcleo accumbens (Dunnett e Iversen, 1982; Salamone et al., 1993). Um recente estudo optogenético mostrou que estimular neurônios GABA tegmentares ventrais, o que resulta na inibição de neurônios DA, agia para suprimir a ingestão de alimentos (van Zessen et al., 2012). No entanto, não está claro se este efeito é especificamente devido a ações dopaminérgicas, ou se é dependente de efeitos aversivos que também são produzidos com esta manipulação (Tan et al., 2012). De fato, o esgotamento e o antagonismo de AD da accumbens têm mostrado repetidamente não prejudicar substancialmente a ingestão de alimentos (Ungerstedt, 1971; Koob et al., 1978; Salamone et al., 1993; Baldo et al., 2002; Baldo e Kelley, 2007). Com base em suas descobertas, as injeções de D1 ou D2 família antagonistas em accumbens núcleo ou shell atividade motora prejudicada, mas não suprimiu a ingestão de alimentos, Baldo et al., 2002 afirmaram que o antagonismo de DA accumbens “não aboliu a motivação primária para comer.” Os depleções de DA Accumbens falharam em reduzir a ingestão ou taxa de alimentação, e não prejudicaram o manuseio dos alimentos, embora depleções similares de neostriatum ventrolateral tenham afetado essas medidas (Salamone et al., 1993). Além disso, os efeitos dos antagonistas de AD ou dos esgotamentos de accumbens DA no comportamento instrumental reforçado com alimentos não se assemelham aos efeitos dos medicamentos inibidores de apetite (Salamone et al., 2002; Sink et al., 2008), ou a desvalorização do reforçador fornecida pelo prefeeding (Salamone et al., 1991; Aberman e Salamone, 1999; Pardo et al., 2012). Lex e Hauber, 2010 demonstraram que ratos com depleções de accumbens DA eram sensíveis à desvalorização do reforço alimentar durante uma tarefa instrumental. Além disso, Wassum et al., 2011 mostraram que o flupentixol antagonista de DA não afetou a palatabilidade da recompensa alimentar ou o aumento na palatabilidade da recompensa induzida pelo aumento do estado motivacional produzido pelo aumento da privação alimentar.

Evidências consideráveis ​​também indicam que o nucleus accumbens DA não medeia diretamente a reatividade hedônica aos alimentos. Um enorme corpo de trabalho de Berridge e colegas demonstrou que a administração sistêmica de antagonistas de DA, bem como depleções de DA em todo o prosencéfalo ou nucleus accumbens, não atenua a reatividade do sabor apetitivo por alimentos, que é uma medida amplamente aceita de reatividade hedônica a soluções doces (Berridge e Robinson, 1998, Berridge e Robinson, 2003; Berridge, 2007). Além disso, knockdown do transportador DA (Peciña et al., 2003), bem como microinjeções de anfetaminas no nucleus accumbens (Smith et al., 2011), os quais elevam o DA extracelular, não conseguiram aumentar a reatividade do sabor apetitivo para a sacarose. Sederholm et al., 2002 relataram que os receptores D2 no núcleo accumbens regulam a reatividade do sabor aversivo, e que a estimulação do receptor do tronco cerebral D2 suprimiu o consumo de sacarose, mas nenhuma das populações de receptores mediou a exposição hedônica do paladar.

Se o nucleus accumbens DA não medeia o apetite por comida per se, ou as reações hedônicas induzidas por alimentos, então qual é seu envolvimento na motivação alimentar? Há um consenso considerável de que as depleções ou antagonismo de acumbens DA deixam os principais aspectos da hedonia induzida por alimentos, apetite ou motivação alimentar primária intactos, mas, no entanto, afetam características críticas do comportamento instrumental (isto é, busca de comida) (Tabela 1; Figura 1) . Os investigadores sugeriram que o nucleus accumbens DA é particularmente importante para a ativação comportamental (Koob et al., 1978; Robbins e Koob, 1980; Salamone, 1988, Salamone, 1992; Salamone et al., 1991, Salamone et al., 2005, Salamone et al., 2007; Calaminus e Hauber, 2007; Lex e Hauber, 2010), esforço de esforço durante o comportamento instrumental (Salamone et al., 1994, Salamone et al., 2007, Salamone et al., 2012; Mai et al., 2012), Pavloviana à transferência instrumental (Parkinson et al., 2002; Everitt e Robbins, 2005; Lex e Hauber, 2008), comportamento de abordagem flexível (Nicola, 2010), despesas energéticas e regulamentação (Salamone, 1987; Beeler et al., 2012) e exploração da aprendizagem de recompensa (Beeler et al., 2010). As depleções e o antagonismo de Accumbens DA reduzem a atividade locomotora e a criação espontânea e induzida por novidade, bem como a atividade induzida por estimulantes (Koob et al., 1978; Cousins ​​et al., 1993; Baldo et al., 2002) Atividades como beber excessivo, correr sobre rodas ou atividade locomotora que são induzidas pela apresentação periódica de pellets de comida para animais privados de comida são reduzidas por depleções de acumbens DA (Robbins e Koob, 1980; McCullough e Salamone, 1992). Além disso, baixas doses de antagonistas de DA, bem como o antagonismo ou depleções de AD em accumbens reduzem a resposta reforçada por alimentos em algumas tarefas, apesar do fato de que a ingestão de alimentos é preservada nessas condições (Salamone et al., 1991, Salamone et al., 2002; Ikemoto e Panksepp, 1996; Koch et al., 2000). Os efeitos das depleções de AD da accumbens sobre o comportamento reforçado com alimentos variam muito, dependendo dos requisitos da tarefa ou do cronograma de reforço. Se os efeitos primários das depleções de accumbens DA estivessem relacionados a uma redução no apetite por comida, então seria de se esperar que o esquema de razão fixa 1 (FR1) fosse altamente sensível a essa manipulação. No entanto, este cronograma é relativamente insensível aos efeitos da transmissão de DA comprometida em accumbens (Aberman e Salamone, 1999; Salamone et al., 2007; Nicola, 2010). Um dos fatores críticos que produzem sensibilidade aos efeitos de depleções de AD da accumbens no comportamento reforçado de alimentos é o tamanho do requisito de razão (isto é, o número de pressões de alavanca requeridas por reforçador; Aberman e Salamone, 1999; Mingote et al., 2005) Além disso, o bloqueio dos receptores acumbens DA prejudica o desempenho da abordagem instrumental instigada pela apresentação de pistas (Wakabayashi et al., 2004; Nicola, 2010).

A capacidade dos antagonistas de AD ou dos esgotamentos de AD de accumbens em dissociar-se entre o consumo de alimentos e o comportamento instrumental reforçado com alimentos, ou entre diferentes tarefas instrumentais, não é um detalhe trivial ou um resultado epifenomênico. Em vez disso, demonstra que, sob condições em que o comportamento instrumental reforçado por alimentos pode ser interrompido, aspectos fundamentais da motivação alimentar estão, no entanto, intactos. Vários pesquisadores que escreveram sobre as características fundamentais dos estímulos reforçadores concluíram que os estímulos que atuam como reforçadores positivos tendem a ser relativamente preferidos, ou para suscitar uma abordagem, um comportamento dirigido ou consumado, ou gerar um alto grau de demanda, e que estes efeitos são um aspecto fundamental do reforço positivo (Dickinson e Balleine, 1994; Salamone e Correa, 2002; Salamone et al., 2012). Como afirmado na análise econômica comportamental oferecida pela Hursh, 1993: “Responder é considerado uma variável dependente secundária que é importante porque é instrumental no controle do consumo.” Assim, os resultados descritos acima demonstram que baixas doses de antagonistas de DA e depleções de acumbens DA não prejudicam aspectos fundamentais da motivação e reforço alimentar primário ou não condicionado, mas tornam os animais sensíveis a algumas características do requisito de resposta instrumental, capacidade de resposta cega a sinais condicionados, e reduzir a tendência dos animais de trabalhar para reforço alimentar.

Uma das manifestações da natureza dissociativa dos efeitos comportamentais de baixas doses sistêmicas de antagonistas de DA e depleção ou antagonismo de acumbens DA, é que essas condições afetam a alocação relativa do comportamento em animais que respondem em tarefas que avaliam a tomada de decisão baseada no esforço (Salamone et al., 2007; Floresco et al., 2008; Mai et al., 2012) Uma tarefa que foi usada para avaliar os efeitos das manipulações dopaminérgicas na alocação de resposta oferece aos ratos uma escolha entre pressionar a alavanca reforçada pela entrega de um alimento relativamente preferido, versus se aproximar e consumir um alimento simultaneamente disponível, mas menos preferido (Salamone et al., 1991, Salamone et al., 2007). Sob condições de linha de base ou de controle, os ratos treinados obtêm a maior parte de seus alimentos pressionando a alavanca e consomem pequenas quantidades de ração. Doses baixas a moderadas de antagonistas DA que bloqueiam D1 ou D2 os subtipos de receptores familiares produzem uma alteração substancial da alocação de resposta em ratos que realizam esta tarefa, diminuindo a pressão da alavanca reforçada com comida, mas aumentando substancialmente a ingestão de ração (Salamone et al., 1991; Koch et al., 2000; Sink et al., 2008). Esta tarefa foi validada em várias experiências. Doses de antagonistas de AD que produzem a mudança de pressão de alavanca para ingestão de ração não afetam a ingestão total de alimentos ou alteram a preferência entre esses dois alimentos específicos em testes de escolha de alimentação livre (Salamone et al., 1991; Koch et al., 2000). Em contraste, os inibidores de apetite de diferentes classes, incluindo fenfluramina e antagonistas canabinóides CB1 (Salamone et al., 2007; Sink et al., 2008), não conseguiu aumentar a ingestão de ração em doses que suprimiam a pressão da alavanca. Em contraste com os efeitos do antagonismo de DA, a pré-alimentação, que é um tipo de desvalorização do reforçador, reduziu tanto a pressão de alavanca quanto a ingestão de comida (Salamone et al., 1991). Estes resultados indicam que a interferência com a transmissão de AD não reduz simplesmente a motivação ou a ingestão de alimentos primários, mas altera a alocação de resposta entre fontes alternativas de alimentos que são obtidas através de diferentes respostas. Estes efeitos comportamentais são dependentes da DA accumbens, e são produzidos por depleções de accumbens DA e infusões locais de D1 ou D2 antagonistas da família no núcleo accumbens ou shell (Salamone et al., 1991; Koch et al., 2000; Nowend et al., 2001; Farrar et al., 2010; Mai et al., 2012).

Um procedimento em labirinto em T também foi desenvolvido para estudar a escolha relacionada ao esforço. Para esta tarefa, os braços de duas opções do labirinto levam a diferentes densidades de reforço (por exemplo, 4 versus 2 food pellets, ou 4 versus 0), e sob algumas condições, uma barreira é colocada no braço com maior densidade de reforço alimentar impor um desafio relacionado com o esforço (Salamone et al., 1994). Quando o braço de alta densidade tem a barreira no lugar, e o braço sem a barreira contém menos reforços, os esgotamentos ou o antagonismo da AD diminuem a escolha do braço de alto custo / alta recompensa e aumentam a seleção do braço de baixo custo / baixa recompensa (Salamone et al., 1994; Denk et al., 2005; Pardo et al., 2012; Mai et al., 2012). Quando não havia barreira no labirinto, os roedores preferiam o braço de alta densidade de reforço, e nem o antagonismo do receptor DA nem a depleção do AD de accumbens alteraram sua escolha (Salamone et al., 1994). Quando o braço com a barreira continha pellets 4, mas o outro braço não continha pellets, os ratos com depleções de accumbens DA ainda escolheram o braço de alta densidade, subiram a barreira e consumiram os pellets. Em um estudo recente em labirinto em T com camundongos, enquanto o haloperidol reduziu a escolha do braço com a barreira, essa droga não teve efeito sobre a escolha quando ambos os braços tinham uma barreira no lugar (Pardo et al., 2012). Assim, manipulações dopaminérgicas não alteraram a preferência baseada na magnitude do reforçamento e não afetaram a discriminação, a memória ou os processos de aprendizagem instrumental relacionados à preferência do braço. Bardgett et al., 2009 desenvolveu uma tarefa de desconto de esforço no labirinto em T, na qual a quantidade de alimento no braço de alta densidade do labirinto diminuía a cada tentativa em que os ratos selecionavam aquele braço. O desconto do esforço foi alterado pela administração de D1 e D2 antagonistas da família, o que tornou mais provável que os ratos escolhessem o braço de baixo reforço / baixo custo. O aumento da transmissão de AD pela administração de anfetamina bloqueou os efeitos do SCH23390 e do haloperidol e também os ratos tendenciosos na escolha do braço de alto reforço / alto custo, o que é consistente com estudos de escolha operante usando camundongos knockdown do transportador DA (Cagniard et al., 2006).

Uma das questões importantes nesta área é até que ponto os animais com transmissão de DA prejudicada são sensíveis aos requisitos de trabalho em tarefas relacionadas ao esforço, ou a outros fatores, como atrasos de tempo (por exemplo, Denk et al., 2005; Wanat et al., 2010). Globalmente, os efeitos do antagonismo de DA no desconto de atraso revelaram-se bastante mistos (Wade et al., 2000; Koffarnus et al., 2011), E Winstanley et al., 2005 relataram que as depleções de accumbens DA não afetaram o desconto de atraso. Floresco et al., 2008 demonstraram que o haloperidol antagonista de DA alterou o desconto de esforço, mesmo quando controlavam os efeitos do fármaco em resposta a atrasos. Wakabayashi et al., 2004 descobriu que o bloqueio do núcleo accumbens D1 ou D2 os receptores não prejudicaram o desempenho em um esquema de intervalo progressivo, que envolve a espera por intervalos de tempo cada vez maiores para receber reforço. Além disso, estudos com esquemas em tandem de reforço que têm requisitos de razão anexados aos requisitos de intervalo de tempo indicam que as depleções de acumbens DA tornam os animais mais sensíveis aos requisitos de razão adicionados, mas não tornam os animais sensíveis aos requisitos de intervalo de tempo de 30-120 s (Correa et al., 2002; Mingote et al., 2005).

Em resumo, os resultados dos estudos de labirinto em T e escolha operante em roedores sustentam a idéia de que doses baixas de antagonistas de AD e de AD em accumbens deixam aspectos fundamentais de motivação primária e reforço intactos, mas ainda assim reduzem a ativação comportamental e fazem com que os animais realoquem seus instrumentos. seleção de resposta com base nos requisitos de resposta da tarefa e selecionar alternativas de menor custo para a obtenção de reforçadores (Salamone et al., 2007, Salamone et al., 2012). Evidências consideráveis ​​indicam que o DA mesolímbico é parte de um circuito mais amplo que regula a ativação comportamental e funções relacionadas ao esforço, o que inclui outros transmissores (adenosina, GABA; Mingote et al., 2008; Farrar et al., 2008, Farrar et al., 2010; Nunes et al., 2010; Salamone et al., 2012) e áreas do cérebro (amígdala basolateral, córtex cingulado anterior, pálido ventral; Walton et al., 2003; Floresco e Ghods-Sharifi, 2007; Mingote et al., 2008; Farrar et al., 2008; Hauber e Sommer, 2009).

Envolvimento da DA Mesolímbica na Motivação Apetitiva: Atividade Dinâmica dos Sistemas DA

Embora às vezes se diga que a liberação de DA no núcleo accumbens ou a atividade de neurônios DA tegmentares ventrais é instigada pela apresentação de reforçadores positivos como alimentos, a literatura que descreve a resposta da DA mesolímbica a estímulos apetitivos é realmente bastante complicada (Hauber, 2010). Em um sentido geral, a apresentação de alimentos aumenta a atividade neuronal DA ou a liberação accumbens DA? Em uma ampla gama de condições, e através de diferentes fases do comportamento motivado, quais fases ou aspectos da motivação estão intimamente ligados à instigação da atividade dopaminérgica? A resposta a essas perguntas depende da escala de tempo da medição e das condições comportamentais específicas que estão sendo estudadas. Flutuações na atividade DA podem ocorrer em várias escalas de tempo, e freqüentemente é feita uma distinção entre a atividade “fásica” e a atividade “tônica” (Grace, 2000; Floresco et al., 2003; Goto e Grace, 2005). As técnicas de registro eletrofisiológico são capazes de medir a atividade fásica rápida de neurônios DA putativos (por exemplo, Schultz, 2010), e os métodos de voltametria (por exemplo, voltametria cíclica rápida) registram “transientes” de DA que são rápidas mudanças fásicas no DA extracelular, que se acredita representar a liberação de rajadas da atividade do neurônio DA (por exemplo, Roitman et al., 2004; Sombers et al., 2009; Brown et al., 2011). Também tem sido sugerido que mudanças fásicas rápidas na liberação de DA podem ser relativamente independentes da queima de neurônios DA, e podem refletir disparo sincronizado de interneurônios estriatérgicos colinérgicos que promovem liberação de DA através de um mecanismo de receptor nicotínico pré-sináptico (Rice et al., 2011; Threlfell et al., 2012; Surmeier e Graybiel, 2012). Os métodos de microdiálise, por outro lado, medem o DA extracelular de uma forma que representa o efeito líquido dos mecanismos de liberação e absorção integrados em unidades maiores de tempo e espaço em relação à eletrofisiologia ou voltametria (por exemplo, Hauber, 2010). Assim, é frequentemente sugerido que os métodos de microdiálise medem os níveis de DA “tônicos”. No entanto, tendo em vista o fato de que a microdiálise pode medir flutuações relacionadas ao comportamento ou à droga (por exemplo, aumentos seguidos de diminuições) no DA extracelular que ocorre em minutos, talvez seja mais útil empregar o termo “fast phasic” para falar sobre as mudanças rápidas na atividade relacionada à DA que podem ser medidas com eletrofisiologia ou voltametria, e “slow phasic” em referência às mudanças que ocorrem na escala de tempo mais lenta medida com métodos de microdiálise (por exemplo, Hauber, 2010; Segovia et al., 2011).

Estudos eletrofisiológicos mostraram que a apresentação de reforços alimentares novos ou inesperados é acompanhada por aumentos transitórios na atividade de supostos neurônios Tegmentares ventrais, mas que esse efeito desaparece com a apresentação regular, ou exposição repetida por meio de treinamento (Schultz et al., 1993; Schultz, 2010). Empregando métodos de voltametria para medir mudanças fásicas rápidas na liberação DA, Roitman et al., 2004 mostraram que, em animais treinados, a exposição a um estímulo condicionado sinalizando que a pressão de alavanca resultaria em entrega de sacarose foi acompanhada por um aumento nos transientes DA, no entanto, a apresentação real do reforçador de sacarose não foi. Um achado semelhante foi relatado anos atrás por Nishino et al., 1987, que estudou a pressão da alavanca de razão fixa em macacos e observou que a atividade de neurônios DA tegmentares ventrais foi aumentada durante a pressão de alavanca em animais treinados, mas na verdade diminuiu durante a apresentação do reforçador. A entrega de alimentos imprevisível, bem como a apresentação de sinais que predizem a entrega de alimentos, aumentaram a sinalização fásica rápida medida por voltametria no núcleo nucleus accumbens (Brown et al., 2011). DiChiara e colegas mostraram que a exposição a novos alimentos saborosos aumentava transitoriamente o DA extracelular na concha do núcleo accumbens, como medido por microdiálise, mas que essa resposta rapidamente se acostumou (por exemplo, Bassareo et al., 2002). Um recente artigo de microdiálise demonstrou que a apresentação de reforçadores alimentares ricos em carboidratos a ratos previamente expostos não produziu nenhuma alteração no DA extracelular no núcleo ou no invólucro de accumbens (Segovia et al., 2011). Em contraste, tanto a aquisição quanto a manutenção da pressão da alavanca de relação fixa foram associadas a aumentos na liberação de DA (Segovia et al., 2011). Um padrão semelhante foi mostrado quando os marcadores de transdução de sinal relacionados a DA (c-Fos e DARPP-32) foram medidos (Segovia et al., 2012). Juntos, esses estudos não apóiam a idéia de que a apresentação de alimentos, por si só, incluindo a de alimentos saborosos, aumenta uniformemente a liberação de DA na população em uma ampla gama de condições.

No entanto, evidências consideráveis ​​indicam que o aumento na transmissão de DA está associado à apresentação de estímulos associados a reforçadores naturais, como alimentos, ou a realização de comportamentos instrumentais; isso foi visto em estudos envolvendo microdiálise (Sokolowski e Salamone, 1998; Ostlund et al., 2011; Hauber, 2010; Segovia et al., 2011), voltametria (Roitman et al., 2004; Brown et al., 2011; Cacciapaglia et al., 2011), e registros eletrofisiológicos durante a resposta operante livre (Nishino et al., 1987; Kosobud et al., 1994). Cacciapaglia et al., 2011 relataram que a liberação rápida de DA fásica no nucleus accumbens medida por voltametria ocorreu durante o início de uma pista que sinalizava a disponibilidade de reforçador, bem como a resposta da imprensa de alavancas, e que os efeitos excitatórios dessa liberação fásica nos neurônios accumbens foram atenuados pela inativação do disparo de rajada em neurônios DA ventrais tegmentares ventrais. Além disso, um corpo substancial de pesquisa em eletrofisiologia identificou algumas das condições que ativam o disparo em neurônios tegmentares ventrais DA, incluindo a apresentação de estímulos que estão associados ao reforçador primário, bem como condições que têm um maior valor de reforço em relação ao estímulo primário. expectativa gerada pela experiência anterior (Schultz et al., 1997). A observação posterior levou à hipótese de que a atividade dos neurônios DA poderia representar o tipo de sinal de erro de predição descrito por alguns modelos de aprendizado (por exemplo, Rescorla e Wagner, 1972). Este padrão de atividade em neurônios DA putativos forneceu uma base teórica formal para o envolvimento da sinalização de FA fásica rápida em modelos de aprendizagem de reforço (Schultz et al., 1997; Bayer e Glimcher, 2005; Niv, 2009; Schultz, 2010).

Embora o foco principal do presente artigo seja sobre os efeitos das manipulações dopaminérgicas em aspectos distintos da motivação, é útil considerar a importância da sinalização fásica rápida e fasica lenta (isto é, “tônica”) para interpretar os efeitos de condições que interferem com transmissão DA. As diferentes escalas de tempo da atividade dopaminérgica podem servir a funções muito diferentes e, portanto, os efeitos de uma manipulação particular podem depender muito de estar alterando a atividade fásica rápida ou lenta ou os níveis basais de DA. Pesquisadores têm usado várias manipulações farmacológicas ou genéticas para afetar diferencialmente a atividade DA rápida das fases versus liberação de DA em escalas de tempo mais lentas (Zweifel et al., 2009; Parker et al., 2010; Grieder et al., 2012) e relataram que essas manipulações podem exercer efeitos comportamentais distintos. Por exemplo, Grieder et al., 2012 mostraram que a interferência seletiva com a atividade de DA fásica impediu a expressão de aversões condicionadas do lugar à retirada de uma dose aguda única de nicotina, mas não à retirada da nicotina crônica. Em contraste, o bloqueio dos receptores D2 prejudicou a expressão da aversão condicionada durante a retirada crônica, mas não aguda. Zweifel et al., 2009 relataram que a inativação genética seletiva dos receptores NMDA, que enfraqueceram o disparo contínuo em neurônios VTA DA, prejudicou a aquisição do aprendizado apetitivo dependente de sinal, mas não interrompeu o comportamento de trabalhar para o reforço alimentar em um programa de taxa progressiva. De fato, uma série de funções comportamentais relacionadas à DA são preservadas em animais com atividade de FA fásicaZweifel et al., 2009; Wall et al., 2011; Parker et al., 2010). Estas observações têm implicações para a integração de informações de estudos de atividade fásica rápida com aqueles que se concentram nos efeitos do antagonismo ou depleção de DA. Em primeiro lugar, eles sugerem que é preciso ser cauteloso ao generalizar a partir de conceitos gerados em estudos de eletrofisiologia ou voltametria (por exemplo, que a liberação de DA atua como um “sinal de ensino”) para as funções comportamentais que são prejudicadas quando drogas ou depletões são usadas para interromper a transmissão da DA. Além disso, eles indicam que estudos de atividade fásica rápida de neurônios DA mesolímbicos podem explicar as condições que rapidamente aumentam ou diminuem a atividade DA ou fornecem um sinal DA discreto, mas não nos informam rigorosamente sobre a ampla gama de funções desempenhadas pela transmissão DA em múltiplos prazos ou aqueles prejudicados pela interrupção da transmissão de DA.

Envolvimento dos Mecanismos Mesolímbico e Neostriatal na Aprendizagem Instrumental Apetitiva

Embora se possa definir motivação em termos que a tornem distinta de outros construtos, deve-se reconhecer que, ao discutir plenamente as características comportamentais ou a base neural da motivação, também se deve considerar as funções relacionadas. O cérebro não tem diagramas de caixa-e-flecha ou demarcações que separem com clareza as funções psicológicas centrais em sistemas neurais discretos e não sobrepostos. Assim, é importante entender a relação entre processos motivacionais e outras funções, como homeostase, alostase, emoção, cognição, aprendizagem, reforço, sensação e função motora (Salamone, 2010). Por exemplo, Panksepp, 2011 enfatizou como as redes emocionais no cérebro estão intrinsecamente entrelaçadas com sistemas motivacionais envolvidos em processos como busca, raiva ou pânico. Além disso, a busca / comportamento instrumental não é apenas influenciada pelas propriedades emocionais ou motivacionais dos estímulos, mas também, é claro, pelos processos de aprendizagem. Os animais aprendem a se engajar em respostas instrumentais específicas que estão associadas a determinados resultados de reforço. Como parte crítica da estrutura associativa do condicionamento instrumental, os organismos devem aprender quais ações conduzem a quais estímulos (isto é, associações ação-resultado). Assim, funções motivacionais estão entrelaçadas com funções motoras, cognitivas, emocionais e outras (Mogenson et al., 1980). Embora a presente revisão esteja focada no envolvimento da AD mesolímbica na motivação para reforçadores naturais, também é útil ter uma breve discussão do envolvimento putativo da DA mesolímbica na aprendizagem instrumental.

Pode-se pensar que seria relativamente simples demonstrar que o nucleus accumbens DA media o aprendizado por reforço ou está criticamente envolvido nos processos de plasticidade sináptica subjacentes à associação de uma resposta operante com a entrega de um reforçador (isto é, associações ação-resultado). Mas essa área de pesquisa é tão difícil e complicada de interpretar quanto a pesquisa motivacional revisada acima. Por exemplo, Smith-Roe e Kelley, 2000 mostrou que bloqueio simultâneo de DA D1 e os receptores NMDA no núcleo nucleus accumbens retardaram a aquisição da pressão instrumental da alavanca. Além disso, as manipulações de postsession que afetam a consolidação da memória também afetaram a aquisição da pressão instrumental da alavanca (Hernandez et al., 2002). No entanto, ao rever a literatura sobre o nucleus accumbens e a aprendizagem instrumental, Yin et al., 2008 concluiu que “o accumbens não é necessário nem suficiente para a aprendizagem instrumental”. Belin et al., 2009 observaram que a manipulação de lesões e drogas no núcleo do nucleus accumbens pode afetar a aquisição do comportamento instrumental reforçado por estímulos naturais, mas afirmou que as “contribuições psicológicas precisas” dos accumbens e outras estruturas cerebrais permanecem obscuras. Embora existam muitos estudos mostrando que as lesões do corpo celular, antagonistas de DA ou depleções de DA podem afetar os resultados relacionados ao aprendizado em procedimentos como preferência de lugar, aquisição de pressão de alavanca ou outros procedimentos, isso por si só não demonstra que os neurônios do nucleus accumbens ou transmissão mesolímbica DA são essenciais para as associações específicas que fundamentam a aprendizagem instrumental (Yin et al., 2008). Efeitos específicos relacionados à aprendizagem instrumental podem ser demonstrados por avaliações dos efeitos da desvalorização do reforçador ou da degradação da contingência, que muitas vezes não são conduzidos em estudos farmacológicos ou de lesões. Com isto em mente, é importante notar que as lesões do corpo celular em qualquer núcleo ou concha do acumbens não alterou a sensibilidade à degradação de contingência (Corbit et al., 2001). Lex e Hauber, 2010 descobriram que os ratos com depleções do nucleotus accumbens DA ainda eram sensíveis à desvalorização do reforçador, e sugeriram que o DA do núcleo accumbens poderia, portanto, não ser crucial para codificar associações ação-resultado. Embora não esteja claro se o accumbens DA é crítico para associações entre a resposta e o reforçador, evidências consideráveis ​​indicam que o nucleus accumbens DA é importante para a abordagem pavloviana e Pavloviano para a transferência instrumental (Parkinson et al., 2002; Wyvell e Berridge, 2000; Dalley et al., 2005; Lex e Hauber, 2008, Lex e Hauber, 2010; Yin et al., 2008). Tais efeitos podem fornecer mecanismos pelos quais estímulos condicionados podem exercer efeitos de ativação na resposta instrumental (Robbins e Everitt, 2007; Salamone et al., 2007), como discutido acima. Os efeitos de ativação ou estímulo de estímulos condicionados podem ser um fator na amplificação de uma resposta instrumental já adquirida, mas também poderiam promover a aquisição aumentando a resposta e a variabilidade de comportamento, estabelecendo a oportunidade para mais oportunidades de pareamento de uma resposta com reforço. Um artigo recente mostrou que a estimulação optogenética de neurônios DA tegmentares ventrais não forneceu reforço positivo da pressão da alavanca instrumental por si só e não afetou a ingestão de alimentos, mas amplificou o surgimento da alavanca reforçada por alimentos pressionando uma alavanca ativa durante a aquisição e melhora produção de respostas instrumentais previamente extintas (Adamantidis et al., 2011).

Curiosamente, apesar de nocaute de DA D1 os receptores atenuaram a aquisição do comportamento de abordagem pavloviana, o nocaute de receptores NMDA, que resultou em uma diminuição de 3 na liberação de DA fásica rápida instigada pela apresentação de sinais associados ao alimento, não retardou a aquisição do comportamento de abordagem pavloviana (Parker et al., 2010) Isso indica que a relação entre a liberação de DA fásica rápida e o aprendizado permanece incerta. Estudos futuros devem examinar os efeitos das manipulações que afetam a sinalização DA fásica rápida usando procedimentos que avaliam diretamente o aprendizado por reforço (isto é, desvalorização do reforçador e degradações de contingência). Além disso, os métodos genéticos e farmacológicos que levam à supressão da atividade DA fásica rápida devem ser avaliados posteriormente quanto às suas ações na ativação comportamental e nos aspectos de motivação relacionados ao esforço.

Envolvimento do DA Mesolímbico na Motivação e Aprendizagem Aversiva: Atividade Dinâmica dos Sistemas DA

Uma revisão superficial de alguns artigos na literatura da DA poderia deixar a pessoa com a impressão de que a AD mesolímbica está seletivamente envolvida em processos hedônicos, motivação apetitiva e aprendizagem relacionada ao reforço, com a exclusão de aspectos aversivos de aprendizagem e motivação. No entanto, tal visão estaria em desacordo com a literatura. Como descrito acima, evidências consideráveis ​​indicam que a transmissão do DA accumbens não medeia diretamente as reações hedônicas aos estímulos. Além disso, existe uma literatura muito extensa indicando que a AD mesolímbica está envolvida na motivação aversiva e pode afetar o comportamento em procedimentos de aprendizagem aversivos. Um número de diferentes condições aversivas (por exemplo, choque, compressão da cauda, ​​estresse de contenção, estímulos condicionados aversivos, drogas aversivas, derrota social) podem aumentar a liberação de DA conforme medido pelos métodos de microdiálise (McCullough et al., 1993; Salamone et al., 1994; Tidey e Miczek, 1996; Jovem, 2004). Por muitos anos, pensou-se que a atividade do neurônio DA ventral tegmentar não era aumentada por estímulos aversivos; entretanto, estudos recentes demonstraram que a atividade eletrofisiológica de neurônios DA putativos ou identificados é aumentada por condições aversivas ou estressantes (Anstrom e Woodward, 2005; Brischoux et al., 2009; Matsumoto e Hikosaka, 2009; Bromberg-Martin et al., 2010; Schultz, 2010; Lammel et al., 2011). Apesar Roitman et al., 2008 relataram que um estímulo aversivo ao sabor (quinina) diminuiu os transientes DA no núcleo accumbens, Anstrom et al., 2009 observaram que o estresse de derrota social foi acompanhado por aumentos na atividade de FA fásica rápida, medida por eletrofisiologia e voltametria. A incerteza permanece sobre se existem neurônios DA separados que respondem diferencialmente a estímulos apetitivos e aversivos, e que proporção de neurônios responde a cada um, mas parece haver pouca dúvida de que a atividade da DA mesolímbica pode ser aumentada por pelo menos algumas condições aversivas e, portanto não está especificamente ligado a hedonia ou reforço positivo.

Um corpo substancial de evidências que remontam a várias décadas (Salamone et al., 1994) e continuando a literatura recente (Faure et al., 2008; Zweifel et al., 2011) demonstra que a interferência com a transmissão de DA pode prejudicar a aquisição ou o desempenho de comportamento aversivamente motivado. De facto, durante muitos anos, os antagonistas de DA foram submetidos a rastreio pré-clínico da actividade antipsicótica, baseada parcialmente na sua capacidade de atenuar o comportamento de evitação (Salamone et al., 1994). Os esgotamentos de DA da Accumbens diminuem a pressão na alavanca de evitar choques (McCullough et al., 1993). Injeções sistêmicas ou intra-acúmulo de antagonistas de DA também interrompem a aquisição de aversão ao lugar e aversão ao gosto (Acquas e Di Chiara, 1994; Fenu et al., 2001), bem como o condicionamento do medo (Inoue et al., 2000; Pezze e Feldon, 2004). Zweifel et al., 2011 relataram que o nocaute de receptores NMDA, que atua para reduzir a liberação de DA fásica rápida, prejudicou a aquisição do condicionamento do medo dependente de cue.

Estudos em humanos também demonstraram um papel para o estriado ventral em aspectos de motivação e aprendizagem aversivas. Veteranos de guerra com transtorno de estresse pós-traumático mostraram aumento do fluxo sanguíneo no estriado / núcleo acumbente ventral em resposta à apresentação de estímulos aversivos (isto é, sons de combate; Liberzon et al., 1999). Estudos de imagem em humanos indicam que as respostas BOLD estriatais ventrais, medidas por fMRI, são aumentadas em resposta a erros de previsão, independentemente de o estímulo predizer eventos de recompensa ou aversivos (Jensen et al., 2007), e que os erros aversivos de predição foram bloqueados pelo antagonista DA haloperidol (Menon et al., 2007). Baliki et al., 2010 relataram que em indivíduos normais, as respostas BOLD fásicas ocorreram tanto para o início quanto para o fim de um estímulo térmico doloroso. Delgado et al., 2011 demonstraram que as respostas BOLD do estriado ventral aumentaram durante o condicionamento aversivo a um estímulo aversivo primário (choque), bem como perda monetária. Um estudo PET que obteve medições de deslocamento de racloprida in vivo para avaliar a liberação de DA em humanos relatou que a exposição ao estresse psicossocial aumentou os marcadores de DA extracelular no estriado ventral de uma maneira que foi correlacionada com o aumento da liberação de cortisol (Pruessner et al., 2004). Assim, estudos de imagens em humanos também mostram que o estriado ventral e sua inervação mesolímbica DA respondem a estímulos aversivos e apetitivos.

Síntese e Conclusões

Em resumo, as ideias tradicionais sobre DA como um mediador de "hedonia" e a tendência de igualar a transmissão de DA com "recompensa" (e "recompensa" com "hedonia") está dando lugar a uma ênfase no envolvimento dopaminérgico em aspectos específicos da motivação e processos relacionados à aprendizagem (Figura 2), incluindo ativação comportamental, esforço, abordagem instigada por sugestão, previsão de eventos e processos pavlovianos. A transmissão de DA no nucleus accumbens não exerce uma influência poderosa sobre a reatividade hedônica aos sabores, nem parece mediar a motivação alimentar primária ou o apetite (Berridge e Robinson, 1998; Salamone e Correa, 2002; Kelley et al., 2005; Barbano et al., 2009). Além disso, embora as manipulações dopaminérgicas possam afetar os resultados comportamentais em animais treinados em tarefas de aprendizado, não há fortes evidências de que a AC accumbens seja crítica para o aspecto específico da aprendizagem instrumental que envolve a associação entre a ação instrumental e o resultado reforçador (Yin et al., 2008). No entanto, o accumbens DA é claramente importante para aspectos de motivação apetitiva e aversiva (Salamone et al., 2007; Cabib e Puglisi-Allegra, 2012) e participa em processos de aprendizagem, pelo menos em parte através de processos que envolvem a abordagem pavloviana e pavloviana à transferência instrumental (Yin et al., 2008; Belin et al., 2009). A interferência com a transmissão de AD accumbens enfraquece a aquisição de respostas de abordagem pavlovianas que são instigadas por sinais que predizem a entrega de alimentos e prejudicam as respostas de evitação eliciadas por pistas que predizem estímulos aversivos. As depleções ou antagonismos de AD da Accumbens reduzem os efeitos de ativação dos estímulos condicionados e tornam os animais muito sensíveis aos custos de resposta instrumental relacionados ao trabalho (por exemplo, a produção de esquemas de razão com requisitos de grande proporção, escalada de barreira; Salamone et al., 2007, Salamone et al., 2012; Barbano et al., 2009) Assim, o nucleus accumbens DA está claramente envolvido nos aspectos da motivação e na regulação das ações dirigidas a um objetivo, mas de uma forma bastante específica e complexa que não é expressa pela simples palavra “recompensa”. Algumas tarefas instrumentais exploram as funções atendidas pela DA mesolímbica (por exemplo, aspectos ativacionais da motivação, esforço e esforço) e, portanto, o comprometimento da DA mesolímbica afeta prontamente o desempenho nessas tarefas, enquanto responde em outras tarefas reforçadas positivamente, ou medidas de alimento primário motivação, são deixados intactos.

Nos últimos anos, a imagem que surgiu é que o neostriato (ou seja, estriado dorsal) e sua inervação DA parecem ter uma ligação mais clara com o processamento de associações instrumentais do que o nucleus accumbens (Yin et al., 2008). As lesões do neostriatum dorsomedial tornavam os animais insensíveis tanto à desvalorização do reforçador quanto à degradação da contingência (Yin et al., 2005). Tanto as lesões do corpo celular como as depleções de DA no estriado dorsolateral demonstraram prejudicar a formação de hábito (Yin et al., 2004; Faure et al., 2005). O envolvimento do neostriatum na formação de hábitos pode estar relacionado ao papel hipotetizado dos gânglios da base em promover o desenvolvimento de seqüências de ação ou “chunking” de componentes do comportamento instrumental (Graybiel, 1998; Matsumoto et al., 1999) A ideia de que há uma transição da regulação do estriado ventral da resposta instrumental aos mecanismos neostriatal que regulam a formação de hábito foi amplamente empregada para fornecer uma explicação de várias características da dependência de drogas (ver revisão por Belin et al., 2009), e também é relevante para a compreensão dos efeitos dos reforçadores naturais (Segovia et al., 2012). No entanto, neste contexto, é útil enfatizar que o envolvimento do Núcleo accumbens DA em aspectos de aprendizagem instrumental ou desempenho, ou o envolvimento de DA neoestatial na regulação da codificação de associações ação-resultado ou formação de hábito, não significa que estes os efeitos são mediados por ações sobre motivação primária ou apetite por reforçadores naturais, como alimentos. Por exemplo, Smith-Roe e Kelley, 2000 mostrou que a injeção combinada de um D1 Um antagonista e um antagonista de NMDA em doses que prejudicaram a aquisição de pressão de alavanca reforçada com alimentos não afetou a ingestão de alimentos e interpretaram este resultado como demonstrando uma falta de um efeito motivacional geral desta manipulação. Além disso, a interferência com a transmissão da DA no neostriatum dorsolateral mostrou prejudicar a formação de hábito, mas deixa intacta a resposta dirigida por metas (ou seja, motivacionalmente) (Faure et al., 2005) Assim, o envolvimento de DA neostriatal na formação de hábito não fornece evidências para a mediação dopaminérgica da motivação alimentar primária ou apetite. Na verdade, a ingestão de alimentos é mais afetada pelas depleções de DA no neostriato ventrolateral, e essas deficiências estão relacionadas a disfunções motoras que afetam a taxa de alimentação e o uso da pata dianteira durante a alimentação e ocorrem em paralelo com a indução de tremor oral que tem as características do repouso parkinsoniano tremor (Jicha e Salamone, 1991; Salamone et al., 1993; Collins-Praino et al., 2011).

Embora não seja um simples marcador de hedonia ou motivação alimentar primária e apetite, DA no nucleus accumbens parece regular múltiplos canais de informação que passam por este núcleo e, portanto, participa de uma variedade de processos comportamentais relacionados a aspectos de motivação. Durante décadas, pesquisadores sugeriram que as estruturas dos gânglios da base atuam como reguladores da função sensório-motora, o que não significa que a interferência com os gânglios da base produza uma simples paralisia ou incapacidade motora, mas remete à ideia de que essas estruturas, incluindo os acumbens, participam na passagem (ou seja, o limiar) do impacto da entrada sensorial na saída comportamental. Similarmente, Mogenson et al., 1980 e colegas sugeriram anos atrás que o nucleus accumbens atua como uma interface "límbico-motora", fornecendo uma ligação entre as áreas límbicas envolvidas na emoção e na cognição e os circuitos neurais que regulam a produção comportamental. Evidências consideráveis ​​de várias fontes indicam que o nucleus accumbens atua como um portão, um filtro ou um amplificador de informações que passam por várias áreas corticais ou límbicas em seu caminho para várias áreas motoras do cérebro (por exemplo, Roesch et al., 2009). Estudos eletrofisiológicos e de voltametria indicam que o nucleus accumbens é organizado em conjuntos e microcircuitos de neurônios específicos da tarefa que são modulados por DA (O'Donnell, 2003; Carelli e Wondolowski, 2003; Cacciapaglia et al., 2011). Roesch et al., 2009 relataram que os neurônios nucleus accumbens integram informações sobre o valor de uma recompensa esperada com características da saída do motor (isto é, velocidade de resposta ou escolha) que ocorrem durante a tomada de decisão. A liberação da DA pode estabelecer um limite para despesas de custo que valham a pena e, em algumas circunstâncias, pode fornecer uma orientação oportunista para a exploração de recursos (Fields et al., 2007; Gan et al., 2010; Beeler et al., 2012). Esta sugestão é consistente com o envolvimento proposto do accumbens DA na economia comportamental do comportamento instrumental, particularmente em termos de tomada de decisão custo / benefício (Salamone et al., 2007, Salamone et al., 2009).

Como dito acima, os organismos normalmente são separados dos estímulos motivacionais primários ou objetivos por obstáculos ou restrições. Outra maneira de dizer isso é que o processo de engajar-se em comportamentos motivados requer que os organismos superem a “distância psicológica” entre si e os estímulos motivacionalmente relevantes. O conceito de distância psicológica é uma idéia antiga em psicologia (por exemplo, Lewin, 1935; Shepard, 1957; Liberman e Forster, 2008) e assumiu muitas conotações teóricas diferentes em diferentes áreas da psicologia (por exemplo, experimental, social, personalidade, etc.). No contexto atual, ela é simplesmente usada como uma referência geral à idéia de que objetos ou eventos não são diretamente presentes ou experimentados e, portanto, os organismos são separados por múltiplas dimensões (por exemplo, distância física, tempo, probabilidade, requisitos instrumentais). esses objetos ou eventos. De várias maneiras, a DA mesolímbica serve como uma ponte que permite que os animais percorram a distância psicológica que os separa de objetos ou eventos objetivos. Vários pesquisadores têm formulado isto de diversas maneiras ou enfatizado diferentes aspectos do processo (Everitt e Robbins, 2005; Kelley et al., 2005; Salamone et al., 2005, Salamone et al., 2007, Salamone et al., 2009; Phillips et al., 2007; Nicola, 2010; Lex e Hauber, 2010; Panksepp, 2011; Beeler et al., 2012; veja a Figura 2), mas muitas das funções nas quais accumbens DA foi implicado, incluindo ativação comportamental, esforço durante o comportamento instrumental, transferência Pavloviana para instrumental, capacidade de resposta a estímulos condicionados, previsão de eventos, comportamento de abordagem flexível, busca e energia gastos e regulamentação são importantes para facilitar a habilidade dos animais de superar obstáculos e, de certa forma, transcender a distância psicológica. No geral, o nucleus accumbens DA é importante para realizar respostas instrumentais ativas que são eliciadas ou mantidas por estímulos condicionados (Salamone, 1992), para manter o esforço na resposta instrumental ao longo do tempo na ausência de reforço primário (Salamone et al., 2001; Salamone e Correa, 2002) e para regular a alocação de recursos comportamentais estabelecendo restrições sobre as respostas instrumentais que são selecionadas para a obtenção de reforços com base em análises de custo / benefício (Salamone et al., 2007, Salamone et al., 2012; Hernandez et al., 2010).

Implicações Translacionais e Clínicas

Paralelamente à pesquisa com animais revisada acima, estudos experimentais e clínicos com humanos também começaram a elucidar algumas das funções motivacionais da DA ventral e dorsal do estriatal e apontam para o seu potencial significado clínico. Essa pesquisa emergente em humanos, usando métodos de imagem e farmacológicos, gerou resultados consistentes com a ideia de que sistemas estriatais em geral, e DA em particular, estão envolvidos em aspectos de comportamento instrumental, antecipação de reforço, ativação comportamental e esforço. processos relacionados. Knutson et al., 2001 relataram que a ativação de fMRI do accumbens era evidente em pessoas que realizavam uma tarefa de jogo, mas que o aumento da atividade estava associado à previsão ou antecipação da recompensa, em vez da apresentação real da recompensa monetária. O'Doherty et al., 2002 observaram que a antecipação da entrega de glicose foi associada com o aumento da ativação da RMf nas áreas do mesencéfalo e DA do estriatal, mas que essas áreas não responderam ao fornecimento de glicose. Estudos de imagem recentes implicaram estriado ventral na tomada de decisão custo / benefício (Croxson et al., 2009; Botvinick et al., 2009; Kurniawan et al., 2011). Treadway et al., 2012 descobriram que as diferenças individuais no esforço de esforço em humanos estavam associadas a um marcador de imagem da transmissão de DA estriatal. Além do que, além do mais, Wardle et al., 2011 mostraram que as anfetaminas aumentaram a disposição das pessoas de se esforçarem para obter recompensa, principalmente quando a probabilidade de recompensa era baixa, mas não alterou os efeitos da magnitude da recompensa na disposição para exercer esforço. Um recente trabalho de imagem mostrou que as doses de L-DOPA que aumentaram a representação estriatal de ações motivadas pelo apetite não afetaram a representação neural do valor de reforço (Guitart-Masip et al., 2012). Outro relato recente descreveu a capacidade de as manipulações de catecolaminas dissociarem-se entre os diferentes aspectos da motivação e da emoção em humanos (Venugopalan et al., 2011). Neste estudo, o acesso ao tabagismo foi utilizado como reforçador, e os pesquisadores manipularam a transmissão da DA pela inibição transitória da síntese de catecolaminas com depleção de fenilalanina / tirosina. A inibição da síntese de catecolaminas não atenuou o desejo auto-relatado de cigarros, ou as respostas hedônicas induzidas pelo fumo. No entanto, ele reduziu os pontos de quebra da relação progressiva para o reforço do cigarro, indicando que as pessoas com reduzida síntese de DA mostraram uma disposição reduzida para trabalhar com cigarros. Além disso, a pesquisa de imagens demonstrou que o núcleo humano accumbens / striatum ventral não é apenas responsivo a estímulos apetitivos, mas também responde ao estresse, aversão e hiperexcitabilidade / irritabilidade (Liberzon et al., 1999; Pavic et al., 2003; Phan et al., 2004; Pruessner et al., 2004; Levita et al., 2009; Delgado et al., 2011). Em conjunto, esses estudos sugerem que existem muitas semelhanças entre os achados gerados a partir de modelos animais e aqueles obtidos a partir de pesquisas com seres humanos, em termos de muitas das funções motivacionais dos sistemas de DA mesostriatais.

À medida que os conceitos sobre o DA continuam a evoluir, as pesquisas sobre as funções comportamentais do DA terão profundas implicações para investigações clínicas de disfunções motivacionais vistas em pessoas com depressão, esquizofrenia, abuso de substâncias e outros transtornos. Em humanos, aspectos patológicos de processos de ativação comportamental têm significado clínico considerável. Fadiga, apatia, anergia (ou seja, falta de energia autorreferida) e retardo psicomotor são sintomas comuns de depressão (Marin et al., 1993; Stahl, 2002; Demyttenaere et al., 2005; Salamone et al., 2006), e sintomas motivacionais semelhantes também podem estar presentes em outros distúrbios psiquiátricos ou neurológicos, como esquizofrenia (isto é, “avolição”), abstinência de estimulantes (Volkow et al., 2001), Parkinsonismo (Friedman et al., 2007; Shore et al., 2011), esclerose múltipla (Lapierre e Hum, 2007) e doença infecciosa ou inflamatória (Dantzer et al., 2008; Miller, 2009). Evidências consideráveis ​​de estudos em animais e humanos indicam que a DA mesolímbica e estriatal está envolvida nesses aspectos patológicos da motivação (Schmidt et al., 2001; Volkow et al., 2001; Salamone et al., 2006, Salamone et al., 2007, Salamone et al., 2012; Miller, 2009; Treadway e Zald, 2011). Uma tendência recente na pesquisa em saúde mental tem sido reduzir a ênfase em categorias diagnósticas tradicionais e, em vez disso, concentrar-se nos circuitos neurais que medeiam sintomas patológicos específicos (isto é, a abordagem dos critérios do domínio de pesquisa; Morris e Cuthbert, 2012) É possível que a pesquisa contínua sobre as funções motivacionais da AD lance luz sobre os circuitos neurais subjacentes a alguns dos sintomas motivacionais em psicopatologia e promova o desenvolvimento de novos tratamentos para esses sintomas que são úteis em vários transtornos.

PDF