Tendencias Neurosci. Feb 2006; 29 (2): 116 – 124.
Publicado en línea en enero 6, 2006. doi 10.1016 / j.tins.2005.12.006
PMCID: PMC2430629
NIHMSID: NIHMS52727
La versión editada final del editor de este artículo está disponible en Tendencias Neurosci
Ver otros artículos en PMC que citar El artículo publicado.
Resumen
La corteza orbitofrontal, como parte de la corteza prefrontal, está implicada en la función ejecutiva. Sin embargo, dentro de esta amplia región, la corteza orbitofrontal se distingue por su patrón único de conexiones con nodos de aprendizaje asociativo subcortical cruciales, como la amígdala basolateral y el núcleo accumbens. En virtud de estas conexiones, la corteza orbitofrontal se encuentra en una posición única para usar información asociativa para proyectar hacia el futuro, y para usar el valor de los resultados percibidos o esperados para guiar las decisiones. Esta revisión discutirá la evidencia reciente que respalda esta propuesta y examinará la evidencia de que la pérdida de esta señal, como resultado de los cambios inducidos por las drogas en estos circuitos cerebrales, podría explicar la mala adaptación de la toma de decisiones que caracteriza a la adicción a las drogas.
Introducción
Nuestra capacidad para generar expectativas sobre la conveniencia o el valor de eventos inminentes subyace en gran parte de nuestra emoción y comportamiento. De hecho, dos funciones generales están fundamentalmente servidas por la formación de tales expectativas. Por un lado, las expectativas guían nuestro comportamiento inmediato, permitiéndonos perseguir objetivos y evitar daños potenciales. Por otro lado, las expectativas pueden compararse con los resultados reales para facilitar el aprendizaje, de modo que el comportamiento futuro pueda ser más adaptable. Ambas funciones requieren que la información sobre los resultados esperados se mantenga en la memoria para que pueda compararse e integrarse con información sobre el estado interno y los objetivos actuales. Un proceso integrador de este tipo genera una señal a la que nos referiremos como una expectativa de resultado, un término usado durante mucho tiempo por los teóricos del aprendizaje para referirnos a una representación interna de las consecuencias que pueden seguir a un acto específico [1]. Se esperaría que la interrupción de tal señal creara innumerables dificultades, tanto en la capacidad de tomar decisiones de adaptación como de aprender de las consecuencias negativas de las decisiones. En esta revisión, primero describimos evidencia reciente de que la corteza orbitofrontal (OFC) desempeña un papel crucial en la generación y el uso de las expectativas de resultados. Posteriormente, analizaremos la evidencia reciente de que las decisiones de mala adaptación que caracterizan la adicción a las drogas reflejan, en parte, una interrupción de esta señal como resultado de los cambios inducidos por las drogas en la OFC y las áreas cerebrales relacionadas.
La actividad neuronal en la OFC y la conducta dependiente de la OFC reflejan un papel crucial de la OFC en la generación de expectativas de resultados
La capacidad de mantener la información de modo que pueda manipularse, integrarse con otra información y luego usarse para guiar el comportamiento se ha descrito de diversas maneras como memoria de trabajo, bloc de notas o representación, y depende fundamentalmente de la corteza prefrontal [2]. Dentro de la corteza prefrontal, la OFC, por sus conexiones con las áreas límbicas, se encuentra en una posición única para permitir la información asociativa con respecto a los resultados o consecuencias para acceder a la memoria representativa (Box 1). De hecho, un número creciente de estudios sugiere que un correlato neural del valor esperado de los resultados está presente y tal vez generado en la OFC. Por ejemplo, los estudios de neuroimagen humana muestran que los cambios en el flujo sanguíneo en la OFC durante la anticipación de los resultados esperados y también cuando el valor de un resultado esperado se modifica o no se entrega [3–6]. Esta activación parece reflejar el valor de incentivo de estos elementos y se observa cuando esa información se utiliza para guiar las decisiones [7]. Estos resultados sugieren que las neuronas en la OFC aumentan la actividad cuando se procesa dicha información. En consecuencia, la actividad neuronal en la OFC que precede a las recompensas o los castigos previstos aumenta, lo que generalmente refleja los valores de incentivo de estos resultados [8–11]. Por ejemplo, cuando a los monos se les presentan señales visuales combinadas con diferentes recompensas preferidas, las neuronas de la OFC disparan de forma selectiva según si el resultado anticipado es la recompensa preferida o no preferida dentro de ese bloque de prueba [10]. Por otra parte, Roesch y Olson [11] han demostrado recientemente que la activación en la OFC rastrea varias otras métricas específicas del valor del resultado. Por ejemplo, las neuronas se activan de manera diferente para obtener una recompensa en función de su tamaño esperado, el tiempo anticipado requerido para obtenerlo y las posibles consecuencias aversivas asociadas con el comportamiento inapropiado [11,12].
Caja 1. La anatomía del circuito orbitofrontal en ratas y primates.
Rose y Woolsey [53] propuso que la corteza prefrontal podría definirse por las proyecciones del tálamo mediodorsal (DM) en lugar de por "analogía estratiográfica" [54]. Esta definición proporciona una base sobre la cual definir homólogos prefrontales a través de las especies. Sin embargo, son las similitudes funcionales y anatómicas las que realmente definen las áreas homólogas (Figura I de este recuadro).
En la rata, el MD se puede dividir en tres segmentos [55,56]. Las proyecciones de los segmentos medial y central del DM definen una región que incluye las áreas orbitales y las cortezas insulares agranulares ventral y dorsal [55–58]. Estas regiones del MD en ratas reciben aferentes directos de la amígdala, el lóbulo temporal medio, el pálido ventral y el área tegmental ventral, y reciben información olfativa de la corteza piriforme [55,56,59]. Este patrón de conectividad es similar al de la división magnocelular medialmente localizada de primate MD, que define la subdivisión prefrontal orbital en primates [60–62]. Por lo tanto, es probable que una región definida en el área orbital de la corteza prefrontal de rata reciba información del tálamo que es muy similar a la que alcanza la corteza prefrontal orbital de primates. Basados, en parte, en este patrón de entrada, los campos de proyección de la MD media y central en las áreas insulares orbital y agranular de la corteza prefrontal de rata se han propuesto como homólogos a la región orbitofrontal de primate [55,57,63–65]. Estas áreas en los roedores incluyen la corteza insular agranular dorsal y ventral, y las regiones orbitales laterales y ventrolaterales. Esta concepción de la corteza orbitofrontal de rata (OFC) no incluye la corteza orbital medial o ventromedial, que se encuentra a lo largo de la pared medial del hemisferio. Esta región tiene patrones de conectividad con el MD y otras áreas que son más similares a otras regiones en la pared medial.
Otras conexiones importantes resaltan la similitud entre la OFC de rata y la OFC de primate. Quizás las más notables son las conexiones recíprocas con el complejo basolateral de la amígdala (ABL), una región que se cree que está involucrada en los aspectos afectivos o motivacionales del aprendizaje [66–74]. En primate, estas conexiones se han invocado para explicar similitudes específicas en anomalías de comportamiento que resultan del daño a la OFC o la ABL [14,17,75–77]. Conexiones recíprocas entre la amígdala basolateral y las áreas dentro de la OFC de la rata, particularmente la corteza insular agranular [58,78–80], sugiere que las interacciones entre estas estructuras podrían ser igualmente importantes para la regulación de las funciones de comportamiento en ratas. Además, tanto en ratas como en primates, la OFC proporciona una fuerte proyección eferente al núcleo accumbens, que se superpone con la inervación de las estructuras límbicas, como la ABL y el subículo [81–84]. El circuito específico que conecta la OFC, las estructuras límbicas y el núcleo accumbens presenta un sorprendente paralelo entre las especies que sugiere posibles similitudes en las interacciones funcionales entre estos componentes principales del cerebro anterior [81,84,85].
Figura I

Relaciones anatómicas de la OFC (azul) en ratas y monos. Basándose en su patrón de conectividad con el tálamo mediodorsal (DM, verde), la amígdala (naranja) y el estriado (rosa), las áreas orbital y agranular de la corteza prefrontal de la rata son homólogas al primate OFC. En ambas especies, la OFC recibe información robusta de las cortezas sensoriales e información asociativa de la amígdala, y envía salidas al sistema motor a través del cuerpo estriado. Cada recuadro ilustra una sección coronal representacional. Abreviaturas adicionales: IAd, ínula agranular dorsal; AIv, ínsula agranular ventral; c, central; CD, caudado; LO, orbital lateral; m, medial; NAc, núcleo accumbens núcleo; RABL, amígdala basolateral rostral; VO, orbital ventral, incluidas las regiones ventrolateral y orbital ventromedial; VP, palido ventral.
Dicha actividad anticipatoria parece ser una característica común de la actividad de activación en la OFC en muchas tareas en las que los eventos ocurren en un orden secuencial, y por lo tanto predecible, (Box 2). Sin embargo, es importante destacar que estas respuestas selectivas se pueden observar en ausencia de señales de señalización, y se adquieren a medida que los animales aprenden que las señales particulares predicen un resultado específico. En otras palabras, esta actividad selectiva representa la expectativa de un animal, basado en la experiencia, de los resultados probables. Estas características se ilustran en Figura 1 y XNUMX, que muestra la respuesta de la población de las neuronas OFC registradas en ratas a medida que aprenden y revierten nuevos problemas de discriminación de olores [8,9,13]. En esta tarea simple, la rata debe aprender que un olor predice la recompensa en un pozo cercano, mientras que el otro olor predice el castigo. Al comienzo del aprendizaje, las neuronas en la OFC responden a una pero no al otro resultado. Al mismo tiempo, las neuronas también comienzan a responder en anticipación de su resultado preferido. En varios estudios, 15 – 20% de las neuronas en la OFC desarrollaron dicha actividad en esta tarea, activándose antes de la presentación de sacarosa o quinina [8,9,13]. La actividad en esta población neuronal refleja el valor de los resultados esperados, mantenidos en lo que hemos definido aquí como memoria representativa.
Caja 2. La actividad orbitofrontal proporciona una señal continua del valor de los eventos inminentes
La corteza orbitofrontal (OFC) está bien posicionada para usar información asociativa para predecir y luego señalar el valor de eventos futuros. Aunque el texto principal de esta revisión se centra en la actividad durante los periodos de demora antes de las recompensas para aislar esta señal, la extensión lógica de este argumento es que la actividad en la OFC codifica esta señal en todo el desempeño de una tarea. Por lo tanto, la OFC proporciona un comentario continuo sobre el valor relativo del estado actual y de los posibles cursos de acción bajo consideración.
Este rol es evidente en la actividad de disparo de las neuronas OFC durante el muestreo de señales que predicen la recompensa o el castigo [86–88]. Por ejemplo, en ratas entrenadas para realizar una tarea de discriminación de ocho olores, en la que cuatro olores se asociaron con la recompensa y cuatro olores se asociaron con la no recompensa, las neuronas OFC se vieron más influenciadas por la importancia asociativa de las señales de olor que por la identidades reales del olor [87]. De hecho, si la identidad del olor se hace irrelevante, las neuronas OFC ignorarán esta característica sensorial de la señal. Esto fue demostrado por Ramus y Eichenbaum [89], que entrenaron ratas en una tarea de ocho olores con retraso continuo que no coincide con la muestra, en la que el constructo relevante asociado con la recompensa no es la identidad del olor sino la comparación de "coincidencia" o "no coincidencia" entre la clave en El juicio actual y anterior. Descubrieron que 64% de las neuronas sensibles discriminaban esta comparación de coincidencia y no coincidencia, mientras que solo el 16% se activaba de forma selectiva a uno de los olores.
Aunque la activación selectiva de señales se ha interpretado como una codificación asociativa, sugerimos que esta actividad neuronal en realidad representa la evaluación en curso de los posibles resultados por parte del animal. Por lo tanto, el disparo selectivo de estas neuronas no refleja simplemente el hecho de que una señal específica se haya asociado de manera confiable con un resultado particular en el pasado, sino que refleja el juicio del animal dadas las circunstancias actuales que, al actuar sobre esa información asociativa, conducir a ese resultado en el futuro. Este juicio se representa como el valor de ese resultado específico en relación con los objetivos o deseos internos, y estas expectativas se actualizan constantemente. Por lo tanto, el disparo en la OFC refleja en esencia el valor esperado del estado subsiguiente que se generará dada una respuesta particular, ya sea que ese estado sea un reforzador primario o simplemente un paso hacia esa meta final. De acuerdo con esta propuesta, una revisión de la literatura muestra que la codificación en la OFC diferencia de manera confiable muchos eventos, incluso aquellos eliminados de la entrega de recompensa real, si proporcionan información sobre la probabilidad de recompensa futura (Figura I de este recuadro). Por ejemplo, en el entrenamiento de discriminación de olores, las neuronas OFC se disparan en anticipación del golpe en la nariz que precede al muestreo de olores. La respuesta de estas neuronas difiere según si la secuencia de ensayos recientes [87,90] o el lugar [91] predice una alta probabilidad de recompensa.
Figura I

Actividad neuronal en la OFC en anticipación de los eventos de prueba. Las neuronas en la OFC de rata se registraron durante la ejecución de una tarea de ocho olores, Go-NoGo de discriminación de olores. Se muestra la actividad en cuatro neuronas orbitofrontales diferentes, sincronizadas con cuatro eventos de tareas diferentes (anuncio). La actividad se muestra en formato ráster en la parte superior y como un histograma de tiempo de evento parcial en la parte inferior de cada panel; las etiquetas sobre cada figura indican el evento de sincronización y cualquier evento que haya ocurrido antes o después del inicio de la luz (LT-ON), el olor a hojaldre (OD-POK), el inicio de olor (OD-ON), el poke de agua (WAT-POK) o el suministro de agua (WAT-DEL). Los números indican el número de intentos (n) y el número de picos por segundo. Cada una de las cuatro neuronas se activó en asociación con un evento diferente, y el disparo en cada neurona aumentó en anticipación de ese evento. Adaptado, con permiso, de [87].

Después del aprendizaje, estas neuronas se activan por las señales que predicen sus resultados preferidos, lo que indica el resultado esperado incluso antes de que se produzca una respuesta. Esto es evidente en la respuesta de la población presentada en Figura 1 y XNUMX, que muestra una mayor actividad, después del aprendizaje, en respuesta a la señal de olor que predice el resultado preferido de la población neuronal. Estas señales permitirían que un animal use las expectativas de resultados probables para guiar las respuestas a las señales y facilitar el aprendizaje cuando se violan las expectativas.
La noción de que la OFC guía el comportamiento al señalar las expectativas de resultados es consistente con los efectos del daño de la OFC en el comportamiento. Estos efectos suelen ser evidentes cuando la respuesta adecuada no puede seleccionarse mediante asociaciones simples, sino que requiere que las expectativas de resultados se integren a lo largo del tiempo o que se comparen entre respuestas alternativas. Por ejemplo, los seres humanos con daños en la OFC no pueden guiar el comportamiento de manera adecuada en función de las consecuencias de sus acciones en la tarea de juego de Iowa [14]. En esta tarea, los sujetos deben elegir de las barajas de cartas con diferentes recompensas y penalidades representadas en las tarjetas. Para tomar decisiones ventajosas, los sujetos deben poder integrar el valor de estas recompensas y penalidades variables a lo largo del tiempo. Las personas con daños OFC inicialmente eligen cubiertas que producen recompensas más altas, lo que indica que pueden usar asociaciones simples para dirigir el comportamiento según el tamaño de la recompensa; sin embargo, no modifican sus respuestas para reflejar grandes penalidades ocasionales en esas cubiertas. La integración de la información sobre las penas probabilísticas ocasionales se facilitaría con la capacidad de mantener la información sobre el valor del resultado esperado en la memoria de representación después de hacer una elección, de modo que se puedan reconocer las violaciones de esta expectativa (penas ocasionales). Este déficit es análogo a los déficits de reversión demostrados en ratas, monos y humanos después del daño a la OFC [15–21].
Esta capacidad para mantener información sobre los resultados esperados en la memoria representativa también se ha probado en un estudio reciente en el que los sujetos seleccionaron entre dos estímulos que predecían el castigo o la recompensa a diferentes niveles de probabilidad [22]. En una parte de este estudio, los sujetos recibieron retroalimentación sobre el valor del resultado que no habían seleccionado. Los sujetos normales pudieron usar esta información para modular su emoción sobre su elección y aprender a tomar mejores decisiones en ensayos futuros. Por ejemplo, una pequeña recompensa los hizo más felices cuando supieron que habían evitado una gran pena. Las personas con daño de OFC mostraron respuestas emocionales normales a las recompensas y los castigos que seleccionaron; sin embargo, la retroalimentación sobre el resultado no seleccionado no tuvo efecto ni en sus emociones ni en su desempeño posterior. Es decir, estaban felices cuando recibieron una recompensa, pero no estaban más contentos si se les informaba que también habían evitado una gran pena. Este deterioro es consistente con un rol para la OFC en el mantenimiento de la información asociativa en la memoria representativa para comparar diferentes expectativas de resultados. Sin esta señal, los individuos no pueden comparar el valor relativo de los resultados seleccionados y no seleccionados y, por lo tanto, no pueden usar esta información comparativa para modular las reacciones emocionales y facilitar el aprendizaje.
Si bien estos ejemplos son reveladores, una demostración más directa del papel crucial de la OFC en la generación de expectativas de resultados para guiar la toma de decisiones proviene de reforzar las tareas de devaluación. Estas tareas evalúan el control del comportamiento mediante una representación interna del valor de un resultado esperado. Por ejemplo, en una versión pavloviana de este procedimiento (Figura 2 y XNUMX), las ratas se entrenan primero para asociar una señal ligera con la comida. Después de que se establece la respuesta condicionada a la luz, el valor de la comida se reduce emparejándolo con la enfermedad. Posteriormente, en la prueba de sondeo, la señal de luz se presenta nuevamente en una sesión de extinción no recompensada. Los animales que han recibido parejas de alimentos y enfermedades responden menos a la luz que los controles no devaluados. Es importante destacar que esta disminución en la respuesta es evidente desde el inicio de la sesión y se superpone a las disminuciones normales en la respuesta que resultan del aprendizaje de la extinción durante la sesión. Esta disminución inicial en la respuesta debe reflejar el uso de una representación interna del valor actual del alimento en combinación con la asociación de alimentos ligeros original. Por lo tanto, las tareas de devaluación del reforzador proporcionan una medida directa de la capacidad para manipular y utilizar las expectativas de resultados para guiar el comportamiento.

Las ratas con lesiones OFC no muestran ningún efecto de la devaluación en la respuesta condicionada en este paradigma, a pesar del condicionamiento normal y la devaluación del resultado [23]. En otras palabras, continúan respondiendo a la luz e intentan obtener el alimento, aunque no lo consumirán si se presenta (Figura 2 y XNUMX). Es importante destacar que las ratas lesionadas con OFC muestran una capacidad normal para extinguir sus respuestas dentro de la sesión de prueba, lo que demuestra que su déficit no refleja una incapacidad general para inhibir las respuestas condicionadas [24]. Más bien, la OFC tiene un papel específico en el control de respuestas condicionadas de acuerdo con las representaciones internas del nuevo valor del resultado esperado. En consecuencia, las lesiones OFC hechas después del aprendizaje continúan afectando el comportamiento en esta tarea [25]. Se han reportado resultados similares en monos entrenados para realizar una versión instrumental de esta tarea [19].
Las ratas con lesiones OFC también muestran cambios neurofisiológicos en las regiones posteriores que son consistentes con la pérdida de expectativas de resultados. En un estudio [26], se registraron las respuestas de unidades individuales en la amígdala basolateral, un área que recibe proyecciones de la OFC, en ratas que aprenden y revierten las nuevas discriminaciones de olores en la tarea descrita anteriormente. En estas condiciones, las lesiones de la OFC interrumpieron el disparo en la expectativa de resultado que se observa normalmente en la amígdala basolateral. Además, sin la aportación de la OFC, las neuronas de la amígdala basolateral se volvieron selectivas de la señal mucho más lentamente, en particular después de que se revirtieron las asociaciones de resultado de la señal. La codificación asociativa más lenta en la amígdala basolateral como resultado de las lesiones OFC, especialmente durante la reversión, es consistente con la idea de que las expectativas de resultados facilitan el aprendizaje en otras estructuras, especialmente cuando se violan las expectativas como en las reversas. Por lo tanto, la OFC parece generar y representar expectativas de resultados que son fundamentales no solo para la orientación de la conducta de acuerdo con las expectativas sobre el futuro, sino también para aprender de las violaciones de esas expectativas. Sin esta señal, los animales se involucran en conductas desadaptativas, impulsadas por pautas previas y hábitos de estímulo-respuesta, en lugar de una representación cognitiva de un resultado u objetivo.
Comportamiento adictivo y expectativas de resultados.
Los hallazgos recientes sugieren que esta conceptualización de la función OFC tiene mucho que ofrecer para comprender la adicción a las drogas. De acuerdo con la Manual Diagnóstico y Estadístico de los Trastornos Mentales [27], un diagnóstico de dependencia de sustancias requiere que un individuo muestre una incapacidad para controlar su comportamiento de búsqueda de drogas, a pesar de las consecuencias adversas. Dicha conducta adictiva se caracteriza de diversas maneras como compulsiva, impulsiva, perseverante o bajo el control de señales asociadas a las drogas. Por otra parte, a menudo se observa a pesar de un deseo declarado por parte de los adictos a parar. Por lo tanto, un diagnóstico de dependencia de sustancias requiere un patrón de comportamiento similar al de ratas, monos y humanos lesionados por OFC.
En consecuencia, la adicción a las drogas se asocia con cambios en la estructura y función de la OFC. Por ejemplo, los estudios de imagen de adictos han revelado consistentemente anomalías en el flujo sanguíneo en la OFC [28–33] (para una excelente revisión, ver [34]). Los adictos al alcohol y la cocaína muestran reducciones en las mediciones de referencia de la activación de la OFC durante la abstinencia aguda e incluso después de largos períodos de abstinencia. Por el contrario, durante la exposición a señales relacionadas con las drogas, los adictos muestran una sobreactivación de la OFC que se correlaciona con el grado de deseo que experimentan. Estos cambios se asocian con deficiencias en las conductas dependientes de OFC en adictos a las drogas [35–39]. Por ejemplo, los consumidores de alcohol y cocaína muestran deficiencias similares, aunque no tan severas en promedio, en la tarea de juego descrita anteriormente, al igual que los individuos con lesiones de la OFC. De manera similar, otras pruebas de laboratorio para la toma de decisiones han revelado que los consumidores de anfetaminas tardan más tiempo y tienen menos probabilidades de elegir la opción más gratificante que los controles. ¿Pero estos déficits reflejan una vulnerabilidad preexistente a la adicción en algunas personas? ¿O son el resultado de neuroadaptaciones inducidas por medicamentos a largo plazo? Y si es así, ¿reflejan cambios en la estructura y / o función dentro de la OFC, o son el resultado de cambios en otras partes de las redes corticolímbicas que imitan los efectos de las lesiones de la OFC?
Para responder a estas preguntas, es necesario recurrir a modelos animales, en los que se pueden administrar drogas adictivas de manera controlada en un contexto genético y ambiental relativamente fijo. Un número creciente de estudios de este tipo demuestra ahora que la exposición prolongada a drogas adictivas, y en particular a los psicoestimulantes, produce cambios cerebrales y de comportamiento relativamente prolongados [40–50]. Es importante destacar que estos efectos se observan generalmente meses después de la interrupción y en entornos de comportamiento que no están relacionados con la exposición a drogas, lo que es consistente con la hipótesis de que las drogas adictivas modifican los circuitos cerebrales que son cruciales para el control normal de la conducta. Recientemente, varios estudios han demostrado efectos en la OFC. Por ejemplo, se informó que ratas entrenadas para autoadministrarse anfetamina durante varias semanas mostraron una reducción en la densidad de la columna dendrítica en la CPA un mes después [46]. Además, estas ratas experimentadas con el fármaco exhibieron menos remodelaciones de sus dendritas en respuesta al entrenamiento instrumental apetitivo. Estos hallazgos son particularmente notables en vista del aumento de la densidad de la columna vertebral que se ha informado previamente en la corteza prefrontal medial, el núcleo accumbens y en otros lugares después del tratamiento con psicoestimulantes [41]. Por lo tanto, entre estas regiones corticolímbicas, la OFC parece ser única en mostrar evidencia de disminución de la plasticidad sináptica después de la exposición al fármaco.
Podría esperarse que una disminución de la plasticidad en la OFC afecte las funciones dependientes de la OFC. De acuerdo con esta conjetura, las ratas a las que se les administró un tratamiento de dos semanas con cocaína muestran un deterioro de larga duración en el comportamiento dependiente de la OFC. Específicamente, estos animales no pueden utilizar el valor de los resultados previstos para guiar su comportamiento. En un experimento [51], las ratas recibieron inyecciones diarias de cocaína durante dos semanas. Más de un mes más tarde, estas ratas se probaron en una tarea de discriminación de olores Go-NoGo. En esta tarea, las ratas aprenden a ir a un puerto de fluido para obtener sacarosa después de oler un olor y se abstienen de ir al mismo puerto de fluido para evitar la quinina después de oler un segundo olor. Las ratas tratadas con cocaína aprendieron estas discriminaciones al mismo ritmo que los controles tratados con solución salina, pero no pudieron adquirir reversiones de las discriminaciones tan rápidamente como los controles. También se han demostrado déficits de inversión similares en primates a los que se les da acceso crónico intermitente a la cocaína [43]. Tales déficits de inversión son característicos de los animales y humanos lesionados con OFC [15–21], donde se cree que reflejan una incapacidad para cambiar los comportamientos establecidos rápidamente. Proponemos que el papel de la OFC en el apoyo a esta flexibilidad rápida se relacione con su importancia para señalar las expectativas de resultados [26]. Durante el aprendizaje inverso, la comparación de esta señal con el resultado real invertido generaría señales de error cruciales para el nuevo aprendizaje [1]. Sin esta señal, las ratas lesionadas con OFC aprenderían más lentamente. Como ya hemos discutido, recientemente se ha demostrado una correlación neurofisiológica de este lento aprendizaje en la inflexible codificación asociativa de las neuronas de amígdala basolateral en ratas lesionadas con OFC [26].
La pérdida de esta señal también es evidente en un segundo experimento en el que las ratas se trataron con cocaína durante dos semanas y luego se probaron en la tarea de devaluación del reforzador pavloviano descrita anteriormente [24]. Nuevamente, las pruebas se realizaron aproximadamente un mes después del último tratamiento con cocaína. Estas ratas exhibieron condicionamiento normal y devaluación, y también se extinguieron respondiendo normalmente en la fase de prueba final; sin embargo, las ratas devaluadas tratadas con cocaína no mostraron una reducción espontánea normal en respuesta a la señal predictiva. Este déficitFigura 3 y XNUMX) es idéntico al déficit después de las lesiones OFC en esta tarea (Figura 2 y XNUMX). Estos hallazgos son consistentes con una incapacidad para señalar el valor del resultado esperado. De hecho, debido a que en esta tarea no hay ambigüedad con respecto a las representaciones requeridas para mediar el desempeño normal, los déficits descritos aquí apuntan inequívocamente hacia una pérdida de expectativas de resultados en ratas tratadas con cocaína.

La pérdida de este mecanismo de señalización daría cuenta de la propensión de los adictos a seguir buscando drogas, a pesar de las consecuencias negativas casi inevitables de tal comportamiento, ya que los haría incapaces de incorporar esta información predictiva en su toma de decisiones y tal vez no podrían aprender de ella. Incluso la experiencia repetida de estas consecuencias negativas. Aunque otros sistemas cerebrales también podrían estar involucrados, los cambios inducidos por las drogas a esta señal dependiente de la OFC contribuirían poderosamente a una transición de la conducta normal dirigida hacia el objetivo a la respuesta compulsiva habitual. Esta transición reflejaría un cambio en el equilibrio entre estos mecanismos competitivos de control de comportamiento. Tal explicación sería válida para el comportamiento de búsqueda de drogas de los adictos, y también para hallazgos recientes en varios modelos animales de adicción en los que las ratas no pueden retener el comportamiento de búsqueda de droga, incluso cuando los resultados adversos dependen de esa conducta [45,47].
Observaciones finales
Hemos revisado los resultados recientes para apoyar la propuesta de que la OFC es crucial para señalar el valor de los resultados o consecuencias esperadas. También hemos discutido cómo esta idea podría ser importante para comprender la patología que subyace a la adicción a las drogas. Por supuesto, estas ideas plantean muchas más preguntas. Si la OFC genera señales con respecto a los resultados esperados, es crucial entender cómo las áreas aguas abajo usan estas señales, en animales normales, además de aquellas expuestas a drogas adictivas. Hemos sugerido cómo podría estar involucrada la amígdala basolateral [26]; sin embargo, comprender el papel que tienen estas señales en el núcleo accumbens y cómo interactúan con otras entradas "límbicas" puede ser mucho más relevante para comprender la adicción. Varios laboratorios están trabajando duro para resolver estos importantes problemas. Además, será importante demostrar si los cambios en el comportamiento dependiente de la OFC después de la exposición al fármaco reflejan realmente una función molecular o neurofisiológica alterada en la OFC, como lo sugieren los datos de registro preliminares [52], o alternativamente, si pueden reflejar cambios en otras partes del circuito, como en el núcleo accumbens, un área implicada desde hace mucho tiempo en la adicción. Y, por supuesto, cualquier modelo animal de enfermedad solo tiene valor si sugiere un remedio para los cambios patológicos. Esto es difícil en el caso de las lesiones, pero podría ser posible para déficits derivados de la exposición al fármaco. Sin embargo, queda por ver si se pueden realizar manipulaciones para normalizar el comportamiento y tal vez cualquier correlato molecular o neurofisiológico que se identifique en animales tratados con fármacos. Esperamos que estos y muchos más temas se aborden en los próximos años (Box 3).
Caja 3. Preguntas sin respuesta
- ¿De qué manera las áreas río abajo, en particular el núcleo accumbens, utilizan señales con respecto a las expectativas de resultados de la OFC? ¿Cómo se integra esta información con otras entradas 'límbicas' a los accumbens?
- ¿Se pueden vincular los cambios en los comportamientos dependientes de la OFC después de la exposición al fármaco a los cambios en las dianas moleculares o neurofisiológicas dentro de la OFC? ¿O estos déficits de comportamiento reflejan cambios en otros lugares en los circuitos de aprendizaje?
- ¿Se pueden revertir los cambios en el comportamiento u otros marcadores relacionados con los medicamentos mediante manipulaciones conductuales o farmacológicas?
- ¿Los cambios funcionales en la OFC o en los circuitos de aprendizaje relacionados son diferentes en los animales que reciben experiencias de drogas contingentes versus no contingentes? Y si es así, ¿las diferencias tienen un impacto crítico en el comportamiento?
- ¿Los cambios en la OFC subyacen al comportamiento en los modelos de adicción a las drogas de búsqueda compulsiva de drogas y la recaída? ¿Y podrían ser particularmente importantes al principio de la transición a la adicción, promoviendo el uso continuo de drogas antes de que los cambios estriatales, que se asocian con un mayor acceso a largo plazo, se vuelvan influyentes?
AGRADECIMIENTOS
Nuestra investigación fue apoyada por subvenciones del NIDA (R01-DA015718 a GS), NINDS (T32-NS07375 a MRR) y NIDCD (T32-DC00054 a TAS).
Referencias