La dopamina modula la expectativa de recompensa durante el desempeño de una tarea de máquina tragamonedas en ratas Evidencia para un efecto de casi pérdida. (2011)

COMENTARIOS: Lo que esto muestra es que a las ratas les gusta jugar, por lo que es una ventaja evolutiva jugar. También muestra que los cuasi accidentes pueden aumentar la respuesta a la dopamina. Como se dijo, si el juego puede alterar nuestro cerebro límbico, entonces la pornografía ciertamente puede hacerlo. También es un recordatorio de que compartimos funciones límbicas básicas con nuestros primos mamíferos.


Neuropsicofarmacología. 2011 abril; 36(5): 913-925.

Publicado en línea 2011 Enero 5. doi  10.1038 / npp.2010.230

Departamento de Psicología, Universidad de British Columbia, Vancouver, BC, Canadá.

Los relatos cognitivos sobre el juego sugieren que la experiencia de casi ganar, los llamados "casi errores", fomenta el juego continuo y acelera el desarrollo del juego patológico (PG) en individuos vulnerables. Una explicación de este efecto es que los cuasi-accidentes señalan resultados inminentes de ganar y aumentan la expectativa de recompensa, lo que impulsa el juego. La determinación de los procesos neuroquímicos subyacentes al impulso de apostar podría facilitar el desarrollo de tratamientos más efectivos para PG. Con este objetivo en mente, evaluamos el rendimiento de las ratas en un modelo novedoso de juego de máquinas tragamonedas, una forma de juego en la que los eventos cercanos al fracaso son particularmente destacados. Los sujetos respondieron a una serie de tres luces intermitentes, ligeramente análogas a las ruedas de una máquina tragamonedas, lo que provocó que las luces se pusieran en "encendido" o "apagado". Se señaló un resultado ganador si las tres luces estaban encendidas. Al final de cada prueba, las ratas eligieron entre responder en la palanca de 'recolectar', lo que resultó en una recompensa en las pruebas ganadoras, pero una penalización de tiempo en las pruebas perdidas o comenzar una nueva prueba.

Las ratas mostraron una marcada preferencia por la palanca de recolección cuando se iluminaron dos y tres luces, lo que indica una mayor expectativa de recompensa después de casi fallos similares a victorias. Las respuestas de recolección erróneas aumentaron con la anfetamina y el agonista del receptor D (2) quinpirol, pero no con el agonista del receptor D (1) SKF 81297 o los antagonistas selectivos del subtipo de receptor.

Estos datos sugieren que la dopamina modula la expectativa de recompensa luego de la experiencia de ganar casi durante el juego en máquinas tragamonedas, a través de la actividad en los receptores D (2), y esto puede resultar en una mejora del efecto de casi fallas y facilitar el juego adicional.

INTRODUCCIÓN

La gente juega a pesar de ser consciente de que las probabilidades están a favor de la casa. Este comportamiento ha resultado en una industria del juego altamente rentable que continúa creciendo incluso en tiempos de recesión. A medida que el juego se vuelve más frecuente y socialmente aceptable, aumenta el debate público sobre sus consecuencias potencialmente dañinas (Shaffer y Korn, 2002). La mayoría de las personas disfrutan de juegos recreativos sin efectos adversos. Sin embargo, para una minoría significativa, el juego se convierte en un comportamiento compulsivo y patológico que se parece mucho al abuso de sustancias (Potenza, 2008), y las estimaciones actuales sobre la prevalencia de vida de tales juegos de azar patológicos (PG) varían entre 0.2-2% (Shaffer et al, 1999; Petry et al, 2005). Determinar por qué las personas juegan podría, por lo tanto, proporcionar una valiosa información sobre los comportamientos adictivos, así como fomentar nuestro conocimiento de la toma de decisiones no normativas o "irracionales".

Las cuentas cognitivas de PG proponen que el juego se mantenga debido a la
creencias erróneas o distorsionadas sobre la independencia de los resultados del juego, la intervención de la suerte y la capacidad de las habilidades personales para conferir éxito al apostar (Ladouceur et al, 1988; Toneatto et al, 1997).
Una hipótesis destacada es que la experiencia de casi ganar (lo que se conoce como "casi perdida") puede vigorizar la actividad de juego y acelerar el desarrollo de PG en individuos vulnerables.(Reid, 1986; Griffiths, 1991; Clark, 2010). Los eventos cercanos pueden producir cambios psicológicos y fisiológicos similares a los resultados ganadores (Griffiths, 1991). Los casi fallos pueden, por lo tanto, aumentar la expectativa de recompensa debido a su similitud con las victorias, lo que hace que el juego continuo sea más probableReid, 1986). En línea con esta teoría, se ha demostrado que los casi fallos aumentan el deseo de continuar apostando (Kassinove y Schare, 2001; Posibilidades et al, 2003; MacLin et al, 2007) y para mejorar la actividad neural en el cerebro medio y el estriado ventral (Clark et al, 2009; Habib y Dixon, 2010). Estas observaciones sugieren que los casi fallos transmiten una señal de recompensa positiva codificada por los circuitos dopaminérgicos que apoyan la expectativa de recompensa y el aprendizaje de refuerzo (Schultz et al, 1997; Schultz, 1998; Fiorillo et al, 2003).

A pesar de esta hipótesis general, se ha demostrado que los fármacos que alteran la actividad dopaminérgica modifican el juego de máquinas tragamonedas, una forma de juego en la que los casi accidentes son particularmente importantes.. La droga psicoestimulante.
la anfetamina, que potencia las acciones de la dopamina (DA), puede aumentar
La motivación para jugar a las máquinas tragamonedas (Zack y Poulos, 2004), mientras que la preferencial D2 El antagonista del receptor, el haloperidol, puede mejorar las propiedades gratificantes de tal comportamiento (Zack y Poulos, 2007). La señalización aberrante de la DA es un componente crítico de la adicción a las drogas, e impulsa la mayor prominencia de incentivo de las señales pareadas de drogas que galvanizan la búsqueda de drogas (Robinson y Berridge, 1993). La observación de que el juego de máquinas tragamonedas es a menudo la actividad de juego más común en los jugadores patológicos ha llevado a la sugerencia de que el juego de máquinas tragamonedas puede ser particularmente compulsivo (Breen y Zimmerman, 2002; Choliz, 2010). Dado que la investigación con animales ha mejorado significativamente nuestra comprensión del comportamiento dirigido a los objetivos y la adicción, un modelo animal de juego con máquinas tragamonedas puede hacer una contribución valiosa a la investigación del juego (Potenza, 2009), y un informe preliminar indica que las ratas son capaces de aprender tal tarea (Peterson et al, 2010).

Para resumir, la evidencia actual sugiere que el sistema DA puede estar involucrado de manera crítica en el desarrollo del juego patológico de máquinas tragamonedas y en la manifestación del efecto de casi fallar. debido a su papel en la señalización expectativa de recompensa. Determinar los procesos neuroquímicos que subyacen a la expectativa de recompensa cuando el juego podría ayudar en el desarrollo de tratamientos efectivos para PG. Usando un nuevo paradigma de roedor de máquinas tragamonedas, por lo tanto, intentamos determinar si la experiencia de "casi ganar" aumentaría la expresión de comportamiento de la expectativa de recompensa en ratas de una manera análoga a un efecto de casi fallas, y si tal comportamiento podría ser modulado por Drogas dopaminérgicas.

MATERIALES Y MÉTODOS

Materias

Los sujetos fueron ratas macho 16 Long Evans (Charles River Laboratories, St Constant, NSW, Canadá) que pesaban 250 – 275g al inicio de las pruebas. Los sujetos fueron alimentos restringidos a 85.% de su peso de alimentación libre y mantenido en 14.Chata de rata dada diariamente. El agua estaba disponible ad libitum. Todos los animales se alojaron en parejas en una sala de colonias con clima controlado mantenida a 21 ° C en un 12 inversoh
horario luz-oscuridad (luces apagadas 0800). Pruebas de comportamiento y vivienda.
estaban de acuerdo con el Consejo Canadiense de Cuidado de Animales y todos
Los protocolos experimentales fueron aprobados por el Comité de Cuidado de Animales de la UBC.

Aparato de comportamiento

Las pruebas se llevaron a cabo en ocho cámaras operantes estándar de cinco orificios, cada una cerrada
dentro de un gabinete de atenuación de sonido ventilado (Med Associates St Albans,
Vermont). La configuración de las cámaras fue idéntica a la de
descrito anteriormente (Zeeb et al, 2009),
con la adición de palancas retráctiles ubicadas a cada lado de la
bandeja de comida. Las cámaras fueron controladas por software escrito en MED-PC por CAW
ejecutándose en una computadora compatible con IBM.

Pruebas de comportamiento

Habituación y formación.

En resumen, los sujetos se habituaron inicialmente a las cámaras de prueba y
Aprendí a responder en cada una de las palancas retráctiles para ganar comida.
recompensa. Los animales fueron entrenados en una sucesión de versiones simplificadas.
Del programa de máquinas tragamonedas que aumentó gradualmente en complejidad. UNA
La descripción detallada de cada etapa de entrenamiento se proporciona en
Información.

Tarea de tragamonedas

Un esquema de tareas se proporciona en Figura 1 y XNUMX. Los tres orificios intermedios dentro de la matriz de cinco orificios se usaron en la tarea
(agujeros 2 – 4). La rata inició cada prueba presionando la palanca de balanceo.
Esta palanca se retrajo y la luz interior del orificio 2 comenzó a destellar a una
frecuencia de 2Hz (Figura 1a). Una vez, la rata hizo una respuesta de bocina en esta abertura, la luz
en el interior, activado o desactivado (resumido de aquí en adelante como '1' o '0') para el
resto del juicio. Dependiendo del estado de iluminación del
luz, ya sea un 20kHz ('on') o 12Sonido kHZ ('off') para 1s, después de lo cual la luz en el agujero 3 comenzó a parpadear (Figura 1b). Nuevamente, una respuesta de bocina hizo que la luz se encendiera o apagara y activó la presentación de un 1s 20/12KHZ tono, después de lo cual la luz en el agujero 4 comenzó a parpadear (Figura 1c).
Una vez que la rata había respondido en el orificio 4 y la luz interior se encendió o se encendió
apagado, nuevamente acompañado por el tono relevante, tanto el coleccionar como el rollo
se presentaron palancas (Figura 1d y e).

Figura 1.

Figura 1: desafortunadamente no podemos proporcionar un texto alternativo accesible para esto. Si necesita ayuda para acceder a esta imagen, comuníquese con help@nature.com o con el autor

Diagrama esquemático que muestra la estructura de prueba para la tarea de la máquina tragamonedas. UNA
La respuesta en la palanca de balanceo comienza a parpadear la primera luz (a). Una vez el
el animal responde en cada apertura intermitente, la luz interior se pone en
o apagado y el agujero vecino comienza a destellar (b, c). Una vez los tres
las luces se han establecido, la rata tiene la opción de comenzar una nueva prueba, por
respondiendo en la palanca de balanceo, o respondiendo en la palanca de recogida. En ganar
pruebas, donde todas las luces se han encendido, una respuesta de recogida
entrega 10 gránulos de azúcar (d). Si alguna de las luces se ha apagado,
La respuesta en la palanca de recolección en lugar de eso da como resultado un 10s
período de tiempo de espera (e). Hay ocho posibles patrones de luz (f). Una victoria
está claramente señalado por las tres luces que están encendidas, y una pérdida clara
es evidente cuando todas las luces están apagadas.

Figura completa y leyenda (99K)Descargar powerPunto de deslizamiento (1,304 KB)

Entonces se requirió que la rata respondiera en una u otra palanca, y el óptimo
La elección fue indicada por el estado de iluminación de las luces en los agujeros.
2 – 4. En las pruebas ganadoras, las tres luces se encendieron en (1,1,1), y una
La respuesta en la palanca de recogida entregó pellets de azúcar 10 (Figura 1d). Si alguna de las luces se hubiera apagado (por ejemplo, Figura 1e), luego una respuesta en la palanca de recolección conduce a un 10s
período de tiempo de espera durante el cual no se pudo obtener la recompensa. El uso de
tres agujeros activos dieron lugar a ocho posibles tipos de prueba (Figura 1f,
(1,1,1); (1,1,0); (1,0,1); (0,1,1); (1,0,0); (0,1,0); (0,0,1);
(0,0,0)), cuya incidencia se distribuyó equitativamente al azar
A lo largo de la sesión en un índice 8 de proporción variable. Si la rata elige
la palanca de balanceo en cualquier prueba, entonces la recompensa potencial o el tiempo de espera fue
Cancelado, y comenzó una nueva prueba. Por lo tanto, en las pruebas ganadoras, el óptimo
La estrategia era responder en la palanca de recolección para obtener el
recompensa, mientras que en las pruebas de pérdida, la estrategia óptima era en cambio
responde en la palanca de balanceo y comienza una nueva prueba. Si la rata elige
recoger, ambas palancas retraídas hasta el final de la entrega de recompensa/tiempo muerto
período, después del cual se presentó la palanca de rodadura y la rata pudo
Iniciar el siguiente juicio. La tarea fue totalmente autodidacta en ese sentido.
los animales no estaban obligados a hacer ninguna de las respuestas dentro de un
ventana de tiempo particular; Si es necesario, el programa continuará esperando.
para que el animal haga la siguiente respuesta válida en la secuencia hasta
El final de la sesión. El único punto en el que la rata podría fallar
Por lo tanto, completar una prueba era si la sesión terminaba a la mitad.
Los animales recibieron cinco sesiones diarias de prueba por semana hasta
Se han establecido patrones de respuesta estadísticamente estables a lo largo de
cinco sesiones (número máximo de sesiones tomadas para alcanzar los criterios,
Incluyendo todas las sesiones de entrenamiento: 49 – 54). Se consideró que los animales tenían
adquirieron con éxito la tarea si completaron> 50 ensayos por
sesión y hecho <50% Recopilar respuestas en pruebas de pérdida clara (0,0,0).

El paradigma actual es similar a un intento anterior de modelar el juego de máquinas tragamonedas en ratas (Peterson et al, 2010),
en que los animales tenían que elegir entre una palanca de recogida y
Palanca de 'girar' o 'rodar' dependiendo de un patrón de luz. Sin embargo, en el
informe por Peterson et al (2010), el hoyo anterior tuvo que ser iluminado para la posterior
Luz para ser encendida. Como resultado, los sujetos podrían resolver el
discriminación atendiendo únicamente a la última luz iluminada en el
secuencia. En el presente estudio, los animales también estaban obligados a
Nosfoke en los agujeros de respuesta para asegurarse de que estaban atendiendo, o
Al menos de frente, las luces de estímulo durante la prueba.

Desafíos farmacológicos

Una vez que se había establecido un comportamiento de referencia estable, se determinó la respuesta a los siguientes compuestos: d-anfetamina (0, 0.6, 1.0, 1.5mg/kg), eticlopride (0, 0.01, 0.03, 0.06mg/kg), SCH 23390 (0, 0.001, 0.003, 0.01mg/kg), quinpirol (0, 0.0375, 0.125, 0.25mg/kg) y SKF 81297 (0, 0.03, 0.1, 0.3mg/kg). Las drogas fueron administradas 10mín. antes de la prueba de acuerdo con una serie de diseños de cuadrado latino de diagrama equilibrado para dosis AD: ABCD, BDAC, CABD, DCBA; p.329 (Cardinal y Aitken, 2006). Cada droga/salina
El día de la prueba fue precedido por un día de referencia sin drogas y seguido por un día
en el que los animales no fueron probados. Los animales fueron probados libres de drogas para al
menos semana 1 entre cada serie de inyecciones para permitir que se restablezca una línea de base de comportamiento estable.

Extinción y Restablecimiento

La extinción/La prueba de restablecimiento tuvo un diseño similar al utilizado en la autoadministración de medicamentos.
experimentos El objetivo de esta manipulación fue observar si la tarea
el rendimiento se extinguiría más lentamente si se tratara de pruebas putativas de casi fallas
estuvieron presentes, de acuerdo con algunos informes en la literatura humana (Kassinove y Schare, 2001; MacLin et al, 2007).
Los ensayos de casi error se definieron como cualquier tipo de ensayo en el que dos de cada
Se iluminaron tres orificios activos (ver la sección de resultados para la justificación).
Tras la finalización de todos los desafíos farmacológicos, los animales.
se dividieron en dos grupos emparejados tanto para el número de ensayos
completado y el patrón de respuestas colectivas observado en diferentes
tipos de prueba Ambos grupos realizaron la tarea de la máquina tragamonedas en
extinción, durante la cual una respuesta de recopilación después de una prueba de victoria ya no es
resultó en la entrega de la recompensa. Para un grupo de ratas, ensayos de casi fallas
fueron omitidos del juego. La incidencia de victorias y pruebas de pérdida clara fue
Mantenido igual en ambos grupos. Después de las sesiones de extinción 10, todas las ratas
se reinstalaron en la tarea de la máquina tragamonedas estándar para un 10 adicional
Sesiones durante las cuales las pruebas de victoria fueron nuevamente recompensadas. Mas rapido
la reinstalación podría ser indicativo de un mayor compromiso en la ranura
tarea de la máquina. Los ensayos de casi fallas estuvieron presentes para ambos grupos durante
reinstalación.

Drogas

Todas las dosis de fármaco se calcularon como la sal y se disolvieron en 0.9.% solución salina estéril Todos los fármacos se prepararon diariamente y se administraron por vía intraperitoneal en un volumen de 1.mg/ml. Clorhidrato de Eticlopride, clorhidrato de SCH 23390 y quinpirol
el clorhidrato se adquirió en Sigma-Aldrich (Oakville, Canadá). SKF
El bromhidrato 81297 se adquirió de Tocris Bioscience (Ellisville,
MES). DEl hemisulfato de anfetamina se adquirió bajo una exención de Health Canada de Sigma-Aldrich UK (Dorset, Inglaterra).

Análisis de Datos

Se analizaron las siguientes variables para cada tipo de prueba: el porcentaje
de los ensayos en los que los animales presionaron la palanca de recogida (arcoseno
transformada), la latencia promedio para responder en la palanca de recolección, y
La latencia para responder en cada apertura cuando la luz interior estaba
brillante. También se analizó el número de ensayos completados por sesión.
La latencia para elegir la palanca de balanceo después de cada prueba no se incluyó
en el análisis formal, ya que esta medida fue sesgada por el mayor
incidencia de respuestas de recopilación erróneas, lo que resulta en un 10s
penalización por tiempo, en algunos tipos de prueba y el tiempo que lleva consumir azúcar
Pellets en las pruebas de ganar. Todos los datos fueron sometidos a dentro de los sujetos.
Análisis de varianza de medidas repetidas (ANOVA), realizado mediante SPSS
software (SPSS v16.0, Chicago, IL).

Durante el entrenamiento, la selección de la palanca de recolección y la latencia de la palanca de recolección se analizaron en cinco
Sesiones (semanales) de sesión con sesión (cinco niveles) y tipo de prueba (ocho
niveles) como factores dentro de los sujetos. Una línea de base estable se definió como la
Falta de un efecto significativo de sesión o tipo de prueba × sesión
Interacción. Para determinar el impacto del número de luces.
iluminados, independientemente de la posición espacial, los datos se agruparon en
Pruebas de luz 2 ((1,1,0), (1,0,1) y (0,1,1)) y pruebas de una luz
((1,0,0), (0,1,0), y (0,0,1)). Luego se realizó ANOVA con sesión.
y luces iluminadas (niveles 4, 0 – 3) como factores dentro de los sujetos. los
La latencia para responder a la matriz se sometió primero a ANOVA con
sesión, tipo de prueba y agujero (niveles 3) como factores dentro de los sujetos. En
Para determinar si la respuesta en el siguiente hoyo se vio afectada por
la iluminación del agujero anterior, la latencia media para responder en
se calculó el orificio central si el primer orificio se había activado o desactivado,
independientemente del tipo de prueba. Asimismo, la latencia media para responder en
se determinó el último orificio si el orificio central se había activado o desactivado.
Estos datos fueron luego sometidos a ANOVA con sesión, agujero (dos niveles:
medio y último) y estado del agujero anterior (dos niveles: encendido y apagado) como
Factores dentro de los sujetos. Los ensayos completados por sesión fueron analizados por un
ANOVA simple con sesión como único factor dentro de los sujetos. los
Se analizó la respuesta a los diferentes retos farmacológicos utilizando
métodos ANOVA similares, pero el factor de sesión fue reemplazado con una dosis
factor.

Los datos de las sesiones de extinción y reincorporación de 10 también fueron analizados por ANOVA en los contenedores de día 3-4, con el
adición de grupo (niveles de 2) como un factor entre sujetos. Como analisis
de todas las demás variables se confundió por el hecho de que no todas las pruebas
Los tipos estaban presentes para ambos grupos, la única variable analizada desde el
Las sesiones de extinción fueron la cantidad de ensayos completados. En todos los análisis,
el nivel de significación se estableció en p<0.05. Si se encontró que la probabilidad de que ocurra un evento es <0.1, la observación se describió como una tendencia.

Notable    

RESULTADOS

Rendimiento de línea de base

Se excluyeron del análisis cuatro animales por no cumplir con los requisitos
siguiendo los criterios de aprendizaje: estas ratas no realizaron al menos 50
pruebas por sesión, ni hicieron menos de 50% Recoger errores en pruebas de pérdida clara (0,0,0). El número final de ratas incluidas en el estudio fue, por lo tanto, 12.

Elección de la palanca

En las pruebas ganadoras, las ratas respondieron en la palanca de recogida virtualmente 100% del tiempo, asegurando así la entrega de la recompensa programada (Figura 2a yb).
En contraste, si ninguna de las luces está encendida (una pérdida 'clara'), las ratas
mostró una fuerte preferencia por la ahora ventajosa palanca de balanceo. Sin embargo,
incluso en tales pruebas de pérdida clara, las ratas respondieron erróneamente en la
recoger la palanca en aproximadamente 20% de ensayos. La preferencia por la palanca de recolección varió significativamente entre los otros tipos de prueba (Figura 2b, tipo de prueba: F7,77=56.75, p<0.01). El predictor más claro del patrón de elección observado fue el grado de
El juicio se parecía a una victoria, como lo demuestra la positiva positiva.
correlación observada entre el número de luces iluminadas y la
porcentaje de respuestas recogidas (Figura 2a).

Por lo tanto, la presencia de señales de 'victoria' putativas en las pruebas de pérdida de forma lineal
aumentó la probabilidad de que la rata respondiera como si el ensayo fuera un
Gana el juicio, y haz una respuesta inadaptada. De esta manera, tal
respuestas de recopilación erróneas podrían reflejar un proceso similar a un
Efecto "cerca de la falta". Este efecto es más fuerte en las pruebas de pérdida de luz 2, en
que la preferencia por la palanca de recogida es significativamente mayor que
probabilidad, y también más alta que la observada para 1-pérdidas ligeras o claras
pérdidas (luces iluminadas: F3,33=245.23, p<0.01; 2 vs 1-luces: F1,11=143.57, p<0.01; 2 vs Luces 0: F1,11=249.20, p<0.01), aunque todavía es significativamente más bajo que el observado durante las pruebas ganadoras (2 vs Luces 3: F3,33=128.92, p

Figura 2.

Figura 2: desafortunadamente no podemos proporcionar un texto alternativo accesible para esto. Si necesita ayuda para acceder a esta imagen, comuníquese con help@nature.com o con el autor

Base de rendimiento de la tarea de la máquina tragamonedas. En las pruebas ganadoras, cuando los tres
las luces se encendieron ((1,1,1)), los animales eligieron la palanca de recolección 100% del tiempo (a, b). Como el número de luces iluminadas disminuyó, así
hizo la preferencia por la palanca de recogida (a). Animales consistentemente
mostró una fuerte preferencia por la palanca de recolección en las pérdidas de luz 2, o
cerca de los ensayos de la falta. La proporción de respuestas colectivas realizadas en ambos
Las pérdidas de 2-light y 1-light también variaron según el patrón preciso
de luces iluminadas (b). En la primera semana de entrenamiento, las ratas fueron
más lento para responder en el siguiente agujero si el agujero anterior se había establecido en
apagado (c). Sin embargo, este efecto diferencial ya no se observó una vez.
Se ha establecido un comportamiento de elección estable. Este patrón fue observado
tanto para el orificio medio como para el último, por lo tanto, el gráfico refleja la
Datos combinados de ambos agujeros. Todos los datos mostrados son la media de cinco
Sesiones ± SEM.

Figura completa y leyenda (60K)Descargar powerPunto de deslizamiento (709 KB)

Aunque el número total de luces iluminadas por prueba es un mejor predictor de la elección de la palanca de recogida que la iluminación de cualquier luz en
En particular, tendió a haber alguna variación entre las tasas de error en
1-light (tipo de prueba: F2,22=3.061, p=0.067) y pérdidas de 2-light (tipo de prueba: F2,22=3.717, p=0.041)
potencialmente indicando que la ubicación espacial de los agujeros exactos
iluminado podría afectar el sesgo de las ratas hacia la recogida o el rollo
palanca. Numéricamente, el mayor número de respuestas erróneas ocurrió
cuando se encendió la última luz. Es posible que un atencionista.
sesgo puede haber desarrollado a esta apertura, potencialmente debido a su cierre
La proximidad en el espacio y el tiempo a la palanca de recogida. Sin embargo, comparando el
Las pérdidas de luz 1, la iluminación de la luz final en la serie llevaron a un
mayor tasa de error que la iluminación del orificio central ((0,1,0) vs (0,0,1): F1,11=5.026, p=0.047), pero no el primer orificio ((1,0,0) vs (0,0,1): F1,11=2.682,
NS). Del mismo modo, si el orificio final no se iluminó en una luz 2
pérdida, se observó una tasa de error más baja en comparación con una pérdida en la que
los primeros y últimos orificios se fijaron en ((1,1,0) vs (1,0,1): F1,44=7.643, p=0.018), pero no si solo se iluminaron las dos últimas luces ((1,1,0) vs (0,1,1): F1,44=2.970,
NS). Sobre la base de los análisis estadísticos, por lo tanto
Parece que una señal de ganancia en medio de la secuencia es menos potente
de uno al final o al principio, pero la iluminación de cualquier particular
El agujero no es suficiente, en sí mismo, para determinar la elección de la palanca.
Ya sea presentando las señales en un orden aleatorio, en lugar de de izquierda a
derecha, mejoraría estos efectos queda por determinar.

Latencias de respuesta

En contraste con la distribución de las respuestas de la palanca de recolección, la latencia a
responder en la palanca de recogida no varió dependiendo de la luz
patrón (Tabla complementaria S1: tipo de prueba: F7,77=0.784,
NS). La latencia para responder en cada agujero sucesivo disminuyó constantemente
desde el primero hasta el último hoyo de la prueba, independientemente de la
tipo de prueba (Tabla complementaria S2: agujero: F2,22=17.773, p<0.01, tipo de prueba: F7,77=1.724,
NS). Desde una perspectiva teórica, si la iluminación de una luz en el
secuencia fue interpretada como una señal de refuerzo positiva, entonces esto
El resultado debe facilitar la respuesta posterior. Por lo tanto, uno podría esperar
una disminución en la latencia para responder en el siguiente agujero si el
El agujero anterior se había puesto en marcha. Por el contrario, la latencia para responder a la
el siguiente orificio debería aumentar si el orificio anterior se hubiera desactivado En orden
para investigar si este fue el caso, la latencia para responder en la
El agujero medio se analizó en función de si el primer agujero se había establecido en
Encendido o apagado, independientemente del tipo de prueba. Del mismo modo, la latencia para responder.
en el último hoyo se analizó en función del estado del agujero medio.
Anteriormente en el entrenamiento, hubo un efecto significativo de la anterior
Estado de agujero en la velocidad de respuesta, en que las ratas tomaron más tiempo para
responda en el siguiente agujero si el agujero anterior se había desactivado
en lugar deFigura 2c; agujero anterior semana 1: F1,11=6.105, p=0.031; - 2 semana: F1,11=10.779, p=0.007).
Sin embargo, una vez que se estableció un patrón de línea de base estable,
este efecto ya no fue significativo (semana 3: estado del agujero anterior: F1,11=0.007, NS).

Pruebas completadas

El número promedio de ensayos completados por sesión una vez que un comportamiento estable
La línea de base que se había logrado era 71.0 ± 3.61 (SEM). En el transcurso de la
experimento, este número aumentó gradualmente (Tabla complementaria S3),
que puede ser indicativo de una mejora general en el compromiso de la tarea con
pruebas repetidas. Sin embargo, la distribución global de la colección
Las respuestas a través del tipo de prueba se mantuvieron constantes.

Efecto de la administración de anfetaminas en el desempeño de la tarea

La anfetamina aumentó de forma selectiva el número de respuestas de recolección realizadas en caso de pérdida
pruebas, pero esto dependía de la cantidad de luces encendidas como se indica
Por una interacción significativa entre la dosis y el número de luces.
iluminadoFigura 3a; dosis × luces iluminadas- todas las dosis: F9,99=3.636, p=0.001).
El análisis de los efectos simples mostró que la anfetamina depende de la dosis
aumento de las respuestas de recolección después de pérdidas claras (dosis: F3,33=4.923, p=0.006; salina vs 1.0mg/kg: F1,11=9.709, p=0.01; salina vs 1.5mg/kg: F1,11=7.014, p=0.023), y hubo una tendencia a un aumento en los errores de recolección en los ensayos de pérdida de luz 1 (dosis: F3,33=3.128, p=0.039; salina vs 1.0mg/kg: F1,11=3.510, p=0.09).
Respecto a la última observación, la capacidad de las anfetaminas para aumentar
Recoger errores solo fue estadísticamente significativo cuando la última luz
fue iluminado (Figura 3b; dosis × tipo de prueba: F21,231=2.521, p=0.022; dosis (0,0,1): F3,33=3.234, p=0.035; (0,1,0): F3,33=0.754, NS; (1,0,0): F3,33=2.169, NS).

Figura 3.

Figura 3: desafortunadamente no podemos proporcionar un texto alternativo accesible para esto. Si necesita ayuda para acceder a esta imagen, comuníquese con help@nature.com o con el autor

Efectos de la anfetamina en el desempeño de la tarea de la máquina tragamonedas. Anfetamina
dependiente de la dosis aumentó la proporción de errores de recolección en claro
Ensayos de pérdida y pérdida de luz 1 (a). Más específicamente, la anfetamina
aumento significativo de respuestas de recopilación en (0,0,0) y (0,0,1)
tipos de prueba (b). La dosis más baja y más alta de anfetamina también se hizo.
animales más sensibles al estado de iluminación de los agujeros, en ese
una vez más fueron más rápidos en responder si el hoyo anterior se hubiera puesto en marcha
en lugar de off (c). Los datos se muestran como la media ± SEM.

Figura completa y leyenda (78K)Descargar powerPunto de deslizamiento (819 KB)

La anfetamina también aumentó selectivamente la latencia para responder en la palanca de recolección
en los mismos tipos de prueba en los que se recogen perceptiblemente más erróneos
se cometieron errores (tabla complementaria S1, dosis x tipo de ensayo todas las dosis: F21,231=2.010, p=0.007; salina vs 1.0mg/kg: F7,77=2.529, p=0.021; salina vs 1.5mg/kg: F7,77=3.720, p=0.002; (0,0,0): F3,33=4.892, p=0.006; - (0,0,1): F3,33=3.764, p=0.02).
En contraste, la anfetamina generalmente disminuyó la latencia para responder a
las aberturas independientemente del tipo de prueba (Tabla complementaria S2,
dosis: F3,33=12.649, p=0.0001; tipo de prueba: f7,77=1.652, NS; salina vs 0.6mg/kg: dosis: F1,11=7.977, p=0.017; salina vs 1.0mg/kg: F1,11=10.820, p=0.017; salina vs 1.5mg/kg: F1,11=12.888, p=0.004).
Además, la anfetamina tendía a hacer que las ratas respondieran más rápido en una
agujero si el agujero anterior se había puesto en on en lugar de en off, que recuerda a
su comportamiento durante la adquisición de tareas (Figura 3c; dosis × estado del agujero anterior: F3,33=2.710, p=0.096; solución salina del estado del agujero anterior: F1,11=0.625, NS; −1.5mg/kg: F1,11=7.052, p=0.022). La anfetamina no alteró el total de ensayos completados por sesión (Tabla complementaria S3; dosis: F3,33=1.385,
NS). Por lo tanto, la anfetamina aumentó la velocidad de respuesta al
matriz, particularmente después de una señal positiva (luz iluminada), aún
impedido el uso del patrón de luz para guiar la elección de la palanca, de modo que
Recopilación de respuestas se realizaron a pesar de indicadores mínimos o nulos que recompensan
era probable.

Efecto de la D2 Receptor antagonista Eticlopride en el desempeño de la tarea

La dosis más alta de eticlopride redujo el número promedio de ensayos
completado a menos de 20, por lo tanto, esta dosis no se incluyó en el
análisis. Todos los datos se proporcionan en Información complementaria.
(Figura complementaria S1, tablas complementarias S1 – S3). Aunque el termino
'RE2 El receptor se usa aquí para mayor claridad, se reconoce que tanto la eticloprida como la quinpirol se unen con menos afinidad a otros D2-como receptores (D3 y D4), y que algunos de estos hallazgos pueden atribuirse a acciones en la D2 familia de receptores en lugar de a la D2 receptor específicamente.

Eticlopride no afectó la proporción de respuestas de recopilación realizadas independientemente de
el número de luces iluminadas por prueba (dosis × luces iluminadas: F6,66=1.489, NS) o el patrón de luz exacto (dosis x tipo de prueba: F14,154=1.182, NS). La dosis más alta de eticlopride tendió a aumentar la latencia para responder en la palanca de recolección (dosis: F2,22=3.306, p=0.056; salina vs 0.03mg/kg: dosis: F1,11=12.544, p=0.005). Ambas dosis aumentaron la latencia para responder en la matriz (dosis: F2,22=15.797, p<0.01; dosis salina vs 0.01mg/kg: F1,11=7.322, p=0.02; salina vs 0.03mg/kg: F1,11=19.462, p<0.01) y disminuyó significativamente el número de ensayos completados (dosis: F2,22=31.790, p<0.01; salina vs 0.01mg/kg: F1,11=11.196, p=0.007; salina vs 0.03mg/kg: F1,11=43.949, p<0.01; ensayos completados 0.01mg/kg: 59.0 ± 6.22; −0.03mg/kg: 17.67 ± 4.06). Este patrón de datos indica que la D2 antagonista del receptor generalmente disminuyó la actividad motora, en lugar de
Afectando específicamente cualquier aspecto cognitivo de la tarea correspondiente a
La decisión de responder en la palanca de recogida.

Efecto de la D1 Receptor antagonista SCH 23390 en el rendimiento de la tarea

Todos los datos se proporcionan en Información complementaria (figura complementaria S2, tablas complementarias S1 – S3).

SCH 23390 no afectó la preferencia por la palanca de recolección independientemente de
el número de luces iluminadas (dosis × luces encendidas: F9,99=0.569, NS) o tipo de ensayo específico (dosis x tipo de ensayo: F21,231=0.764, NS). Aunque la dosis más alta aumentó la latencia para responder en la palanca de recolección (dosis: F3,33=5.968, p=0.002; salina vs 0.01mg/kg dosis: F1,11=10.496, p<0.01) y aumentó la latencia para responder en la matriz (dosis: F3,33=4.603, p=0.008), el número de ensayos completados bajo esta dosis también se redujo drásticamente (los ensayos completados bajo 0.01mg/kg: 20.7 ± 5.0; dosis: F3,33=40.66, p=0.0001; salina vs 0.01mg/kg: F1,11=60.601, p=0.0001).
Por lo tanto, similar a los efectos de eticlopride, la dosis más alta
Disminución moderada de la salida del motor, sin embargo, no afectó a ningún cognitivo
Aspectos de la tarea.

Efecto de la D2 Aginista quinpirol en el desempeño de la tarea

La dosis más alta de quinpirol redujo el número promedio de ensayos completados a menos de 20, por lo tanto, esta dosis no se incluyó en el análisis.

La quinpirol incrementó significativamente la proporción de respuestas de recolección erróneas realizadas tanto en "casi fallas"
pruebas y pruebas de pérdida clara (Figura 4a; dosis × luces iluminadas: f6,66=7.586, p=0.002; salina vs 0.0375mg/kg: F3,33=8.163, p=0.0001; salina vs 0.125mg/kg: dosis x luces iluminadas f3,33=14.865, p=0.0001).
Desglosando los datos por el patrón preciso de luces, significativo
Los efectos de la droga se observaron en todos los tipos de ensayos, excepto en los ensayos con Win (Figura 4b; dosis: F2,22=16.481, p=0.0001; dosis × tipo de prueba: F14,154=4.746, p=0.0001; dosis (1,1,1) F2,22=1.068, NS todos los demás tipos de prueba F> 3.25, p
Comparando las dos dosis de fármaco, la dosis más alta pareció inducir una
Mayor aumento en los errores de recolección, particularmente en las pruebas con 0-light.
(0.0375 vs 0.125mg/kg: dosis × tipo de prueba: F7,77=2.880, p=0.01).

Figura 4.

Figura 4: desafortunadamente no podemos proporcionar un texto alternativo accesible para esto. Si necesita ayuda para acceder a esta imagen, comuníquese con help@nature.com o con el autor

Efectos de la quinpirol en el desempeño de la tarea de la máquina tragamonedas. Quinpirol
dependiente de la dosis aumentó los errores de recopilación en todos los ensayos de pérdida (a, b).
Este efecto fue particularmente pronunciado en las pérdidas de 1-light y 2-light en
La dosis más baja probada. El quinpirol también aumentó la latencia a
responda en la matriz independientemente del estado de iluminación de los orificios
(do). Los datos se muestran como la media ± SEM.

Figura completa y leyenda (78K)Descargar powerPunto de deslizamiento (830 KB)

Quinpirole también aumentó la latencia para responder en la palanca de recolección, independientemente de
del tipo de ensayo o dosis (Tabla complementaria S1; dosis: F2,22=14.035, p=0.0001, dosis × tipo de prueba: F14,154=0.475, NS; salina vs 0.0375mg/kg: F1,11=18.563, p=0.001; salina vs 0.125mg/kg: F1,11=30.540, p=0.0001).
Del mismo modo, ambas dosis aumentaron la latencia para responder a la matriz
independientemente del tipo de ensayo (Tabla complementaria S2; dosis: F2,22=8.986, p=0.001; dosis × tipo de prueba: F14,154=1.500, NS; salina vs 0.0375mg/kg dosis: F1,11=9.891, p=0.009; salina vs 0.125mg/kg dosis: F1,11=20.08, p=0.001) o el estado de iluminación del agujero anterior (Figura 4c; dosis × estado del agujero anterior: F2,22=0.291,
NS). Ambas dosis de quinpirol también disminuyeron el número de ensayos
completado en un grado similar (Tabla complementaria S3; ensayos completados
-0.0375mg/kg: 47.08 ± 5.8; −0.125mg/kg: 40.92 ± 3.8; dosis: F2,22=44.726, p=0.0001; salina vs 0.0375mg/kg: F1,11=45.633, p=0.0001; salina vs 0.125mg/kg: F1,11=57.513, p=0.0001; 0.0375 vs 0.125mg/kg: F1,11=1.268,
NS). En resumen, aunque el quinpirol redujo la salida del motor, ambos
las dosis conducen a un aumento en las respuestas de recolección erróneas en los ensayos de pérdida
que fueron particularmente pronunciados en las pérdidas de 1-light y 2-light.

Efecto de la D1 Agonista del receptor SKF 81297 en el desempeño de la tarea

Todos los datos se proporcionan en Información complementaria (Figura complementaria
S3, Tablas Suplementarias S1 – S3). SKF 81297 tuvo muy poco efecto sobre
Realización de la tarea. La proporción de respuestas colectivas se mantuvo
sin cambios (dosis: F3,33=0.086, NS; dosis × tipo de prueba: F21,231=1.185, NS; dosis × luces iluminadas: f9,99=1.516, NS) al igual que la latencia para presionar la palanca de recolección (dosis: F3,33=0.742, NS; dosis × tipo de prueba: F21,231=0.765, NS). La dosis más alta disminuyó marginalmente el número de ensayos completados (dosis F3,33=4.764, p=0.007, solución salina vs 0.03mg/kg: F1,11=10.227, p=0.008) y aumentó la latencia para responder en la matriz independientemente del estado de iluminación de cualquiera de los orificios (dosis: F3,45=4.644, p=0.007; salina vs 0.03mg/kg: F1,11=15.416, p=0.002; dosis × estado del agujero anterior: F3,33=2.047, NS).

Extinción y Restablecimiento

Cuando las respuestas de recopilación después de ganar las pruebas ya no fueron recompensadas, todas las ratas
mostró una disminución constante en el número de ensayos completados (Figura 5a; dia: f9,90=50.3, p<0.01). La presencia o ausencia de ensayos de 2 luces 'near-miss' no alteró la tasa de extinción (día × grupo: F9,90=0.503, NS; grupo: f1,10=0.365,
NS). Sin embargo, cuando las pruebas ganadoras fueron nuevamente indicadores válidos que
la recompensa estaba disponible, el número de pruebas completadas comenzó a aumentar
Y los animales vuelven a comprometerse en la tarea. Aunque ambos grupos de animales fueron
realizando un número comparable de ensayos después de las sesiones de 10, el
La tasa de "reincorporación" del juego en máquinas tragamonedas fue más rápida en ratas
que no habían experimentado juicios casi perdidos durante la extinción (Figura 5a; días 1 – 3: sesión × grupo: F2,20=4.310, p=0.028; días 4 – 6: sesión × grupo: F2,20=4.677, p=0.022; días sesión 7 – 10 × grupo: F3,30=1.323,
NS). A pesar de esta diferencia en el número de ensayos completados, la
proporción de respuestas de palanca de recogida realizadas en los distintos tipos de prueba,
y la latencia para presionar la palanca de recogida, no difirió entre el
Grupos en cualquier etapa durante la reinstalación (días 1 – 3, 4 – 6, y 7 – 10:
sesión × grupo, sesión × grupo × tipo de prueba, todas las F <2.1, NS). Incluso
En los primeros días de prueba de 3, la distribución de las respuestas recopiladas
a través de los diversos tipos de prueba se parecen mucho a lo que se vio antes
extinciónFigura 5b).

Figura 5.

Figura 5: desafortunadamente no podemos proporcionar un texto alternativo accesible para esto. Si necesita ayuda para acceder a esta imagen, comuníquese con help@nature.com o con el autor

Efecto de la eliminación de los ensayos casi perdidos durante la extinción tanto en la tasa de
Extinción y posterior reincorporación del desempeño de la tarea. los
La presencia o ausencia de ensayos de casi fallas no afectó la tasa de
extinción según lo indicado por el número de intentos completados por sesión
(una). Sin embargo, las ratas que no habían experimentado ensayos de casi fallas durante
la extinción fue más rápida para retomar la tarea una vez que ganaron las pruebas
recompensado Durante esta fase de reincorporación, los ensayos de casi fallas fueron nuevamente
Presente para ambos grupos. A pesar de la diferencia en el número de ensayos.
completado, la proporción de respuestas colectivas realizadas en los diferentes
Los tipos de ensayos fueron similares en ambos grupos, incluso dentro de los primeros tres
Sesiones de reposición (b). Aunque ratas que no experimentaron
los ensayos de casi fallas durante la extinción fueron inicialmente más rápidos de respuesta en
el orificio posterior, si el orificio anterior se había puesto en (c), ambos grupos
de ratas fueron sensibles al estado de iluminación de los agujeros por el
fin de la reincorporación (c, d).

Figura completa y leyenda (135K)Descargar powerPunto de deslizamiento (1,352 KB)

A medida que la cantidad de intentos completados por sesión aumentó, la latencia a
responder a la matriz disminuida, pero esto se observó en el mismo grado
en ambos grupos (Tabla complementaria S2; días 1 – 3: sesión: F2,20=14.182, p=0.0001; sesión × grupo: F2,20=1.772,
NS; días 4–6, 7–10: sesión, sesión × grupo: todos Fs <2.3, NS).
Sin embargo, los animales que no habían estado expuestos a ensayos de "casi fallas" durante
extinción fueron mucho más sensibles al estado de iluminación de la
agujero anterior durante estas primeras sesiones de reincorporación, en el sentido de que
tendía a responder más rápido si la luz anterior se había encendido en lugar de
apagado (Figura 5c días 1 – 3: sesión × estado del agujero anterior × grupo: F2,20=3.798, p=0.04; Sesión grupal 'no cerca de la señorita' × estado del agujero anterior: F2,10=3.583, p=0.067; Sesión grupal 'cerca de la señorita' × estado del agujero anterior: F2,10=0.234,
NS). Por lo tanto, a pesar de que la presencia o ausencia de ensayos casi fallidos sí
No afecta superficialmente la tasa de extinción, los animales que no han
los ensayos experimentados de casi fallas en condiciones de no recompensa fueron más rápidos
para volver a participar en la tarea.

Notable    

DISCUSIÓN

Las cuentas cognitivas del juego proponen que la experiencia de casi ganar puede sostener el comportamiento del juego y puede promover el PG en individuos vulnerables (Reid, 1986; Griffiths, 1991; Clark, 2010). Aquí, mostramos que las ratas son capaces de realizar una tarea compleja de discriminación condicional (CD) que es estructuralmente análoga a una máquina tragamonedas simple. Las ratas aprendieron que la iluminación de las tres luces en la matriz indicaba que la recompensa estaba disponible si se hacía una respuesta en la palanca de recolección, mientras que esta respuesta después de cualquier otro patrón de luz llevaría a un 10s tiempo fuera Los animales pudieron discriminar con éxito si una respuesta en la palanca de recolección era ventajosa en la mayoría de los ensayos. Sin embargo, las ratas hicieron una alta tasa de respuestas de recolección erróneas cuando dos de las tres luces se iluminaron, y estas fueron las únicas pruebas en las que la tasa de error fue constante y marcadamente más alta que la probabilidad. Una respuesta tan errónea sugiere que los ensayos con 2-light producen un efecto casi errado, en el sentido de que se interpretan como más similares a una victoria que a una pérdida a pesar de la falta de refuerzo entregado. Tanto la anfetamina como la D2 el agonista del receptor quinpirole incrementó los errores de recolección en los ensayos no ganadores, lo que sugiere que el aumento de la señalización de DA puede aumentar la expectativa de entrega de recompensa en los ensayos de pérdida.

En contraste con nuestro descubrimiento anterior de que la eticloprida mejoró el rendimiento de una tarea de juego con ratas (rGT; Zeeb et al, 2009), El d2 El antagonista del receptor no alteró el comportamiento en la tarea de la máquina tragamonedas. Tsu comparación rudimentaria apoya la sugerencia de que los compuestos farmacéuticos no necesariamente tendrán efectos similares en todas las formas de comportamiento de juego (Grant y Kim, 2006). Sin embargo, también es importante tener en cuenta que la D2 El antagonista del receptor haloperidol tiene diferentes efectos en el juego de máquinas tragamonedas en controles sanos vs aquellos con PG (Zack y Poulos, 2007; Tremblay et al, 2010), y se debe tener cuidado al extrapolar entre modelos animales y poblaciones de pacientes humanos. Además, aunque este paradigma de roedores comparte algunas características clave con una máquina tragamonedas simple, hay algunas diferencias obvias que deben reconocerse. Por ejemplo, las ratas no podrían ajustar el tamaño de la apuesta, ni elegir arriesgar una cantidad mayor por la posibilidad de una mayor recompensa, aun cuando esas contingencias sean una característica de algunas máquinas tragamonedas comerciales (Kassinove y Schare, 2001; Weatherly et al, 2004; Harrigan y Dixon, 2010).

Además, se requirió que las ratas detuvieran cada luz individualmente, en lugar de esperar a que las tres luces se encendieran después de una sola respuesta. Esta característica podría haber involucrado de manera diferente a los mecanismos que subyacen al aprendizaje instrumental a expensas del comportamiento de enfoque (pavloviano) que se cree que subyace a los aspectos del juego de máquinas tragamonedas (Reid, 1986; Griffiths, 1991). Dicho esto, algunos juegos modernos de máquinas tragamonedas ofrecen una variedad de oportunidades para que los humanos intervengan para terminar directamente los giros e influir en el tiempo de los eventos aleatorios (Harrigan, 2008). No soportando las limitaciones anteriores, por lo tanto, oSus experimentos demuestran que las pruebas de pérdida que se asemejan a las ganancias pueden aumentar la expresión conductual de la expectativa de recompensa en ratas de una manera descrita por las teorías cognitivas de la conducta de juego, y que este efecto es susceptible a al menos dos manipulaciones de la actividad de la dopamina.

Se podría argumentar que la mayor proporción de respuestas colectivas observadas en los ensayos de pérdida de luz 2 podría haber surgido simplemente porque los animales lucharon para discriminar entre estos y los ensayos de ganancia de luz 3 a nivel perceptivo, en lugar de reflejar diferencias en la interpretación cognitiva del resultados del ensayo. Aunque la similitud perceptiva debe, de factoAl contribuir con los efectos que se observan aquí, existen varias razones para suponer que nuestros hallazgos no son artefactos de discriminaciones perjudiciales entre los patrones de luz. Primero, bajo las condiciones de línea de base, estaba claro que los animales podían discriminar de manera confiable entre el resultado ganador y el resultado casi faltante, como lo demuestra el número significativamente mayor de respuestas de recolección después de este último en comparación con el primero. En segundo lugar, se observó un número diferente de respuestas de recopilación erróneas después de diferentes resultados que consistían en solo dos luces encendidas (cf (1,1,0) vs (1,0,1)), nuevamente indicando que las ratas podrían discriminar confiablemente entre los distintos patrones de luz. En tercer lugar, las dosis de quinpirol que produjeron incrementos tan marcados en las tasas de error en los ensayos casi fallidos no afectan la precisión de la detección del objetivo en la tarea del tiempo de reacción en serie de cinco opciones, una medida bien validada de la atención visuoespacial (Winstanley et al, 2010). Dichos datos tienden a excluir la posibilidad de que nuestra demostración de efectos de casi fallos en la expectativa de recompensa en ratas pueda atribuirse simplemente a las dificultades en la discriminación visual.

Alternativamente, es posible que las respuestas erróneas en la palanca de recolección después de cuasi accidentes reflejen los efectos vestigiales del entrenamiento anterior; A medida que la complejidad de la tarea se incrementó gradualmente a lo largo de diferentes etapas de entrenamiento, hubo casos en los que la recompensa se entregó si solo se encendían una o dos luces. Sin embargo, nuevamente, el hallazgo de que las respuestas de recopilación de ratas no se distribuyeron uniformemente en las pruebas de 2 luces argumenta en contra de esta posibilidad: el patrón
(1,0,1) nunca se asoció con un resultado gratificante en la capacitación, pero las respuestas de recopilación fueron las más frecuentes en este tipo de prueba. Además, debido a las repetidas pruebas requeridas para los desafíos farmacológicos, los animales experimentaron cientos de pérdidas de luz 2 no reforzadas en el transcurso del experimento en comparación con el número relativamente pequeño de
Pruebas con 2-light recompensadas en algunas sesiones de entrenamiento. No es infrecuente que se forme a los animales para que den una respuesta durante el entrenamiento que luego se les pide que inhiban posteriormente en una tarea cognitiva (por ejemplo, durante el aprendizaje de la estrategia (Floresco et al, 2008)). Por lo tanto, es poco probable que el período limitado de refuerzo recibido durante el entrenamiento pueda explicar la persistente preferencia por la palanca de recolección en los ensayos de casi fallas.

Los datos de latencia de respuesta también indican que las ratas fueron capaces de detectar el estado de iluminación de los orificios y fueron sensibles a las consecuencias, ya que cuando un orificio en particular se había apagado, respondiendo
En el hoyo posterior fue más lento. Sin embargo, este efecto fue sólo
Observado anteriormente en el entrenamiento, antes de estabilizar el desempeño de la tarea. Por
esta métrica, por lo tanto, parecería que los animales se hicieron menos
sensible a los comentarios de momento a momento proporcionados durante un ensayo como
La capacitación continuó, a pesar de que dicha información podría determinar si
la recompensa estaba finalmente disponible. Es tentador utilizar tales datos para
argumentan que el desempeño de la tarea se volvió más 'automático' o compulsivo
a través del tiempo (Jentsch y Taylor, 1999; Robbins y Everitt, 1999).
Sin embargo, las ratas seguían siendo extremadamente sensibles a la cancelación de
recompensa esperada como lo demuestra la fuerte caída en los juicios completados
durante la extinción. Estos datos pueden indicar que el rendimiento fue todavía
En gran parte dirigido a un objetivo en lugar de habitual, aunque esto queda por ser
confirmado mediante una prueba más precisa, como la devaluación en lugar de
omitiendo la recompensa esperada (Balleine y Dickinson, 1998).
Al contrario de algunos informes anteriores en sujetos humanos, extinción de tareas.
el rendimiento no fue más lento en presencia de ensayos casi fallidos.
Sin embargo, los casi fallos no siempre retrasan la extinción, y este efecto
parece depender críticamente de la frecuencia de los eventos cercanos a la falta (Kassinove y Schare, 2001) y el número de apuestas realizadas (MacLin et al, 2007).
El paradigma de extinción utilizado aquí, aunque típico en el diseño de un
experimento de teoría del aprendizaje con animales, tampoco es comparable al tipo de
Extinción experimentada durante algunos episodios de juego en los que gana.
simplemente no se produce. Por lo tanto, se necesita más trabajo para determinar
si los ensayos de casi fallas afectan la tasa de extinción en ratas usando una
conjunto de parámetros más similar a los utilizados en el humano pertinente
estudios.

Aunque la ausencia de ensayos de casi fallos sí
No afecta el curso temporal de la extinción, el reintegro en la tarea.
el rendimiento fue más rápido en este grupo, y estas ratas fueron más
sensible al estado de iluminación de los orificios de respuesta durante el
Primeras pocas sesiones. Por lo tanto, si los estímulos cercanos a la falta no hubieran sido explícitamente
emparejados con un estímulo de ganancia devaluado, las pruebas casi perdidas mantuvieron su
Capacidad de evocar una representación de un resultado positivo y vigorizar.
comportamiento. Parecería, por tanto, que el incentivo de la prominencia de un
el estímulo cercano a la falta no se actualiza automáticamente cuando el valor hedónico
de una victoria disminuye. La idea de que los sistemas de valores hedónicos y de incentivo.
se puede desconectar es un principio central de la sensibilización de incentivos
hipótesis de adicción, en la cual los estímulos ambientales asociados con
drogas han llegado a ejercer una influencia considerable sobre el comportamiento a pesar de la
placer decreciente asociado con el consumo de drogas (Robinson y Berridge, 1993; Wyvell y Berridge, 2000, 2001).
Será interesante determinar, por lo tanto, si casi se pierden
los estímulos tienen un papel similar en la facilitación del comportamiento de juego como
Las señales de drogas emparejadas hacen con respecto al abuso de sustancias, promoviendo la recaída
y el deseo incluso después de períodos de abstinencia (Dackis y O'Brien, 2001).
Podemos explorar esta idea explícitamente en experimentos adicionales, por ejemplo
observando si las pruebas de 2-light casi perdidas pueden mejorar el restablecimiento
incluso si no hay pruebas de victoria. Los hallazgos presentados aquí también sugieren
que rompiendo la asociación entre los ensayos de casi fallas y la recompensa
los resultados podrían limitar el mantenimiento del comportamiento del juego. En el
experimento actual, esto se realizó mediante el emparejamiento repetido de pruebas de casi fallas
con un evento estimulante no reforzado que puede ser difícil de
Introducción convincente a los jugadores humanos. Sin embargo, trabajos recientes con el objetivo de
Romper estas asociaciones a través de la formación de CD ha dado lugar alentador
resultados (Zlomke y Dixon, 2006; Dixon et al, 2009), lo que sugiere que esta podría ser una relación importante para apuntar desde una perspectiva terapéutica.

La exposición repetida a drogas adictivas puede inducir un estado hiper-dopaminérgico, y se cree que esta aberrante señalización de DA subraya la mayor sensibilidad a los estímulos condicionados observados en sujetos dependientes de drogas (Berridge y Robinson, 1998). Del mismo modo, PG también puede implicar señalización de recompensa dañada a través de la interrupción de las vías DA (Reuter et al, 2005), y la administración repetida de la terapia con agonistas DA puede inducir PG en algunos pacientes con enfermedad de Parkinson (Voon et al, 2009). Los informes psicológicos sugieren que las características estructurales de las máquinas tragamonedas, incluidas las fallas cognitivas, las bajas demandas cognitivas y las altas tasas de juego, podrían promover el juego excesivo o compulsivo (Breen y Zimmerman, 2002; Harrigan, 2008; Choliz, 2010). TPor lo tanto, el sistema DA puede tener un papel importante en la mediación del compromiso con las máquinas tragamonedas, y los datos que se presentan aquí brindan cierto apoyo a esta hipótesis.

La administración de anfetamina psicoestimulante, que potencia las acciones de DA, disminuyó
La latencia para responder en la matriz, particularmente después de la presentación de una señal de ganancia putativa (luz iluminada). Esta observación concuerda con la conocida capacidad de la anfetamina aguda para aumentar la respuesta a las señales condicionadas.
(Robbins, 1978; Beninger et al, 1981; Robbins et al, 1983; Mazurski y Beninger, 1986). De hecho, el aumento en las respuestas de recolección que se obtienen después de la administración de anfetaminas podría ser simplemente otro ejemplo de la capacidad de este medicamento para
aumentar la respuesta prepotente para recompensa, como lo ejemplifica el aumento de
tasas de respuesta en el refuerzo diferencial de los programas de tasas bajas (Segal, 1962; Sanger, 1978) y respuesta prematura elevada en la tarea de tiempo de reacción en serie de cinco opciones (Cole y Robbins, 1987; Harrison et al, 1997).
Sin embargo, aunque esto puede jugar un papel en los efectos observados,
la anfetamina no incrementó la preferencia por la palanca de recolección en cada
tipo de prueba Si los efectos de la anfetamina surgen a través de un aumento
conducir para responder en la palanca emparejada recompensa, entonces esto debería ser
Observado independientemente del patrón de luz. De hecho, este efecto solo
alcanzó importancia en ciertas pruebas de pérdida de luz 1 y pérdida clara, es decir,
en ensayos en los que el menor número de estímulos condicionados positivamente (un estímulo
asociado con la entrega de recompensa: CS+) estuvieron presentes. Además, las respuestas erróneas de la palanca de recolección inducidas por la anfetamina se hicieron más lentamente, potencialmente indicativas de un mayor conflicto de decisión, y otra vez contrarrestaron cualquier sugerencia de que los animales simplemente perseveraban en la elección de la respuesta asociada con la recompensa (Robbins, 1976). Por lo tanto, aunque los animales parecen hipersensibles al estado de iluminación de las luces individuales, la capacidad de la anfetamina para mejorar la respuesta a los estímulos de recompensa o recompensa no es suficiente para explicar los efectos de la droga en la elección de la palanca.

Sin embargo, se ha informado que la anfetamina induce déficits en una tarea de CD, de manera que
los animales no podían usar señales para determinar qué acción era apropiada (Dunn et al, 2005).
Algo similar a los efectos de latencia de respuesta que observamos aquí, el
La información afectiva codificada por las señales utilizadas en el CD todavía estaba siendo
procesado, como lo indica la transferencia intacta de Pavlovian a instrumental (Dunn et al, 2005).
Los efectos de la anfetamina en la tarea de la máquina tragamonedas podrían por lo tanto ser
atribuido al deterioro del rendimiento del CD. Sin embargo, las deficiencias de CD
causadas por la anfetamina se revierten mediante la administración conjunta de un D1, pero no una D2antagonista (Dunn y Killcross, 2006), lo que sugiere que el rendimiento exacto del CD está influenciado por D1- Actividad dependiente. El hallazgo de que D1-selectivo
compuestos no afectaron la preferencia por la palanca de recogida puede indicar
esa dificultad manifiesta con el procesamiento de reglas condicionales no puede
explicar los efectos de la anfetamina. Además, el desempeño de la tarea no fue
Deterioro global: los animales todavía eran 100% precisa en las pruebas ganadoras, y sus tasas de error se mantuvieron sin cambios en el
mayoría de los tipos de prueba. Dado que el mayor incremento de errores fue
observados en ensayos de pérdida clara que fueron menos, en lugar de la mayoría, similares
Para ganar, también parece improbable que la anfetamina actuara ampliando
El gradiente de generalización del estímulo, aunque este fármaco ha sido encontrado.
para aumentar los errores falsos positivos en una tarea de discriminación visual (Hampson et al, 2010).

Una explicación de los efectos de la anfetamina es que la capacidad del estimulante para potenciar la señalización de DA modificó las representaciones de estímulo-resultado, lo que lleva a un sesgo en la respuesta a los estímulos como si
fueron emparejados con la recompensa. En apoyo de esta sugerencia, la D2 el agonista del receptor quinpirol tuvo efectos similares a los de la anfetamina, lo que incrementó de manera dependiente la dosis de errores de recolección en los ensayos de pérdida.
aunque este efecto fue más pronunciado en los ensayos con 1 y 2-light en lugar de pérdidas claras en la dosis más baja. En cuanto a si este efecto podría reflejar un aumento en la respuesta prepotente para la recompensa, las dosis más bajas de quinpirol utilizadas aquí no aumentan la respuesta diferencial a una CS+ (Beninger y Ranaldi, 1992), y disminuir en lugar de aumentar la respuesta prematura en el 5CSRT (Winstanley et al, 2010). Presentación de un CS+ lleva a un aumento en la liberación de DA, mientras que la cancelación de una recompensa esperada conduce a una pausa en la actividad dopaminérgica (Schultz et al, 1997; Gan et al, 2010). Dada esta premisa general, es posible que la iluminación constante de un orificio de respuesta intermitente produzca un aumento transitorio en DA, mientras que no se producirán cambios o tal vez una caída en DA si un orificio se establece en la posición de apagado. Estas señales podrían formar la base de un error de predicción de recompensa que sesgaría la elección hacia las palancas de recolección o de rotación, como lo sugiere la respuesta de las neuronas dopaminérgicas a los estímulos complejos de recompensa y predicción en monos (Nomoto et al, 2010).

En modelos recientes, se ha sugerido que la sobre activación de D2 los receptores perjudicarían la discriminación de información relevante por reducir la relación señal / ruido e impedir la sintonización adecuada de la respuesta DA fásica (Floresco et al, 2003; Marinos y Yang, 2004). Como tal, la respuesta dopaminérgica a un estímulo de pérdida se asemejaría a la observada después de un estímulo de ganancia, desviando a los animales hacia la selección de la palanca de recolección. En estudios recientes de neuroimagen del juego con máquinas tragamonedas, la activación de la región dopaminérgica del cerebro medio en respuesta a un error cercano se correlacionó positivamente con el nivel de gravedad del juego en jugadores recreativos (Chase y Clark, 2010), y la distribución de señales fue más como resultados ganadores en jugadores patológicos, pero perdiendo resultados en controles no patológicos saludables (Habib y Dixon, 2010). En conjunto, estos hallazgos sugieren que la actividad dentro del sistema DA contribuye significativamente a la propensión a apostar de manera inadaptada. Con respecto a la enfermedad de Parkinson, se ha sugerido que la sobreestimulación crónica de D2 Los receptores, predominantemente dentro de las vías indirectas, previenen la detección de caídas en la actividad de la dopamina que siguen los malos resultados de las decisiones y, por lo tanto, promueven la conducta de juego en personas vulnerables. (Frank et al, 2004; Frank y claus, xnumx). A la luz de estas observaciones, un objetivo de investigación futuro es
determinar si la capacidad del quinpirol para promover las respuestas recopiladas en los ensayos de pérdida es el resultado de la incapacidad de detectar un error de predicción negativo (insensibilidad al castigo) o la generación de una expectativa de recompensa positiva, o ambos.

Anteriormente se ha informado que las pruebas de casi fallas, aunque aversivas, aumentan el deseo de continuar apostando en máquinas tragamonedas (Kassinove y Schare, 2001; Posibilidades et al, 2003; MacLin et al, 2007), y esto puede afectar la velocidad con la que los sujetos inician la próxima apuesta. Desafortunadamente, la latencia para responder en la palanca de balanceo podría
no se debe utilizar para evaluar la motivación para iniciar el siguiente ensayo, ya que esta medida se vio afectada tanto por el tiempo que se tarda en consumir los gránulos de azúcar después de una victoria como en el 10s periodos de tiempo de espera causados ​​por una respuesta de recopilación errónea. Incluir un intervalo entre ensayos, de manera que se requiera una respuesta de palanca de balanceo separada para comenzar el próximo juicio, podría mejorar la validez de este
medir, y nos permite determinar si un tipo de prueba en particular afectó la voluntad de comenzar una nueva prueba. Un registro preciso de esta variable también podría revelar si las manipulaciones que modificaron el número de pruebas completadas, y/o la elección afectada de la palanca de recolección, moduló diferencialmente este aspecto de la asignación de tareas.

Modelando procesos de juego en animales y humanos, incluyendo los sesgos cognitivos que confieren vulnerabilidad para trastornos patológicos (Ladouceur et al, 1988; Toneatto et al, 1997), podría proporcionar nuevas oportunidades para determinar los circuitos neuronales y los sistemas de neurotransmisores que median la unidad para apostar (Campbell-Meiklejohn et al, 2011). La demostración de que las ratas pueden realizar una tarea similar a una máquina tragamonedas y mostrar evidencia de un efecto casi errado, puede indicar que las ratas son susceptibles a algunos de los errores cognitivos que se cree contribuyen al mantenimiento de la conducta de juego (Clark, 2010; Griffiths, 1991; Reid, 1986). Los datos reportados aquí también indican que DA, vía D2 Los receptores pueden tener un papel importante en la modulación de la expectativa de recompensa durante el juego en las máquinas tragamonedas. Junto con las investigaciones clínicas, este enfoque puede mejorar fundamentalmente nuestra comprensión del juego recreativo y problemático, y facilitar el desarrollo de nuevos tratamientos para PG.

Conflicto de intereses

CAW ha consultado previamente para Theravance sobre un asunto no relacionado. No
Los autores tienen otros conflictos de intereses o divulgaciones financieras que realizar. 

Referencias

  1. Balleine BW,
    Dickinson A (1998). Acción instrumental dirigida a la meta: contingencia y
    El incentivo del aprendizaje y sus sustratos corticales. Neurofarmacología 37: 407–419. | Artículo | PubMed | ISI | ChemPort |
  2. Beninger RJ, Hanson DR, Phillips AG (1981). La adquisición de responder con refuerzo condicionado: efectos de la cocaína, (+) -anfetamina y pipradrol. Br J Pharmacol 74: 149–154. | PubMed | ISI |
  3. Beninger
    RJ, Ranaldi R (1992). Los efectos de la anfetamina, la apomorfina, SKF.
    38393, quinpirol y bromocriptina en respuesta para recompensa condicionada
    en ratas. Behav Pharmacol 3: 155–163. | Artículo | PubMed | ISI |
  4. Berridge
    KC, Robinson TE (1998). ¿Cuál es el papel de la dopamina en la recompensa: hedónica
    ¿Impactar, premiar el aprendizaje, o incentivar la prominencia? Brain Res Brain Res Rev. 28: 309–369. | Artículo | PubMed | ChemPort |
  5. Breen RB, Zimmerman M (2002). Inicio rápido del juego patológico en jugadores de máquinas. J Gambl Stud 18: 31–43. | Artículo | PubMed |
  6. Campbell-Meiklejohn DK, Wakeley J, Herbert V, Cook J, Scollo P, Kar Ray M et al (2011). La serotonina y la dopamina desempeñan papeles complementarios en el juego para recuperar pérdidas. Neuropsicofarmacología 36: 402–410. | Artículo | PubMed | ISI |
  7. Cardinal RN, Aitken M (2006). ANOVA para el investigador de ciencias del comportamiento.. Lawrence Erlbaum Asociados: Londres.
  8. Chase HW, Clark L (2010). La gravedad del juego predice la respuesta del cerebro medio a resultados casi errados. J Neurosci 30: 6180–6187. | Artículo | PubMed | ISI |
  9. Choliz
    M (2010). Análisis experimental del juego en jugadores patológicos:
    Efecto de la inmediatez de la recompensa en máquinas tragamonedas. J Gambl Stud 26: 249–256. | Artículo | PubMed | ISI |
  10. Clark L (2010). Toma de decisiones durante el juego: una integración de enfoques cognitivos y psicobiológicos. Philos Trans R Soc Lond B Biol Ciencia 365: 319–330. | Artículo | PubMed |
  11. Clark
    L, Lawrence AJ, Astley-Jones F, Gris N (2009). Apuestas casi perdidas
    aumentar la motivación para apostar y reclutar circuitos cerebrales relacionados con el triunfo. Neurona 61: 481–490. | Artículo | PubMed | ISI |
  12. Col
    BJ, Robbins TW (1987). La anfetamina perjudica lo discriminativo.
    El rendimiento de ratas con lesiones dorsales del grupo noradrenergic en un
    Tarea de tiempo de reacción en serie de elección 5: nueva evidencia para central
    Interacciones dopaminérgico-noradrenérgicas. Psicofarmacología 91: 458–466. | Artículo | PubMed | ISI | ChemPort |
  13. Cote D, Caron A, Aubert J, Desrochers V, Ladouceur R (2003). Las ganancias cercanas prolongan el juego en una terminal de video lotería. J Gambl Stud 19: 433–438. | Artículo | PubMed |
  14. Dackis CA, O'Brien CP (2001). Dependencia de la cocaína: una enfermedad de los centros de recompensa del cerebro. Tratamiento de abuso de sustancia J 21: 111–117. | Artículo | PubMed | ISI | ChemPort |
  15. Dixon MR, Nastally BL, Jackson JE, Habib R (2009). Alterar el efecto de casi fallar en los jugadores de máquinas tragamonedas. J Appl Behav anal 42: 913–918. | Artículo | PubMed | ISI |
  16. Dunn
    MJ, Futter D, Bonardi C, Killcross S (2005). Atenuación de
    Interrupción inducida por d-anfetamina de la discriminación condicional
    Rendimiento por alfa-flupenthixol. Psicofarmacología (Berl) 177: 296–306. | Artículo | PubMed |
  17. Dunn
    MJ, Killcross S (2006). Atenuación diferencial de
    Interrupción inducida por d-anfetamina de la discriminación condicional
    Desempeño por los antagonistas de la dopamina y la serotonina. Psicofarmacología (Berl) 188: 183–192. | Artículo | PubMed |
  18. Fiorillo CD, Tobler PN, Schultz W (2003). Codificación discreta de la probabilidad de recompensa y la incertidumbre de las neuronas de dopamina. Ciencia: 299: 1898–1902. | Artículo | PubMed | ISI | ChemPort |
  19. Floresco
    SB, Bloque AE, Tse MT (2008). Inactivación de la prefrontal medial.
    córtex de la rata altera la estrategia de cambio de posición, pero no la reversión
    Aprendizaje, utilizando un procedimiento novedoso, automatizado. Behav Brain Res 190: 85–96. | Artículo | PubMed | ISI |
  20. Floresco
    SB, West AR, Ash B, Moore H, Grace AA (2003). Modulación aferente de
    La activación de las neuronas de la dopamina regula de manera diferencial los tónicos y los fásicos.
    Transmisión de dopamina. Nat Neurosci 6: 968–973. | Artículo | PubMed | ISI | ChemPort |
  21. Frank
    MJ, Claus ED (2006). Anatomía de una decisión: estriato-orbitofrontal.
    Interacciones en el aprendizaje por refuerzo, toma de decisiones y reversión. Psychol Rev 113: 300–326. | Artículo | PubMed | ISI |
  22. Frank MJ, Seeberger LC, O'Reilly RC (2004). Por zanahoria o por palo: aprendizaje por refuerzo cognitivo en el parkinsonismo. Ciencia: 306: 1940–1943. | Artículo | PubMed | ISI | ChemPort |
  23. Gan JO, Walton ME, Phillips PE (2010). Codificación disociable de costos y beneficios de recompensas futuras por la dopamina mesolímbica. Nat Neurosci 13: 25–27. | Artículo | PubMed | ISI |
  24. Grant JE, Kim SW (2006). Gestión de la medicación del juego patológico. Medicina de minnesota 89: 44–48. | PubMed |
  25. Griffiths M (1991). Psicobiología de los casi perdedores en el juego de máquinas de frutas. J psychol 125: 347–357. | PubMed | ISI |
  26. Habib R, Dixon MR (2010). Evidencia neurocomportamental del efecto "casi perdido" en jugadores patológicos. J exp anal de comportamiento 93: 313–328. | Artículo | PubMed | ISI |
  27. Hampson CL, Body S, den Boon FS, Cheung TH, Bezzina G, Langley RW et al (2010). Comparación de los efectos de 2,5-dimetoxi-4-yodoanfetamina
    y D-anfetamina sobre la capacidad de las ratas para discriminar las duraciones
    e intensidades de los estímulos luminosos. Behav Pharmacol 21: 11–20. | Artículo | PubMed | ISI |
  28. Harrigan KA (2008). Características estructurales de las máquinas tragamonedas: la creación de casi fallas utilizando altos índices de símbolos de premio Int J adicto a la salud mental 6: 353–368. | Artículo |
  29. Harrigan
    KA, Dixon M (2010). Rango 'apretado' y 'suelto' sancionado por el gobierno
    máquinas: cómo tener múltiples versiones del mismo juego de tragamonedas puede
    Problema de impacto en el juego. J Gambl Stud 26: 159–174. | Artículo | PubMed | ISI |
  30. Harrison
    AA, Everitt BJ, Robbins TW (1997). Mejoras en el agotamiento de 5-HT central
    Respuesta impulsiva sin afectar la precisión de atención.
    Rendimiento: interacciones con mecanismos dopaminérgicos. Psicofarmacología 133: 329–342. | Artículo | PubMed | ISI | ChemPort |
  31. Jentsch
    JD, Taylor JR (1999). Impulsividad resultante del frontostriatal.
    disfunción en el abuso de drogas: implicaciones para el control del comportamiento por
    estímulos relacionados con la recompensa. Psicofarmacología 146: 373–390. | Artículo | PubMed | ISI | ChemPort |
  32. Kassinove JI, Schare ML (2001). Efectos de la "casi falta" y la "gran victoria" en la persistencia en los juegos de tragamonedas. Psychol Addict Behav 15: 155–158. | Artículo | PubMed | ISI |
  33. Ladouceur
    R, Gaboury A, Dumont M, Rochette P (1988). Juego: Relación
    Entre la frecuencia de victorias y el pensamiento irracional. J Psychol: Interdisciplinario Aplicado 122: 409–414. | Artículo |
  34. MacLin
    OH, Dixon MR, Daugherty D, SL pequeña (2007). Usando una simulación por computadora
    de tres máquinas tragamonedas para investigar la preferencia de un jugador entre
    Densidades variables de alternativas cercanas a la falta. Métodos de comportamiento 39: 237–241. | Artículo | PubMed | ISI |
  35. Mazurski EJ, Beninger RJ (1986). Los efectos de (+) -anfetamina y apomorfina en respuesta a un refuerzo condicionado. Psicofarmacología (Berl) 90: 239–243. | Artículo | PubMed |
  36. Nomoto
    K, Schultz W, Watanabe T, Sakagami M (2010). Temporalmente extendido
    Respuestas de la dopamina a estímulos predictivos de recompensa que exigen perceptivamente. J Neurosci 30: 10692–10702. | Artículo | PubMed | ISI |
  37. Peterson
    H, Hunt M, Harper D (2010). Un modelo animal de juego de tragamonedas:
    El efecto de las características estructurales en la latencia de respuesta y
    Persistencia. J Gambl Stud 26: 521–531. | Artículo | PubMed | ISI |
  38. Petry
    NM, Stinson FS, Grant BF (2005). Comorbilidad del DSM-IV patológico.
    Juegos de azar y otros trastornos psiquiátricos: resultados de la National
    Encuesta epidemiológica sobre alcohol y afecciones relacionadas. J Clin Psiquiatría 66: 564–574. | Artículo | PubMed | ISI |
  39. Potenza MN (2008). Revisión. La neurobiología del juego patológico y la adicción a las drogas: una visión general y nuevos hallazgos. Philos Trans R Soc Lond B Biol Ciencia 363: 3181–3189. | Artículo | PubMed |
  40. Potencia
    MN (2009). La importancia de los modelos animales de toma de decisiones,
    Juego y comportamientos relacionados: implicaciones para la investigación traslacional
    en adicion. Neuropsicofarmacología 34: 2623–2624. | Artículo | PubMed | ISI |
  41. Reid RL (1986). La psicología de la cercana señorita. J Gambl Behav 2: 32–39. | Artículo |
  42. Reuter
    J, Raedler T, Rosa M, Mano I, Glascher J, Buchel C (2005). Patológico
    El juego está vinculado a la activación reducida de la recompensa mesolímbica.
    . Nat Neurosci 8: 147–148. | Artículo | PubMed | ISI | ChemPort |
  43. Robbins TW (1976). Relación entre la mejora de la recompensa y los efectos estereotipados de las drogas estimulantes psicomotoras. Naturaleza 264: 57–59. | Artículo | PubMed | ISI | ChemPort |
  44. Robbins
    TW (1978). La adquisición de responder con condicionado.
    refuerzo: efectos de pipradrol, metilfenidato, d-anfetamina y
    nomifensina. Psicofarmacología (Berl) 58: 79–87. | Artículo | PubMed | ChemPort |
  45. Robbins TW, Everitt BJ (1999). Adicción a las drogas: los malos hábitos se suman. Naturaleza 398: 567–570. | Artículo | PubMed | ISI | ChemPort |
  46. Robbins TW, Watson BA, Gaskin M, Ennis C (1983). Interacciones contrastantes de pipradol, d-Anfetamina, cocaína, análogos de cocaína, apomorfina y otras drogas con refuerzo acondicionado. Psicofarmacología 80: 113–119. | Artículo | PubMed | ISI | ChemPort |
  47. Robinson TE, Berridge KC (1993). La base neural del ansia de drogas: una teoría de la adicción a la sensibilización de incentivos. Brain Res Brain Res Rev. 18: 247–291. | Artículo | PubMed | ChemPort |
  48. Sanger DJ (1978). Efectos de la d-anfetamina en la discriminación temporal y espacial en ratas. Psicofarmacología (Berl) 58: 185–188. | Artículo | PubMed |
  49. Schultz W (1998). Señal de recompensa predictiva de las neuronas dopaminérgicas. J neurofisiol 80: 1–27. | PubMed | ISI | ChemPort |
  50. Schultz W, Dayan P, Montague PR (1997). Un sustrato neural de la predicción y la recompensa. Ciencia: 275: 1593–1599. | Artículo | PubMed | ISI | ChemPort |
  51. Seamans JK, Yang CR (2004). Las principales características y mecanismos de la modulación de la dopamina en la corteza prefrontal. Prog Neurobiol 74: 1–58. | Artículo | PubMed | ISI | ChemPort |
  52. Segal EF (1962). Efectos de la dl-anfetamina bajo el refuerzo de VI DRL concurrente. J exp anal de comportamiento 5: 105–112. | Artículo | PubMed | ISI |
  53. Shaffer
    HJ, Hall MN, Vander Bilt J (1999). Estimando la prevalencia de
    comportamiento de juego desordenado en los Estados Unidos y Canadá: una investigación
    síntesis. Am J Public Health 89: 1369–1376. | Artículo | PubMed | ISI | ChemPort |
  54. Shaffer HJ, Korn DA (2002). El juego y los trastornos mentales relacionados: un análisis de salud pública. Annu Rev Salud Pública 23: 171–212. | Artículo | PubMed | ISI |
  55. Toneatto T, Blitz-Miller T, Calderwood K, Dragonetti R, Tsanos A (1997). Distorsiones cognitivas en el juego pesado. J Gambl Stud 13: 253–266. | Artículo | PubMed |
  56. Tremblay
    AM, Desmond RC, Poulos CX, Zack M (2010). El haloperidol modifica
    Aspectos instrumentales del juego de máquinas tragamonedas en jugadores patológicos.
    Y controles sanos. Biología de la adicción (10 marzo e-pubahead de impresión).
  57. Voon V, Fernagut PO, Wickens J, Baunez C, Rodriguez M, Pavon N et al (2009). Estimulación dopaminérgica crónica en la enfermedad de Parkinson: desde discinesias hasta trastornos del control de impulsos. Lancet Neurology 8: 1140–1149. | Artículo | PubMed | ISI |
  58. Weatherly JN, Sauter JM, King BM (2004). La 'gran victoria' y la resistencia a la extinción al apostar. J psychol 138: 495–504. | Artículo | PubMed | ISI |
  59. Winstanley CA, Zeeb FD, Bedard A, Fu K, Lai B, Steele C et al (2010). La modulación dopaminérgica de la corteza orbitofrontal afecta
    Atención, motivación y respuesta impulsiva en ratas que realizan el
    Tarea de tiempo de reacción en serie de cinco opciones. Behav Brain Res 210: 263–272. | Artículo | PubMed | ISI |
  60. Wyvell
    CL, Berridge KC (2000). La anfetamina intra-accumbens aumenta la
    incentivo saliente condicionado de la recompensa de sacarosa: mejora de la recompensa
    'querer' sin 'gusto' mejorado o refuerzo de respuesta. J Neurosci 20: 8122–8130. | PubMed | ISI | ChemPort |
  61. Wyvell
    CL, Berridge KC (2001). Sensibilización incentivadora por anfetamina previa.
    exposición: aumento del deseo de cue desencadenado por la recompensa de sacarosa. J Neurosci 21: 7831–7840. | PubMed | ISI | ChemPort |
  62. Zack M, Poulos CX (2004). La anfetamina estimula la motivación para apostar y las redes semánticas relacionadas con el juego en los jugadores con problemas. Neuropsicofarmacología 29: 195–207. | Artículo | PubMed | ISI | ChemPort |
  63. Zack
    M, Poulos CX (2007). Un antagonista D2 mejora la recompensa y el cebado.
    Efectos de un episodio de juego en jugadores patológicos. Neuropsicofarmacología 32: 1678–1686. | Artículo | PubMed | ISI | ChemPort |
  64. Zeeb
    FD, Robbins TW, Winstanley CA (2009). Serotoninérgico y dopaminérgico.
    modulación de la conducta de juego según lo evaluado usando un juego de rata novedoso
    tarea. Neuropsicofarmacología 34: 2329–2343. | Artículo | PubMed | ISI | ChemPort |
  65. Zlomke KR, Dixon MR (2006). Modificación de las preferencias de máquinas tragamonedas mediante el uso de un paradigma de discriminación condicional. J Appl Beh anal 39: 351–361. | Artículo | ISI |