ความไวของนิวเคลียสมีการละเมิดต่อความคาดหวังของรางวัล (2007)

Neuroimage 2007 ม.ค. 1; 34 (1): 455-61 Epub 2006 ตุลาคม 17

สไปเซอร์เจ, กัลวานเอ, กระต่าย TA, Voss H, ถุงมือ G, Casey B.

แหล่ง

สถาบัน Sackler เพื่อการพัฒนาด้านจิตวิทยาวิทยา Weill Cornell Medical College แห่งมหาวิทยาลัย Cornell, 1300 York Avenue, Box 140, นิวยอร์ก, NY 10021, USA.

นามธรรม

การศึกษาครั้งนี้ตรวจสอบว่าบริเวณหน้าท้องส่วนหน้าท้องรหัสที่แตกต่างกันที่คาดหวังและผลตอบแทนที่ไม่คาดคิด เราจัดการความน่าจะเป็นของตัวแปรและตรวจสอบการตอบสนองของระบบประสาทเพื่อให้รางวัลและไม่ตอบสนองสำหรับแต่ละเงื่อนไขความน่าจะเป็นใน ventral striatum และ orbitofrontal cortex (OFC) โดยการทดลองช่วงปลายของการทดลองผู้ทดลองแสดงการตอบสนองเชิงพฤติกรรมช้าลงสำหรับเงื่อนไขที่มีความน่าจะเป็นของรางวัลต่ำที่สุดเมื่อเทียบกับเงื่อนไขที่มีความน่าจะเป็นรางวัลสูงสุด ในระดับประสาททั้งนิวเคลียส accumbens (NAcc) และ OFC แสดงให้เห็นถึงการกระตุ้นที่มากขึ้นเมื่อเทียบกับการทดลองแบบ nonrewarded แต่ accumbens ดูเหมือนจะไวต่อการละเมิดมากที่สุดในผลลัพธ์ที่คาดหวัง ข้อมูลเหล่านี้แสดงให้เห็นถึงบทบาทที่แตกต่างกันของวงจรด้านหน้าในการทำนายผลตอบแทนและในการตอบสนองต่อการละเมิดความคาดหวัง

 

บทนำ

การสร้างการคาดการณ์ที่แม่นยำและการตรวจจับการละเมิดในความคาดหวังเกี่ยวกับกิจกรรมที่กำลังจะให้รางวัลเป็นองค์ประกอบที่สำคัญของพฤติกรรมที่มุ่งเป้าหมายไปที่เป้าหมาย การศึกษาเกี่ยวกับเจ้าคณะที่ไม่ใช่มนุษย์และการถ่ายภาพมนุษย์ชี้ให้เห็นว่าพื้นที่ส่วนหน้าที่อุดมด้วยโดปามีนมีส่วนเกี่ยวข้องในการสร้างการคาดการณ์เกี่ยวกับผลตอบแทนในอนาคตและการปรับพฤติกรรมให้เหมาะสม กลไกประสาทของข้อผิดพลาดในการทำนายที่เกี่ยวข้องกับรางวัล - การแสดงความแตกต่างระหว่างรางวัลจริงและรางวัลที่คาดหวัง (Schultz et al, 1997) - ได้รับการศึกษาในสัตว์เลี้ยงลูกด้วยนมที่ไม่ใช่มนุษย์ในแง่ของรางวัลที่คาดหวังและไม่คาดคิดและ / หรือการละเว้นรางวัล (Hollerman et al, 1998, Leon และ Shadlen, 1999; Tremblay และ Schultz, 1999) การศึกษาในปัจจุบันใช้ภารกิจจับคู่กับตัวอย่างการหน่วงเวลาเชิงพื้นที่อย่างง่ายคล้ายกับงานที่เคยใช้กับไพรเมตที่ไม่ใช่มนุษย์มาก่อน (Fiorillo et al, 2003) ซึ่งควบคุมความน่าจะเป็นของผลตอบแทนเพื่อตรวจสอบการตอบสนองของระบบประสาทต่อรางวัลที่คาดหวังและไม่คาดคิด

หลักฐานที่แสดงถึงนัยยะของระบบโดปามีนมีความสำคัญต่อการทำนายและการให้รางวัล (Olds and Milner, 1954; Montague et al, 2004, ชูลท์ซ 2002 เพื่อการตรวจสอบ) การศึกษาเจ้าคณะที่ไม่ใช่มนุษย์แสดงให้เห็นว่าเซลล์โดปามีนตอบสนองต่อรางวัลปฐมภูมิที่ไม่คาดคิดและในที่สุดก็มีสิ่งเร้าที่ทำนายรางวัลเหล่านั้นในที่สุด (Mirencowicz & Schultz, 1994, Tobler et al, 2005) เซลล์โดปามีนในพื้นที่หน้าท้อง (VTA) ของลิงจะยิงเพื่อตอบสนองต่อรางวัลปฐมภูมิที่ไม่คาดการณ์ (หรือทำนายด้วยความน่าจะเป็นต่ำ) มากกว่ารางวัลที่คาดการณ์ไว้อย่างสมบูรณ์ (Fiorillo et al, 2003;Tobler et al, 2005) ในทางกลับกันกิจกรรมของเซลล์ประสาทเดียวกันก็จะถูกระงับเมื่อไม่มีการส่งรางวัลที่คาดหวังเมื่อเทียบกับการละเว้นของรางวัลที่คาดหวัง (Fiorillo et al, 2003; Tobler et al, 2005) ดังนั้นโดปามีนรหัสเซลล์ประสาทสำหรับข้อผิดพลาดในการทำนายโดยเป็นตัวแทนของความคลาดเคลื่อนระหว่างผลลัพธ์ที่เกิดขึ้นจริงและที่คาดการณ์ไว้ (Schultz et al, 1997; Tobler et al, 2005) เช่นการนำเสนอผลตอบแทนที่ไม่คาดคิดในกิจกรรมที่เพิ่มขึ้นและการละเว้นผลลัพธ์ที่ไม่คาดคิดในกิจกรรมที่ลดลง

การเปลี่ยนแปลงโดปามีนในการตอบสนองต่อการเปลี่ยนแปลงในผลตอบแทนจะถูกขนานไปกับการเปลี่ยนแปลงพฤติกรรม การศึกษาเจ้าคณะ nonhuman ได้พบว่าลิงจะเพิ่มการเลียที่คาดการณ์ไว้เป็นหน้าที่ของความน่าจะเป็นที่มีการกระตุ้นปรับอากาศที่มีความสัมพันธ์กับการกระตุ้นที่ไม่มีเงื่อนไขต่อมา ดังนั้นสิ่งเร้าที่แสดงให้เห็นถึงความน่าจะเป็นที่สูงของการส่งมอบน้ำผลไม้ที่ตามมาทำให้เกิดการเลียที่คาดการณ์ล่วงหน้ามากขึ้น (Fiorillo et al., 2003).

การเชื่อมต่อทางกายวิภาคของกันและกันซึ่งกันและกันระหว่างภูมิภาคที่เกี่ยวข้องกับการกำหนดเป้าหมายพฤติกรรม (e กรัม prefrontal นอก) และผู้ที่เกี่ยวข้องกับพฤติกรรมการกินอาหารอัตโนมัติ (e กรัม ventral striatum) ซึ่งอาจมีการคำนวณการพยากรณ์Shultz et al., 1997; ฮาเบอร์และคณะ 2003) ภูมิภาคเหล่านี้จะถูกกระตุ้นด้วยโดปามีนอย่างหนักผ่านการคาดการณ์จากเซลล์ประสาทโดปามีนในสมองส่วนกลางและการเชื่อมต่อเหล่านี้อาจกลายเป็นวงจรประสาทที่ทำงานได้ดีซึ่งสนับสนุนการปรับพฤติกรรมให้เหมาะสมในการกระทำที่เป็นประโยชน์มากที่สุด

เมื่อเร็ว ๆ นี้การศึกษาการถ่ายภาพด้วยคลื่นสนามแม่เหล็กของมนุษย์ (fMRI) ได้มีส่วนเกี่ยวข้องสองส่วนของวงจรนี้นิวเคลียส accumbens และ orbitofrontal cortex เพื่อเป็นตัวแทนของการทำนายผิดพลาด ตัวอย่างเช่นลำดับของน้ำผลไม้และน้ำที่ไม่สามารถคาดเดาได้แสดงให้เห็นถึงกิจกรรมที่เพิ่มขึ้นใน NAcc เมื่อเทียบกับการจัดส่งที่คาดการณ์ได้ (Berns et al, 2001) ข้อผิดพลาดในการทำนายขึ้นอยู่กับเวลา (McClure และอัล 2003) และสิ่งเร้า (O'Doherty et al, 2003 O'Doherty et al, 2004) การละเมิดยังเปิดใช้งานหน้าท้อง striatum

บทบาทของ OFC ในการทำนายผลตอบแทนมีความชัดเจนน้อยลง ในขณะที่การศึกษาบางส่วนได้รายงานความไวของ OFC ภายใต้เงื่อนไขของการทำนายผิดพลาด (Berns และคณะ, 2001; O'Doherty และคณะ, 2003; Ramnini และคณะ, 2004; Dreher et al., 2005) อื่น ๆ ไม่ได้ (McClure และคณะ, 2003; O'Doherty และคณะ, 2004; Delgado และคณะ, 2005) การศึกษาที่เน้นความผิดพลาดในการทำนายน้อยกว่าแสดงให้เห็นว่าการเปิดใช้งาน OFC เป็นไปในทางที่ดีเมื่อเทียบกับผลลัพธ์ที่ไม่พึงประสงค์O'Doherty et al, 2001; เอลเลียตและอัล 2003; Galvan et al, 2005) ในการศึกษามูลค่ารางวัล (Gottfried และคณะ 2003) และเวเลนซ์ (Cox และ al, 2005; O'Doherty, 2000 O'Doherty, 2003 O'Doherty, 2004) เมื่อเร็ว ๆ นี้ Kringelbach and Rolls (2004) บูรณาการวรรณกรรม neuroimaging และ neuropsychological บัญชีสำหรับฟังก์ชั่นที่แตกต่างกันของเยื่อหุ้มสมอง orbitofrontal พวกเขาแนะนำความแตกต่างตรงกลางด้านข้างและความแตกต่างด้านหน้า - หลัง คอร์เทกซ์ด้านนอกที่อยู่ตรงกลางและด้านข้างจะตรวจสอบมูลค่ารางวัลและการประเมินผลของผู้ลงโทษตามลำดับ (เช่น O'Doherty et al, 2001 ; ม้วนและอัล 2003) เยื่อหุ้มสมองด้านหน้าหรือวงโคจรด้านหน้าเป็นความคิดที่จะมีส่วนร่วมมากขึ้นในการเป็นตัวแทนของ reinforcers นามธรรม (O'Doherty et al, 2001) ง่ายกว่าคนที่เกี่ยวข้องกับการลิ้มรส (เช่น De Araujo et al, 2003) และความเจ็บปวด (เช่น Craig et al, 2000).

ภูมิภาคหน้าท้องส่วนหน้ามีเมื่อเร็ว ๆ นี้ (Knutson et al, 2005) เกี่ยวข้องกับการแสดงค่าที่คาดหวัง (ผลิตภัณฑ์ของความน่าจะเป็นที่คาดหวังและขนาดของผลลัพธ์) ระหว่าง ความคาดหวังของผลรางวัล. ด้วยการออกแบบที่หรูหรา แต่ซับซ้อนซึ่งรวมถึงตัวชี้นำ 18 ที่แสดงถึงการรวมกันของขนาดความน่าจะเป็นและ / หรือวาเลนซ์การขาดพลังงานเชิงสถิติทำให้นักเขียนไม่สามารถตรวจสมองที่เกี่ยวข้องกับแรงกระตุ้นได้ ผลลัพธ์. ในการศึกษาปัจจุบันเราใช้ตัวชี้นำที่แตกต่างกันสามตัวซึ่งแต่ละอันเกี่ยวข้องกับรางวัล 33%, 66% หรือ 100% สำหรับการทดลองที่ถูกต้อง ความสำคัญของการศึกษาครั้งนี้คือเมื่อ ผลรางวัล แทนที่จะให้รางวัลตามความคาดหมายเพื่อตรวจสอบความอ่อนไหวในระดับประสาทถึงการละเมิดในการคาดหวังผลตอบแทนแทนที่จะคาดหวังผลตอบแทนก่อนที่จะมีผลลัพธ์ การวิเคราะห์นี้มีความสำคัญในการทำความเข้าใจความสามารถในการคาดการณ์ของรางวัลเนื่องจากมีการเปลี่ยนแปลงในการยิงโดปามีนที่เกิดขึ้นที่ผลตอบแทนเมื่อมีการละเมิดการคาดการณ์ที่คาดการณ์ไว้Fiorillo et al, 2003) ได้โดยง่าย priori การคาดการณ์เกี่ยวกับการตอบรับและการตอบสนอง OFC ต่อรางวัลทางการเงินที่คาดหวังและไม่คาดคิดมาจากงานถ่ายภาพก่อนหน้าซึ่งส่งผลต่อภูมิภาคเหล่านี้ในการประมวลผลรางวัล (Knutson et al, 2001; 2005; O'Doherty et al, 2001; Galvan et al, 2005) เราใช้การจับคู่ที่ล่าช้าเชิงพื้นที่อย่างง่ายเพื่อสุ่มตัวอย่างกระบวนทัศน์ที่คล้ายกับที่ใช้โดย Fiorillo et al (2003) ในการศึกษา electrophysiological ของเซลล์ประสาทโดปามีนในไพรเมตที่ไม่ใช่มนุษย์ เราตั้งสมมติฐานว่ากิจกรรมใน ventral striatum โดยเฉพาะ NAcc จะเพิ่มขึ้นเมื่อมีการส่งรางวัลที่ไม่คาดคิดและจะลดลงเมื่อไม่ได้รับรางวัลที่คาดหวัง พฤติกรรมที่คาดว่าจะขนานการเปลี่ยนแปลงเหล่านี้กับเวลาปฏิกิริยาที่เร็วขึ้นเพื่อทำนายการชี้นำรางวัลบ่อยที่สุด แต่เวลาปฏิกิริยาช้าลงกับคิวที่ทำนายการให้รางวัลอย่างน้อยบ่อยครั้ง นอกจากนี้เรายังตั้งสมมติฐานว่า OFC จะมีความอ่อนไหวต่อผลตอบแทน (รางวัลหรือไม่) แต่ผู้ที่มีความอ่อนไหวจะอ่อนไหวต่อการเปลี่ยนแปลงในการทำนายผลตอบแทนมากที่สุด สมมติฐานเหล่านี้มีพื้นฐานมาจากรายงานจากการศึกษาการถ่ายภาพก่อนหน้า (Galvan et al 2005ในสื่อสิ่งพิมพ์) และงานเจ้าคณะที่ไม่ใช่มนุษย์แสดงให้เห็นการมีส่วนร่วมของคนสำคัญมากในพารามิเตอร์ความน่าจะเป็นรางวัลเมื่อเทียบกับกิจกรรมที่ล็อครางวัลของ OFC (ชูลทซ์และอัล 2000) และในจำนวนที่แน่นอนมากกว่าจำนวนเงินรางวัลที่แตกต่างกันไปตามเงื่อนไขความน่าจะเป็น

วิธีการ

ผู้เข้าร่วมกิจกรรม

ผู้ใหญ่ที่มีสุขภาพถนัดขวาสิบสองคน (หญิง 7) อายุ 19 – 27 (หมายถึงอายุ 24 ปี) รวมอยู่ในการทดลอง fMRI ผู้เข้าร่วมการวิจัยไม่เคยมีประวัติป่วยด้วยโรคทางระบบประสาทหรือจิตเวชและอาสาสมัครทุกคนยินยอมให้คณะกรรมการพิจารณาทบทวนสถาบันอนุมัติการศึกษาก่อนการมีส่วนร่วม

งานทดลอง

ผู้เข้าร่วมได้รับการทดสอบโดยใช้เวอร์ชันแก้ไขของภารกิจตอบกลับล่าช้าสองทางเลือกที่อธิบายไว้ก่อนหน้านี้ (Galvan et al, 2005) ในการศึกษา fMRI ที่เกี่ยวข้องกับเหตุการณ์ (รูป 1) ในงานนี้สามตัวชี้นำแต่ละอันเกี่ยวข้องกับความน่าจะเป็นที่แตกต่างกัน (33%, 66% และ 100%) จากการได้รับรางวัลจำนวนคงที่ ผู้สอนได้รับคำสั่งให้กดดัชนีหรือนิ้วกลางเพื่อระบุด้านที่คิวปรากฏขึ้นเมื่อได้รับแจ้งและตอบสนองโดยเร็วที่สุดโดยไม่ทำผิด ภาพการ์ตูนโจรสลัดหนึ่งในสามภาพนั้นถูกนำเสนอแบบสุ่มบนด้านซ้ายหรือด้านขวาของการตรึงศูนย์กลางสำหรับ 1000 msec (ดู รูป 1) หลังจากการหน่วงเวลา 2000 msec วัตถุถูกนำเสนอด้วยการตอบสนองของกล่องสมบัติสองอันที่ทั้งสองด้านของการตรึง (2000 msec) และสั่งให้กดปุ่มด้วยนิ้วชี้ที่ถูกต้องหากโจรสลัดอยู่ด้านซ้ายของการตรึงหรือ นิ้วกลางขวาของพวกเขาหากโจรสลัดอยู่ด้านขวาของการตรึง หลังจาก 2000 msec ล่าช้าอีกครั้งรางวัลตอบรับ (เหรียญการ์ตูน) หรือหีบสมบัติที่ว่างเปล่าถูกนำเสนอที่กึ่งกลางของหน้าจอ (1000 msec) ตามความน่าจะเป็นรางวัลประเภททดลองนั้น มีช่วงเวลาระหว่าง 12 วินาที (ITI) ก่อนเริ่มการทดลองครั้งถัดไป

รูป 1  

การออกแบบงาน

มีเงื่อนไขความน่าจะเป็นรางวัลสามประการ: ความน่าจะเป็นรางวัล 33%, 66% และ 100% ในสภาพ 33% อาสาสมัครได้รับรางวัลจากการทดลอง 33% และไม่มีรางวัล (หีบสมบัติว่างเปล่า) ที่เกิดขึ้นในอีก 66% ของการทดลองในสภาพนั้น ในสภาพ 66% อาสาสมัครได้รับรางวัลจากการทดลอง 66% และไม่มีการให้รางวัลใด ๆ สำหรับการทดลอง 33% อื่น ๆ ในสภาพ 100% อาสาสมัครได้รับรางวัลสำหรับการทดลองที่ถูกต้องทั้งหมด

อาสาสมัครรับประกัน $ 50 สำหรับการมีส่วนร่วมในการศึกษาและได้รับการบอกว่าพวกเขาสามารถสร้างรายได้มากถึง $ 25 ขึ้นอยู่กับประสิทธิภาพ (ตามดัชนีโดยเวลาตอบสนองและความแม่นยำ) ในงาน สิ่งกระตุ้นถูกนำเสนอด้วยระบบการถ่ายภาพการทำงานแบบบูรณาการ (IFIS) (PST, พิตต์สเบิร์ก) โดยใช้จอแสดงผลวิดีโอ LCD ในเบื่อของเครื่องสแกน MR และอุปกรณ์เก็บรวบรวมการตอบสนองใยแก้วนำแสง

การทดสอบประกอบด้วยการทดลอง 18 ห้าครั้ง (6 แต่ละความน่าจะเป็น 33%, 66% และ 100% ของประเภทการทดลองให้รางวัล) ซึ่งกินเวลา 6 นาทีและ 8 แต่ละครั้ง การทดสอบแต่ละครั้งมีการทดลอง 6 ของความน่าจะเป็นรางวัลแต่ละครั้งที่แสดงตามลำดับแบบสุ่ม ในตอนท้ายของการวิ่งแต่ละครั้งผู้เรียนจะได้รับการปรับปรุงเกี่ยวกับจำนวนเงินที่พวกเขาได้รับระหว่างการวิ่ง ก่อนที่จะเริ่มการทดลองผู้เข้าร่วมจะได้รับคำแนะนำโดยละเอียดซึ่งรวมถึงความคุ้นเคยกับสิ่งกระตุ้นที่ใช้และดำเนินการฝึกซ้อมเพื่อให้แน่ใจว่ามีความเข้าใจในงาน พวกเขาบอกว่ามีความสัมพันธ์ระหว่างตัวชี้นำและผลลัพธ์ทางการเงิน แต่ลักษณะที่แน่นอนของความสัมพันธ์นั้นไม่ได้ถูกเปิดเผย

การได้มาของภาพ

การถ่ายภาพดำเนินการโดยใช้เครื่องสแกน MRI 3T General Electric โดยใช้ขดลวดส่วนหัวแบบสี่เหลี่ยมจัตุรัส การสแกนตามหน้าที่ได้มาโดยใช้ลำดับการเข้าและออกแบบเกลียว (Glover & Thomason, 2004) พารามิเตอร์ดังกล่าวประกอบด้วยเมทริกซ์ TR = 2000, TE = 30, 64 X 64, ชิ้นส่วนโคโรนาขนาด 29 มม. 5 ชิ้น, ความละเอียดในระนาบ 3.125 X 3.125 มม., พลิก 90 °) สำหรับการทำซ้ำ 184 ครั้งรวมถึงการได้มาที่ทิ้งสี่ครั้งเมื่อเริ่มต้น แต่ละครั้ง มีการรวบรวมการสแกนในระนาบทางกายวิภาค T1 (TR = 500, TE = นาที, 256 X 256, FOV = 200 มม., ความหนาของชิ้นงาน 5 มม.) ในตำแหน่งเดียวกับภาพที่ใช้งานได้นอกเหนือจากชุดข้อมูล 3 มิติ ของภาพ SPGR ความละเอียดสูง (TR = 25, TE = 5, ความหนาชิ้น 1.5 มม., 124 ชิ้น)

การวิเคราะห์ภาพ

แพคเกจซอฟต์แวร์ Brainvoyager QX (Brain Innovations, Maastricht, The Netherlands) ถูกนำมาใช้เพื่อทำการวิเคราะห์ผลกระทบแบบสุ่มของข้อมูลภาพ ก่อนการวิเคราะห์ขั้นตอนก่อนการประมวลผลต่อไปนี้ได้ดำเนินการกับภาพดิบ: การแก้ไขการเคลื่อนไหว 3D เพื่อตรวจจับและแก้ไขการเคลื่อนไหวของหัวขนาดเล็กโดยการจัดตำแหน่งเชิงปริมาตรทั้งหมดไปยังปริมาตรแรกโดยการแปลงร่างแข็งการแก้ไขเวลาการสแกนชิ้น การกำจัดเทรนด์เชิงเส้นการกรองชั่วขณะแบบ High-pass เพื่อกำจัดสิ่งที่ไม่ใช่เชิงเส้นของ 3 หรือรอบที่น้อยกว่าต่อรอบหลักสูตรและข้อมูลเชิงพื้นที่ที่ราบเรียบโดยใช้เคอร์เนล Gaussian ด้วย 4mm FWHM การหมุนและการแปลโดยประมาณไม่เกิน 2mm สำหรับวิชาที่รวมอยู่ในการวิเคราะห์นี้

ข้อมูลการทำงานถูกบันทึกร่วมกับปริมาตรกายวิภาคโดยการจัดตำแหน่งของจุดที่สอดคล้องกันและการปรับด้วยตนเองเพื่อให้ได้ขนาดที่เหมาะสมโดยการตรวจสอบด้วยสายตาและจากนั้นเปลี่ยนเป็นพื้นที่ Talairach ในระหว่างการแปลง Talairach, voxels ทำงานถูกสอดแทรกความละเอียด 1 mm3 สำหรับจุดประสงค์ในการจัดตำแหน่ง แต่เกณฑ์ทางสถิติขึ้นอยู่กับขนาดของ voxel ที่ได้มา นิวเคลียส accumbens และเปลือกนอกด้านหน้าของวงโคจรถูกกำหนดโดยสมองทั้ง voxelwise GLM กับรางวัลเป็นตัวทำนายหลัก (ดูด้านล่าง) และจากนั้นแปลโดย Talairach พิกัดร่วมกับการอ้างอิงถึง atlas สมอง Duvernoy (Talairach & Tournoux, 1988; Duvernoy, 1991)

การวิเคราะห์ทางสถิติของข้อมูลการถ่ายภาพได้ดำเนินการกับสมองทั้งหมดโดยใช้แบบจำลองเชิงเส้นทั่วไป (GLM) ประกอบด้วย 60 (5 ทำงาน X วิชา 12) ทำงานตามปกติซี ตัวทำนายหลักคือรางวัล (รางวัลเทียบกับการทดลองแบบไม่ตอบกลับ) ตลอดความน่าจะเป็นของการให้รางวัลทั้งหมดตามผลลัพธ์ของรางวัล ตัวทำนายได้มาจากการตอบสนองของ boxcar ในอุดมคติ (สมมติว่ามีค่า 1 สำหรับปริมาณงานนำเสนอและปริมาณของ 0 สำหรับจุดเวลาที่เหลือ) ด้วยแบบจำลองเชิงเส้นของการตอบสนองทางโลหิตวิทยา (บอยน์ตันและอัล 1996) และใช้ในการสร้างเมทริกซ์การออกแบบของแต่ละหลักสูตรในการทดสอบ มีการรวมการทดลองที่ถูกต้องเท่านั้นและเครื่องสร้างตัวทำนายแยกต่างหากสำหรับการทดลองผิดพลาด จากนั้นทำการวิเคราะห์ความคมชัดหลังโพสต์ในพื้นที่ที่น่าสนใจโดยใช้การทดสอบ t บนน้ำหนักเบต้าของตัวทำนาย การจำลองของ Monte Carlo ดำเนินการโดยใช้โปรแกรม AlphaSim ภายใน AFNI (Cox, 1996) เพื่อกำหนดเกณฑ์ที่เหมาะสมเพื่อให้ได้ระดับอัลฟาที่ได้รับการแก้ไขที่ p <0.05 จากปริมาณการค้นหาประมาณ 25,400 mm3 และ 450 mm3 สำหรับเยื่อหุ้มสมองส่วนหน้าของวงโคจรและนิวเคลียส accumbens ตามลำดับ เปอร์เซ็นต์การเปลี่ยนแปลงของสัญญาณ MR เทียบกับค่าพื้นฐาน (ช่วงเวลาก่อนการทดลอง 20 วินาทีทันที) ในนิวเคลียส accumbens และเยื่อหุ้มสมองส่วนหน้าของวงโคจรถูกคำนวณโดยใช้ค่าเฉลี่ยที่เกี่ยวข้องกับเหตุการณ์เหนือ voxels ที่ใช้งานอย่างมีนัยสำคัญที่ได้จากการวิเคราะห์ความเปรียบต่าง

GLM ในสมองทั้งหมดได้มาจากการทดลองแบบ 50 แบบรางวัลต่อวิชา (n = 12) สำหรับการทดลอง 600 ทั้งหมดและการทดลองแบบ nonreward แบบไม่ต่อเนื่อง (n = 30) สำหรับการทดลอง 12 แบบ nonreward ทั้งหมดในการทดลองทั้งหมด ความแตกต่างที่ตามมาของเงื่อนไขความน่าจะเป็นของรางวัลประกอบด้วยจำนวนรางวัลที่แตกต่างกันและไม่มีการทดลองให้รางวัล สำหรับเงื่อนไขความน่าจะเป็นรางวัล 360% มีการทดลองใช้รางวัล 100 ต่อการดำเนินการ (6) ต่อเรื่อง (5) สำหรับการทดลองใช้รางวัล 12 ทั้งหมดและไม่มีการทดลองแบบไม่ย้อนกลับ สำหรับเงื่อนไขความน่าจะเป็นรางวัล 360% มีการทดลองใช้รางวัล 66 ต่อการดำเนินการ (4) ต่อเรื่อง (5) สำหรับการทดลองใช้รางวัล 12 ทั้งหมดและการทดลองแบบไม่ใช้ XRUMX สำหรับเงื่อนไขความน่าจะเป็นรางวัล 240% มีการทดลองใช้รางวัล 120 ต่อการดำเนินการ (33) ต่อเรื่อง (2) สำหรับการทดลองใช้รางวัล 5 ทั้งหมดและการทดลองแบบไม่ใช้ค่าตอบแทน 12

ผลสอบ

ข้อมูลเกี่ยวกับพฤติกรรม

ผลกระทบของความน่าจะเป็นรางวัลและเวลาในงานได้รับการทดสอบด้วย 3 (33%, 66%, 100%) x 5 (รัน 1 – 5) วัดการวิเคราะห์ความแปรปรวน (ANOVA) ซ้ำ ๆ ) และความถูกต้องเฉลี่ย

ไม่มีผลกระทบหลักหรือปฏิสัมพันธ์ของความน่าจะเป็นของรางวัล (F [2,22] =. 12, p <.85) เวลาในงาน (F [4,44] = 2.02, p <.14) หรือความน่าจะเป็นของรางวัล X เวลา ในงาน (F [8, 88] = 1.02, p <.41) สำหรับค่าเฉลี่ยความแม่นยำ สิ่งนี้คาดว่าจะเกิดขึ้นเนื่องจากความแม่นยำของผู้เข้าร่วมถึงระดับที่ใกล้เพดานสำหรับความน่าจะเป็นทั้งหมดของการทดลอง (เงื่อนไข 33% = 97.2%; 66% เงื่อนไข = 97.5%; เงื่อนไข 100% = 97.7%)

มีปฏิสัมพันธ์ที่สำคัญระหว่างความน่าจะเป็นของรางวัลและเวลาในงาน (F [8,88] = 3.5, p <.01) กับค่าเฉลี่ย RT แต่ไม่มีผลกระทบหลักของเวลาต่องาน (F [4,44] = .611 , p <0.59) หรือความน่าจะเป็นของรางวัล (F [2,22] = 2.84, p <0.08) การทดสอบหลังการทดลอง t ของปฏิสัมพันธ์ที่มีนัยสำคัญแสดงให้เห็นว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างเงื่อนไขความน่าจะเป็นของรางวัล 33% และ 100% ในระหว่างการทดลองช่วงปลายของการทดลอง (วิ่ง 5) (t (11) = 3.712, p <.003), ด้วยค่าเฉลี่ย RT ที่เร็วกว่าสำหรับเงื่อนไขความน่าจะเป็นของรางวัล 100% (ค่าเฉลี่ย = 498.30, sd = 206.23) เทียบกับเงื่อนไข 33% (ค่าเฉลี่ย = 583.74, sd = 270.23)

ความแตกต่างของเวลาตอบสนองเฉลี่ยระหว่างเงื่อนไข 100% และ 33% เพิ่มขึ้นสองเท่าจากการทดลองตั้งแต่ต้นจนถึงปลายการทดลอง (ดูที่ รูปที่ 2a) เพื่อแสดงการเรียนรู้เพิ่มเติมเราแนะนำการกลับรายการการสลับความน่าจะเป็นของรางวัลสำหรับเงื่อนไข 33% และ 100% เมื่อสิ้นสุดการทดสอบ A ความน่าจะเป็น 2 (ความน่าจะเป็น) X 2 (การกลับรายการและการไม่กลับรายการ) ANOVA สำหรับการทดลองปลายแสดงให้เห็นว่าการทำงานร่วมกันอย่างมีนัยสำคัญ (F (1,11) = 18.97, p = 0.001) โดยการลดลงของ RT การไม่กลับรายการ (mean = 33, sd = 583.74) และ 270.24% ในการกลับรายการ (mean = 100, sd = 519.89) (รูปที่ 2b).

รูป 2  

ผลลัพธ์ด้านพฤติกรรม (RT)

ผลการถ่ายภาพ

GLM สำหรับการทดลองที่ถูกต้องโดยใช้ความน่าจะเป็นรางวัลเป็นตัวทำนายหลักถูกสร้างแบบจำลอง ณ จุดที่ผู้เข้าร่วมได้รับผลตอบรับเกี่ยวกับรางวัลหรือไม่ (เช่นผลลัพธ์) การวิเคราะห์นี้ระบุขอบเขตของ NAcc (x = 9, y = 6, z = −1 และ x = −9, y = 9, z = −1) และ OFC (x = 28, z = - 39) (ดู รูปที่ 3a, b). การทดสอบหลังการทดสอบระหว่างน้ำหนักเบต้าของการทดลองที่ให้รางวัลกับการทดลองที่ไม่ได้รับรางวัลแสดงให้เห็นว่ามีการเปิดใช้งานมากขึ้นในทั้งสองภูมิภาคนี้เพื่อให้รางวัล (NAcc: t (11) = 3.48, p <0.01; OFC x = 28, y = 39, z = −6, เสื้อ (11) = 3.30, พี <0.02)1.

รูป 3  

การกระตุ้นที่ยิ่งใหญ่กว่าเมื่อเทียบกับผลลัพธ์ที่ไม่ได้รับการตอบกลับใน a) นิวเคลียส accumbens (x = 9, y = 6, z = −1; x = −9, y = 9, z = −1) 28, y = 39, z = −6)

มีสองผลลัพธ์ที่เป็นไปได้ (รางวัลหรือไม่มีรางวัล) สำหรับตารางการให้รางวัลไม่ต่อเนื่องสองรายการ (ความน่าจะเป็น 33% และ 66%) และมีเพียงผลลัพธ์เดียวสำหรับกำหนดการรางวัลต่อเนื่อง (ความน่าจะเป็นของรางวัล 100%) ซึ่งใช้เป็นเงื่อนไขการเปรียบเทียบ ในขณะที่ผลกระทบหลักของการให้รางวัล (รางวัลเทียบกับการทดลองไม่ให้รางวัล) ใน OFC ที่อธิบายไว้ข้างต้นกิจกรรม OFC ไม่แตกต่างกันไปตามหน้าที่ของความน่าจะเป็นของรางวัลในการศึกษาปัจจุบัน [F (2,10) = 0.84, p = 0.46) . ในทางตรงกันข้าม NAcc แสดงให้เห็นการเปลี่ยนแปลงที่ชัดเจนในกิจกรรมเพื่อผลลัพธ์เป็นฟังก์ชันของการจัดการความน่าจะเป็นของรางวัล [F (2,10) = 9.32, p <0.005] โดยเฉพาะอย่างยิ่งกิจกรรม NAcc เพิ่มขึ้นเพื่อให้ผลตอบแทนเมื่อรางวัลไม่คาดคิด (เงื่อนไขความน่าจะเป็นของรางวัล 33%) เทียบกับที่คาดไว้ (เงื่อนไขพื้นฐาน 100%) [t (11) = 2.54, p <.03 ดู รูปที่ 4a]. ประการที่สองมีกิจกรรม NAcc ลดลงจนไม่มีรางวัลเมื่อคาดว่าจะได้รับรางวัลและไม่ได้รับ (เงื่อนไขความน่าจะเป็นของรางวัล 66%) เทียบกับรางวัลที่ไม่ได้คาดหวังหรือได้รับ (เงื่อนไขความน่าจะเป็นของรางวัล 33% t (59) = 2.08, p <.04; ดู รูปที่ 4b) โปรดทราบว่าไม่มีความแตกต่างอย่างมีนัยสำคัญในการเปิดใช้งานระหว่าง 33% และ 66% เงื่อนไขความน่าจะเป็นรางวัล [t (11) =. 510, p = .62] หรือระหว่าง 66% และ 100% เงื่อนไขความน่าจะเป็นรางวัล [t (11) = 1.20, p = .26] ในผลลัพธ์ที่ได้รับรางวัล สัญญาณ MR เป็นฟังก์ชันของผลลัพธ์ของรางวัลและความน่าจะเป็น รูป 4.

รูป 4  

ร้อยละ MR สัญญาณการเปลี่ยนแปลงเป็นหน้าที่ของผลตอบแทนและความน่าจะเป็นในนิวเคลียส accumbens เป็น) ได้รับรางวัลและข) ผลลัพธ์ที่ไม่ได้ส่งต่อ

การสนทนา

การศึกษาครั้งนี้ตรวจสอบผลกระทบของการละเมิดในผลตอบแทนที่คาดหวังต่อพฤติกรรมและกิจกรรมของระบบประสาทใน accumbens และ orbital frontal cortex (OFC) ซึ่งแสดงก่อนหน้านี้ว่ามีส่วนร่วมในการคาดหวังผลลัพธ์ของรางวัล (McClure และคณะ 2004; Knutson et al, 2005) เราแสดงให้เห็นว่าทั้งนิวเคลียส accumbens และ OFC ได้รับการคัดเลือกในระหว่างการทดลองที่ได้รับผลตอบแทนเมื่อเทียบกับการทดลองแบบ nonrewarded แต่มีเพียงนิวเคลียส accumbens เท่านั้นที่แสดงความไวต่อการละเมิดในผลการทำนายที่คาดการณ์ไว้ในการศึกษานี้ ความไวที่มากขึ้นของ accumbens เพื่อให้รางวัลแก่ค่า (เช่นขนาด) ที่เกี่ยวข้องกับ OFC ได้ถูกแสดงในงานก่อนหน้านี้ (Galvan et al 2005) และด้วยกันการค้นพบนี้ชี้ให้เห็นว่าภูมิภาคนี้อาจมีส่วนร่วมในการคำนวณขนาดและความน่าจะเป็นของรางวัล การขาดความอ่อนไหวใน OFC ต่อกิจวัตรเหล่านี้อาจสะท้อนให้เห็นถึงการมอบรางวัลหรือความกำกวมในผลลัพธ์ (Hsu และคณะ, 2005) อีกทางเลือกหนึ่งเนื่องจากสัญญาณ MR มีความผันแปรมากขึ้นในภูมิภาคนี้ผลกระทบเหล่านี้อาจลดลงในการศึกษาปัจจุบัน

ในการศึกษา electrophysiological ในสัตว์เซลล์ประสาทโดปามีนใน midbrain (ซึ่งโครงการไปยังนิวเคลียส accumbens) ได้รับการแสดงให้เห็นว่ามีการตอบสนองต่อการทำนายผลรางวัลที่ได้รับน้อย (ไม่มีความน่าจะเป็น = 1.0) แต่แสดง phasic fasic ความน่าจะเป็น% แม้หลังจากการฝึกอบรมอย่างกว้างขวาง (Fiorillo et al, 2003) ในการศึกษาปัจจุบันเราแสดงให้เห็นถึงกิจกรรมที่มากขึ้นในการให้รางวัลเมื่อผลตอบแทนที่คาดไม่ถึง (เงื่อนไข 33%) เทียบกับเมื่อมันถูกคาดหวัง (เงื่อนไข 100%) สอดคล้องกับสิ่งที่ค้นพบเหล่านี้ นอกจากนี้การศึกษาทางไฟฟ้าวิทยาของเซลล์ประสาทโดปามีนในสัตว์ (เช่น Fiorillo et al, 2003) แสดงให้เห็นว่าสำหรับการทดลองที่ทำนายรางวัล แต่ไม่เกิดขึ้นกิจกรรมของเซลล์ประสาทลดลง การศึกษาในปัจจุบันแสดงให้เห็นถึงรูปแบบที่คล้ายกันใน accumbens ด้วยการลดลงของกิจกรรมในภูมิภาคนี้ในการทดลองที่ไม่ได้รับรางวัลสำหรับเงื่อนไขความน่าจะเป็นรางวัล 66% เทียบกับสภาพ 33%2

เซลล์โดปามีนมีส่วนเกี่ยวข้องในการเรียนรู้ได้สองวิธี ก่อนพวกเขาเข้ารหัสภาระผูกพันระหว่างสิ่งเร้า (หรือการตอบสนอง) และผลลัพธ์ผ่านสัญญาณข้อผิดพลาดการทำนายที่ตรวจจับการละเมิดในความคาดหวัง (Schultz et al, 1997; Mirencowicz และ Schultz, 1998; Fiorillo et al, 2003) ดังนั้นข้อผิดพลาดในการทำนายจึงดูเหมือนว่าจะให้สัญญาณการสอนที่สอดคล้องกับหลักการเรียนรู้ที่อธิบายไว้ในตอนแรก Rescorla และ Wagner (1972). ประการที่สองพวกมันทำหน้าที่เปลี่ยนการตอบสนองเชิงพฤติกรรมSchultz et al, 1997; McClure และอัล 2004) เช่นนั้นการกระทำจะเอนเอียงไปยังตัวชี้นำที่สามารถคาดเดาได้มากที่สุด ในการศึกษาปัจจุบันเราแสดงให้เห็นว่าจากการทดลองช่วงปลายของการทดสอบประสิทธิภาพที่เหมาะสมที่สุดสำหรับเงื่อนไขที่มีความน่าจะเป็นรางวัลสูงสุด (ความน่าจะเป็นรางวัล 100%) และเหมาะสมที่สุดสำหรับสภาพความน่าจะเป็นต่ำสุด (33% การค้นหาพฤติกรรมนี้สอดคล้องกับงานที่น่าจะเป็นก่อนหน้าแสดงประสิทธิภาพที่ดีที่สุดอย่างน้อยที่สุดกับความน่าจะเป็นต่ำสุดของผลลัพธ์รางวัลแนะนำว่าภาระผูกพันรางวัลได้เรียนรู้เมื่อเวลาผ่านไป (Delgado et al, 2005) เพื่อแสดงการเรียนรู้เพิ่มเติมเราแนะนำการกลับรายการการสลับความน่าจะเป็นของรางวัลสำหรับเงื่อนไข 33% และ 100% เมื่อสิ้นสุดการทดสอบ การจัดการนี้ส่งผลในการลดทอนความแตกต่างระหว่างเงื่อนไขเหล่านี้ยืนยันผลการเรียนรู้เพิ่มเติม

เป้าหมายสำคัญของการศึกษาที่เกี่ยวข้องกับผลตอบแทนคือการพิจารณาว่ารางวัลมีอิทธิพลและพฤติกรรมอคติได้อย่างไร (เช่น Robbins และ Everitt, 1996; ชูลท์ซ 2004) นอกเหนือจากการอธิบายลักษณะการประมวลผลของระบบประสาท ปัจจัยต่าง ๆ ที่มีส่วนช่วยในการให้รางวัลที่มีอิทธิพลต่อพฤติกรรมอย่างรวดเร็วและมีประสิทธิภาพรวมถึงตารางการสนับสนุน (สกินเนอร์ 1958) มูลค่ารางวัล (Galvan et al, 2005) และให้รางวัลที่คาดการณ์ได้ (Fiorillo et al, 2003; Delgado et al, 2005) ค่าที่คาดหวังซึ่งเป็นผลคูณของขนาดและความน่าจะเป็นของรางวัล (Pascal, ca 1600s) มีอิทธิพลต่อการเลือกพฤติกรรม (von Frisch, 1967; Montague et al, 1995; Montague และ Berns, 2002) การใช้งานที่คล้ายกันมากซึ่งมีเพียงผลลัพธ์ (ขนาดแทนที่จะเป็นความน่าจะเป็น) แตกต่างจากการศึกษาในปัจจุบันเราแสดงให้เห็นว่านิวเคลียส accumbens มีความไวต่อค่าตอบแทนที่ไม่ต่อเนื่อง (Galvan et al, 2005) ถ่ายพร้อมหลักฐานที่นำเสนอที่นี่และที่อื่น ๆ (Tobler et al, 2005) เราขอแนะนำให้โอกาสที่ striatum หน้าท้องมีส่วนช่วยในการคำนวณมูลค่ารางวัลที่คาดหวังเนื่องจากความอ่อนไหวต่อความน่าจะเป็นของรางวัลและขนาด

บทบาทของเยื่อหุ้มสมองด้านหน้าวงโคจรในการทำนายผลตอบแทนสอดคล้องกับเขตการทำงานของภูมิภาคนี้โดย Kringelbach and Rolls (2004). พวกเขาแนะนำว่าส่วนหน้าของ OFC ที่อยู่ตรงหน้าและอยู่ตรงกลางมากขึ้นนั้นอ่อนไหวต่อการให้รางวัลที่เป็นนามธรรม การเปิดใช้งาน OFC ในการศึกษานี้พบในตำแหน่งทั่วไปนี้ การศึกษา electrophysiological เกี่ยวข้อง OFC ในการเข้ารหัสค่าอัตนัยของการกระตุ้นรางวัล (สำหรับการตรวจสอบ O'Doherty, 2004) ตัวอย่างเช่นเซลล์ประสาท OFC ยิงไปยังรสชาติที่เฉพาะเจาะจงเมื่อสัตว์หิว แต่ลดอัตราการเผาของพวกเขาเมื่อสัตว์อิ่มและค่ารางวัลของอาหารลดลง (Critchley and Rolls, 1996) ดังนั้นคนอื่น ๆ จึงแนะนำให้ OFC มีความอ่อนไหวต่อรางวัลที่เกี่ยวข้องมากที่สุด (Tremblay และ Schultz, 1999) และการตั้งค่ารางวัล (Schultz et al, 2000) การศึกษาเกี่ยวกับระบบประสาทได้แสดงรูปแบบคล้ายคลึงในมนุษย์ที่มีสิ่งเร้าต่าง ๆ รวมถึงรสชาติ (O'Doherty et al, 2001; Kringelbach et al, 2003) การดมกลิ่น (แอนเดอร์สันและอัล 2003; ม้วนและอัล 2003) และเงิน (เอลเลียตและอัล 2003; Galvan et al, 2005) ด้วยการเปิดใช้งานแต่ละครั้งจะแตกต่างกันไปในตำแหน่งของกิจกรรมตั้งแต่ด้านหน้าไปจนถึงด้านหลังและจากตรงกลางถึงด้านข้างของ OFC OFC มีส่วนเกี่ยวข้องในการคาดหวังผลตอบแทน (O'Doherty et al 2002) แต่เพียงตราบเท่าที่เป็นค่าการทำนายของการตอบสนองที่เชื่อมโยงกับเฉพาะ ความคุ้มค่า ของรางวัลที่เกี่ยวข้องมากกว่าความน่าจะเป็นของรางวัลที่เกิดขึ้น (O'Doherty, 2004 ) ในการศึกษาปัจจุบันเราไม่เห็นความไวต่อการละเมิดในการทำนายผลตอบแทนใน OFC Knutson และเพื่อนร่วมงาน (2005) ได้รายงานความสัมพันธ์ระหว่างการประมาณความน่าจะเป็นและการกระตุ้นสมองในการรอรับรางวัลในเยื่อหุ้มสมอง prefrontal (mesial prefrontal cortex)Knutson และคณะ 2005) แต่ไม่เจาะจงในคอร์เทกซ์ด้านหน้าของวงโคจร ในทางตรงกันข้าม, Ramnani et al (2004 ) รายงานความไวของ OFC ต่อข้อผิดพลาดการทำนายเชิงบวกในเยื่อหุ้มสมองส่วนหน้าตรงกลางโดยใช้งานการรับชมแบบพาสซีฟและ Dreher และคณะ (2005) รายงานการทำนายข้อผิดพลาด OFC ในงานที่จัดการทั้งความน่าจะเป็นและขนาดของตัวชี้นำการทำนาย แต่ภาระผูกพันเหล่านี้ได้รับการเรียนรู้ก่อนการสแกน ดังนั้นจึงยังคงมีความเป็นไปได้ที่ OFC สามารถคำนวณผลตอบแทนที่คาดการณ์ไว้ได้ แต่บางทีการคำนวณเหล่านี้คือ cruder (เช่นการสรุปในช่วงของความน่าจะเป็น) หรือช้ากว่าในการจัดรูปแบบเมื่อเทียบกับการคำนวณที่แม่นยำ อีกทางเลือกหนึ่งภูมิภาคนี้อาจมีความอ่อนไหวมากขึ้นในการตรวจจับสิ่งเร้าของความไม่แน่นอนและ / หรือคุณค่าที่คลุมเครือตามที่เสนอโดย Hsu et al (2005)กว่าในการตรวจจับการละเมิดในการทำนายรางวัล Hsu et al (2005) แสดงให้เห็นว่าระดับของความคลุมเครือในการเลือก (ตัวเลือกที่ไม่แน่นอนเนื่องจากข้อมูลที่ขาดหายไป) มีความสัมพันธ์เชิงบวกกับการเปิดใช้งานใน OFC ในที่สุดความแปรปรวนของสัญญาณ MR ในภูมิภาคนี้อาจลดลงความสามารถของเราในการตรวจจับผลกระทบเหล่านี้เช่นกัน

คำถามพื้นฐานของการศึกษาในปัจจุบันคือวิธีการที่ accumbens และ OFC รหัสที่แตกต่างกันทำนายผลรางวัลเทียบกับผลลัพธ์ที่ไม่ได้คาดการณ์ไว้ (เช่นการละเมิดในความคาดหวัง) เราจัดการความน่าจะเป็นของพารามิเตอร์และตรวจสอบการตอบสนองทางประสาทเพื่อให้รางวัลและการทดลองแบบไม่ตอบสนองต่อเงื่อนไขการให้รางวัลความน่าจะเป็นแต่ละครั้ง ข้อมูลของเราสอดคล้องกับการถ่ายภาพคนก่อนหน้าและการศึกษาทางสรีรวิทยาที่ไม่ใช่มนุษย์Fiorillo et al, 2003; ชูลท์ซ 2002) และแนะนำว่า accumbens และ OFC มีความอ่อนไหวต่อการให้รางวัลผลลัพธ์ (รางวัลหรือไม่) อย่างไรก็ตามกิจกรรมในภูมิภาคเหล่านี้โดยเฉพาะอย่างยิ่งผู้ที่ได้รับผลกระทบนั้นดูเหมือนว่าจะได้รับการปรับแต่งโดยการคาดการณ์เกี่ยวกับความน่าจะเป็นของผลตอบแทนที่เกิดขึ้นจากการเรียนรู้เมื่อเวลาผ่านไป รูปแบบการเปิดใช้งานแบบไดนามิกนี้อาจแสดงถึงการปรับเปลี่ยนในกิจกรรมโดปามีนภายในหรือฉายไปยังภูมิภาคเหล่านี้เนื่องจากข้อมูลเกี่ยวกับรางวัลที่คาดการณ์ไว้นั้นได้เรียนรู้และปรับปรุง

เชิงอรรถ

1NAcc [t (11) = 3.2, p <0.04] และ OFC [t (11) = 3.5, p <0.02] แสดงกิจกรรมที่เพิ่มขึ้นโดยคาดว่าจะได้รับรางวัลเป็นระยะ ๆ แต่ไม่ใช่เงื่อนไขการให้รางวัลต่อเนื่อง

2การงดรับผลตอบแทนในสภาพ 33% ทำให้กิจกรรม NAcc เพิ่มขึ้นเล็กน้อยแทนที่จะเป็นกิจกรรมที่ลดลงคล้ายกับที่สังเกตโดย Knutson และคณะ, 2001. การตีความที่เป็นไปได้อย่างหนึ่งของผลลัพธ์นี้คืออาสาสมัครมีแรงจูงใจภายในหรือได้รับรางวัลหากพวกเขาทำนายว่าจะไม่มีรางวัลใด ๆ มาทดลองใช้และไม่มีใครทำ อีกทางหนึ่งเนื่องจากผลลัพธ์ของรางวัลสำหรับการทดลองเหล่านี้มีจำนวนน้อยที่สุดในการทดลองกิจกรรมอาจสะท้อนถึงการเรียนรู้อย่างต่อเนื่องสำหรับเงื่อนไขนี้

ข้อจำกัดความรับผิดชอบของผู้จัดพิมพ์: นี่เป็นไฟล์ PDF ของต้นฉบับที่ไม่มีการแก้ไขซึ่งได้รับการยอมรับให้ตีพิมพ์ เพื่อเป็นการบริการลูกค้าของเราเรากำลังจัดทำต้นฉบับฉบับแรกนี้ ต้นฉบับจะได้รับการคัดลอกเรียงพิมพ์และตรวจสอบหลักฐานที่เป็นผลลัพธ์ก่อนที่จะเผยแพร่ในรูปแบบที่อ้างอิงได้สุดท้าย โปรดทราบว่าในระหว่างกระบวนการผลิตข้อผิดพลาดอาจถูกค้นพบซึ่งอาจส่งผลกระทบต่อเนื้อหาและการปฏิเสธความรับผิดชอบทางกฎหมายทั้งหมดที่ใช้กับวารสารที่เกี่ยวข้อง

อ้างอิง

  • แอนเดอร์สัน, Christoff K, Stappen I, Panitz D, Ghahremani D, Glover G, Gabrieli JD, Sobel N. , การแสดงออกของเส้นประสาทที่แยกจากกันของความเข้มและความจุในการรับกลิ่นของมนุษย์ ธรรมชาติประสาทวิทยา 2003;6: 196 202-
  • Berns GS, McClure SM, Pagnoni G, Montague PR ความคาดหมายปรับการตอบสนองสมองของมนุษย์เพื่อให้รางวัล วารสารประสาทวิทยา 2001;21: 2793 2798- [PubMed]
  • Boynton GM, Engel SA, Glover GH, Heeger DJ การวิเคราะห์ระบบเชิงเส้นของการถ่ายภาพด้วยคลื่นสนามแม่เหล็กในมนุษย์ V1 วารสารประสาทวิทยา 1996;16: 4207 4221- [PubMed]
  • Cox RW AFNI: ซอฟต์แวร์สำหรับการวิเคราะห์และการแสดงภาพของ neuroimages ด้วยคลื่นสนามแม่เหล็กทำงาน การคำนวณในงานวิจัยทางชีวการแพทย์ 1996;29: 162 173-
  • Cox SM, Andrade A, Johnsrude IS เรียนรู้ที่จะชอบ: บทบาทของเยื่อหุ้มสมองมนุษย์หรือวงโคจรด้านหน้าในการให้รางวัลตามเงื่อนไข วารสารประสาทวิทยา 2005;25: 2733 2740- [PubMed]
  • Craig AD, Chen K, Bandy D, Reiman EM การกระตุ้นด้วยความร้อนของคอร์เทกซ์เชิงเดี่ยว ธรรมชาติประสาทวิทยา 2000;3: 184 190-
  • Critchley HD, Rolls ET ความหิวและความอิ่มแปล้แก้ไขการตอบสนองของเซลล์ประสาทรับกลิ่นและภาพในเยื่อหุ้มสมองเจ้าคณะ orbitofrontal วารสารสรีรวิทยา 1996;75: 1673 1686- [PubMed]
  • De Araujo IET, Kringelbach ML, Rolls ET, McGlone F. เยื่อหุ้มสมองมนุษย์ตอบสนองต่อน้ำในปากและผลของความกระหาย วารสารสรีรวิทยา 2003;90: 1865 1876- [PubMed]
  • Delgado MR, Miller M, Inati S, Phelps EA การศึกษา fMRI ของการเรียนรู้ความน่าจะเป็นที่เกี่ยวข้องกับผลตอบแทน Neuroimage 2005;24: 862 873- [PubMed]
  • Dreher JC, Kohn P, Berman KF การเข้ารหัสของคุณสมบัติเชิงสถิติที่แตกต่างกันของข้อมูลรางวัลในมนุษย์ Cortex สมอง 2005 Epub ก่อนการพิมพ์
  • Elliott R, Newman JL, Longe OA, Deakin JFW รูปแบบการตอบสนองที่แตกต่างกันใน striatum และ orbitofrontal cortex เพื่อรับรางวัลทางการเงินในมนุษย์: การศึกษาการถ่ายภาพด้วยคลื่นสนามแม่เหล็ก วารสารประสาทวิทยา 2003;23: 303 307- [PubMed]
  • Fiorillo CD, Tobler PN, Schultz W. การเข้ารหัสแบบไม่ต่อเนื่องของรางวัลความน่าจะเป็นและความไม่แน่นอนโดยเซลล์ประสาทโดปามีน วิทยาศาสตร์ 2003;299: 1898 1902- [PubMed]
  • Galvan A, Hare TA, Davidson M, Spicer J, Glover G, Casey BJ บทบาทของวงจรหน้าท้องส่วนหน้าท้องในการเรียนรู้ที่ได้รับรางวัลในมนุษย์ วารสารประสาทวิทยา 2005;25: 8650 8656- [PubMed]
  • Galvan A, Hare TA, Parra C, Penn J, Voss H, Glover G, Casey BJ การพัฒนา accumbens ก่อนหน้านี้เมื่อเทียบกับ orbitofrontal cortex อาจรองรับพฤติกรรมเสี่ยงในวัยรุ่น วารสารประสาทวิทยา 2006;26: 6885 6892- [PubMed]
  • กอทฟริด JA, O'Doherty J, Dolan RJ การเข้ารหัสค่ารางวัลทำนายผลในเยื่อหุ้มสมองมนุษย์และเยื่อหุ้มสมอง orbitofrontal วิทยาศาสตร์ 2003;301: 1104 1107- [PubMed]
  • ฮาเบอร์ SN. ปมประสาทฐานเจ้าคณะ: เครือข่ายแบบขนานและบูรณาการ วารสารเคมีประสาท 2003;26: 317 330- [PubMed]
  • Hollerman J, Schultz W. Dopamine neurons รายงานข้อผิดพลาดในการทำนายผลรางวัลชั่วขณะระหว่างการเรียนรู้ ธรรมชาติประสาทวิทยา 1998;1: 304 309-
  • Hsu M, Bhatt M, Adolphs R, Tranel D, Camerer CF. ระบบประสาทตอบสนองต่อระดับความไม่แน่นอนในการตัดสินใจของมนุษย์ วิทยาศาสตร์ 2005;310: 1680 1683- [PubMed]
  • Knutson B, Adams CM, Fong GW, Hommer D. ความคาดหวังของการเพิ่มรางวัลทางการเงินที่คัดเลือกเข้ามาคัดเลือกนิวเคลียส accumbens วารสารประสาทวิทยา 2001;21: 1 5-
  • Knutson B, Taylor J, Kaufman M, Peterson R, Glover G. Distrbuted การแสดงออกทางประสาทของค่าคาดหวัง วารสารประสาทวิทยา 2005;25: 4806 4812- [PubMed]
  • Kringelbach ML, O'Doherty J, Rolls ET, Andrews C. การกระตุ้นของเปลือกนอกวงโคจรของมนุษย์กับสิ่งกระตุ้นอาหารเหลวมีความสัมพันธ์กับความพึงพอใจส่วนตัวของมัน Cortex สมอง 2003;13: 1064 1071- [PubMed]
  • Kringelbach ML, Rolls ET neuroanatomy การทำงานของเยื่อหุ้มสมอง orbitofrontal มนุษย์: หลักฐานจาก neuroimaging และวิทยา ความก้าวหน้าทางประสาทชีววิทยา 2004;72: 341 372- [PubMed]
  • Leon MI, Shadlen MN. ผลของขนาดของรางวัลที่คาดหวังต่อการตอบสนองของเซลล์ประสาทในเยื่อหุ้มสมองส่วนหน้าของ dorsolateral ของ macaque เซลล์ประสาท 1999;24: 415 425- [PubMed]
  • McClure SM, Berns GS, Montague PR ข้อผิดพลาดการคาดการณ์ชั่วคราวในงานการเรียนรู้แบบพาสซีฟทำให้มนุษย์ striatum เซลล์ประสาท 2003;38: 339 346- [PubMed]
  • McClure SM, Laibson DI, Loewenstein G, Cohen JD แยกระบบประสาทให้ความสำคัญกับผลตอบแทนทางการเงินทันทีและล่าช้า วิทยาศาสตร์ 2004;306: 503 507- [PubMed]
  • Mirenowicz J, Schultz W. ความสำคัญของความคาดเดาไม่ได้สำหรับการตอบสนองของรางวัลในเซลล์ประสาทโดปามีนเจ้าคณะ วารสารสรีรวิทยา 1994;72: 1024 1027- [PubMed]
  • Montague PR, Berns GS เศรษฐศาสตร์ประสาทและสารตั้งต้นทางชีวภาพ เซลล์ประสาท 2002;36: 265 284- [PubMed]
  • Montague PR, Hyman SE, Cohen JD บทบาทการคำนวณสำหรับโดปามีนในการควบคุมพฤติกรรม ธรรมชาติ 2004;431: 379 387-
  • โอโดเฮอร์ตี้ JP. การให้รางวัลและการเรียนรู้ที่เกี่ยวข้องกับรางวัลในสมองของมนุษย์: ข้อมูลเชิงลึกจากการสร้างภาพระบบประสาท ความคิดเห็นปัจจุบันทางชีววิทยา 2004;14: 769 776- [PubMed]
  • O'Doherty JP, Dayan P, Friston K, Critchley H, Dolan RJ แบบจำลองความแตกต่างชั่วคราวและการเรียนรู้ที่เกี่ยวข้องกับรางวัลในสมองของมนุษย์ เซลล์ประสาท 2003;38: 329 337- [PubMed]
  • O'Doherty JP, Deichmann R, Critchley HD, Dolan RJ การตอบสนองทางประสาทระหว่างการคาดหวังรางวัลรสชาติหลัก เซลล์ประสาท 2002;33: 815 826- [PubMed]
  • O'Doherty J, Kringelbach M, Rolls ET, Hornak J, Andrews C. รางวัลนามธรรมและการลงโทษแทนในเปลือกนอกวงโคจรของมนุษย์ ธรรมชาติประสาทวิทยา 2001;4: 95 102-
  • O'Doherty J, Rolls ET, Francis S, Bowtell R, McGlone F, Kobal G, Renner B, Ahne G. การกระตุ้นการรับกลิ่นที่เกี่ยวกับความอิ่มตัวของประสาทสัมผัสโดยเฉพาะของเปลือกนอกวงโคจรหน้าผากของมนุษย์ Neuroreport 2000;11: 893 897- [PubMed]
  • Olds J, Milner P. การเสริมแรงเชิงบวกที่เกิดจากการกระตุ้นด้วยไฟฟ้าของบริเวณผนังและพื้นที่อื่น ๆ ของสมองหนู วารสารสรีรวิทยาเปรียบเทียบและจิตวิทยา 1954;47: 419 427-
  • Ramnani N, Elliott R, Athwal B, Passingham R. ข้อผิดพลาดการทำนายสำหรับเงินรางวัลฟรีในเยื่อหุ้มสมองส่วนหน้าของมนุษย์ NeuroImage 2004;23: 777 786- [PubMed]
  • Rescorla R, Wagner A. ใน: Classical Conditioning 2: การวิจัยและทฤษฎีปัจจุบัน ดำ A, Prokasy W, บรรณาธิการ Appleton Century-Crofts; นิวยอร์ก: 1972 pp. 64 – 69
  • Robbins TW, Everitt BJ กลไกการให้รางวัลและแรงบันดาลใจของ Neurobehavior ความคิดเห็นปัจจุบันทางชีววิทยา 1996;6: 228 235-
  • Rolls E, Kringelbach M, DeAraujo I. การแสดงออกที่แตกต่างกันของกลิ่นที่น่าพอใจและไม่เป็นที่พอใจในสมองของมนุษย์ วารสารประสาทวิทยาศาสตร์แห่งยุโรป 2003;18: 695 703- [PubMed]
  • Schultz W, Dayan P, Montague PR สารตั้งต้นของการทำนายและการให้รางวัล วิทยาศาสตร์ 1997;275: 1593 1599- [PubMed]
  • Schultz W, Tremblay L, Hollerman JR การประมวลผลรางวัลในไพรเมต orbitofrontal cortex และ basal ganglia Cereb Cortex 2000;10: 272 284- [PubMed]
  • Schultz W. ได้รับอย่างเป็นทางการกับโดปามีนและรางวัล เซลล์ประสาท 2002;36: 241 263- [PubMed]
  • Schultz W. การเข้ารหัสประสาทของเงื่อนไขการให้รางวัลขั้นพื้นฐานของทฤษฎีการเรียนรู้สัตว์ทฤษฎีเกมเศรษฐศาสตร์จุลภาคและนิเวศวิทยาพฤติกรรม ความคิดเห็นปัจจุบันทางชีววิทยา 2004;14: 139 147- [PubMed]
  • สกินเนอร์ BF แผนผังการเสริมกำลัง วารสารการทดลองเชิงพฤติกรรม 1958;1: 103 107-
  • Sutton RS, Barto AG การเรียนรู้การเสริมแรง: การแนะนำ กด MIT; เคมบริดจ์: 1998
  • Schultz W, Tremblay L, Hollerman J. ได้รับรางวัลโพรเซสซิงในคอร์เทกซ์ orbitofrontal cortex และ basal ganglia Cortex สมอง 2000;10: 272 284- [PubMed]
  • Talairach J, Tournoux P. ร่วม stereotaxic atlas ของสมองมนุษย์ Thieme; นิวยอร์ก: 1988
  • Tobler PN, Fiorillo CD, Schultz W. Adaptive การเข้ารหัสของค่าตอบแทนโดย dopamine neurons วิทยาศาสตร์ 2005;307: 1642 1645- [PubMed]
  • Tremblay L, Schultz W. การตั้งค่ารางวัลสัมพัทธ์ในเยื่อหุ้มสมองเจ้าคณะ orbitofrontal ธรรมชาติ 1999;398: 704 708- [PubMed]
  • von Frisch K. ภาษาเต้นรำและปฐมนิเทศของผึ้ง สำนักพิมพ์มหาวิทยาลัยฮาร์วาร์ด; เคมบริดจ์แมสซาชูเซตส์: 1967