（L）脳の長期報酬システムはドーパミン（2013）に頼る

脳の長期報酬システムはドーパミンに頼る

2013 年 8 月 5 日

redOrbit.comのBrett Smith - あなたの宇宙オンライン

国を越えて運転することから大学を卒業することまで、即時の報酬が目に見えないときに長期的な目標は焦点を合わせることがしばしば難しいです。

Nature誌のレポートによると、シアトルのワシントン大学とMITの研究者チームは最近、これらの長期目標が達成されるまで脳がどのように集中し続けることができるかに関する新しい詳細を発見しました。

この共同チームの研究は、神経伝達物質ドーパミンを脳の報酬システムに結び付けた以前の研究に基づいています。以前の研究のほとんどは即時報酬に関してドーパミンを見ることを含んでいましたが、実験室のラットが遅れた満足感の後に期待される報酬に近づくにつれて新しい研究はドーパミンのレベルの増加を発見しました。

ラットの脳内のドーパミンレベルを測定するために、チームは、その電気化学的特徴を探すことによってドーパミン濃度を連続的に記録する小型の植え込まれた電極を含む高速走査サイクリックボルタンメトリー（FSCV）と呼ばれる

現在、ノースウェスタン大学の博士後期神経生物学者であるMark Howeの共著者は、次のように述べています。「各プローブは、微量の脳組織内の細胞外ドーパミン濃度を測定し、おそらく数千の神経終末の活動を反映しています。」

科学者たちは、報酬を求めて迷路を通して彼らの道を見つけるようにラットを訓練することから始めました。各ラットが迷路を走っている間、チョコレートミルクの報酬を求めて交差点で右または左に曲がるように指示する音が鳴ります。

研究チームは、試験期間中、ラットの脳からドーパミンのパルスが定期的に放出されるのを目にすると予想していると述べた。しかしながら、彼らは実験の間ずっと神経伝達物質のレベルが着実に上昇することを発見しました - げっ歯類がその報酬に近づくにつれてピークレベルに達する。各試行中のラットの行動は変化したが、それらのドーパミンレベルは走る速度または報酬の可能性にもかかわらず確実に上昇した。

「その代わりに、ドーパミンシグナルはラットがその目標からどれだけ離れているかを反映しているようです」とMITの脳研究所を運営するAnn Graybielは述べました。「近づくほど、信号は強くなります。」

チームはまた、ドーパミンシグナルの大きさが予想される報酬の大きさと関連していることを発見しました。ラットがより多くのチョコレートミルクを摂取することを期待するように条件付けられたとき、それらのドーパミンレベルはより急速により高いピークまで上昇した。

研究者たちは、迷路をもっと複雑な形に広げることで実験を変え、ラットをもっと遠くまで走らせて賞品にたどり着くための追加のターンを作りました。これらのより長い試験の間に、ドーパミンシグナルはよりゆっくりと増加しました、しかし結局前の迷路と同じレベルに達しました。

「あたかも動物がさらに進むべきであることを知って、あたかも動物がその期待を調整しているかのようです」とGraybielは言った。

彼女は、将来の研究が人間のこれと同じ現象を調べるべきであると提案しました。

「似たようなことが私たち自身の頭の中で起こっていなければ、私はショックを受けます」とGraybiel氏は言います。

研究は、脳がどのように賞に注目しているかを明らかにします

08年05月2013日月曜日– 10:15 am

マクガバン脳研究所

"私達はまだそこにいますか？"

幼い子供たちと一緒に旅行したことがある人なら誰でも知っているように、遠くの目標に焦点を合わせることは難しいことです。マサチューセッツ工科大学（MIT）の新しい研究は、脳がこの課題をどのように達成しているかを示唆しており、神経伝達物質ドーパミンが長期的な報酬の価値を示唆している可能性を示唆しています。この知見はまた、なぜドーパミンシグナル伝達が損なわれているパーキンソン病の患者が、仕事を終わらせる動機を持続するのが困難である理由を説明するかもしれません。

この作品はNatureに記載されています。

以前の研究はドーパミンを報酬に結びつけており、そして動物が予想外の報酬を受けたときにドーパミンニューロンが活動の短いバーストを示すことを示しました。これらのドーパミンシグナルは、強化学習、つまり動物が報酬につながる行動を実行することを学ぶプロセスにとって重要であると考えられています。

ロングビューを撮る

ほとんどの研究で、その報酬は数秒以内に届きました。しかし現実の生活の中では、満足感は必ずしも即時ではありません。動物はしばしば食料を求めて移動しなければならず、より直接的な合図に反応しながら遠くの目標への動機を維持しなければなりません。同じことが人間にも当てはまります。長い遠征のドライバーは、交通に反応し、軽食を止め、後部座席で子供たちを楽しませながら、最終目的地にたどり着くことに集中し続ける必要があります。

MITのMcGovern Institute for Brain Researchの研究者でもあるAnn Graybiel研究所教授が率いるMITチームは、迷路課題の間にドーパミンがどのように変化して遅延満足のための仕事に近づくかを研究することを決めました。研究者たちは、報酬を得るために迷路を進むようにラットを訓練しました。各試行中、ネズミはチョコレートミルクの報酬を見つけるために交差点で左右どちらかに曲がるように指示する音を聞きます。

ドーパミン含有ニューロンの活動を単純に測定するのではなく、線条体、どれだけのドーパミンが強化学習に重要であることが知られている中に放出されたかを測定したいと思いました。彼らは大学のポールフィリップスと提携しました。彼は、高速の走査型サイクリックボルタンメトリー（FSCV）と呼ばれる技術を開発しました。そこでは、小さな、植え込まれた、炭素繊維電極が、その電気化学的指紋に基づいてドーパミン濃度の連続測定を可能にします。

「動物が迷路の中を自由に移動しながら、脳内の最大4つの異なる部位で同時にドーパミンを測定できるようにFSCV法を採用しました」と、Graybielの元大学院生、Mark Howeは説明します。ノースウェスタン大学の神経生物学科「各プローブは、微量の脳組織内の細胞外ドーパミン濃度を測定し、おそらく数千の神経終末の活動を反映しています。」

ドーパミンの漸増

Graybiel氏は次のように述べています。以前の研究から、研究者たちは、試験のさまざまな時点でドーパミンのパルスが放出されるのを見ることを期待していました。まるで報酬を見込んでいるかのように、動物はその目標に近づいた。

ラットの行動は試験ごとに異なっていました - いくつかの走行は他のものより速く、そして時々動物は短時間止まるでしょう - しかしドーパミン信号は走行速度や試験期間によって変化しませんでした。それは報酬を得る可能性、以前の研究で示唆されていたことに依存していませんでした。

「代わりに、ドーパミンシグナルはラットがその目標からどれだけ離れているかを反映しているようです」とGraybielは説明します。研究者たちはまた、信号の大きさが予想される報酬の大きさに関連していることを発見した。ラットがチョコレートミルクのより大きな一団を予想するように訓練されたとき、ドーパミン信号は上昇した最終濃度が高いほど急勾配になります。

いくつかの試験では、T字型迷路はより複雑な形に拡張され、報酬を得る前に動物はさらに走りそして余分なターンをする必要がありました。これらの試験の間、ドーパミンシグナルはより緩やかに上昇し、やがてより短い迷路と同じレベルに達しました。「あたかも動物がさらに進むべきであることを知って、あたかも動物がその期待を調整しているかのようです」とGraybielは言います。

「内部ガイダンスシステム」

「これは、ドーパミンレベルを使用して動物が目標に向かって選択し、目標までの距離を推定できるようにするために使用できることを意味します」とSalk InstituteのTerrence Sejnowski氏は言います。研究に関わっていなかった。「この「内部ガイダンスシステム」は、遠い目標となる可能性があるものに至るまでの選択をしなければならない人間にも役立つ可能性があります。」

Graybielが将来の研究で調べることを望んでいる1つの質問は、信号がどのように脳内で発生するかということです。ラットおよび他の動物は、その動物が特定の場所にいるときに活動的になるいわゆる「場所細胞」を用いて、それらの空間的環境の認知地図を形成する。「われわれのラットは、迷路を繰り返し走っているので、迷路の各点を、彼らが前回の走りで経験した報酬からの距離と関連付けることを学ぶのではないかと疑っている」と彼女は言う。

この研究のヒトへの関連性に関して、Graybielは、「私たち自身の脳で同様のことが起こらなければショックを受けるだろう」と述べています。ドーパミンシグナル伝達が損なわれているパーキンソン病患者はしばしば無関心なようです。そして長い仕事を完了する動機づけを維持することが困難である。「たぶん、それは彼らがこのゆっくりとした傾斜ドーパミンシグナルを作り出すことができないからです」、とGraybielは言います。

出典：マサチューセッツ工科大学