連載

ひとがハマるとき、脳はどうなっているのか。「嗜好する脳」の正体:脳科学者・坂上雅道

森旭彦

嗜好品を、最先端の科学はいかに分析し、創造することができるのか。

この連載では、認知科学、脳科学、心理学など一線で活躍するサイエンスの研究者が読み解く「嗜好を科学する」をお届けする。

今回は玉川大学脳科学研究所長、坂上雅道教授をたずねた。

嗜好体験は、私たちの人生を豊かにする。その体験における心の動きは薬効や薬理だけでは説明できないものだ。

それでは、私たちの心や思考を宿す城である脳では一体何が起きているのか。一見、健康や経済には不要のようにも思える嗜好品を、一体何のために私たちは嗜むのだろう? 

長年に渡り、脳科学の基礎研究に取り組み、脳を「臓器」と話す坂上教授とともに、ひとの「選択」や「価値」といった、私たちの深い知の営みを紐解く。

曰く、「働いた後のビールはうまい」理由もまた、脳の働きによるものだった。

嗜好品:栄養分として直接必要ではないが、ひとの味覚。触覚、嗅覚、視覚などに快感を与える食料。飲料の総称。

茶、コーヒー、たばこ、酒、漬物、清涼飲料、氷などがこれで、有機酸、カフェイン、タンニン酸、コカイン、アルコール、苦味物質、揮発油成分を含むものが多い。広い意味では菓子類も含む。

(ブリタニカ国際大百科事典)

(取材・文:森旭彦 編集:笹川ねこ 写真:西田香織)

脳科学から紐解く、人間の「嗜好体験」

ーー脳科学から見たときに、嗜好品を愉しんでいるとき、脳はどのような状態だと言えるのでしょうか?

それでは嗜好品に関連した研究から話をはじめましょう。

私たちの研究チームは2019年に「働いた後のビールはうまい」理由を脳内メカニズムから解き明かすことに成功しました(※1)。

この研究では、2頭のニホンザルに、「努力が強いられる課題(ハイコスト)」と「努力が必要ない課題(ローコスト)」を与えて訓練し、報酬としてジュースを与えるという実験を行い、その反応時間を調べました。

ちなみにジュースの量はどちらの課題でも同じです。また、実験中のサルの「中脳ドーパミンニューロン」からの電気信号を測定し、解析しました。

これらの結果を併せて解析したところ、努力が強いられる課題によって得た報酬の方が、努力が必要ない課題によって得た報酬よりも、主観的な「価値」が大きくなるということを示しました。

サルは私たち人間と、遺伝子レベルでは非常に近い存在です。この実験の結果は、私たちが努力を強いられる労働の後のビールを美味しく感じることができる理由の一端を、脳科学の視点で説明したものです。

このように私の仕事は、サルの頭に電極をつなぐことから始まり、実験を通して、私たち人間の脳の働きを解明することなのです。

ーー報酬、ドーパミンというキーワードが出てきました。脳科学的に、これらは嗜好品を嗜む体験の最中にも深く関わるものなのでしょうか?

私たちの嗜好体験には先の実験同様、ドーパミン報酬、そして報酬予測誤差情報が深く関わっていると考えられます。

しかし、それらを理解するためには少し前提の説明が必要ですね。順番にその話をしていきましょう。まず、私たちの脳がどのような臓器なのかを説明しましょう。

脳は、「感覚情報を運動情報に変換する臓器」ということになります。感覚情報とは、私たちが目や耳などで感じた環境からの刺激や、自身の身体の状態を電気信号に変換し、脳に取り込んでつくられた情報のことです。

次に、私たちは動物です。つまり、動いて生きる物です。私たちにとって動くこと、つまり行動することは生存において不可欠です。

脳は、環境情報からどこに動けばより良く生きていけるか、という意思決定をしている臓器だと言えます。この意思決定において、私たちの脳には非常に人間らしい特徴が備わっています。

動物の行動は、外部からの刺激と、それに対する反応と言い換えられます。下等な動物では、環境からの刺激と、反応の決定が1:1の対応をとるのです。

たとえばカエルは、何か動くものがいれば舌を伸ばして食べます。これを「無条件反射」と言います。下等な動物ほど、行う反応のほとんどが無条件反射で成り立っています。

しかし人間のような高等な動物は、環境の刺激と、反応の決定が1:1に定まらないわけです。ここで必要になるものが、反応の「選択」です。

「ハマる」とは何か。脳における「選択」のメカニズム

ーー人間がどのように「選択」をしているか、に対して、脳科学は説明をすることができるのでしょうか? 

私たちがどのように反応を選択するかというと、より良く生きていくため、という観点ということになります。

そして脳科学的に、より良く生き続けるためには、特定の刺激に対し、どのように反応するべきかを結び付ける作業が必要になります。これを「学習」と言います。

学習は、「記憶」と深く関係しています。私たちの脳は、学習や記憶の機能を、刺激と反応の間に置くことによって、過去の経験に基づきながら、状況によって反応の仕方を選択する。

これが人間を高等な生物たらしめる要因のひとつであり、人間の脳の複雑さの一端です。

ーー「選択」と「学習」というと、非常に複雑に思えます。たとえば、今日のお昼ごはんに何かを食べるにしても、料理のジャンルから、いっしょに食べる人まで、選択は多岐に渡ります。私たちの脳はどのようにしてたくさんの選択肢の中から「選ぶ」ことを可能にしているのでしょうか?

繰り返しになりますが、私たちの脳の選択は、より良く生きていくために行われています。

具体的には、私たちは「お腹が減った、さて何食べよう?」というとき、いろいろな選択肢があります。イチゴを食べてもいいし、バナナを食べてもいいわけです。

そこで、選ぶことが必要になります。

下等な動物ほど、選ぶということはしません。先に目に入ったほうを食べるわけです。

しかし人間の場合は、イチゴとバナナを両方見て、「どっちにしよう?」と考えます。その際、判断の拠り所として私たちが使うものが「価値」というものです。

ーー「価値」とは何なのでしょう? 現代における価値は非常に多様で移り変わるものです。たとえばSNSの影響力などは、20年前には存在しなかった価値ですよね?

脳科学者にとって、価値の考え方は非常にシンプルです。

実験をする都合上、自分が手に入れたときに「どのくらい嬉しいだろうか」、つまり「報酬の予測」のことを価値と定義しています。

脳科学において報酬というとき、それは食料や水の摂取など、人間の生存に関わる根本的な欲求を満たす活動から、幅広く「良いこと」をもたらす物質、状況や活動に関わるものまでを指します。

私たちの脳は、結果的にさまざまな環境の中で、多様な判断をしなければなりません。

その判断は、特定の行動(反応)をすることで、どんな良いことが起こるか、どんな悪いことが起こるかを予測することに依っています。

そして、「高い報酬を得られる選択を予測する機能こそが、どうやら脳の基本的な仕組みである」ということが動物実験から人間に至るまでの、最先端の脳科学研究から明らかになりつつあります。

つまり質問に答えると、脳科学における価値とは、私たちの脳がつくりだしているものなのです。イチゴの価値、バナナの価値など、それぞれの価値は、人によって異なります。

ーー人によって価値は異なるのですね。ちなみに、食べ物と、ペンなどの物の価値の違いは、脳内でどうやってわけられているのでしょうか?

物の場合は少し複雑ですね。たとえばペンの価値は、「書く」という行動が予測できるため、価値が予測できます。また、食べ物は食べたら終わりですが、ペンは持っていれば明日も明後日も使えます。

よって、物の価値となるとその将来性も報酬の予測に反映されるだろうと考えられます。

「価値」とは何か。ドーパミンの働きと学習の関係

ーーそもそも、価値は脳内のどのような働きでつくられているのでしょうか?

ここでようやく出てきますが、ドーパミンが関係していると考えられています。

ドーパミンは、中脳という脳の奥深いところにある神経細胞「ドーパミンニューロン」から分泌されています。

「分泌される」というのは、ドーパミンニューロンが電気的に活動して、軸索というものが脳内を行き交い、その先からドーパミンが出てくる作用を言います。

ドーパミンは脳内全体に分泌されますが、主に「大脳基底核」の「線条体」というところに強く分泌され、線条体に分泌されるときに価値が生まれます。

ーードーパミンが分泌されると、どんな作用があるのでしょうか?

まず、ドーパミンが脳内で何をしているかを説明しましょう。

かつて、ドーパミンは「良いこと」、つまり報酬が与えられたときに分泌されるようになっているという仮説が一般的でした。その仕組みを理解するために、脳科学者たちはさまざまな実験をしてきました。

ドーパミンは電気刺激によって、意図的に分泌させることができます。

たとえば、ネズミの脳に電極を埋め込み、「レバーを押す」というタスクを行うとドーパミンを分泌させるような実験をするとします。ネズミはどうすると思いますか?

ーー「レバーを押す」ことを「良いこと」だと捉えるようになるのでしょうか?

結果を言うと、ネズミは死ぬほどレバーを押すようになります。

同様の実験を、人間にやった例もあります。やはりドーパミンが分泌されると気持ち良いらしいのです。それも、性的な気持ちよさなのだといいます。覚醒剤の摂取によってドーパミンの分泌が促されますが、乱用が増えるのはこうしたことと相関があるのでしょう。身近な例だと、アルコールの摂取によってもドーパミンが分泌されるといいます。

では、本当にドーパミンは「良いこと」があったら分泌されるのか。

これを実験で確かめ、ドーパミンが学習における非常に重要な働き、つまり価値をつくるメカニズムである「報酬予測」に関係していることを明らかにしたのが、ケンブリッジ大学のシュルツ博士でした(※2)。

シュルツ博士の研究が秀逸だった点は、ドーパミンが報酬を予測するために働いていることを実験で明らかにしたことです。

ーー報酬予測が価値をつくる。どのような実験だったのでしょうか?

彼は実験で、サルにベルが鳴ったらエサ(報酬)が与えられる状態をつくりました。

こうした状態で訓練をすると、サルはベルが鳴ったらエサが来ること、つまり報酬が来ることを予測できるようになります。そうして、報酬を予測しているときに、ドーパミンニューロンがどのような活動しているかを記録していったのです。

すると、なんと実際に報酬が来たとき、つまり「良いこと」があったときには、ドーパミンニューロンは応答しなくなっていることが明らかになったのです。

この実験から、「良いこと」があったときにドーパミンが分泌されるという仮説は正しくないことが分かりました。

では、どうしたらドーパミンニューロンが活動するのかというと、ベルが鳴ったとき、つまり脳は報酬を予測するときに活動する、ということが分かったのです。

こうして、ドーパミンニューロンは報酬予測に応答して活動しているようだという仮説が生まれました。

ーー脳は、「良いこと」が起きたときではなく、その前の段階、つまり報酬を予測しているときに「価値」を感じていると。

たとえば私たちが、目の前の未知の飲み物を飲むときに、まずは目で見たり、匂いを嗅いだりして、その飲み物がどのくらい美味しいかをこれまでの経験から予測します。

これが価値です。このときにドーパミンニューロンが活動をします。

そして実際に飲むと、予測と同じくらい美味しい、予測より美味しい、予測より不味いという、予測情報との誤差が結果としてもたらされます。この「報酬予測誤差」にしたがって、ドーパミンが分泌される量が決まり、それに応じて快感が生まれる、ということです。

シュルツ博士の報告は、その後の脳科学に大きな影響を与えました。

一人ひとりの「学習」が生みだす嗜好体験

ーーそうした脳内のドーパミンニューロンの活動は、何の役に立つのでしょうか?

私たちが生存する上でもっとも重要な、学習に役立つのです。

シュルツ博士の功績は、私たちが「報酬予測」によって「価値」というものを脳でつくっているからこそ、「学習」ができるというメカニズムをドーパミンの働きから提示したことです。

私たちが日々、より良く生きるためには、未知の出来事に対して判断し、行動し、その経験から将来のより良い状態を維持するために価値のある判断を学習し、それを反復する必要があります。

こうした、価値のある判断を強化していく学習を、「強化学習」と呼びます。

シュルツ博士の仮説が生まれる以前では、単純に「報酬が来たら学習が起きる」とされていましたが、「どれだけ学習すればいいか」、つまり学習する価値を提示する、まるで教師のように教えてくれる仕組みがよく分かっていませんでした。これを強化学習における「ティーチングシグナル」と言います。

報酬予測の誤差に応じてドーパミンが分泌されるとすると、脳はどれだけ学習すれば良いかを、ドーパミンの分泌量をティーチングシグナルとして加減しているという説明がつくようになります。

これにより、私たち人間は、特定の価値のある判断を選択的に強化する行動が可能になるとも説明がつきます。

ーーより良く生きるために、私たちの脳は「強化学習」をし続けている。

ただ、予測よりも良い結果が得られたときにドーパミンの分泌量が増える一方、悪かった場合の働きはまだよく分かっていません。つまり予測より悪かったときに、ドーパミンの分泌量は減りますが、減る余地が少ないため、予測より悪いときの学習についてはドーパミンが関与しているかどうかよくわかりません。これにはさらなる研究が必要です。

最初の方で、嗜好体験にはドーパミン、報酬、そして報酬予測誤差情報が深く関わっているとお話しました。

特定の嗜好体験にハマっている状態、というのは、少なくとも人間がその嗜好体験を「価値がある」と予測し、価値のある結果を回収し続け、その結果として将来的にも反復すべきという学習をし続けていた結果だと言えるでしょう。

※後編は、12/2(金)に掲載予定です。

※1 坂上雅道教授、田中慎吾特別研究員(新潟大学助教)、ジョン P. オドハティー客員教授(カリフォルニア工科大学教授)らによる『The cost of obtaining rewards enhances the reward prediction error signal of midbrain dopamine neurons』(報酬を得るためのコストは、中脳ドーパミンニューロンの報酬予測誤差情報を高める) https://www.nature.com/articles/s41467-019-11334-2

※2 Schultz,W. (1998) Predictive Reward Signal of Dopamine Neurons. Available at: https://journals.physiology.org/doi/full/10.1152/jn.1998.80.1.1 (Accessed: 5 November 2022).

Follow us!  → Instagram / Twitter

Author
サイエンスライター

テクノロジー・サイエンスと人間性に関係する社会評論がテーマ。WIRED日本版、美術手帖などに執筆。ロンドン芸術大学大学院、メディア・コミュニケーション修士課程修了。

Editor
編集者

『DIG THE TEA』メディアディレクター。編集者、ことばで未来をつくるひと。元ハフポスト日本版副編集長。本づくりから、海外ニュースメディアの記者まで。企業やプロジェクトのコミュニケーション支援も。岐阜生まれ、猫好き。

Photographer