黒いうどん ― しつこく眠り姫問題

 子供の頃に読んだ小話です。

 

「このうどん黒いよ」

「そばだからだよ」

「離れても黒いよ」

 

 ダジャレですが、眠り姫問題の決着の付かない論争に似ています。「そば」を麺類の蕎麦と解釈する人と、位置の「傍」と解釈する人で話が食い違うのは当然で、さらに一人の頭の中で二つの解釈が区別できないと奇妙なパラドクスになります。

 

 「目覚めたときに表である確率」の解釈もいろいろです。一つの解釈は、「目覚める可能性のある日数(3日)に対する表が出た後に目覚める可能性のある日数(1日)の割合」です。目覚めた場合の条件付き確率になります。もう一つの解釈は、文字通りに、コインを投げた時に表が出る確率です。条件がない事前確率になります。このどちらの解釈かはっきりすれば、論争になるような難しい確率の問題ではありません。

 

 ただ、解釈の自覚があるつもりでも、途中でぶれてしまうのが眠り姫問題の落とし穴です。例えば、目覚めた時に眠り姫には新しい情報が与えられていないので、事前確率と変わらないと考える人もいます。かつての私がそうでした。この考えでは、寝覚めているのが総ての事象で、眠っている状態は最初から除外されています。だから、目覚めは新しい情報ではないわけです。そこで、月曜日の場合に表である条件付き確率を考えると、直観と違う2/3となって混乱します。

 

 この考え方の最大の特徴は、起こりうる可能性として、コインの表が出た場合と裏が出た場合の2つしか考えていない点です。月曜と火曜は、コインのどちらかが出た後に、一人の眠り姫が続けて経験する一つの出来事(根源事象)という解釈なのです。この解釈は自然と言えば自然ですが、月曜と火曜を分離して考えていないので、月曜である場合の表の確率などを考えることができません。根源事象はコインの表裏の二つだけで、曜日や目覚・睡眠の情報に意味ないのですからどう考えても無理です。目覚めたときに質問したことが新しい情報ではないというのは、そういうことです。にもかかわらず、月曜日で有る場合の表の確率を計算するために、途中で方針転換して、月曜と火曜を分離するという首尾一貫しないことをするので、奇妙なことになります。

 

 また、日曜日の夜に振られたコイン表の確率が、その後の眠り姫の目覚めや睡眠によって変わるのが不自然という人もいます。これは、事前確率と条件付き確率の混同による錯覚です。目覚めが、それ以前に振ったコインの表の事前確率を変えないのは当然ですが、条件付確率は、変わります。

 

 目覚め前には、その後起きる出来事に4つの可能性があります。「表が出て月曜に目覚める」、「表が出て火曜に寝ている」、「裏が出て月曜に目覚める」、「裏が出て火曜に目覚める」です。目覚めによって、今日が「表が出て火曜に寝ている」である可能性が無くなります。その結果、今日が表の出た後の日である確率は2/4から1/3に変化します。

 

 AとBのじゃんけん2回戦問題でも、1回戦でAが勝つ確率は、情報が何もなければ、1/2ですが、結果を知っている出題者からAの2連勝は無かったという情報が与えられれば、可能性は4つから3になり、1回戦でAが勝った確率は1/3と見積もりが変わります。仮に、Aが1回戦で負けたという情報が与えられたなら、Aが1回戦で勝った確率はゼロになりますが、不自然どころか至極当然です。

 

 このように、「目覚めたときに表である確率」という言葉から思い浮かべるイメージが違えば、議論は平行線になり、1人の頭のなかで区別できなくなるとパラドクスと感じるのだと思います。これまで度々述べてきたように、主観確率人間原理などの哲学的説明は無用です。ただ、言葉の解釈という点では、哲学の主要なテーマかもしれません。

 

 哲学の専門家からは怒られそうですが、「哲学とは、言葉使いの間違いを見つける学問である」という説明が腑に落ち、気に入っています。土屋賢二氏の「ツチヤ教授の哲学講義」では、ウィトゲンシュタインの「言語ゲーム」を喫茶店でのコーヒーの注文に例えてします。お客が「コーヒー」と注文して、お客が心の中にイメージした「コーヒー」と同じものをウェイトレスが持ってきてくれれば「言語ゲーム」は成立します。ところが紅茶が出てきたり、ウェイトレスがコーヒーを飲んだりという間違いが哲学では起こります。原因は、お客とウェイトレスがイメージする「コーヒー」が違うためです。それを解明するのが哲学だそうです。

 

 眠り姫問題でも、心の中で思い浮かべる「コーヒー」のイメージが人によって違っているか、同じ人の中に違うイメージが入り混じっているのだと思います。

2回戦じゃんけん問題(眠り姫問題同型)

 以前の記事にも書いた2回戦じゃんけん問題のアンケート結果です。単純極まりない問題でも意見が分かれるのか気になって、アンケートしてみました。わずか5名の回答では、何も言えませんが、かろうじて両方の意見がありました。これほど単純でも意見がわかれますね。1名だけ1/2と答えていて、その人は次のように考えたのではないかと思います。

「1回戦でAが勝った確率」なら1/2に決まっている、2回戦の勝負が過去の1回戦の確率に影響するはずがない。

 この自然な考えは否定できません。設問には「Aが2連勝しなかった場合にAが1回戦で勝った条件付き確率」ではなく「1回戦でAが勝った確率」としか書いてないからです。Aが2連勝しなかったという情報を使えとは言っていませんからね。解釈は一つとは限りません。

 しかし、現実的な場面では、情報を利用するかしないかで、結果に大きな違いをもたらします。例えば、お金が掛かっているような場合です。1回戦でどちらが勝ったか当てれば賞金をもらえるとしたら、Bに賭けるべきです。勝負の結果の可能性は、AA、AB、BA、BBの4通りありすべて同じ確率です。このうちAAは無く、可能性は3通りに減り、1回戦でAが勝った確率はABの1通りなのでその確率は1/3です。

 一方の1/2の解釈は、次のような意味になります。1回戦の勝負の結果の可能性は、AとBの2通りで同じ確率である。そのうちAが勝ったのはAの1通りなのでその確率は1/2である。この解釈自体は間違いではありません。もし、2回戦を行う前に賭けるならどちらに賭けても同じです。しかし、2回戦が行われ、そしてAの2連勝は無かったという情報が与えられているのなら、その情報を使わないのは、愚策です。

 1/3の解釈が間違いのように錯覚しやすいのは、2回戦の結果が1回戦の結果に影響するように見えるからでしょう。当然、そのような事はあり得ませんが、2回戦までの結果が出た後で、その結果を知っている出題者が、起こらなかった結果の一つを教えてくれたわけです。モンティ・ホール問題で司会者がハズレのドアの一つを教えてくれたのと同じです。その情報で確率が変わるなら利用しない手はありません。極端な場合、正解を教えてくれたのなら、選択肢は一つです。現実問題での確率の理解は、お金どころか命に係わることもありますからね。

 

 

 

 

「眠り姫問題」で記憶が無くなるのは、曜日情報不明というだけ

■ 条件付確率の条件は、因果関係の原因でも、順序関係の先でもない

 前の記事は、数式が多すぎました。数式を追わなくても、八分表をみればわかる簡単なことですが、今回は、できるだけ言葉で、何故「眠り姫問題」は錯覚しやすいのか説明してみます。

 条件付き確率では、「Aが起きる場合に、Bが起きる確率」も「Bが起きる場合に、Aが起きる確率」も考えます。このことからも、AとBには因果関係も順序関係もないことは明白です。例えば、感染症検査で「陰性の場合に感染している確率」は、感染の事前確率より小さくなるのが普通ですが、陰性になった結果、感染しにくくなったのでないのは言うまでもありません。感染していなければ陰性になりやすいので、陰性者の中の感染者は少ないということ以上の何も意味しません。これに異論を唱える人は稀だと思います。

■ 眠り姫問題は、条件付き確率と考えにくい

 眠り姫問題も「目覚めた場合に、コインが表の確率」という条件付確率を問われていると考えれば、簡単に答えられます。表であれば、実験者が裏の場合の半分しか起こしてくれないので、目覚めた場合に、表で有ることが少なくなります。そのため、表の確率が1/3になるのは何の不思議もないのですが、そのように考えにくいのです。「目覚め」を条件付確率の条件と考えにくいのです。何も条件は付いておらず、表の事前確率と同じ、と考えてしまうのです。何故なのでしょうか。

■ 眠り姫問題は、多数回試行で数える対象を錯覚する

 感染症検査問題と眠り姫問題には、設定に微妙な違いがあります。検査問題では、多数回試行で考えやすくなっていて、一人の確率を考える代わりに、大勢の検査で考えることができます。例えば、感染の事前確率1/2だと、1000人が感染し、1000人が感染していない集団と考えることができます。この集団を検査すると、非感染者は1000人全員が陰性になり、感染者は500人が陽性、500人が陰性となるとします。この例では、陰性の場合の感染の確率は500/(1000+500)=1/3と困難なく考えることができます。

 一方、眠り姫問題では、「表が出た500人の眠り姫と裏が出た500人の眠り姫がいる」というところまでは考えやすいです。しかし、その後、「表が出た500人は1回だけ起こし、裏が出た500人は2回起こす。起こされた場合に表である確率は」と問われた時、500回/(500回+500回+500回)と考えにくくなっています。回数ではなく、500人/(500人+500人)と人数で数えたくなります。記憶を失い別人格になったようでも、1人の眠り姫が2回起こされただけですからね。

■ 記憶が無くなる設定は、なくてもよい

 しかし、記憶を無くさなくてもよいのです。記憶を失わないならば、起こされたときに眠り姫には曜日が分かるので、月曜日なら1/2、火曜日なら0と答えられます。そして、月曜日に答えるのは1000人で火曜日に答えるのは500人ですから、平均は、(1000×1/2+500×0)/(1000+500)=1/3です。記憶をなくす代わりに、表の確率の平均値を問う問題にすればよいです。

 ただ、「確率の平均値」は、問題文に簡潔に表現しにくいのですね。眠り姫問題では、記憶をなくすという非現実的設定によって、曜日の情報を消し去って、月曜と火曜の平均を問う問題になっています。

■ 「眠り」は、条件だとすぐにわかる

 眠り姫問題にはさらに考えにくくする仕掛けがあります。「寝ている場合に、コインが表である確率は」という問を考えさせないようになっています。考えてしまったら、「コインが表の確率は1」と簡単に分かってしまいますからね。眠っている眠姫には、尋ねられないという点をうまく利用しています。

 記憶が無くなる設定は、曜日情報がないとして考えよというだけのことです。主観確率やら人間原理やらは不要です。

「眠り姫問題」について、長々と書いてきたことを簡潔にまとめる、つもりが

 「眠り姫問題」について、昨年から、いろいろ書いてきました。今年は、主に、何故パラドクスのように感じるかについて見解を述べてきました。区切りとして、簡潔に述べます。

 

 パラドクスだと思う原因は、表である事前確率と月曜日の場合の表の事後確率と目覚めの場合の表の事後確率が同じであるはずという思い込みです。以上、終わり。

 

 ちょっと簡潔過ぎたので、前言を翻して、例によってくどくど説明します。

 

■ 普通に解く

 パラドクスと錯覚する原因について述べる前に、普通の解釈を示します。先ず、用語の説明から。

  • 根源事象眠り姫問題」の問題設定には3つの状態があります。コインの表裏、月曜か火曜か、目覚めか睡眠かの3つです。この組み合わせで根源事象は8つになります。例えば、「表かつ月曜日かつ目覚めている確率(表月覚)」などです。
  • 事前確率他の二つの状態について限定しない場合の一つの状態の確率を事前確率と言います。例えば、「表である確率」などです。
  • 条件付き確率他の状態について条件を付けたものが条件付き確率です。例えば、「月曜日で有る場合に表である確率」などです。

 

  これ以降、次の記号を用います。

 :表

 :裏

 :月曜日

 :火曜日

 :目覚め

 :睡眠

 

 これらの確率は、問題の設定から求められます。根源事象のうち、(FTA)、(FMS)、(BMS)、(BTS)の確率は、問題の設定からすぐに0とわかります。F、B、M、Tの事前確率も1/2とするのが自然です。つまり、

表の事前確率:

 (FMA)+(FMS)+(FTA)+(FTS)=(FMA)+0+0+(FTS)=1/2

裏の事前確率:

 (BMA)+(BMS)+(BTA)+(BTS)=(BMA)+0+(BTA)+0=1/2

月の事前確率:

 (FMA)+(BMA)+(FMS)+(BMS)=(FMA)+(BMA)+0+0=1/2

火の事前確率:

 (FTA)+(BTA)+(FTS)+(BTA)=0+(BTA)+(FTS)+0=1/2

また全事象の確率は1なので、

 (FMA)+(FTA)+(BMA)+(BTA)+(FMS)+(FTS)+(BMS)+(BTS)

= (FMA)+0+(BMA)+(BTA)+0+(FTS)+0+0=1

 以上より、0以外の根源事象の確率は、計算でき、

 (FMA)=(FTS)=(BMA)=(BTA)=1/4

になります。

 また、目覚めの事前確率は、

 (FMA)+(FTA)+(BMA)+(BTA)=1/4+0+1/4+1/4=3/4、

睡眠の事前確率は、

 (FMS)+(FTS)+(BMS)+(BTS)=0+1/4+0+0=1/4です。

 

 これらをまとめたのがこれまでも度々示してきた八分表です。今回は下図のように立体的に表現しました。条件付き確率は、八分表からわかります。

 例えば、月曜という条件での表の条件付き確率は、1/4÷(1/4+0+0+1/4)=1/2です。

 目覚めという条件での表の条件付確率は、1/4÷(1/4+0+1/4+1/4)=1/3です。

 これ以外の解はありません。ただし、眠り姫は「目覚めという条件での表の条件付確率」ではなく、目覚めた時に「表の事前確率」を尋ねられたという解釈も可能です。そういうあいまいさが問題文にはあります。

 

■ パラドクスに陥る

 次に、パラドクスに陥る考え方を示します。

 上記、普通の解釈の結果1/3に違和感がある人が多数です。私も第一印象はそうでした。これは結局、事前確率と同じになるはずだという思い込みによるものですが、1/2にすることも可能です。次がその解釈です。

 寝ている時に眠り姫に意識はなく質問を受けないので、目覚めの状態だけ考えればよい。つまり、(FM)、(BM)、(BT)が根源事象である。FとBの事前確率は1/2なので、(FM)=1/2、(BM)=(BT)=1/4である。これらは総て目覚めの状態なので、目覚めている場合の表の確率も1/2である。だが、まてよ、月曜日に表である確率は1/2÷(1/2+1/4)=2/3になる。あれ?

   そこで考えなおします。

 月曜日に表である確率を1/2にするには、(FM)= (BM)=(BT)=1/3とすればよい。あれ、表である事前確率が、1/3÷(1/3+1/3)=2/3になっちゃった。

 この混乱の原因は、「表の事前確率」と「月曜日の場合に表である条件付き確率」と「目覚めの場合に表である条件付確率」が同じであるはずという思い込みです。これらが一致するのは、3つの状態の事前確率が互いに独立な場合のみで、普通はそれが成り立ちます。ところが眠り姫問題の設定では、眠り姫は、恣意的に目覚めさせられたり、眠らされたりしていて、独立ではありません。一致しないのは当然です。

 つまり、上に示した解釈はパラドクスではなく、問題の設定に合っていないだけです。問題の設定に合うようにするには、睡眠かつ表かつ月曜日を根源事象に加える必要があります。この場合でも、目覚めの場合に表である条件付確率と表の事前確率は同じにはなりません。このことに違和感があるため、あれこれ考えますが、どのように考えても、一致するはずはないのですね。

「双子の性別問題」も「眠り姫問題」と同型

 今頃になって気づきました。以前の記事に書いた「双子の性別問題」も、「眠り姫問題」と同型ですね。

shinzor.hatenablog.com

  • 問1「私には子供が2人います。一人は女の子です。もう一人も女の子である確率はどれほどか?」
  • 問2「私には子供が2人います。上の子は女の子です。下の子も女の子である確率はどれほどか?」

 

 問1と問2の八分表は次の通りです。求める確率は、(太枠)/(黄色塗)になります。

 「目覚め」は、「少なくとも一人は女の子」に、「睡眠」は、「二人とも男の子」に、「月曜」は、「妹がいる場合」に、「火曜」は、「弟がいる場合」に、「コイン表」は、「兄がいる場合」に、「コイン裏」は「姉がいる場合」にそれぞれ対応しています。

 このように、図表にすると、明確ですが、文章の問題だと、問1と問2の違いがわかりにくいです。紹介しているものの中には、どちらにも解釈できる曖昧なものもあります。ただ、問2の解釈をする人は、問1の解釈が頭の中にないのに対して、問1の解釈をする人は、両方の可能性に気づいたうえで、問2の解釈を否定します。

 次のジャンケン問題も人によって解釈が違うようです。

2連勝ジャンケン問題

AとBがジャンケン2回戦を行った。Aは2連勝していないことだけわかっている。Aが1回戦で勝った確率は?

 ジャンケン問題には、「Aが2連勝していない」という条件が付いていますが、「Aが1回戦で勝った確率」に影響しないと考えるのもアリかもしれません。ただし、それは条件付き確率の問題ではないと解釈しているわけです。眠り姫問題に1/2と答える人(最初の私のことですが)もそうです。

 そもそも条件付き確率というものが、多くの人が素朴にイメージしている確率と違うようです。少なくとも私が条件付き確率を最初に知った時は、奇妙に感じました。

 私の素朴な言語感覚では、「明日の雨の確率」は自然な語感ですが、「昨日が、雨だった確率」だと少し違和感があります。「Aなる条件でBの起こる確率」と聞くとAが原因でBが起こったという因果関係や、AのあとにBが起こったという順序関係があるかのように感じます。ジャンケン問題では、Aが2連勝したのは、1回戦のあとの出来事なので、1回戦の結果に影響しないと感じます。

 しかし、条件付き確率には、そのような因果関係も順序関係もなく、単に、条件Aを満たしているものの中のBの割合というだけで、八分表の(太枠)/(黄色塗)という意味しかないのですね。それだけのことで、難解な意味はないと思います。

ドゥ・メレの掛け金配分問題と眠り姫問題

 先ず、問題です。それほど難しくはありません。

AとBが3回勝負のジャンケンをしました。2回勝ったほうが掛け金300円を取り、そこでゲームは終了します。ところが、1回戦でAが勝ったところで、急用のため勝負を中断しました。そこで、300円を配分することになりました。次のAとBの主張のどちらが正しいでしょうか。

 

Aの主張:勝負を続けた場合の可能性は、次の4通りだ。

  • 2回戦と3回戦で俺Aが勝つ場合(AA)
  • 2回戦で俺Aが、3回戦でお前B勝つ場合(AB)
  • 2回戦でお前Bが、3回戦で俺Aが勝場合(BA)
  • 2回戦と3回戦でお前Aが勝つ場合(BB)

そのうち俺が賞金を得るのは、(BB)以外の3通りだから、3/4の225円を俺がもらう。

Bの主張:いや、2回戦でお前Aが勝った時点でゲームは終わりなので、(AA)と(AB)はダブルカウントだ。可能性は、次の3通りだ。

  • 2回戦でお前Aが勝つ場合(A)
  • 2回戦で俺Bが勝ち、3回戦でお前Aが勝つ場合(BA)
  • 2回戦と3回戦で俺Bが勝つ場合(BB)

お前が賞金を得るのは、そのうちの2通りだから、お前の取り分は、2/3の200円だ。

 正解はAです。なぜなら、Bの主張する3つの可能性の蓋然性は同じではないからです。つまり、(A)の確率は1/2ですが、(BA)と(BB)の確率は1/4です。従って、Aが賞金を得る確率は、(1/2+1/4)÷(1/2+1/4+1/4)=3/4 となり、Aの主張と同じになります。

 

 ここで、ルールを少し変えて別の問題にします。ジャンケンは3回戦まで必ず行うこととし、3連勝すると、快眠効果のあるヤクルト1000がもらえます。では、ヤクルト1000がもらえない場合に2回戦でAが勝っていた確率は如何ほどでしょうか。

 

 もうお分かりだと思いますが、これは「眠り姫問題」と同型の問題です。目覚めがヤクルト1000ゲット失敗に、睡眠がヤクルト1000ゲット成功に、月曜が3回戦でAが負け、火曜が3回戦でAが勝ちに、コイン表が2回戦A勝ちに、コイン裏が2回戦A負けに対応しています。次のそれぞれの八分表を比較すればわかります。

 眠り姫問題には、「裏で火曜日」を無視させるトリックがあります。裏が出たのは日曜日の1回であって、それを月曜日と火曜日の2回数えるのはダブルカウントのように思えてしまいます。これは、冒頭のジャンケン問題でのBの主張と類似の錯覚です。

 

 また、眠り姫問題では、表の確率は日曜日に投げた時の事前確率と変わらないような気がしますが、これは、3回戦まで行うジャンケン問題を、単に「2回戦でAが勝っていた確率は如何」と錯覚するのと類似しています。眠り姫問題には、「目覚め」という条件がありますし、ジャンケン問題には「ヤクルト1000ゲット失敗」という条件があります。実際には「ヤクルト1000ゲット失敗」条件は目立つので、錯覚することはないと思いますが、「目覚め」条件は無視されやすいので、錯覚するんですね。私も錯覚しました。

数学者がいとも簡単にヘマをやらかすのは何故?( 主観的憶測)

 確率の問題で錯覚しやすいのは、問題の具体的設定を確率の理論に落とし込むところですね。例えば、次の二つの問題の設定は錯覚しやすいです。

  • 問1「私には子供が2人います。一人は女の子です。もう一人も女の子である確率はどれほどか?」
  • 問2「私には子供が2人います。上の子は女の子です。下の子も女の子である確率はどれほどか?」

 確率の理論には、独立性とか従属性、加法定理やら乗法定理やらいろいろありますけど、まあ、常識的に分かり、それほど難しいものじゃありません。ある出来事の確率とは、可能性のある出来事総ての数に対するその出来事の数です。可能性のある出来事に条件を付けて絞ったものが条件付確率です。別にベイズの定理とか知らなくても大丈夫です。むしろ知らない方がいいくらいです。それだけのことなので、連続量でなければ四則演算ができればだれでもできます。私の知らない高度な理論もあるかもしれませんが、確率クイズ程度を解く分には要りません。高等数学を使うクイズなんてのは、面白くありませんからね。

 厄介なのは、出来事の数え方ですよ。この部分については確率の理論は教えてくれませんからね。数えた数字の処理について、数学は教えてくれますけど、処理に使う数字自体は矛盾がなければどんなものでもいいんですから。確率の問題の具体的設定を確率の理論が適用できる数字に翻訳する部分は、数学者の考える範疇の外なんじゃないでしょうか。数学者は出来るだけ多様な設定に対応できる理論の構築に腐心しますけど、どの理論を使うのか決めるのは、具体的設定の問題を解きたい人ですからね。数学者と具体的問題を解きたい人は違う場合が多いです。

 私は、建築技術者だったので、建物の構造計算を始める前に、現実の建物に計算が適用できるようにモデル化を行っていました。現実の建物の柱は例えば、80cm角の断面の立体ですが、1次元の針金みたいなものに大胆にモデル化します。そんないい加減なモデル化でいいのかと最初は心配になりましたが、経験を積むうちにまあ大丈夫と分かってきました。モデル化の妥当性の確認に感度解析などをすることもありますが、支障がなかったという経験に負う所が大きいです。もっとも、今までの経験にないことが時々起こるので、難しいのですが。それはともかく、モデル化してしまえば、数学者が考えた計算が使えます。この計算方法は極めて汎用性が高いので、建築分野以外の様々な分野で利用されています。計算では、現実に存在しない物性を持った材料を使うことも可能です。現時点では実現不可能な建築も想像上の世界では建築できます。

 このように、数学は強力です。しかし、モデル化については何も教えてくれません。建築技術者が経験と勘で考えるしかないのですよ。そんなあやふやな部分なのに、一番大事な部分だと何かといわれます。適切でないモデル化をすれば、後の計算は無意味になりますから怖いですよ。

 このモデル化に相当するのが、確率問題では、設定の出来事の数え方ではないでしょうか。この部分は、数学者だから得意というわけでもないと思うんですよ。賭け事の問題なら、経験の多いギャンブラーの得意分野です。モンティ・ホール問題は、数学者は間違えても、ギャンブラーはピンとくるみたいです。私は賭け事が嫌いなので単なる想像ですけど。「眠り姫問題」のような非現実的な設定を得意とする職業の分野はないのかもしれません。SF作家や哲学者が一見適任に見えますが、私はむしろ迷宮にはまり込みやすいと思います。何故かと言うと、非現実的な設定に見えて、同型の現実的な問題があるからです。