「二つの封筒のパラドックス」の派生問題

 「二つの封筒のパラドックス」の派生問題を考えました。

派生問題1 

「二つの封筒のパラドックス」で、封筒に入っている上限金額が分かっている。

選んだ封筒の金額が上限金額の半額を超えていれば、交換すべきか。

 馬鹿にするなと言われそうですが、言うまでもなく答えは「ノー」です。

派生問題2

「二つの封筒のパラドックス」で、封筒に入っている上限金額が分かっている。

選んだ封筒の金額が上限金額の半額以下ならば、交換すべきか。

 「イエス」のような気もしますが、前記事の具体例(下に再掲)で確認すると、上限金額の半額は6万円なので、選んだ金額が、1万円、2万円、3万円なら交換すべきで、4万円なら交換すべきではありません。6万円なら交換しても、しなくても同じです。一概には言えませんが、6万円以下の金額の平均値(期待値)33/9に対して封筒を交換した金額の平均値(期待値)は39/9なので、交換した方が得する可能性は大きいです。一般的に成り立つかはまだわかりません。(上段の表、参照)

 (例題)

(1万円、2万円)の封筒ペアが1組、(2万円、4万円)の封筒ペアが1組、(3万円、6万円)の封筒ペアが2組、(6万円、12万円)の封筒ペアが1組ある。この中から一組を選び、さらに、そのうちの片方を開封する。その組のもう一つの封筒の金額の期待値はいくらか?

派生問題3

「二つの封筒のパラドックス」で、封筒に入っている金額の期待値が分かっている。

選んだ封筒の金額が期待値以下ならば、交換すべきか。

 これも、「イエス」のようですが、具体例で確かめると、4万円以下の金額期待値15/6に対して、封筒を交換した金額の平均値(期待値)は21/6なので、を交換した方が得する可能性は大きいです。一般的に成り立つかはまだわかりません。(下段の表、参照)

 次に、一般的な証明をしようとしましたが、証明という程のものは必要なさそうです。なぜなら、選んだ封筒が上限なら、交換すれば必ず損するのですから、上限以外の場合は、封筒金額の平均より、交換した封筒の金額の平均が大きくなります。ただし、平均であって、損する場合もありますが。

平均の錯覚 「二つの封筒のパラドックス」

 前記事に注記を加えました。

 「選んだ封筒に2万円が入っていた場合に、それが(1万円、2万円)のペアから選ばれた確率」は事後確率(条件付確率)です。一方、封筒を選ぶ前は、封筒のペアの可能性は無数にあります。(a万円、2a万円)の封筒ペアである確率P(a)は、事前確率であり違います。にもかかわらず、同じ記号P(1),P(2)と表現していたので、念のため注記です。

 さて、「二つの封筒のパラドックス」では、「2万円」のような具体的数字が無く、「選んだ封筒の金額」という表現なので、可能性が絞られた条件付確率であると意識しにくいです。

 また、設問が一般的なので、個別具体例で考えることが出来ず、一般的な考察しかできません。このため、平均と個別例が同じであるかのようにも錯覚します。

 この錯覚を明確にするため、具体的な例題を作ってみました。 

  【例題】

 (1万円、2万円)の封筒ペアが1組、(2万円、4万円)の封筒ペアが1組、(3万円、6万円)の封筒ペアが2組、(6万円、12万円)の封筒ペアが1組ある。この中から一組を選び、さらに、そのうちの片方を開封する。その組のもう一つの封筒の金額の期待値はいくらか?

 結果を表に示しますが、考えやすいように、事前確率の代わりに封筒ペアの数にしています。上段の表は、封筒ペアで整理しています。5組、10通の封筒の合計金額が45万円なので、1通の封筒の平均は4.5万円です。

 下段の表は、選んだ封筒の金額で整理しています。交換した金額の期待値は、選んだ封筒の金額毎に違います。しかし、全体の平均は4.5万円で、当然ながら、上記の1通の封筒の平均と同じです。

 平均賞金額10万円と謳っていたのに、1万円しか当たらなかったとクレームをいう人は稀です。しかし、「二つの封筒のパラドックス」はこのクレームにどことなく似ています。

 

 錯覚を以下にまとめます。

① 「一つの封筒ペアから、低い金額を選んだ確率0.5」と「金額Xを、封筒ペア(X、2X)から選んだ確率」の混同

② 封筒ペアの事前確率は不明なのに、総て同じと考える錯覚

③ ②の錯覚の結果、交換した封筒の金額の期待値は選んだ封筒にかかわらず同じと考える錯覚

④ 選んだ封筒毎の交換金額の期待値と全体の交換金額の平均(これは、全体の金額の平均と同じ)を混同する錯覚

⑤ ④の結果、個別の交換金額と交換金額の平均が違って当たり前なのに、パラドックスに感じる錯覚

 

「二つの封筒のパラドクス」錯覚の原因

 前記事の【追記】をもう少し説明してみます。

 例えば選んだ封筒に2万円入っていたならば、金額ペアは(1万円、2万円)と(2万円、4万円)の二つの可能性に絞られます。(1万円、2万円)の確率をP(1)、(2万円、4万円)の確率をP(2)としたとき、P(1)=P(2)=0.5と考えたら、錯覚です。何故なら、二つの封筒に入れる金額は相手が決めますので、その確率は不明だからです。*1

 選んだ封筒に2万円が入っていたとき、交換した封筒に入っている金額の期待値は、1万円×A+4万円×Bです。

ここに、

 A「選んだ封筒に2万円が入っていた場合に、

  (1万円、2万円)のペアの高い額を選んだ条件付確率」

 B「選んだ封筒に2万円が入っていた場合に、

  (2万円、4万円)のペアの低い額を選んだ条件付確率」

 このA、Bと「封筒のペアが(a、2a)であるときに、aの封筒を選んだ条件付確率」や「封筒のペアが(a、2a)であるときに、2aの封筒を選んだ条件付確率」は違います。その違いは、下表を見れば分かるかと思います。

 式を示すと、*2

  A=0.5P(1)/{0.5P(1)+0.5P(2)}

  B=0.5P(2)/{0.5P(1)+0.5P(2)}

ですので、P(1)=P(2)=0.5の時にA=B=0.5になりますが、例えば、2万円が上限ならば、P(1)=1、P(2)=0なので、Aは1、Bは0です。問題文の設定では、2万円が上限なのか、下限なのか、上限でも下限でもないのかは分かりません。従って、交換した場合の期待値1万円×A+4万円×Bも分かりませんので、交換した方が得とも損とも言えません。

 一般の場合も同じことが言え、下表に示しています。

結局、「封筒のペアが(a、2a)である時に、a(2a)を選んだ条件付確率」「選んだ封筒がXである時に、Xが低い(高い)金額である条件付き確率」を混同したのがパラドックスの原因になっています。

 

 最後に、金額の上限がない例について計算してみます。

金額ペアの確率をP(1)=0.5、P(i+1)=0.5P(i)とすると、全事象の確率の和は、

 P(1)+P(2)+・・・=1

なので、確率の条件を満たしています。

 この場合、選んだ封筒の金額がX円(下限を除く)であった時に、Xが低い金額で有る確率は、

 0.5/(1+0.5)=1/3

よって、交換した封筒に入っている金額の期待値は、

 0.5X×(1-1/3)+2X×1/3=X

 

 

*1:【6/1追記】ここでいうP(1)、P(2)は、選んだ封筒の金額を確認した後の事後確率(条件付き確率)であり、後に出てくる事前確率のP(i)とは異なる。

*2:ここ以降のP(i)は、事前確率。

「二つの封筒の問題」の解説の誤り

■ 昔考えた「二つの封筒の問題」

 十年以上前に、次の「二つの封筒の問題」が話題になりました。

二つの封筒の問題

二つの封筒があり、1つにはもう一つの二倍の金額が入っている。

一つの封筒を選んだ後で、もう一つと交換できる。

選んだ封筒にX円入っていたのなら、もう片方は1/2X円か、2X円であり、その確率はどちらも1/2である。交換した場合の期待値は、1/2・1/2X+1/2・2X=1.25X円となり、

交換すれば得する。しかし、もう一方の封筒を選んでも同じことが言えるので、パラドクスである。どこに間違いがあるか?

 問題文の説明のどこが間違っているのか分かるまで、数日、悩みましたが、金額の上限を無視しているんですね。(上限の有無は本質的でないことを【追記】に記載しました。)

例えば、二つの封筒の金額の組み合わせが、(1万円、2万円)、(2万円、4万円)の2通りで、その確率は同じとします。選んだ封筒に2万円入っていれば、もう一方は1万円か4万円なので、期待値は2万5千円で確かに1.25倍です。しかし、1万円か4万円なら、もう一方の期待値は2万円で、倍か半分になります。

 つまり、問題文の記述では、Xが2万円だと決め付ける間違いを犯しています。Xの可能性は、1万円も4万円もありますが、それを無視しているわけです。無視せずに、総ての可能性を考慮した時の、最初の封筒の金額Xの期待値と、もう一方の封筒の金額の期待値を計算すれば同じになるのは明白のようですが、ちゃんと計算すると次の通りです。

各金額の確率は、

 1万円:1/2×1/2=1/4

 2万円:1/2×1/2+1/2×1/2=1/2

 4万円:1/2×1/2=1/4

従って、選んだ封筒に入っている金額の期待値は、

 1✕1/4+2×1/2+4×1/4=2万2500円

一方、封筒を交換すれば、

1万円→2万円、2万円→1万円、2万円→4万円、4万円→2万円の確率は総て1/4なので、交換後の金額の期待値は、

 (2+1+4+2)/4=2万2500円

なので、交換前と同じです。

 つまり、金額が最小値の場合は、交換すれば2倍に、最大値の場合は半分に、それ以外は1.25倍になりますが、どの場合なのかは分かりません。そこで、交換倍率の期待値のさらに期待値を計算すると1になります。仮に、上限がわかっていれば、上限の半分以下ならば交換した方が得です。

 

■ 一般化

 以上が昔、考えたことですが、今回、一般化してみました。次の様になります。

 

 金額の組み合わせは、(a万円、2a万円)、・・・(a・2n-1万円、a・2n万円)のn通りで、その確率を、P(1),・・・・P(n)とする。

 選んだ封筒の金額の期待値は、

0.5a{∑P(i)2i-1 +a∑P(i) 2i }=0.5{∑P(i)2i-1 +2a∑P(i) 2i-1 }

=1.5a∑P(i)2i-1 

 左辺のかっこ内の第1項は、封筒の低い金額の和で、第2項は、高い金額の和に相当する。ここで、封筒を交換するのは、第1項と第2項を交換するだけなので、交換しても金額の期待値は変わらない。(下図参照)

なお、上限でも下限でもない場合に交換した時の倍率はP(i)により、1.25倍とは限りません。

 

■ ネット上のさまざまな解説

 さて、今回、あらためて、この問題の解説をいくつか読んだのですが、金額の上限に触れていない解説が多いです。それでは、交換すると1.25倍になると期待できることを否定できませんが、誤った否定の仕方のものがありました。例えば、次のような解説です。

 封筒を交換した場合の金額の期待値を0.5(x/2)+0.5(2x)=1.25x とするのが間違いである。正しくは、次のように考えるべきである。

 封筒の中身をそれぞれx、2xとする。

  1)受け取った封筒がxならば、もう片方の封筒の中身は2x

  2)受け取った封筒が2xならば、もう片方の封筒の中身はx

 封筒を交換した場合、前者はx円の得をして、後者はx円の損をする。

  e=0.5(2x-x)+0.5(x-2x)=0

 損得なしなので、交換しても金額の期待値は変わらない。

 この解説の誤りは、Xに具体的数値を入れてみると分かります。Xを2万円とすると、式の第1項は、選んだ封筒の金額が2万円の場合で、第2項は4万円の場合の交換した時の得失です。封筒にX円入っていた場合と2X円入っていた場合が入り混じっています。正しくは、

 e=0.5(2X-X)+0.5(0.5X-X)=0.25X

です。Xが上限でも下限でもないのならば、交換すれば確かに1.25倍になりますが、上限か下限の可能性もあります。

 そのほか、情報の非対称性とか、従属事象と独立事象の混同とか、多分関係ない理由が述べてあったりします。

 

■ 問題文の微妙な違い

 問題文を次の様に少し変えてみます。

二つの封筒の問題(お得バージョン)

ここに1万円か4万円が入った封筒がある。どちらの金額なのか、その確率は同じ1/2である。この封筒を2万円で買うか?

 もちろん、買うべきですね。「二つの封筒の問題」は、この全く違う問題と混同させているわけです。私も数日間、混同して、夜寝れなくなりました。

 

【5/30 追記】上限は関係ない。

  よく考えてみると、今回の一般化で、金額の上限は無関係だと分かりました。上限がなくても、交換した時の期待値は変わりません。

 金額ペア(a、2a)から、aを選ぶ確率と2aを選ぶ確率は共に1/2なので、選ぶ金額の期待値はa×0.5+2a×0.5=1.5aです。これを交換しても、2a×0.5+a×0.5=1.5aで変わりません。

金額ペアが有限でも無限でも、これは同じです。

 

 a円が2a円になる確率と2a円がa円になる確率が1/2であり、封筒に入っていたX円が2X円や0.5X円になる確率が1/2ではないのですね。

X(変数)がa(定数)である確率は1/2で、その時にもう一つの封筒に入っているのは、2aです。

X(変数)が2a(定数)である確率も1/2で、その時にもう一つの封筒に入っているのは、aです。

 上記の二つの文のX(変数)の値は違うのですが、言葉で表すとどちらも「選んだ封筒に入っている金額」になり、混同しますね。

モンティホール問題も数えてみた

 前の前の記事『悩ましくない「眠り姫問題」』で確率問題を数え上げて考えてみました。今回は、「モンティホール問題」でもやって見ます。

 プレーヤーの前に閉じた3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。

ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。

ここでプレーヤーはドアを変更すべきだろうか?

 元の問題では、司会のモンティは、必ず外れドアを開けますが、正解を知らずに、偶然に外れドアを開けた場合も考えてみます。数え上げた結果を下表に示します。

 司会が必ず外れドアを開ける場合は、最初からそのようにすると司会が言っていれば、ありうるケースは、司会がドアを開ける前も開けた後も同じです。一方、偶然に外れドアを開けた場合は、ドアを開けたことで限定されます。いわゆる条件付確率ですが、ここでは確率という言葉を使わないようにしているので、事前比率、事後比率と記載しています。

 ただ、一つ、気になることが出てきました・・・。

当たり前すぎるのに使いにくいベイズの定理

 前の記事にベイズの定理を使った計算を追記しました。この計算経過に、「少なくとも一人が火曜日生まれの女の子であり(B)、かつ二人とも女の子である(A)確率P(A⋀B)を求めるところがあります。最初、これを  

 P(A)×P(B)=1/2×1/2

としてしまい、混乱しました。

 正しくは、

 P(A∧B)=P(A|B)×P(B)

です。

 どころで、これ、なんだか奇妙に感じませんか、条件付き確率を計算するベイズの定理の式の中に条件付確率の式が出てきます。式で表せば次の通りです。

 

 P(A|B)=P(A∧B)/P(B)    ・・・ベイズの定理

    =P(A|B)×P(B)/P(B)
         = P(A|B)

 

 「なんじゃこりゃ!」と言いたくなりますが、ベイズの定理は当たり前すぎることを述べているだけなんですね。式で表せば、

 X/Y=(X/Z)/(Y/Z)

という馬鹿みたいな関係です。言葉で言えば、XをYで割ったものは、「XをZで割ったもの」を「YをZで割ったもの」で割った値に等しい、ということです。ここで、「XをZで割ったもの」を「Zという条件でXの起こる確率」と言い換えれば、

「Yという条件でXの起こる確率は、Zという条件でXの起こる確率をZという条件でYの起こる確率で割ったもの」

というベイズの定理になります。このように言えば定理っぽいですが、内実は馬鹿みたいです。

 馬鹿みたいに当たり前なのに、実際に計算しようとすると分かりにくく間違い安いという困ったところがベイズの定理にはあります。条件付き確率なのに、全事象に対する事前確率と混同しやすいです。X/Y=(X/Z)/(Y/Z)という数式では、分母を意識しないわけにいきませんが、確率の文章になると、重要な条件である分母を軽視しがちになります。

 確率の積の法則は、

 P(A∧B)= P(A|B)×P(B)

ですが、AとBが独立していればP(A|B)=P(A)となり、

 P(A∧B)=P(A)×P(B)

としてもよくなります。確率の問題にはそういうものが多いので、独立ではない場合にも同じようにしてしまうのかもしれません。

 特に、ベイズの定理の式を使うと、このうっかりが起きやすいような気がします。前の記事で示した表の様に、重複なく、もれなく数えあげて、割り算した方が分かり安くて、間違いも少ないと思います。割り算すれば分母を意識しないわけにはいきませんからね。

悩ましくない「眠り姫問題」

 ツイッターで、次の条件付き確率の問題を見かけました。

Aさんの家には子供が二人いる。男女の修正比率はそれぞれ1/2であるとする。次の確率を求めよ。

  • Aさんの子どもの一人が女の子であると聞かされたとき、もう一人の子どもも女の子である確率。
  • Aさんの第一子が女の子であると聞かされたとき、もう一人の子どもも女の子である確率。
  • Aさんの子どもの一人が火曜日に生まれた女の子であると聞かされたとき、もう一人の子どもも女の子である確率 

 問題文が雑ですが、程度の差はあれ確率の問題は、あいまいなところがありますね。同じ問題でも、違う意味に解釈されることが良くあります。あいまいではなくても、うっかりしていると重要な点を見逃してしまうことがあり、モンティホール問題がその代表です。司会者が偶然に外れのドアを開けたのか、選んで開けたのかで答えが違ってきます。

 そもそも確率のイメージが人によって違うようで、その結果、人によって見解が分かれます。そこで、確率という言葉を一切、使わないほうがよいのではないかと思いました。具体的にどうするかというと、ありうる事象をしらみつぶしに全部、数え上げて、単に事象の数の比率を計算せよと問うのです。

 

例題1二人の女の子の問題(1)

少なくとも一人が女の子である二人きょうだいのありうる男女の組み合わせパターン数(B)に対する、二人とも女の子であるパターン数(A)の比率は?

 

(解答)

 少なくとも一人が女の子である二人きょうだいのパターン数(B)は、姉・妹、姉・弟、兄・妹の3パターン。

 二人とも女の子のパターン数(A)は、姉・妹の1パターン。

 答え:1/3

 

例題2二人の女の子の問題(2)

女の子が自分は、二人きょうだいと言った。その兄弟のありうるパターン数(B)に対する二人とも女の子のパターン数の比率は?

 

 (B) は、もう一人女、もう一人男の2パターン。

 (A)は、 もう一人女の1パターン。

 答え:1/2

                                               

例題3 火曜日生まれの女の子の問題

少なくとも一人が火曜日生まれの女の子である二人きょうだいのパターン数(B)に対する、そのうち二人とも火曜日生まれの女の子である二人きょうだいのパターン数(A)の比率は?

 

 少し複雑なので、パターンを網羅した表を作成し、そこから(A)と(B)のパターンを数えます。

 下表より、(B)は、27パターン、(A)は、13パターン。

 答え:13/27

 

 

 続いて、なにかと見解が分かれる「眠り姫問題」も同じように変えてみます。

 

コインを投げ、表が出たら眠り姫は月曜に起こされ、火曜日は寝たままである。裏がでたら、月曜日と火曜日に起こされる。眠り姫が起きているパターン数(B)に対する起きていてコインが表であるパターン数(A)の比率は?

 

 最後の表より、(B)は、3、(A)は、1。答え:1/3

   

 どうでしょうか。明確ではないでしょうか。この問題形式の良いところは、眠り姫が記憶を失うという条件が不要なことです。コインの表が出る確率が1/2である必要もありません。女の子が火曜日に生まれる確率も不要です。パターン数を数えるだけですからね。そして最も大きなメリットは、難解な哲学に迷い込む心配が皆無であることです。

 

 ただし、これで、眠り姫問題の答えが1/2と思う人が、1/3に納得するかというと、それは期待できません。なぜなら、寝覚めた時に、眠り姫が受けた質問を次のように解釈するのも可能だからです。

 

眠り姫問題 別解釈

コインを投げたとき、出方のパターン数 (B)に対するコインが表であるパターン数(A)の比率は?ただし、曜日や起きているか寝ているかの違いは考えない。

 

 さらに、このような設問は簡単すぎてつまらないという欠点もあります。少々あいまいな文章をどのように解釈するのかを考えるのが確率クイズの面白いところかもしれません。

【5/23追記】

例題3の問題文を修正しました。

また、例題3をベイズの定理を使って解くと、以下の通り。

・少なくとも一人が火曜日生まれの女の子である確率P(B)は、以下の二つの和、

   第1子が火曜日生まれの女の子の確率

    1/2×1/7=1/14

    第1子が火曜日生まれの女の子の以外で、第2子が火曜日生まれの女の子の確率

    (1-1/2×1/7)×1/2×1/7=13/196

    よって、

    P(B)=1/14+13/196=27/196

・少なくとも一人が火曜日生まれの女の子であり、かつ二人とも女の子である確率 

    P(A⋀B)は、以下の二つの和

  第1子が火曜日生まれの女の子で第2子が女の子である確率

    1/2×1/7×1/2=1/28

  第1子が火曜日生まれ以外の女の子で第2子が火曜日生まれの女の子である確率

    (1/2×6/7)×1/2×1/7=6/196

 よって、

  P(A⋀B)=1/28+6/196=13/196

・以上より、少なくとも一人が火曜日に生まれた女の子であるとき、

 もう一人の子どもも女の子である確率 P(A|B)は、

  P(A|B)= P(A⋀B)/P(B)=13/27

 整理して計算しないと間違いますね。