もう1人も女の子の確率・・・もう1人って誰?

近所に引っ越してきた一家には子供が2人います。
奥さんに「女の子はいますか?」と訊いたら、「おります」という返事でした。
もう1人が女の子である確率はいくらですか?

 この問題の答えをを初めて見た時はなかなか納得できませんでした。それは私だけではないらしく、世に多くの解説があり、それを読んで分かったつもりが、また疑問がぶり返したりの繰り返しでした。今は納得していますが、この先どう転ぶか分かりません。そこで、現時点で自分自身が納得できる素人ながらの解説を書いておきます。そして、なぜ納得しにくいのか、問題文に潜む仕掛けを探ってみます。

 この問題の答えは1/3ですが、類似の問題では「2人のうち一人は女の子であると分かっている」とだけあって、どのようにして分かったのか具体的に説明していないものがあります。その場合は、1/2とも1/3とも決められません。しかし、この問題では、奥さんに「女の子はいますか?」と訊いたら、「おります」という返事があって分かったと極めて具体的に状況が説明してあり、これが決定的に重要なのだと私は考えます。

 2人のうち一人は女の子であると分かる別の状況には、奥さんが一人の子供を連れていて、その子が女の子だったという場合があります。この状況では、もう1人も女の子である確率は1/2になります。以下、この二つの状況の違いを明確にしたいと思います。

 その前に基礎の基礎として、確率の問題では、「同様に確からしい」事象の単位を明確にするのが重要です。また、数学者でもない素人が事後確率を考える場合は、ベイズの定理等を使ったりしていきなり確率を考えるのではなく、その単位の頻度を数え上げて、最後に確率にするのが分かり易いです。
確率は誤解しやすい
 このことを念頭に置き、問題について考えて見ます。

 男女の出生確率は同じですので、2人兄弟の4つのパターン、(兄・弟)、(兄、妹)、(姉、弟)、(姉、妹)の頻度は同じです。当然、それぞれの兄弟パターンを子供に持つ母親の頻度も同じです。400組の兄弟がいるとすれば、それぞれ100組ずつ、その母親は100人ずついます。

 一方、「(兄・弟)の兄」というような子どものパターンは全部で8つあり、この頻度も同じです。それぞれの子供は100人ずつ、全員で800人います。

 奥さんに訊ねて「女の子がいます」と答えがあった場合は、(兄・弟)の母親である可能性はなくなり、残りの300人の母親の誰かである可能性に絞られます。そのうち、女の子二人の(姉・妹)の母親は100人ですから、確率は100/300=1/3になります。

 一方、奥さんが連れていた子供が女の子であった場合は、その子供のパターンで可能性が残るのは、(兄・妹)の妹、(姉・弟)の姉、(姉・妹)の姉、(姉・妹)の妹の4パターン,400人です。そのうち、もう1人も女の子であるのは2パターン、200人ですので、確率は、200/400=1/2です。

 奥さんに訊ねて分かった場合は、その奥さんが(姉・妹)の母親である確率を求める問題になりますが、奥さんが連れていた子どもを見て分かった場合は、連れていない子供が女の子(姉か妹)である確率を求める問題になり、「同様に確からしい」事象の単位が違うのです。

 さて、この問題はさまざまに引用され、その過程で変化して、上述の二つの問題のいずれかであるかがあいまいになってしまったものがあります。あいまいというのは、「一人は女の子である」と結果だけ書いてあって、それがどのようにして分かったのか説明がないのです。事後確率ではそれが決定的に重要なのに、あいまいになっているわけです。この指摘は様々な解説で行われています。例えば、次のリンク先の記事もその例ですが、指摘が不十分だと、私は思います。

二人の子どもがいて、片方が男である場合に、もう一人も男である確率

二人の子供のいる家庭がある。そのうち一人"は"女であることがわかっているとき、二人とも女である確率を求めよ。

 これでは、あいまいで、1/2とも1/3とも言えると指摘してあり、私もその通りだと思います。しかし、次の場合は明確だと書いてありますが、私はそれもあいまいだと考えます。

二人の子供のいる家庭がある。そのうち一人が女であることがわかっているとき、二人とも女である確率を求めよ。

二人子供のいる家庭がある。そのうち最低一人は女であるとき、二人とも女である確率を求めよ。

 前者なら1/2であり、後者なら1/3と述べてあり、その理由は問題文の「が」と「は」の違いという微妙なものです。確かに、「そのうち一人"が"女であることがわかっている」と言えば、「そのうち一人"は"女であることがわかっている」に比べて「二人のうちどちらか一人だけを確認したら女であった」というニュアンスを感じないこともありませんが、ニュアンスに過ぎません。また、「そのうち最低一人は女であるとき」と「そのうち一人"は"女であることがわかっているとき」の意味の違いもそれほど感じません。

 それに対して、最初の問題文の「奥さんに訊ねて分かった」という状況は、再現実験も可能なほど明確です。街頭に出て、無作為に子どものいそうな女性に調査すれば結果が出ます。先ず「あなたには二人お子さんがいますか?」と尋ね、「ハイ」と答えがあれば、さらに「女の子はいますか?」と尋ね、「ハイ」ならば、最後の質問「二人とも女の子ですか?」をします。これを多数行い、データを集めて、二人の子供がいて女の子がいると答えた人数のうち二人とも女の子と答えた人数の割合を求めればそれが答えです。たぶん、1/3になるでしょう。

 最後に、納得しにくい問題文に潜む仕掛けについてですが、この記事を考えていて気付いたことです。上記の街頭調査の最後の質問は「二人とも女の子ですか?」であって、「もう1人も女の子ですか?」ではありません。後者の質問は奇妙です。「もう1人」って誰のことか分かりませんからね。特に、二人とも女の子だった場合は、問われた人は面食らうでしょう。

 しかし、最初の問題では、「もう1人が女の子である確率はいくらですか?」と尋ねています。ただし、解答者に尋ねているのであって奥さんに「もう1人も女の子ですか?」とは訊ねているのではないので、それほど奇妙な感じはしませんが、もう1人が誰かは定かでないことに変わりはありません。定かではないのに、「もう1人も女の子か」と問いかけられると、もう1人が確定しているようにミスリードされそうです。つまり、兄弟(母親)のパターンではなくて、特定されたもう1人の子供の性別を問われているような気になるんじゃないでしょうか。ぎん@なぞまっぷ さんが納得できないのは、そのあたりに原因があるのかもしれません。