過剰適合 「シグナル&ノイズ」

 いつ頃だったか,「シグナル&ノイズ」という本を読みました。データの中の予測に使えるシグナルと予測を狂わすノイズがテーマの本です。

シグナル&ノイズ 天才データアナリストの「予測学」
ネイト シルバー (著), 川添 節子 (翻訳), 西内 啓 (監修)
https://www.amazon.co.jp/%E3%82%B7%E3%82%B0%E3%83%8A%E3%83%AB-%E3%83%8E%E3%82%A4%E3%82%BA-%E5%A4%A9%E6%89%8D%E3%83%87%E3%83%BC%E3%82%BF%E3%82%A2%E3%83%8A%E3%83%AA%E3%82%B9%E3%83%88%E3%81%AE%E3%80%8C%E4%BA%88%E6%B8%AC%E5%AD%A6%E3%80%8D-%E3%83%8D%E3%82%A4%E3%83%88-%E3%82%B7%E3%83%AB%E3%83%90%E3%83%BC-ebook/dp/B00HWP6MXA?ie=UTF8&*Version*=1&*entries*=0

 熊本地震の後,地震予知に付いても1章割り当てられていたのを思い出し,本棚から引っ張り出して,その部分を読み直してみました。すると今回の地震に関係しそうなことが書いて有ったことに気づきました。 

 熊本地震の特徴は,震度7の大きな地震が2回起こったことです。当初は本震と思われていた4月14日のM6.5の地震は前震に修正され,16日のM7.3の地震が本震とされました。気象庁は前代未聞の出来事であり,今後の予測は困難と発表しました。

 前代未聞と言っても,日本の気象庁の観測史上という意味だと思います。実は,世界に目を転じれば,もっとややこしい地震も発生しているんですね。「シグナル&ノイズ」に次の様な記述があります。

たとえば,1811年12月16日,ミズーリ州テネシー州の境にあるニューマドリッド断層でM8.2の地震が起きたが,その6時間後に同じ規模の地震が再び発生している。しかもそれで終わりではなかった。翌年1月23日にはM8.1の揺れがあり,2月7日にはM8.3の地震が続いた。こうなるともう,どれが前震でどれが余震なのかわからない。

 気象庁地震予知できるほどの観測記録は持っていませんが,余震のパターンは把握しており,今までも余震の予測に基づいて注意情報は発していました。余震にパターンがあるのは確かなことのようですが,本震が分かっているという前提が必要です。ところが,事前には前震なのか本震なのかは予測できないのです。とはいえ,震度7というような大きな地震が連続して観測されたことは日本ではなく,本震と考えるのも無理は無いという落とし穴があったわけです。

 めったに起こらないということは,データも少ないことを意味します。後知恵で考えれば,少ないデータから震度7なら本震であるというパターンを読み取ることはできない筈です。にもかかわらず,私もこのパターンを信じていました。もっとも,このパターンはパターンと言うほどのものではなく,前震は小さなものという単なる思いこみと言った方が良いかも知れません。現実に世界ではこのパターンから外れる地震が起こっており,思いこみをただす情報はありました。しかし,その情報を無視する要因もありました。それは次に述べるようなことです。

 少ないデータが示す傾向は単なるランダム性の現れ,つまりノイズに過ぎない可能性が高いと言えます。にもかかわらず,その傾向に意味のあるパターンを見いだすことを「過剰適合」というそうです。例えば,A町では今年4月の雨の日は月の前半に多かったことから,A町は月の前半に雨が降りやすいというパターンを読み取ることが「過剰適合」です。期間や地理的範囲を広げていけば,このパターンは消え去ります。

 「シグナル&ノイズ」には,2011年の東北地方太平洋沖地震についても「過剰適合」を示唆しています。地震マグニチュードと発生頻度の関係は「グーテンベルグ・リヒターの法則」から算出出来ます。M9.0の地震が発生する可能性は300年に1回となります。しかし,東北地方太平洋沖地震以前の東北地方の観測データはM7.5より大きな範囲でグーテンベルグ・リヒターの法則から外れていました。このような場合に,東北地方では法則から外れる何か理由があると考え,観測記録をそのまま東北地方の特徴とすることもあります。このことを地震学者は「特性適合」と言うそうです。「特性適合」によれば,東北地方でM9.0の発生する頻度は1万3000年に1回となってしまいます。残念ながら,東北地方太平洋沖地震の発生で,この「特性適合」は消滅しました。

 「過剰適合」は超能力者の予知能力も説明します。たまたま予知の成功が続くことがありますが,いずれその超能力は消え去ってしまいます。長期間にわたって予知を成功させ続ける超能力者はいません。ただ,新手の超能力者が次から次に供給されますから,超能力者が絶えることは有りません。なんとなく,地震予知の状況に似ています。

 そもそもM9.0以上の地震記録は世界でも数例しかありません。被害をもたらす大きな地震は稀でデータは大して有りません。感じるか感じないか程度の小さな地震のデータは膨大にありますが,予知しても仕方ないわけで,被害をもたらす地震こそ予知したいわけです。そこで,その少ないデータからなんらかのパターンを読み取ってきたのが,過去の様々な地震予知です。当然ながら「過剰適合」の可能性は高くなります。実際にも,たまたま適中したことはあっても,継続的に成功した例は無く,尽く失敗しています。

 だからといって,地震予知が不可能と決まったわけでは有りません。ただし,地域限定であれば,予知法を開発したとしても,正しいか検証するには少なくとも数百年は必要ということになります。地震予知の研究者は自分で成果を出すのではなく,子孫の為のデータを蓄積しているという天文学者のような気持ちが必要だと思います。でも,今のご時世では厳しそう。