率の率 - 5年相対生存率

【7/23 追記】
 7/16の追記で間違いを見つけたと書きましたが,間違っていませんでした。
 訂正記事のタイトルを
  補足「率の率 - 5年相対生存率」
 に修正し,内容修正しました。
【7/16 追記】
 間違いを見つけたので,訂正記事を書きました。そちらもご覧ください。
訂正「率の率 - 5年相対生存率」

http://d.hatena.ne.jp/shinzor/20160716/1468622031


 前の前の記事で引用したNATROMさんのツィートにあった5年相対生存率のグラフ(再掲引用)を見ていて違和感を感じました。Totalの値がMaleとFemaleのどちらの値よりも大きくなっています。まるで,二つの数の平均値がどちらの数よりも大きいような不思議な感じがします。単純な生存率なら,男女合わせた生存率は,男の生存率と女生存率の中間の値に必ずなります。b,dが正で,a/b

韓国における甲状腺がんの5年相対生存率の年次推移。がん検診がまったく無効であっても、将来死亡の原因にならないがんを診断(過剰診断)して治療するようになれば、生存率は改善する。 pic.twitter.com/2mEDZpTI8o

— なとろむ (@NATROM) 2016年6月23日
 しかし,5年相対生存率は生存率と生存率の率という少々複雑な指標です。そういえば,このような直感に反する結果をもたらす指標についての似たようなクイズを見たことがありますが,細部は忘れてしまいました。そこで,どのような場合に合計が男女それぞれよりも大きくなるのか確かめてみます。記号の意味は以下の通りです。

 全体の人数(T)に占める男の比率をp1
 全体の生存数(L)に占める男の比率をp2
 全体の患者数(t)に占める男の比率をp3
 全体の患者の生存数(l)に占める男の比率をp4

 とすると,男の5年相対生存率と女の5年相対生存率よりも全体の5年相対生存率が大きいという条件から,

 (p1・p4)<(p2・p3)
 (1-p1)・(1-p4)<(1-p2)・(1-p3)

 が導かれ,T,L,t,lには無関係になります。
 ここで,p1+p4=1,p2+p3=1 とすると,上記の二つの不等式は同じになります。これ以外の解もありますが,この条件での解は,例えば次のようになります。

 p1=0.6,p2=0.45,p3=0.55,p4=0.60.4

 この解で,

T=1000,L=600,t=200,l=100

 とすると,男と女の5年相対生存率は共に80.8%で,全体の5年相対生存率は83.3%となります。

 さて,このようなことになるのは,5年相対生存率が率の率という4つの要因からなる複雑な値だからですが,私には,その意味するところが良くわかりません。「がんと診断された人のうち5年後に生存している人の割合が、日本人全体で5年後に生存している人の割合に比べてどのくらい低いか」というのは理解できます。ただし,それが,「治療でどのくらいの生命を救えるかという指標」と言うためには,いくつか条件を付けなければならないような気がします。例えば,NATROMさんの指摘のように過剰診断でこの指標は「改善」しますし,患者の生存率に何ら変化がなくても,日本人全体の生存率が悪化すれば,「改善」します。

 男と女をA病院とB病院と置き換えれば,病院が合併するだけで「治療でどのくらいの生命を救えるかという指標」は「改善」することもあるわけです。