直感は意外とあてにならない?

結城さんの日記に面白い問題がありました。

ある病気にかかっているかどうかを見分ける検査があるとしましょう。その検査の確かさは95%とします。つまり、
* その病気に実際にかかっている人100人に検査すると、正しく陽性になる人は95人いて(誤って陰性になる人は5人)
* その病気に実際にかかっていない人100人に検査すると、正しく陰性になる人は95人いる(誤って陽性になる人は5人)
という意味です。

さて、あなたが住んでいる都市には100万人の人がいます。そのうち1%の人(つまり1万人)が実際にその病気にかかっているとしましょう。

あなたがこの検査を受けたとき、陽性の結果になりました。
あなたがその病気にほんとうにかかっている確率は何%でしょうか?

http://www.hyuki.com/d/200905.html#i20090524210000

いわゆる条件付き確率の問題。モンティ・ホール問題なんかが有名でしょうか。
実際の確率は、直感的な感覚とはけっこうずれますね。


解答
検査結果が陽性となったときに、病気にかかっていた条件付き確率 P は、以下のようにして求めることができる。

P = 病気にかかっており、かつ検査結果が陽性となる確率 / 検査結果が陽性となる確率

まず、検査結果が陽性となる確率を求める。検査結果が陽性となる可能性は以下のいずれか。

1. 本当に病気にかかっていて、ただしく検出された。
2. 本当は病気にかかっていなくて、誤って検出された。

それぞれについて確率を計算する。

1. の場合、1% の確率で罹患し 95% の確率で正しく検出される。この確率は 0.01 * 0.95 = 0.0095 ( 0.95% )
2. の場合、99% の確率で罹患せず 5% の確率で誤検出される。この確率は 0.99 * 0.05 = 0.0495 ( 4.95% )

上記 1, 2 は排反 (同時に起こることはない) なので、検査結果が陽性となる確率は 1, 2 の和となる。

0.01 * 0.95 + 0.99 * 0.05 = 0.059  ( 5.9% )

以上より、検査結果が陽性となったときに、病気にかかっていた確率 P は

P = 罹患して、かつ検査結果が陽性となる確率 / 検査結果が陽性となる確率
  = 0.0095 / 0.059
  = 19 / 118
  = 0.1610 ...

結論:病気にかかっている確率は約 16.1 % (正確には 19/118) である。(終)


というわけで、直感とはかなりずれるんじゃないでしょうか。
確率 5% で誤検出されるというのが結構大きいですね。


ちなみに、この検査の精度が 99% だったとすると、

  ・罹患して、かつ検査結果が陽性となる確率 = 0.01 * 0.99 = 0.0099
  ・検査結果が陽性となる確率 = 0.01 * 0.99 + 0.99 * 0.01 = 0.0198

ですから、

  P = 0.0099 / 0.0198
    = 0.5 ( 50% )

精度が 99.9% だったとすると、

  P = 0.01 * 0.999 / (0.01 * 0.999 + 0.99 * 0.001)
    = 0.00999 / (0.00999 + 0.00099)
    = 0.9098... ( 91% )

となります。