最近条件付き確率という言葉を知ったのですが、その概念が面白かったので紹介します。
とはいえ、いきなり概念的な話をしても理解し辛いので、具体例を交えて紹介します。
あるウイルスに感染しているかどうかを99.9%の確率で判定できる検査キットがあります。
この検査キットを使うと自分がウイルスに感染しているのであれば99.9%陽性で0.1%の確率で陰性が示され、自分がウイルスに感染していないのであれば99.9%陰性で0.1%で陽性が示されるということです。
検査の結果あなたは陽性でした。
あなたは自分がウイルスに感染していると思いますか?
自分が感染していると思うと考える人が多いでしょう。
では、次の前提も知っていたらどうでしょうか?
このウイルスに感染する可能性は統計的に100万人に1人しか居ない。
先ほどと同じように検査キットを使い、検査の結果あなたは陽性でした。
あなたは自分がウイルスに感染していると思いますか?
これで、自分が感染しているだろうと考える人はだいぶ減ると思います。
99.9%正しい検査結果を得られるはずなのになぜか?
100万人に対して検査をすることを考えていましょう。
100万人の中にはだいたい1人のウイルス感染者と99万9999人の感染していない人が居ますが、
99万9999人の人々がそれぞれウイルス検査を行うと、0.1%の確率で陽性、つまり役1000人の陽性者がでてしまうのです。