情報学部大学生のダラダラ日記

β日記

機械学習や日記っぽいものを書きます

統計学入門(基礎統計学Ⅰ)第4章演習問題(ベイズの定理など)

スポンサーリンク

第4章(確率)

4.1<ド・メレの問題>

(1) サイコロを4回投げる時、6の目が少なくとも1回出る方に掛けるか、出ない方に掛けるか

これは確率の定番の問題ですね。全て6以外の目が出る確率を求めます。1回投げた時、6以外の目が出る確率は5/6であるため

{\displaystyle (\frac{5}{6})^4=\frac{625}{1296}\leq\frac{1}{2} }

となるため、少なくとも1回出る方へかける方が良い。

(2)サイコロを2個同時に24回投げる時、(6,6)の目が少なくとも1回出る方にかけるか否か 

先ほどと同様に解く。 1回投げた時、(6,6)の目が出ない確率は1-1/36=35/36であるため

{\displaystyle (\frac{35}{36})^24≒0.508\geq\frac{1}{2} }

よって出ない方へかけたほうが良い。

4.2<ホイヘンスの14問題>

2個のサイコロを何回投げればそのうちの1回は和が12になる確率が0.9を超えるか 

先ほどの問題と似ています。和が12になる事象=(6,6)が出る事象である。つまり、(6,6)の目が出ない確率1/35をn回投げた時の確率が1-0.9=0.1以下となる最小のnを求めることを目標とする。

{\displaystyle (\frac{35}{36})^n\leq\frac{1}{10} }

これを解くとn=82となる。

4.3

30人を15人ずつ2グループに分ける分け方を求める。30人から15人を選べばもう一方のグループも一意に決まるので

{\displaystyle _{30}C_{15}}通り

4.4

r人いるとして、同じ集団に2人以上同じ誕生日の人がいる確率

今回も、1-(全員誕生日が異なる確率)を求めることを目標とします。

r人と言われるとわかりにくいので小さい具体的な人数で解いてみましょう。

r=2の時、2人の誕生日が異なる確率は364/365です。これは1人の誕生日以外をもう1人が誕生日としていればいいためです。

r=3の時、先ほどの2人が異なる確率364/365にさらにもう1人がその他2人と誕生日が異なればいいため363/365を掛けて{\displaystyle \frac{364}{365}×\frac{363}{365} }のように求めることができる。

同様に考えていくと、r人の時、{\displaystyle \frac{364}{365}×\frac{363}{365}×…×\frac{365-r+1}{365} }となる。

これでr人の誕生日が被らない確率を求めることができたので解は

{\displaystyle 1-\frac{364}{365}×\frac{363}{365}×…×\frac{365-r+1}{365} }

4.5

省略

4.6<ガリレイの問題>

3つのサイコロを投げて目の和が9になる場合と10になる場合は共に6通りしかない。これから、両者の確率は等しいと言えるか。

まず、直感的に考えると等しくなさそうですよね。カタンでも9は大きいけど10は小さいですし。カタンはサイコロ2つでしたね。すんまそん。

ではキチンと考えてみましょう。事象数を考えてみます。

9の場合、

(1,2,6)(1,3,5)(2,3,4)が6通りずつ

(1,4,4)(2,2,5)が3通りずつ

(3,3,3)は1通り

となっています(重複する並びを許さないため)。

では次に10の場合、

(1,3,6)(1,4,6)(2,3,5)が6通りずつ

(2,2,6)(2,4,4)(3,3,4)が3通りずつ

つまりこれから、和が9となる確率と10となる確率は異なり、10の方が高いことがわかる。

4.7<癌の診断>

(1){\displaystyle P(A|C)=P(A^c|C^c)=0.95,P(C)=0.005 }の時、P(C|A)を求めよ

Cは癌である事象であり、Aは検査結果が陽性である事象です。つまり今、癌である確率(事前確率)が0.005とわかっており、癌である時、検査で陽性となる確率が0.95であることがわかっています。ここから検査で陽性である時、癌である確率(事後確率)を求めます。結果から原因の確率を求めるのでベイズの定理を使います。

ベイズの定理

{\displaystyle P(H_i|A) = \frac{P(H_i)*P(A|H_i)}{\sum P(H_i)*P(A|H_i)} }

今回、原因である{\displaystyle H_iはCとC^c }があることに注意して解きます。

{\displaystyle P(C|A) = \frac{P(C)*P(A|C)}{P(C)*P(A|C)+P(C^c)*P(A|C^c)} }

上式に、{\displaystyle P(C)=0.005,P(C^c)=1-0.005=0.995, }

{\displaystyle P(A|C)=0.95,\\P(A|C^c)=1-P(A^c|C^c)=1-0.95=0.05 }

を代入すると

{\displaystyle P(C|A) = \frac{0.005*0.95}{0.005*0.95+0.995*0.05}≒0.087 }となる。計算は小数ではなく分数で計算しましょう。低いですね。

(2) (1)において、{\displaystyle P(A|C)=P(A^c|C^c)=R,P(C)=0.005 }である時、{\displaystyle P(C|A)\geq0.9 }となるRの範囲を求めよ

 同様にベイズの定理を使います。

{\displaystyle P(C)=0.005,P(C^c)=1-0.005=0.995, }

{\displaystyle P(A|C)=R,P(A|C^c)=1-P(A^c|C^c)=1-R }を代入すると

{\displaystyle P(C|A) = \frac{0.005*R}{0.005*R+0.995*(1-R)}\geq0.9 }

これを解くと、{\displaystyle R\geq0.9995 }となり、非常に高い精度が求められることがわかる。

 

スポンサーリンク