【目次】
二項分布とその確率質量関数、期待値、分散
二項分布の例
ベルヌーイ分布と二項分布の関係
二項分布を正規分布で近似する。
練習問題
練習問題回答
二項分布とその確率質量関数、期待値、分散
二項分布(Binomial distribution)は二択の結果(「成功」と「失敗」など)が出る試行を一定数繰り返し、そのうち何回「成功」の結果が得られるかの確率を表す離散型確率分布です。
このときの毎回の試行において「成功」が得られる確率をp、「失敗」が得られる確率を1-pと表し、「成功確率」pは毎回等しいものとします。また、同じ試行を繰り返す回数を通常nで表します。
確率変数Xが試行回数n、成功確率pの二項分布に従うことを、
などと表します。
この確率分布の確率質量関数、期待値、分散は以下の通りです。
•確率質量関数
•期待値
•分散
なお、はn個の中からx個を選ぶ時、何通りの選び方があるか?を表します。高校数学Aで学習する「組み合わせ」という概念ですので、これが分からない方は、復習されることをお勧めします。
それでは例を見てみましょう。
二項分布の例
歪んだコインがあり、このコインを投げると表が出る確率を0.6とし、裏が出る確率を0.4とします。このコインを2回投げたとき、表が出る回数を確率変数Xとすると、Xはn=2、p=0.6の二項分布に従います。
つまり、となります。
このコインを2回投げて0回表が出る確率、つまりP(X=0)、1回だけ表が出る確率、つまりP(X=1)、そして2回とも表が出る確率、P(X=2)を二項分布の確率質量関数を用いて計算してみます。
まず、この分布の確率分布は以下のように表すことができますね。
•確率質量関数(pmf)
•0回表が出る確率
•1回だけ表が出る確率
•2回とも表が出る確率
確率分布表
表の回数(X) | 確率 |
0 | 0.16 |
1 | 0.48 |
2 | 0.36 |
それ以外 | 0 |
•期待値
•分散
また、上記の結果を用いて、例えばこのコインを2回投げて、1回以上表が出る確率、つまりP(X=1 又は 2)を求めたいとき、
というように求めることができます。
ベルヌーイ分布と二項分布の関係
「ベルヌーイ分布とは何か?」のページで学習したベルヌーイ分布と二項分布の関係を見ていきます。
n個の確率変数が独立であり、それぞれ成功確率pのベルヌーイ分布に従う時、このn個の確率変数の和は試行回数n、成功確率pの二項分布に従います。
つまり、
が独立で、
のとき、Xを確率変数
とすると、
となります。
例
前述の表が出る確率がp=0.6のコインを考えてみましょう。
を1回目にコインを投げて表がでたら1、裏がでたら0の確率変数とします。
を2回目にコインを投げて表がでたら1、裏がでたら0の確率変数とします。
この確率変数はどちらも成功確率p=0.6のベルヌーイ分布に従いますね。
そして、1回目コインの結果(表、裏)が2回目にコインを投げた時の結果に影響を与えることはないので、とは独立した確率変数です。
ですので、この二つの確率変数の和は試行回数n=2,p=0.6の二項分布に従います。
つまり、
となります。
二項分布を正規分布で近似する。
さて、二択の試行を繰り返し行うときに何回「成功」が得られるかを考えるのに便利な二項分布ですが、試行回数nが十分に大きい場合、二項分布を正規分布で近似的に表すことができます。
「正規分布とは何か?」のページで詳しく説明しますが、正規分布はよく見る左右対称のベル型の分布のことです。
なぜわざわざ二項分布を正規分布で近似的に表す必要があるのでしょうか?
例えば、前述の表が出る確率がp=0.6の偏ったコインを1000回投げて、表が出る回数が500回以上600回以下になる確率、つまりを求めたい時、
二項分布を利用してP(X=500)+P(X=501)+・・・+P(X=600)と101項を足し合わせて計算することができますが、電卓を叩いてこれを足し合わせるのは非常に面倒です。
そのため、この二項分布を正規分布で近似的に表して、正規分布の確率密度関数をXが500から600の範囲で積分することにより、この確率を求めることができるので便利なケースがあるのです。
ということで、以下が二項分布と正規分布の関係です。
確率変数Xが試行回数n、成功確率pの二項分布に従うとき、
つまり、のとき、
nが十分に大きければ、この分布を
平均値、分散の正規分布、
つまりで近似することができる。
実際に表が出る確率(成功確率)p=0.6のコインを投げる例を見てみましょう。
まず、例えばこのコインを2回だけ投げたときの表が出る数の分布は、以下の図のようになりますね。
このグラフでは、何となくベル型の分布には見えますが、左右対称とは言えませんね。
次にn=5、n=10とコインを投げる回数を増やしていって、表が出る確率の分布を見てみます。
ベル型の正規分布っぽくなってきてはいますが、まだ左側に裾をひいたような形のグラフになっています。
そして、コインを投げる回数nを1000回まで増やすと、以下のようなグラフになります。
ほぼ完全にベル型の左右対称のグラフ、つまり正規分布の確率密度関数のグラフになりました。
この正規分布の平均値と分散は上記の公式で計算できますから、Xは近似的に
•平均値μ=np=1000•0.6=600
•分散σ2=np=1000•0.6•0.4=240
の正規分布に従うといえます。
以下に、平均値600、分散240の正規分布の確率密度関数のグラフを赤で重ねてみます。
見事に正規分布とほぼ同じになっていますね。
そして、この近似的に表した正規分布を利用して、となる確率は、以下の図の青く塗られた部分なので、この確率は約50%、つまり、となることが分かります。
練習問題
歪んでいないコインを投げて表が出る確率をp=0.5とします。
このコインを5回投げて、表が出る回数を確率変数Xとすると、
1,Xはどんな確率分布に従うか?
また、
2,このコインを5回投げて4回以上表が出る確率、
3,この確率変数の期待値、
4,この確率変数の分散
をそれぞれ求めてみましょう。
練習問題回答
1,この確率変数Xは試行回数n=5、成功確率p=0.5の二項分布に従います。
つまり、
2,このコインを5回投げて4回表が出る確率と、5回表が出る確率を足し合わせます。
•4回表が出る確率
•5回表が出る確率
•4回以上表が出る確率
このコインを5回投げて4回以上表が出る確率は18.75%と計算することができました。
3,期待値
4,分散