確率分布について
確率分布(Probability distribution)とは、確率変数の各実現値に対して、確率を割り当てたものです。
抽象的な概念だけでは理解しづらいと思いますので、早速例を挙げますね。
サイコロの目の確率分布
Xを{1,2,3,4,5,6}の値を取る確率変数と定義します。
歪んでいないサイコロの場合、それぞれの目が出る確率は1/6なので、確率分布は以下のようになりますね。
確率分布表
出る目 | 確率 |
1 | 1/6 |
2 | 1/6 |
3 | 1/6 |
4 | 1/6 |
5 | 1/6 |
6 | 1/6 |
それ以外 | 0 |
サイコロを振って出る目をXとすると、「確率変数Xは各実現値1,2,3,4,5,6に対してそれぞれ1/6という確率が割り当てられている確率分布に従う」と言います。
また、例えばXが1の目になる確率は1/6なので、数学の式としては
と書きます。
このPは英語のProbabilityの略です。
なので、人によっては同じことを
と書いたり、
と書いたりします。
少し改造したサイコロの確率分布
すべて同じ確率の確率分布では面白くないので、少し状況を変えてみましょう。
歪んでいないサイコロの1の目を2に書き換えてしまいましょう!
すると、1の目は出なくなってしまったので、このサイコロを振って出る目を確率変数Xとすると、Xは2,3,4,5,6の値を取り得ますね。
そして、2の目は出る確率が倍になったので、確率分布は以下のようになります。
確率分布表
出る目 | 確率 |
2 | 1/3 |
3 | 1/6 |
4 | 1/6 |
5 | 1/6 |
6 | 1/6 |
それ以外 | 0 |
つまり、この1の目を2に書き換えられたサイコロの目Xは上の表の確率分布に従います。
数式を用いて表現すると
となります。
このように、確率変数、つまり観測するまで何の数字が得られるか分からない変数は分布する、ということを常に意識しておいてください。
そして確率変数がどのような分布に従っているか?ということにも常に考えましょう。
きちんと学ばずに統計学を使っている学者などは、自分勝手に確率変数が正規分布(ベル型の分布)に従っていると思い込んで間違った統計学の手法を使っている、といったことも珍しくありません。
また、私たちは平均値を用いて、ある集団の性質などを理解しようとすることが一般的ですが、確率変数がどのような分布に従っているかによって、平均値を用いると間違った理解を与えてしまう場合もあります。
詳細は「平均値、中央値、最頻値の違い」のページでも紹介しますが、ここでは確率変数がどんな分布に従っているか?または、得られたデータがどのように分布しているか?ということを常に意識するようにしてください。
分布を視覚的に調べる方法は「ヒストグラムとは何か?」のページで解説します。
練習問題
1、Xを歪んでいないコインを1回投げた時に出る面とすると、X
はどのような確率分布に従いますか?
上述のような確率分布表と、数式で表してみてください。
2、上述のサイコロでは1の目を2に書き変えましたが、今回は1の目と2の目を3に書き変えて、さらに、4の目を6に書き変えましょう。
この改造されたサイコロを1回振って出る目を確率変数Y
とすると、Yが従う確率分布を確率分布表と数式で表してみてください。
練習問題回答
1、歪んでいないコインを投げた時の分布。
確率分布表
X | 確率 |
表 | 1/2 |
裏 | 1/2 |
それ以外 | 0 |
2、1と2の目を3に、4の目を6に書き換えたサイコロを投げた時の目(Y)の分布。
確率分布表
Y | 確率 |
3 | 1/2 |
5 | 1/6 |
6 | 1/3 |
それ以外 | 0 |