【目次】
F分布の定義と例
F分布のグラフ
F分布の確率密度関数、期待値、分散
F分布を使った検定
練習問題
練習問題回答
F分布の定義と例
F分布(F distribution)とは、等分散の検定や、重回帰分析におけるパラメーターの検定などの統計学的検定に利用される分布で、2つの自由度によって形が決まる分布です。
F分布の定義は以下のようになります。
確率変数U,Vが独立で、それぞれに自由度p,qのカイ二乗分布に従うとき、確率変数は自由度p,qのF分布に従う。
つまり、, , のとき、
となる。
例を見てみましょう。UがVがお互いに独立で、それぞれ自由度3、自由度30のカイ二乗分布に従うとします。
すると、となります。
実際にシュミレーションをして確かめて見ましょう。
Rを使って、Uを自由度3のカイ二乗分布、Vを自由度30のカイ二乗分から抽出し、を計算してみます。
set.seed(10) # 自由度3のカイ二乗分布から抽出 U=rchisq(1,3) # 自由度30のカイ二乗分布から抽出 V=rchisq(1,30) # Xを計算 X=(U/3)/(V/30)
[1] 0.738
が抽出されました。これを1000回ほど繰り返して、がどのような分布を描くか、確認してみます。
以下がそのヒストグラムです。
このヒストグラムに、自由度3,30のF分布の確率密度関数を重ねると以下のようになります。
シュミレーションで抽出されたが見事に自由度3,30のF分布に従っているのが確認できます。
F分布のグラフ
F分布のグラフは、2つの自由度と呼ばれるパラメータによって形が決まります。
また、前述のF分布の定義におけるパラメータpを固定し、qを無限大に近づけていくとF分布は自由度pのカイ二乗分布に従います。
上のように、p=1を固定して、qを大きくしていくと、自由度1のカイ二乗分布になることが分かりますね。
以下は、q=1を固定してpを大きくしていった場合のF分布のグラフです。
以下は、p,qを両方とも大きくしていった場合のグラフです。
このようにF分布は主に、右に歪んだ形になりますが、パラメータによって多少形が変わってくることが分かります。
F分布の確率密度関数、期待値、分散
Xが自由度p,qのF分布に従う時、つまり、のとき:
・確率密度関数
※
・期待値
・分散
F分布を使った検定
F分布は等分散性の検定や、重回帰分析のパラメータの検定など、幅広く統計検定に利用されます。詳しくは「統計学の基礎」や、各検定手法を取り扱う項目にて解説します。
F検定というと、すなわち、等分散性の検定のことをいうと勘違いをしている人が多いですが、検定統計量がF分布に従う検定を総称してF検定と呼びます。
練習問題
互いに独立な確率変数X,Yがそれぞれ、自由度3,4のカイ二乗分布に従う時、確率変数はどんな確率分布に従うか?
練習問題解答
確率変数は自由度3,4のF分布に従う。つまり、