社会人が統計学の基礎を学び、実務で活かす

Rコード:ヒストグラムに正規分布など確率密度関数の曲線を重ねる方法。

スポンサーサーチ

ヒストグラムに確率分布の曲線を重ねる方法

Rで統計分析をする際、得られたデータをヒストグラムにしてデータの分布を確認し、
その上に正規分布などの確率分布の曲線を重ねて表示したいことがよくあります。

今回はその方法について解説します。

まず、例えば日本人の成人男性を30人ランダムにサンプリング(抽出)したところ、各男性の身長が以下のように得られたとします。

> X
[1] 163.30 168.66 173.07 161.78 172.57 171.24 171.68 179.93 161.25 181.14
[11] 165.04 161.95 165.27 173.02 172.22 168.54 163.38 165.81 180.79 172.60
[21] 166.37 163.46 169.37 157.67 167.12 165.07 180.28 179.10 170.42 161.91

 
このデータをヒストグラムにして分布を調べてみましょう。

# 日本語フォントの指定
par(family = "HiraKakuProN-W3")

# ヒストグラム作成
hist(X,
     main="30人の日本人成人男性の身長",
     xlab="身長",
     ylab="",
     prob=T)

以下のようなヒストグラムが描けます。



日本人の成人男性の身長はだいたい平均値171cm、分散64、標準偏差8の正規分布に近い分布をしていますので、この正規分布を重ねてみます。

curve()関数で、()内にdnorm(x,171,8)を指定することにより、正規分布の確率密度関数を描くことができます。

これを、ヒストグラムに重ねたいのでadd=TRUEを追加します。

curve(dnorm(x,171,8),
      add=TRUE,
      col="red")

これにより、以下のように正規分布の確率密度関数の曲線を重ねることができました。



なお、この30人の身長のデータは以下のコードで同じものを発生させることができます。

# 毎回同じ乱数を発生させる
set.seed(3)
#平均171標準偏差8の正規分布から30個のデータを抽出
X=rnorm(30,171,8)
# 少数第三位を四捨五入
X=round(X,digits = 2)

プログラミングとソフトウェア

スポンサー募集中。

統計ドットリンクでは広告出稿をご希望のスポンサー様を募集しております。ページビューなどは、「お問い合わせ」からご連絡ください。

更新・勉強会などの情報を受け取る。

以下からFacebookページをフォローもしくは、メールマガジンへの登録をすると、更新情報、勉強会、講習会、交流会の案内など各種情報を受け取ることができます。

↑こちらからFacebookページをフォロー。
 

メルマガ登録はこちら

理系の就職・職業訓練

統計ドットリンクでは、理系の大学生、大学院生、第二新卒の就職や転職を応援しています。職業訓練、求人やエージェントなどの必要な情報を選別し、紹介しています。 就職、職業訓練の情報を確認する。
PAGETOP
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.