どこにでもいる30代SEの学習ブログ

主にプログラミング関連の学習内容。読んだ本の感想や株式投資についても書いてます。

平均身長と体重から母平均と母分散の検定を復習する

だいぶ以前に読んだ「完全独習 統計学入門」の内容を思い出しがてら、記事を書きました。

小学生や中学生の頃、年に何回か身体測定をしていた記憶があります。小さい頃は身長も体重もどんどん変わっていくため、一喜一憂していました。

大人になってからも毎年の健康診断で測定しますが、大きく変わることはもう無いので子供の頃のようなワクワク感はありませんね。

毎年、全国の学校で測定したデータを用いて、各年齢の平均身長と体重が算出されています。詳しいデータは「政府統計 e-Stat」から見ることができます。

2019年度のデータを参照して「完全独習 統計学入門」の内容を復習しました。

17歳の平均身長と体重

「2019年度 学校保健統計調査」によれば、17歳の平均身長と体重は次の通りです。

男性:身長 170.6 cm、体重 62.5 kg
女性:身長 157.9 cm、体重 53.0 kg

この数字はあくまで平均です。当たり前ですが、全員がこの身長・体重というわけではありません。人によって異なり、全体としてはバラ付きがあります。

身長や体重は正規分布に従うと言われています。学校保健統計調査には、平均だけでなく標準偏差も載っています。平均と標準偏差を元に以下のようなグラフで表せます。

f:id:predora005:20210612211016j:plain

縦軸は確率密度、横軸は身長です。平均身長を中心に左右に分布しています。

全高校生の平均ではない

この平均身長と体重は、すべての高校生の平均ではありません。全高校生の身長と体重を測定するのは大変なため、全国の高校から抜粋して調査を実施します。

身長・体重の調査対象人数は126,900人で、全体の5.2%を抽出しています。詳しくは下記リンク先に載っています。

学校保健統計調査-令和元年度(確定値)の結果の概要:文部科学省

本当の平均身長は?

t分布を用いて、17歳男性の本当の平均身長を求めてみます。

f:id:predora005:20210612214510p:plain

(sは不偏分散ではありません)

統計量Tの式に、実際の数値を当てはめてみます。標本数は126,900人です。男女の比率は分からないので、ここでは半々と仮定します。男女とも63,450人とします。

f:id:predora005:20210612215655p:plain

自由度は標本数から1引いて63,459です。自由度63,459のときのt分布の95%信頼区間を確認すると「1.960」です。よって、以下の式を解けばよいことになります。

f:id:predora005:20210612215703p:plain

この式から「本当の平均μ」は「170.55〜170.65 cm」の範囲に95%含まれます

これは、ほとんど平均と差がありません。0.05cmなんてほぼ0に等しく、測定誤差の方が0.05cmよりも大きそうです。

測定した人数が十分多いので、全体の5.2%から抽出した平均身長でも十分と言えるわけです。

ちなみに、その他の平均についても95%信頼区間を求めると次の通りです。

  • 17歳男性 平均身長 170.55〜170.65 cm
  • 17歳男性 平均体重 62.42〜62.58 kg
  • 17歳女性 平均身長 157.86〜157.93 cm
  • 17歳女性 平均体重 52.94〜53.06 kg

本当の標準偏差は?

本当の標準偏差も求めてみます。カイ二乗分布を用います。

f:id:predora005:20210612230603p:plain

統計量Wの式に、実際の数値を当てはめます。

f:id:predora005:20210612230614p:plain

自由度63,459のときのカイ二乗分布の95%信頼区間を確認すると、相対度数97.5%が「62,753」、相対度数2.5%が「63,447」です。よって、以下の式を解けばよいことになります。

f:id:predora005:20210612231103p:plain

この式から「本当の母標準偏差σ」は「5.870〜5.903」の範囲に95%含まれます

標準偏差も平均と同じで、ほとんど差がありませんでした。つまり、標準偏差5.87は十分信頼できる数値と言っていいでしょう。

終わりに

「完全独習 統計学入門」は読みやすい本でした。筆者が超入門書と謳っている通り、統計が苦手そうな人にも分かりやすいよう工夫されています。

久々に読みましたが、あまり覚えていませんでした。しばらく使わないと忘れてしまうものですね。

出典

アイキャッチの画像はTumisuによるPixabayからの画像

参考文献

完全独習 統計学入門 | 小島 寛之 |本 | 通販 | Amazon