Medbb's blog

日々の中でなにかしらまとまった話をしたときや調べたときの内容を忘れないように書き留めたページです

Medbb Webサイトはコチラ

不偏分散の正の平方根は不偏標準偏差でよろしいのか(よろしくない)

 記述統計と異なり推測統計は記号・表記や,このタイトルのような話など学ぶ側から眺めると本によって記載が異なるので,謎めいた感あふれる分野に映っていると思います.授業では謎分野にならないよう注意深く臨むのですが,早々に授業を理解する取り組みをあきらめて世の中のソースや友人に頼ってなんとかした学生さんは単位を取得しただけだとしても,社会では統計に見識のある人材と見做されますので,期待外れにならんと良いなと思う今日この頃です.

 本題ですが,記述統計では分散の正の平方根標準偏差としていますが,推測統計においても同様のノリだと,「不偏分散の正の平方根を不偏標準偏差とする」となります.そのような数式を記載をされている本を教科書として用いていたことから,便宜上そのような説明をしたこともあります.非常にわかりやすい本で授業も進めやすかったのですが,他の理由から現在その本は用いておりません.

 不偏推定とは一方に偏った推定にならないことですから,不偏分散が偏った推定になっていないのであれば,「不偏分散に基づく標準偏差」(不偏分散の正の平方根)の分布は当然偏るという話です.

以下は,一様分布のダミーデータを20000用意し,サンプル数2000サンプルサイズ10のデータ(母平均は125.0,母分散は81.0,母標準偏差は9.00)にして求めた不偏分散のヒストグラムです.母分散を中心に偏ることのない推定がされています.

なお不偏分散の期待値は81.1になりました.

https://medbb.net/education/medbbstat2022/img/medbbstat2022-0205.png

では,「不偏分散に基づく標準偏差」も同様にヒストグラムを作成しました.

https://medbb.net/education/medbbstat2023/img/medbbstat2023-b05.png

「不偏分散に基づく標準偏差」の期待値は8.87になりました.先ほど求めた不偏分散の期待値81.1の正の平方根(9.00)と異なります.母平均周辺のヒストグラムが左右非対称になっています.

 不偏分散の時のX軸を,分散81.0,標準偏差は9.00のところを揃えて表記すると,母平均よりも高い値は圧縮されており,低い値が低い側に間延びしていることがわかります.故に不偏分散と比較すると値が全般的に低い側にシフトしているわけですが.両者には以下の関係があるからです.

https://medbb.net/education/medbbstat2023/img/medbbstat2023-b06.png

まとめると,不偏分散の計算式は不偏性を担保しているものの,それに基づく標準偏差は不偏性を担保できない.なぜなら分散と標準偏差が一次の関係ではないため分布が変わるから.というところです.

 

 推定の話のキモは「点推定はまず当たらない」というところでしょう.記述統計の場合は当然100%当たる話(事実なので当然)ですから,その続きで推定の話を聞いても受講者は記述統計のイメージを引きずりがちと思います.故に最近は,点推定は当たらないということを意識して伝えています.参考までに母平均の推定も上記のデータセットで行っていますが,僅か1.1%しかあたらなかったという結果です.

https://medbb.net/education/medbbstat2022/img/medbbstat2022-0202.png

 

 あと分散の話では,不偏分散(n-1で除する)と分散(nで除する)とどう使い分けするのか?という話もあります.統計学のオンラインフォローで,そのような質問が出ておりました,そちらはこちらのページ*1私見を載せています

 

一連の話にご興味のある方は,以下の資料をご覧いただけたらと思います.

統計学2023(統計の復習用)

https://medbb.net/education/medbbstat2023/index.php

 

 

 

*1:

不偏分散の話はよく分かったけどn数が多い場合は普通に分散求めるケースがありますが良いの?(統計学(3)母平均と母分散の点推定ー統計学2023(統計の復習用))

https://medbb.net/education/medbbstat2023/index.php#3q1