https://d1021.hatenadiary.com
http://d1021.hatenablog.com

ファイナンスと統計学はなぜ相性がいいいのか? 文系でもわかる「標準偏差」超入門|あれか、これか ― 「本当の値打ち」を見抜くファイナンス理論入門|ダイヤモンド・オンライン

標準偏差に関係するデータとして、日本人が何よりも親しんでいるのは「学力偏差値」だろう。テストの成績を示す偏差値は、自分の得点が全体の平均点から見てどれくらいの位置にあるのかを指し示している(なお、後述するが偏差値と標準偏差は別の概念なので要注意)。

一般に自然界では、母集団のデータを無作為に選ぶと下の図のような釣鐘型のばらつきになることが多い。これを正規分布という。

すべてのデータがこのようにきれいにばらつくわけではない。

人口ピラミッドの形を思い浮かべていただければわかるとおり、年齢ごとの人口分布も正規分布にはならない。

一方、ダーツとかルーレットのような無作為のゲーム、そしてランダムウォークをする株価の動きなどは、正規分布を描くようになる。

では、実際に標準偏差の出し方を説明していこう。まず、超シンプルな例から。


3人兄弟がいる。長男の身長は180、次男は170、三男は160センチだとしよう。3人の平均身長が170センチになることは小学生でもわかる。元のデータと平均値との差を偏差という。長男の偏差は10、次男は0、三男はマイナス10だ。


このとき、平均からどれだけ離れているかだけに注目したい。そこで、それぞれの偏差を2乗する。「偏差の2乗」を比較すれば、長男と三男はともに100(10の2乗)として扱うことができる。つまり、平均より10センチ高いことも、10センチ低いことも同じ事柄として扱えるようになるわけだ。


さらにここで、偏差の2乗の「平均」を計算する。長男100、次男0、三男100の平均は66.7(≒200÷3)だ。偏差の2乗の平均値を分散と呼ぶ。


しかし、この分散を求めるために、先ほど僕たちは「2乗」の操作を加えた。そこで今度は、この66.7という数値に2乗と逆の操作を加える必要がある。要するに、平方根(√)を求めるわけだ。そこで出てくる数字が標準偏差であり、身長の例で言えば8.2(≒66.7の平方根)センチだ。なお、標準偏差は「σ」(小文字のシグマ)の記号で表される。

それほど難しい計算はないし、エクセルを使えば簡単に割り出すことができるはずだ。ちなみに、俗に言う「偏差値」とは、次のような手続きで計算されている。


(1) 偏差に10をかける
(2) この(1)の数字を標準偏差で割る
(3) この(2)の数字に50を足す

データの集合が正規分布しているとき、平均値に対して±1σ(1標準偏差)の範囲内に「68.27%」のデータが含まれることがわかっている。これは純粋に統計学の理論上の話だ(詳細な証明はここではしない)。同様に、±2σの範囲には95.45%のデータが含まれ、±3σの範囲には99.73%が含まれる。

http://d.hatena.ne.jp/d1021/20160516#1463394935